Pandas(python)にてヒストグラムの割合を表示する(正規化)方法【matplotlib】 | ウルトラフリーダム

Pandas(python)にてヒストグラムの割合を表示する(正規化)方法【matplotlib】

Python3
本サイトでは記事内に広告が含まれています。

Jupyter notebook(Python3)を使ってみようと思っても慣れていないうちは、どうしても処理に躓いてしまうものです。

例えば、Pythonのpandas機能にてヒストグラムを作成する際に度数ではなく、割合で表した(正規化した)もので表示するためには、どのように処理すればいいのか理解していますか。

ここでは、このpython(pandas)にてヒストグラムを作成した際に割合で記載する方法について確認していきます。

スポンサーリンク

Pandas(python)にてヒストグラムの割合を表示する(正規化)方法【matplotlib】

まずは、numpyをインポートしてサンプルデータを生成し、度数表示の基本的なヒストグラムを作成していきます。

サンプルコードは以下の通りです。

import numpy as np
x = np.random.randn(100)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
import pandas as pd
ax.hist(x)

なお、csvを読み込みヒストグラムを作る方法はこちらで解説していますので、参考にしてみてください。

そして、表示のヒストグラムでは度数での表示になっているため、これを割合での表示に変換していきます。このときは、以下のコードをhist関数内の引数(normed=True)に入れるだけでいいです。

ax.hist(x,normed=True)

これだけでpython(pandas、numpy)によって正規化されたヒストグラムが生成されました

Pandas(python)にてヒストグラムの割合の累積を表示する(累積比率)方法【matplotlib】

なお、上では累積ではなく各範囲にあてはまる割合のヒストグラムを作りましたが、累積の割合(累積比率)で表した場合のヒストグラムを作りたいときもあるでしょう。

この場合では、以下の累積表示のコード(cumulative=True)を足すといいです。

ax.hist(x,normed=True,cumulative=True)

このようにして累積の割合に変更したヒストグラムの作成ができました。

他のpython(pandas、matplotlib)におけるヒストグラムの各体裁を整える方法は別途~で解説していますので、参考にしてみてください。

まとめ Pandas(python)にてヒストグラム作成時に正規化する方法(割合で記載)

ここでは、jupyternotebook(python)のpandas機能によってヒストグラムの作成、割合での表示を行う(正規化する)方法について解説しました。

基本的には、pythonにおけるhist関数を使用した上で

・正規化を実行する引数のnormed=True
・累積に変換する引数のcumulative=True

を使うといいです。

各種対処方法を理解して、pandasの使い方をマスターしていきましょう。

コメント

タイトルとURLをコピーしました