Pythonのpandasは時系列データの処理等を行う際に非常に便利なツールといえます。
ただ、pandasの使用方法に慣れていないとなかなかうまく処理できないケースも多いです。
中でもここではpandasにて特定の列や行の累積和(累積値)を求める方法(cumsum関数)について解説していきます。
Pandasにて累積和(累積値)を計算する方法【列方向:cumsum】
それでは以下のcsvのサンプルデータを用いてPythonのpandasライブラリにて累積和を求める方法について確認していきます。
このデータの列方向の累積和を求めていくためには、cumsum関数を使うといいです。
サンプルコードは以下の通りです。
os.chdir(“C:\\sample”)
import pandas as pd
df = pd.read_csv(“ruiseki.csv”, encoding=”SHIFT_JIS”)
df.cumsum()
このコードの意味について確認していきます。
os.chdir(“C:\\sample”)
→ruiseki.csvというファイルが置いてあるディレクトリに移動しています。
df = pd.read_csv(“ruiseki.csv”, encoding=”SHIFT_JIS”)
→pandasをインポートし、ruiseki.csvを読み込んでいます。
累積和を計算しています。
別の列に累積和(累積値)を出力する方法
上では累積和を元の列に上書きしていますが、別の列に累積和を表示することもできます。
の1行によって、ruisekiという列名で元の列の累積和を計算することができます。
どちらもよく使用する方法なのでこの機会に覚えておくといいです。
行方向の累積和を計算していく方法【Pandas】
今度はデータが横方向に並んでいる場合の累積和を求める方法についても確認していきます。
行方向に累積和を計算していくには、以下のようcumsum関数の()内にaxis=1と追加するといいです。
axis=1がないと行方向ではなく、列方向の累積和の計算になってしまうので注意するといいです。
まとめ Python(Pandas)にて累積和(累積値)を計算する方法
ここでは、PythonのPandasライブラリにて累積和を計算する方法について確認するといいです。
Pandasにて累積和を計算するには基本的にcumsum関数を使うといいです。
Pythonでの各種操作を身につけることによって、日々の業務効率を上げていきましょう。
コメント