Pythonのpandasにて年代別の集計(合計やカウント)する方法【`floordiv`, `groupby`, `count`, `sum`】 | ウルトラフリーダム

Pythonのpandasにて年代別の集計(合計やカウント)する方法【`floordiv`, `groupby`, `count`, `sum`】

本サイトでは記事内に広告が含まれています。

この記事では、pandasを使用して「年代別の集計」について解説していきます。

ポイントとしては、`floordiv`関数での年代の切り捨て、`groupby`関数を用いた集計、そして`count`および`sum`関数を使用することです。

詳しく見ていきましょう!

スポンサーリンク

1.Pandasにて年齢から年代を得る(10歳刻み)【`floordiv`】

pandasを使い、年齢の数値を10で割った商を取得することで、10歳刻みの年代を得ることができます。


import pandas as pd

# サンプルデータの読み込み
renshu_df = pd.read_csv('renshu.csv')

# 年齢から年代を取得
renshu_df['nendai'] = renshu_df['nenrei'].floordiv(10) * 10

print(renshu_df)

上記のコードでは、`floordiv`関数を使用して、年齢を10で割った商を取得し、その後10を掛けることで年代を取得しています。

2. 年代ごとの合計を計算する方法【`groupby`, `sum`】

pandasの`groupby`関数と`sum`関数を組み合わせることで、年代ごとの合計を簡単に計算することができます。


# 年代ごとの合計を計算
nendai_goukei = renshu_df.groupby('nendai').sum()

print(nendai_goukei)

このコードでは、`groupby`関数で`nendai`カラムを基に集約し、その後`sum`関数を使用して年代ごとの合計を取得しています。

3. 年代ごとのデータ数を数える集計をする方法【`groupby`, `count`】

同様に、`groupby`関数と`count`関数を使って、各年代ごとのデータ数を簡単に集計することが可能です。


# 年代ごとのデータ数を数える
nendai_kazu = renshu_df.groupby('nendai').count()

print(nendai_kazu)

上記のコードでは、`groupby`関数で`nendai`カラムを基に集約した後、`count`関数を使用して各年代のデータ数を集計しています。

以上が、pandasを使った年代別の集計方法の基本的な手順です。これらの関数を駆使することで、さまざまなデータ解析を行うことができます。

コメント

タイトルとURLをコピーしました