この記事では、pandasを使用して「年代別の集計」について解説していきます。
ポイントとしては、`floordiv`関数での年代の切り捨て、`groupby`関数を用いた集計、そして`count`および`sum`関数を使用することです。
詳しく見ていきましょう!
—
1.Pandasにて年齢から年代を得る(10歳刻み)【`floordiv`】
pandasを使い、年齢の数値を10で割った商を取得することで、10歳刻みの年代を得ることができます。
import pandas as pd
# サンプルデータの読み込み
renshu_df = pd.read_csv('renshu.csv')
# 年齢から年代を取得
renshu_df['nendai'] = renshu_df['nenrei'].floordiv(10) * 10
print(renshu_df)
上記のコードでは、`floordiv`関数を使用して、年齢を10で割った商を取得し、その後10を掛けることで年代を取得しています。
—
2. 年代ごとの合計を計算する方法【`groupby`, `sum`】
pandasの`groupby`関数と`sum`関数を組み合わせることで、年代ごとの合計を簡単に計算することができます。
# 年代ごとの合計を計算
nendai_goukei = renshu_df.groupby('nendai').sum()
print(nendai_goukei)
このコードでは、`groupby`関数で`nendai`カラムを基に集約し、その後`sum`関数を使用して年代ごとの合計を取得しています。
—
3. 年代ごとのデータ数を数える集計をする方法【`groupby`, `count`】
同様に、`groupby`関数と`count`関数を使って、各年代ごとのデータ数を簡単に集計することが可能です。
# 年代ごとのデータ数を数える
nendai_kazu = renshu_df.groupby('nendai').count()
print(nendai_kazu)
上記のコードでは、`groupby`関数で`nendai`カラムを基に集約した後、`count`関数を使用して各年代のデータ数を集計しています。
—
以上が、pandasを使った年代別の集計方法の基本的な手順です。これらの関数を駆使することで、さまざまなデータ解析を行うことができます。
コメント