Pandasにて上位を抽出する方法【pythonにおける上位のソート（sort）方法：上位10位などを昇順、降順で並び替え】

Jupyter notebook（Python3）を使ってみようを使ってみようと思っても慣れていないうちは、どうしても処理に躓いてしまうものです。

例えば。Pythonのpandas機能にてソート（sort）をかけて昇順や降順で並び替え、データの上位10位を表示させる方法について理解していますか。

ここでは、このPandas（python）を用いてデータの上位の抽出する方法について解説していきます。

Pandasにて特定の列の数値を元に昇順（ソートする）に並び替えを行う方法【上位の抽出（python）】
Pandasにて特定の列の記号を元に降順（ソートする）に並び替えを行う方法【上位の抽出（python）】
pythonにて複数列の昇順と降順の並び替えを行う方法【上位の抽出（pandas）】
まとめ　Pandas（python）にてソートを行い、上位を抽出させる方法

Pandasにて特定の列の数値を元に昇順（ソートする）に並び替えを行う方法【上位の抽出（python）】

まずはpandasにてデータの数値を昇順、降順に並び替え、上位10を抽出していく方法を確認していきます。以下のデータを活用していきます。

ここでageの列に着目して、数値の昇順への並び替えを行っていきます。このときpythonのsort_valuesの機能を活用するとよく、サンプルコードは以下の通りです。

import os
os.chdir(“C:\\sample”)
import pandas as pd
df= pd.read_csv(‘sample9.csv’,encoding=”SHIFT JIS”)
df.sort_values(by=”age”)

ここでは、ageの列を昇順に並び変えてみました。

さらに、表示されたデータにおいて上位10位を抽出する際には、pandasのhead関数を使っていきます。

以下のよう（）内に数値をいれるだけでいいです。

Pandasにて特定の列の記号を元に降順（ソートする）に並び替えを行う方法【上位の抽出（python）】

今度は、数値ではなく記号を元に降順に並び替えを行っていきましょう。以下のコードでは、sample列において、降順（ascending=False）に変化させることができます。

import os
os.chdir(“C:\\sample”)
import pandas as pd
df= pd.read_csv(‘sample9.csv’,encoding=”SHIFT JIS”)
df.sort_values(by=”sample”,ascending=False)

さらにここから上位5位を表示させてみましょう。上述の通りpandasにおけるhead関数を利用していきます。

import os
os.chdir(“C:\\sample”)
import pandas as pd
df= pd.read_csv(‘sample9.csv’,encoding=”SHIFT JIS”)
df=df.sort_values(by=”sample”,ascending=False)
df.head(5)

これがpythonにおけるsample列を降順に並び替えた上で、上位5位を抽出する方法といえます。

pythonにて複数列の昇順と降順の並び替えを行う方法【上位の抽出（pandas）】

また、pandasにて特定の1列のみでなく、複数列に対する並び替えを行うことも可能です。

import os
os.chdir(“C:\\sample”)
import pandas as pd
df= pd.read_csv(‘sample9.csv’,encoding=”SHIFT JIS”)
df.sort_values(by=[“sample”,”age”],ascending=[True,False])

このコードでは、sample列にて昇順で並べ、その次にage列では降順に並べていくような処理をしています。