Pythonのpandasやnumpyライブラリは両方ともがデータ解析を行うための便利なツールといえます。
両方ともを使いこなせていないとうまく処理できないケースも多く、操作方法を丁寧に理解していく必要があります。
ここでは、中でもPythonのPandasのデータ(csv)をNumpy型に変換したり、numpyのデータをpandas用に変換したりする方法について確認していきます。
PythonのPandasデータ(csv)をnumpy型に変換する方法
それでは以下のcsvのサンプルデータを用いてPythonのPandasデータ(csv)をnumpy型に変換する方法について確認していきます。
まずはpandasにてcsvを読み込み出力してみます。
import os
os.chdir(“C:\\sample”)
import pandas as pd
import numpy as np
df = pd.read_csv(“numpy.csv”, encoding=”SHIFT_JIS”)
df
os.chdir(“C:\\sample”)
import pandas as pd
import numpy as np
df = pd.read_csv(“numpy.csv”, encoding=”SHIFT_JIS”)
df
numpy.csvというデータを読み込んで表示させています。
このデータ内の数値をnumpy型に変換していきます。
df.values
の1行のみでnumpy型のデータに変換されます。
Numpy型のデータからpandasに変換する方法【Python】
さらにはnumpy型のデータからPandas型のデータへの変換も行ってみましょう。
Numpyのデータをpandasに変換するには、
・numpyにて出力の列を一旦定義し(ここではhenkanという名前で)
・df=pd.dataframe(定義名)
・df=pd.dataframe(定義名)
と指定するだけでnumpy型からpandas型への変換が完了となります。
なお上ではカラム名が抜けているため、以下のように再定義すると元のpandasにて読み込んだ際のcsvそのままとなります。
columns=[“data”]
df=pd.DataFrame(henkan,columns=columns)
df
df=pd.DataFrame(henkan,columns=columns)
df
まとめ Pandasとnumpy型のデータの変換方法【Pythnoにてcsvを元に】
ここではPythonのPandasのデータ(csv)をNumpy型に変換したり、numpyのデータをpandas用に変換したりする方法について解説しました。
Pandas→numpy ではdf.valuesを
Numpy→pandasでは df=pd.dataframe(numy型のデータ)
と処理し変換していくといいです。
Pandasやnumpyでの各種操作を身につけることによって、日々の業務効率を上げていきましょう。
コメント