この記事では、Pythonを用いて文字コードの指定(sjis:utf-8:open:ファイル読み込み:書き込み:テキスト出力など)方法について解説していきます。
ポイントとしては
各関数の引数にencoding=”文字コード”
の追記することですね。
なお、下記の解説では完全な初心者でもわかりやすいように、変数名を少々変わった名称にしております。そのため、実際に使用する際には、適切な英語表記に変更してご活用ください。
それでは詳しく見ていきましょう!
Pythonで文字コードの指定する方法(shift_jisで。with openメソッドでC直下のrenshu.txtファイルを読み込み)
それではまず、Pythonで文字コードを指定してファイルを読み込む方法、について解説していきます。
標準モジュールでのwith openメソッドの引数にて、encoding=”shift_jis”とするだけで文字コードを指定したファイル読み込みができますね(ここでは.txtファイル)
文字コードを指定しておかないと文字化けで表示がおかしくなる時があるので、ここで覚えておきましょう。
# ファイルを読み込むための関数
def file_yomikomi(filepath):
# with openを使ってファイルを開く
with open(filepath, 'r', encoding='shift_jis') as file:
# ファイルの内容を読み込む
content = file.read()
return content
# 実際にファイルを読み込んでみる
furemu = file_yomikomi('C:\\renshu.txt')
print(furemu)
Pythonで文字コードの指定する方法(PandasでC直下のrenshu.csvファイルをshift_jisで読み込み、hoka_renshu.csvとしてutf-8で出力させる)
続いては、Pandasを使用して異なる文字コードでcsvファイルを読み込み、別の文字コードで書き出す方法について解説していきます。
ここでは
・ファイル読み込み:Shift_jis
・ファイル書き込み(出力):utf-8
という文字コードにしてみます。
import pandas as pd
# CSVファイルを読み込む関数
def csv_yomikomi_to_kakikomi(input_filepath, output_filepath):
# Pandasを使ってCSVファイルを読み込む
df = pd.read_csv(input_filepath, encoding='shift_jis')
# 読み込んだデータフレームをutf-8で別名で保存する
df.to_csv(output_filepath, encoding='utf-8', index=False)
# 実際にCSVファイルを読み込み、別の文字コードで保存する
csv_yomikomi_to_kakikomi('C:\\renshu.csv', 'C:\\hoka_renshu.csv')
まとめ Pythonで文字コードの指定(ファイル読み込み:書き込み:utf-8など)方法
ここでは、文字コードの指定(sjis:utf-8:open:ファイル読み込み:書き込み:テキスト出力など)方法について確認しました。
Pythonの扱いに慣れ、さらに快適な生活を送っていきましょう。
コメント