この記事では、Pythonを空白を削除・消す(文字列のスペースや空白行)する方法について解説していきます。
ポイントとしては、
`pandas`ライブラリ
・文字列の空白削除:.str.replace()
・空白行の削除:.dropna
を使用することです。
なお、下記の解説では完全な初心者でもわかりやすいようにあえて変数名を少々変わった名称にしています。そのため、ご活用の際には適切な英語表記に変更してご利用ください。
それでは詳しく見ていきましょう!」
Pythonで文字列の空白を削除する【Pandas:.str.replace()】
それではまず、文字列の空白の一括削除方法について解説していきます。
jupyter notebookなどの各開発環境を開いて、以下コードをコピペしましょう。
import pandas as pd
# CSVファイルを読み込む
df = pd.read_csv('sample.csv')
# '練習'列の文字列から空白を削除し、新しい列'削除済み列'に格納
df['sakujozumi'] = df['練習'].str.replace(' ', '')
# 結果をExcelファイルに出力
df.to_excel('output.xlsx', index=False)
このコードでは、まずpandasライブラリを用いてCSVファイルを読み込みます。
次に`str.replace`メソッドを使用して、指定した列の文字列からすべての空白を削除し、新しい列にその結果を保存します(具体的にはスペース’ ‘を完全な空白”に置換してスペースを削除している)。
最後に、修正したデータフレームをExcelファイルとして出力します(もちろんcsvのままなど、任意の形式で出力できますので、好みでコードを修正してみてくださいませ(^^)/)。
Pythonで空白行を削除する
続いては、空白行の削除についてpandasでcsvを読み込んだものを使用して、解説していきます。
行方向に1つでも空白があれば、その行を消し、.xlsx(エクセルファイル)として出力できるものとなっています。
jupyter notebookなどの各開発環境を開いて、以下コードをコピペしましょう。
import pandas as pd
# CSVファイルを読み込む
df = pd.read_csv('sample.csv')
# 空白を含む行を削除
df = df.dropna()
# 結果をExcelファイルに出力
df.to_excel('output.xlsx', index=False)
ここでは、`dropna`メソッド(欠損値NANを削除する)を用いて、データフレームから空白を含む行を削除しています。
そして、最後に修正されたデータをExcelファイルとして出力しています(こちらも同様にcsvのままなど、任意の形式で出力できますので、好みでコードを修正してみてくださいませ(^^)/)
まとめ
これらのステップにより、Pythonで効果的に文字列の空白を削除する方法を理解できます。初心者でも容易に扱えるこれらの手法は、データの前処理や整理において非常に有用です。
コメント