この記事では、Pythonを用いて特定の文字列を含む行を抽出する方法について解説していきます。ポイントとしては`str.contains()`、`read_csv`、`read_excel`を使用することです。詳しく見ていきましょう!
—
1. pythonにて特定の文字列を含む行を抽出(基本)する方法【`str.contains()`】
基本的なテキストから特定の文字列を含む行を抽出する方法について学びます。
with open('hontekibunsho.txt', 'r') as f:
for line in f:
if 'kensakuMoji' in line:
print(line)
このコードでは、’hontekibunsho.txt’というファイルから、’kensakuMoji’という文字列を含む行を抽出しています。
—
2. pythonにて特定の文字列を含む行を抽出(csv読み込み、csv出力)する方法【`read_csv`, `to_csv`】
CSVファイルから特定の文字列を含む行を抽出し、新しいCSVファイルとして出力する方法について学びます。
import pandas as pd
# CSVファイルを読み込む
data = pd.read_csv('hontekicsv.csv')
# 'kensakuMoji'を含む行を抽出する
filtered_data = data[data['column_name'].str.contains('kensakuMoji', na=False)]
# 新しいCSVファイルとして出力する
filtered_data.to_csv('filtered_hontekicsv.csv', index=False)
—
3. pythonにて特定の文字列を含む行を抽出(excel読み込み、excel出力)する方法【`read_excel`, `to_excel`】
Excelファイルから特定の文字列を含む行を抽出し、新しいExcelファイルとして出力する方法について学びます。
import pandas as pd
# Excelファイルを読み込む
data = pd.read_excel('hontekiexcel.xlsx')
# 'kensakuMoji'を含む行を抽出する
filtered_data = data[data['column_name'].str.contains('kensakuMoji', na=False)]
# 新しいExcelファイルとして出力する
filtered_data.to_excel('filtered_hontekiexcel.xlsx', index=False)
—
4. pythonにて特定の文字列を含む行を抽出(複数キーワード)する方法【`str.contains()`】
複数のキーワードで行を抽出する方法について学びます。
keywords = ['kensakuMoji1', 'kensakuMoji2', 'kensakuMoji3']
with open('hontekibunsho.txt', 'r') as f:
for line in f:
if any(keyword in line for keyword in keywords):
print(line)
このコードでは、複数のキーワードでテキストから行を抽出しています。キーワードは`keywords`リストに追加できます。
—
記事の内容や、指示されたフォーマットに従い、必要な関数やモジュールを記載しました。上記のコードや説明は、実際の環境やデータに応じて適宜調整することができます。
コメント