Pandas 読み取りテキスト ファイル

Pandas Dumi Quritekisuto Fairu



「『pandas』では、『pandas』メソッドを使用してテキスト ファイルを簡単に読み取ることができます。 「パンダ」は、テキスト ファイルを読み取る機会を提供してくれます。 「パンダ」には、テキスト ファイルを読み取るためのさまざまな組み込みメソッドが用意されています。このチュートリアルのすべてのメソッドと、ここにあるすべてのパラメーターについて説明し、詳細に説明します。また、ここのコードで「pandas」のメソッドを使用して、「pandas」のテキスト ファイルを読み取ります。

「pandas」でのテキスト ファイルの読み取り方法

「pandas」には、テキスト ファイルの読み取りに役立つ 3 つの方法があります。ここでは、テキスト ファイルを読み取る例もいくつか示しました。 「パンダ」が提供するメソッドについては、以下で説明します。







    • pd.read_csv() メソッドを利用する。
    • pd.read_table() メソッドを利用する。
    • pd.read_fwf() メソッドを利用する。

このチュートリアルでは、これらすべてのメソッドの構文を説明し、すべてのメソッドのパラメーターについても詳しく説明しています。



read_csv() の構文



pd.read_csv ( 「ファイル名.txt」、 9月 =' ', ヘッダ =なし、 名前 = [ 「Col_name1」、「Col_name2」、「Col_name2」、………….. ] )


このメソッドでは、最初に、データを読み取りたいテキスト ファイルの名前を追加します。これは、このメソッドの最初のパラメーターです。次に、このメソッドのセパレーターである「sep」を配置し、ここにスペースを文字として配置して、スペースがセパレーターと見なされるようにします。この後、ヘッダー パラメーターがあり、このパラメーターの「なし」値が使用されるため、既定のヘッダーが作成されます。このパラメーターを追加しない場合は、テキスト ファイルの最初の行が考慮されます。ヘッダーとして。 「names」パラメーターでは、ヘッダーとして追加する必要がある列名を追加できます。





read_table() の構文

pd.read_table ( 「ファイル名.txt」 、区切り記号 = ' ' )


このメソッドでは、テキスト ファイルのファイル名を最初のパラメーターとして指定します。区切り文字に「 」を配置すると、スペース文字が区切り文字として使用されます。



read_fwf() の構文

pd.read_fwf ( 「ファイル名.txt」 )


このメソッドは、テキスト ファイルの名前である 1 つのパラメーターのみを受け取ります。

ここで、これらのメソッドを使用して、「pandas」コードでテキスト ファイルを読み取り、テキスト ファイルのデータを端末に表示します。

例 # 01

「Spyder」アプリはここにあり、このチュートリアルで提示されているすべてのコードを実行しています。データを読みたいテキストファイルを以下に示します。このテキストファイルを「pandas」で読み込むには、「read_csv()」メソッドを使用します。


「read_csv()」メソッドを利用したいので、最初に「pandas」ライブラリをインポートします。これは「pandas」のメソッドです。 「pandas」のライブラリをインポートした場合にのみ、このメソッドにアクセスします。ここでは「pandas as pd」と記載しているので、この「pd」はそれを使用するメソッドの名前で配置されています。この後、ここで変数「df」を作成します。これは、読み取り後のテキスト ファイルのデータを格納するために使用されます。ここに「pd.read_csv()」メソッドを配置します。これは、テキスト ファイルを読み取り、テキスト ファイル データを DataFrame に変換して「df」変数に格納するのに役立ちます。

ここでは「myData.txt」というファイル名を渡し、「sep」を使用して、この「sep」に空白文字を割り当てます。したがって、この空白文字はテキスト ファイルの区切り文字として機能します。そこで、テキストファイルのデータを印刷する以下の「print()」を利用しました。テキストファイルのデータをDataFrame形式で表示します。


このコードを実行するには、「Shift + Enter」を押す必要があり、出力は「Spyder's」ターミナルでレンダリングされます。上記のコードの結果が特定のスクリーンショットに表示され、テキスト ファイルのデータが DataFrame として表示され、テキスト ファイルの最初の行がその DataFrame の列名としてここに表示されていることがわかります。また、テキスト ファイルにスペース文字が存在するデータも区切ります。

例 # 02

この例で読み取るテキスト ファイルを次に示します。ここでも「read_csv()」メソッドを使用しますが、パラメーターは異なります。


「pandas」メソッド「pd.read_csv()」が使用され、ここで 3 つのパラメーターを渡します。まず、「Record.txt」というファイル名を配置します。 2 番目のパラメーターは「sep」パラメーターで、それに空白文字を割り当てます。次に、「header」を設定して「None」に調整する 3 番目のパラメーターがあるため、DataFrame のデフォルトのヘッダーが作成されます。このコードを実行すると。これらすべてを「My_Record」変数に保存し、印刷用に「print()」関数に「My_Record」を追加しました。


すべてのデータは DataFrame に保存され、テキスト ファイルのデータで空白文字が存在するデータを区切ります。また、「header」パラメータを「None」に調整したため、ここで DataFrame のデフォルト ヘッダーを作成しました。

例 # 03

この例のテキスト ファイルが表示され、変更されたパラメーターを使用して「read_csv()」メソッドをもう一度使用します。


このコードでは、ここで 4 つのパラメーターが「pandas」メソッド「pd.read_csv()」に渡されます。テキスト ファイルの名前は、最初のパラメーターです。 「sep」パラメータには、2 番目のパラメータで空白文字が与えられます。第3引数に「header」パラメータを「None」に設定し、第4引数にテキストファイルを読み込んだ後にDataFrameの列名として現れる「names」を設定しており、これらの列名は「COL_1、COL_2、COL_3、COL_4、および COL_5」。この情報はすべて「My_Record」変数に保存されており、「My_Record」も「print()」メソッドに追加されているため、端末に出力されます。


テキスト ファイルのすべての情報がここに DataFrame としてレンダリングされ、テキスト ファイル内のスペースが追加されたデータも分離されます。それに応じて、上記のコードで追加した列名も追加されます。

例 # 04

これは、この例で別のメソッド「pd.read_table()」メソッドを使用して読み取るテキスト ファイルです。


ここで、テキスト ファイルを読み取るための「pd.read_table()」メソッドを追加し、テキスト ファイルの名前である「ABC.txt」を追加します。このメソッドは、テキスト ファイルの読み取りに役立ちます。また、「delimiter」パラメーターをスペース文字に調整したため、上記で説明したセパレーターのようにも機能します。次に、すべてのテキストのファイル データが「My_Data」変数に保存され、ここにも出力されます。


ここでは、テキスト ファイルの最初の行が DataFrame の列名として表示され、テキスト ファイルのデータが DataFrame として出力されます。さらに、スペース文字が存在するテキスト ファイルのデータを区切ります。

例 # 05

これで、テキスト ファイルにデータが含まれるようになりました。これを以下に示します。今回は「read_fwf()」を適用し、テキスト ファイルを読み取った後にデータをレンダリングする方法を示します。


この「read_fwf()」メソッドは、読み取りたいファイル名である 1 つのパラメーターのみを取ることがわかっているためです。ここで、テキスト ファイルの名前である「textfile.txt」を追加し、この pandas メソッドを「File_Data」変数に割り当てます。この変数は、このテキスト ファイルのデータを保存します。次に、「print(File_Data)」を配置して、このデータも印刷します。


ここでは、テキスト ファイルのすべてのデータが表示されます。この関数には「Sep」や「delimiter」などのパラメータがないため、空白文字が存在するデータを区切りませんでした。

結論

このチュートリアルでは、「pandas」でテキスト ファイルを読み取る方法と、「pandas」でテキスト ファイルを読み取るために使用されるメソッドについて説明します。 「pandas」でテキスト ファイルを読み取るのに役立つすべての方法について説明しました。このチュートリアルでは、「pandas」でテキスト ファイルを読み取るための「pandas」の 3 つの異なる方法を調べました。ここでは、すべてのメソッドの構文とすべてのメソッドのパラメーターについても詳しく説明し、このチュートリアルで可能なすべてのパラメーターを使用してさまざまなメソッドを適用することにより、多くのテキスト ファイルを読みました。