Pandas データフレーム ユニーク

Pandas Detafuremu Yuniku



データ サイエンスで利用される最も人気のある Python ライブラリは Pandas と呼ばれます。 Python プログラマーに高性能で使いやすいデータ分析ツールを提供します。基本的な機能とその利用方法を理解すれば、Pandas はデータを変更するための強力なツールになります。 「pandas」では、データを表形式で格納するための標準的な方法は DataFrame です。 「pandas」DataFrame の列で一意の値を取得するために、いくつかの「pandas」メソッドを利用できます。 DataFrame の列で一意の値を取得する必要があり、「pandas」DataFrame の列で値を重複させたくない場合は、「pandas」がこれを行うために提供するメソッドを使用できます。 DataFrame の「pandas」列で一意の値を取得するためのいくつかの例と出力とともに、このガイドでそのようなメソッドを見てみましょう。

「pandas」DataFrame の列で一意の値を取得する方法

「pandas」DataFrame の列で一意の値を取得するには、2 つの方法を利用できます。重複する値を削除し、DataFrame の列で一意の値のみを取得します。このタスクを実行するために「pandas」が提供するメソッドは次のとおりです。







  • unique() メソッドを利用する。
  • drop_dupliactes() メソッドを利用する。

ここで、「pandas」DataFrame の列で一意の値を取得するために、「pandas」コードで両方のメソッドを利用します。



例 # 01

ここでは、「Spyder」アプリを使用してこれらの「pandas」コードを生成し、「pandas」DataFrame の列で一意の値を取得するのに役立つメソッドを利用します。 DataFrame を作成する前に、「pandas」コードに必要な「pandas」モジュールをインポートする必要があります。 「インポート」という用語を使用し、「pandas as pd」を配置することで、これらのモジュールをインポートします。



これで、「pd」の助けを借りて、「pandas」関数またはメソッドをすばやく取得できます。次に、「Name」を追加する「Subject_data」を入力し、「Name」に「Roman、William、Peter、Smith、John、Milli、Thomas、および James」という名前のデータを追加します。次に、「Subj」に「Math, Economics, Science, Math, Statistics, Statistics, Statistics, and Computer」という科目データを追加します。次に、この「Subject_data」を「pd.DataFrame()」メソッドを使用して「Subject_df」DataFrame に変換します。 「Subject_df」を「print()」メソッドに配置して、端末に表示されるようにします。





ここで、「pandas」DataFrame の列「Subj」で一意の値を取得したいと考えています。この目的のために、ここでは「unique()」メソッドを使用し、以下に示すように列の名前と DataFrame の名前を追加します。このメソッドを「print()」に追加して、結果が端末にも表示されるようにします。



ここで、このコードの結果を取得するために「Shift + Enter」を押しています。これはターミナルでレンダリングされ、ここにも示されています。これには、すべての値を持つ DataFrame が含まれています。これは、コードに追加した元の DataFrame で、その下に「Subj」列の一意の値が表示されます。重複する値を削除し、DataFrame の「Subj」列の一意の値を表示します。

例 # 02

いくつかの情報を含む「Sample_list」を作成します。このリストを DataFrame に変換すると、最初の列として表示される「Layla、21、28、31、14、および 39」を挿入します。次に、DataFrame の 2 行目に「Lusy, 31, 25, 34, 26, and 21」を追加します。この後、「Peter, 38, 20, 20, 35, and 24」と「Layla 38, 23, 39 24, 23」が DataFrame の 3 行目と 4 行目になります。また、「Stella, 21, 24, 24, 28, 31」、「Layla, 33, 32, 26, 30, 25」、「Peter, 21, 21, 31, 21, 29」の 3 つのデータを挿入します。 .

ここで「pd.DataFrame()」関数を入れて、「Sample_list」をDataFrameの名前である「DF_Sample」に変換しています。また、この DataFrame の列の名前を設定し、これらの名前は「Name、Ass_1、Ass_2、Ass_3、Ass_4、および Ass_5」です。次に、DataFrame「DF_Sample」の表示に役立つ「print()」を使用します。この例では、DataFrame の列で一意の値を取得するために別の方法を使用しています。このメソッドは「pandas」の「drop_duplicates()」メソッドです。

「drop_duplicates()」メソッドでは、DataFrame の列で一意の値を取得する列の名前を設定します。 「drop_duplicates()」メソッドを使用してこの列の重複値をドロップすることで「名前」列の一意の値を取得し、ここで「print()」関数を使用してこれらの一意の値をレンダリングします。

重複する名前は削除され、「drop_duplicates()」メソッドを適用した後に一意の値がレンダリングされます。 「名前」列の 3 つのセルに「Layla」という名前が表示されていることに注意してください。しかし、「drop_duplicates()」メソッドがこの列に適用されると、すべての重複値が削除され、1 つの「Layla」名が画面に表示されます。重複する値を削除した後、この「名前」列に一意の値を含む新しい DataFrame が表示されました。このようにして、「drop_duplicates()」メソッドを使用して、重複する値を削除し、DataFrame の列で一意の値を取得できます。

例 # 03

同じ DataFrame が再び利用され、ここで「unique()」メソッドが適用されます。 「unique()」メソッドを使用して、列の名前と、一意の値を取得するためにこの「unique()」メソッドを適用する DataFrame の名前を配置します。これは、その列の一意の値のみをレンダリングし、これらの値を DataFrame の形式で表示しません。

ここでは、DataFrame の「Name」列に 7 つの値が含まれていますが、この列に「unique()」メソッドを適用すると、4 つの値のみが表示され、これらがその列の一意の値になります。重複する値はレンダリングされません。

例 # 04

この例で作成する DataFrame は「F_G_df」です。この DataFrame に「My_fruits」と「my_Vegs」を挿入します。 「My_fruits」列には、「Apple、Orange、Apple、Pear、Lychee、Apple、Apple、Pear、および Apple」が含まれています。次に、「Chilli、Bringle、Carrot、Potato、Potato、Carrot、Onion、Garlic、および Ginger」という野菜の名前を含む「My_Vegs」があります。この DataFrame には 2 つの列しか含まれていません。

これで、「unique()」メソッドを使用して、両方の列で一意の値を取得しています。 DataFrame の名前について言及します。次に、列の最初の列名を入れます。この後、append() メソッドを使用します。この追加では、DataFrame の名前と 2 番目の列名を再度配置し、「unique()」メソッドを配置します。これにより、両方の列の一意の値が取得され、両方の列の一意の値が追加されて画面に表示されます。

最初に、すべての値を含む DataFrame がレンダリングされます。この後、「unique()」メソッドが適用され、両方の列の一意の値が以下に表示されます。このコードでは、「unique()」メソッドを使用して、DataFrame の複数の列で一意の値を取得します。

結論

DataFrame の列で一意の値を取得する方法の完全な説明は、このガイドにあります。 DataFrame の列の一意の値を取得するのに役立つ「unique()」および「drop_duplicates()」メソッドについて説明しました。コードでこれらのメソッドを使用することにより、「pandas」コードでこれらのメソッドを使用する方法を調べました。このガイドではさまざまな例を示し、「unique()」メソッドと「drop_duplicates()」メソッドを使用して 1 つの列の一意の値を取得する方法を示しました。このガイドでは、「unique()」メソッドを利用して、複数の列で一意の値を取得する方法についても説明しました。