Google スプレッドシートで重複を削除する

Google Supureddoshitode Zhong Fuwo Xue Chusuru



重複データは、混乱、エラー、偏った洞察を引き起こす可能性があります。幸いなことに、Google スプレッドシートは、これらの冗長なエントリを特定して削除するタスクを簡素化するための多くのツールとテクニックを提供します。基本的なセルの比較から数式ベースの高度なアプローチまで、乱雑なシートを整理された貴重なリソースに変換するための準備が整います。
顧客リスト、調査結果、その他のデータセットを扱う場合でも、重複エントリを排除することは、信頼性の高い分析と意思決定への基本的なステップです。
このガイドでは、重複した値を特定して削除するための 2 つの方法について詳しく説明します。

テーブルの作成

まず、Google スプレッドシートで表を作成しました。この表は、この記事の後半の例で使用します。このテーブルには 3 つの列があります。列 A にはヘッダー「Name」があり、名前が格納されます。列 B には「年齢」というヘッダーがあり、人々の年齢が格納されます。最後に、列 C のヘッダー「都市」には都市が含まれます。観察すると、「John」と「Sara」のエントリなど、このテーブルの一部のエントリが重複しています。









このテーブルを操作して、さまざまな方法でこれらの重複値を削除します。



方法 1: Google スプレッドシートの「重複の削除」機能を使用する

ここで説明する最初の方法は、Google スプレッドシートの「重複の削除」機能を利用して重複値を削除することです。この方法では、選択したセル範囲から重複したエントリが完全に削除されます。





この方法を実証するために、上記で生成されたテーブルを再度検討します。

この方法の作業を開始するには、まず、ヘッダーを含むデータを含む範囲全体を選択する必要があります。このシナリオでは、セルを選択しました A1:C11



Google スプレッドシート ウィンドウの上部には、さまざまなメニューを備えたナビゲーション バーが表示されます。ナビゲーションバーで「データ」オプションを見つけてクリックします。

[データ] オプションをクリックするとドロップダウン メニューが表示され、データの分析、クリーニング、操作に使用できるさまざまなデータ関連のツールと機能が表示されます。

この例では、「データ」メニューにアクセスして、「重複の削除」機能を含む「データ クリーンアップ」オプションに移動する必要があります。

[重複の削除] ダイアログ ボックスにアクセスすると、データセット内の列のリストが表示されます。これらの列に基づいて重複が検出され、削除されます。重複の識別に使用する列に応じて、ダイアログ ボックス内の対応するチェックボックスをオンにします。

この例には、「名前」、「年齢」、「市区町村」の 3 つの列があります。 3 つの列すべてに基づいて重複を特定したいため、3 つのチェックボックスをすべてオンにしました。それとは別に、テーブルにヘッダーがある場合は、「データにヘッダー行がある」チェックボックスをオンにする必要があります。上記のテーブルにはヘッダーがあるため、「データにヘッダー行がある」チェックボックスをオンにしました。

重複を特定する列を選択したら、データセットからそれらの重複を削除する作業に進むことができます。

[重複の削除] ダイアログ ボックスの下部に、[重複の削除] というラベルのボタンがあります。このボタンをクリックしてください。

[重複を削除] をクリックすると、Google スプレッドシートがリクエストを処理します。列がスキャンされ、それらの列に重複する値を持つ行が削除され、重複が正常に排除されます。

ポップアップ画面で、重複した値がテーブルから削除されたことが確認されます。これは、2 つの重複行が検出されて削除され、テーブルに 8 つの一意のエントリが残ったことを示しています。

「重複の削除」機能を使用すると、テーブルが次のように更新されます。

ここで考慮すべき重要な点は、この機能を使用した重複の削除は永続的なアクションであるということです。重複する行はデータセットから削除され、データのバックアップがない限り、この操作を元に戻すことはできません。したがって、選択内容を再確認して、重複を見つけるために正しい列を選択していることを確認してください。

方法 2: UNIQUE 関数を使用して重複を削除する

ここで説明する 2 番目の方法は、 個性的 Googleスプレッドシートの関数。の 個性的 関数は、指定されたデータ範囲または列から個別の値を取得します。元のデータから重複を直接削除するわけではありませんが、重複のないデータ変換や分析に使用できる一意の値のリストが作成されます。

この方法を理解するために例を作成してみましょう。
このチュートリアルの最初の部分で生成されたテーブルを使用します。すでにご存知のとおり、テーブルには重複した特定のデータが含まれています。したがって、セル「E2」を選択して、 個性的 式を入力します。書いた式は次のとおりです。

=ユニーク(A2:A11)

Google スプレッドシートで使用すると、UNIQUE 数式は別の列で一意の値を取得します。したがって、この数式にはセルからの範囲を指定しました A2 A11 、これは列 A に適用されます。したがって、この数式は列から一意の値を抽出します。 式が書かれた欄に表示されます。

Enterキーを押すと指定した範囲に数式が適用されます。

このスナップショットでは、2 つのセルが空白であることがわかります。これは、テーブル内で 2 つの値 (John と Emily) が重複しているためです。の 個性的 関数は、各値の 1 つのインスタンスのみを表示します。

このメソッドは、指定された列から重複した値を直接削除するのではなく、別の列を作成してその列の一意のエントリを提供し、重複を排除します。

結論

Google スプレッドシートで重複を削除することは、データ分析に有益な方法です。このガイドでは、データから重複エントリを簡単に削除できる 2 つの方法を説明しました。最初の方法では、Google スプレッドシートを使用して重複した機能を削除する方法について説明しました。このメソッドは、指定されたセル範囲をスキャンして重複を削除します。これまでに説明したもう 1 つの方法は、重複値を取得するための式を使用することです。範囲から重複を直接削除するわけではありませんが、代わりに新しい列に一意の値が表示されます。