MySQLが重複行を削除する方法

MySQLは、行と列を持つテーブルにデータを格納するリレーショナルデータセットです。ただし、データベースに保存されているデータには、アプリケーションまたはユーザーのエラーが原因で重複した値が含まれている可能性があります。

このチュートリアルでは、MySQLデータベースの重複行を削除してデータベースのサイズを縮小し、サーバーのパフォーマンスを向上させる方法を学習します。

続行する前に、次のことを前提としています。

MySQLがインストールされ、システムで実行されています
データベースへのルートアクセス権があります。
実験またはテスト用のデータベースにアクセスできます

ノート ：このガイドで提供されている概念を試すためにサンプルデータベースが必要な場合は、Sakilaデータベースを検討するか、このガイドで使用されているデータベースのコピーをダウンロードしてください。

リソースは以下に提供されています：

基本的な使用法

始める前に、テスト目的で重複する値を含むテーブルを意図的に作成します。このアクションを実行するためのSQLクエリは次のとおりです。

使用する世界;
落とすテーブルもしも存在するユーザー;
作成テーブルユーザー（（id INT 主キーいいえヌル自動増加、ユーザー名 VARCHAR （（10）。いいえヌル、フルネーム VARCHAR （（20）。、Eメール VARCHAR （（255）。いいえヌル）。;
入れるの中へユーザー（（ユーザー名、フルネーム、Eメール）。値
（（「乙女座」、「クロード・M・モリ」、 '[メール保護]'）。、
（（'押す'、「ティファニーG.ベイリー」、 '[メール保護]'）。、
（（'ロケット'、「クリストファーS.ペイトン」、 '[メール保護]'）。、
（（「darkmatter」、「パトリシアJ.フォックス」、 '[メール保護]'）。、
（（'主題'、「フェイ・H・ハートリー」、 '[メール保護]'）。、
（（「darkmatter」、「パトリシアJ.フォックス」、 '[メール保護]'）。、
（（'ロケット'、「クリストファーS.ペイトン」、 '[メール保護]'）。、
（（「アルテミス」、「ウェズリーC.ディラード」、 '[メール保護]'）。;

ニーズに合わせて、上記のクエリを自由に変更してください。また、エラーを回避するために、データベース（ワールド）が作成されていることを確認する必要があります。

ここで、テーブル内のすべてのデータをユーザー名順に取得すると、次のように重複が表示されます。

上の表からわかるように、2つの重複する値があり、理由もなくデータベースが大きくなり、速度が低下します。

これらの値を削除する方法を学びましょう。

＃1-結合の削除

データベース内の重複行を削除する1つの方法は、MySQL DELETEJOINステートメントを使用することです。ただし、クエリはIDを使用して重複する値を削除します。

たとえば、上記のusersテーブルの重複する値を削除するには、次のように入力します。

消去表1 からユーザーtable1 内側加入ユーザーtable2 どこ table1.id<table2.id と table1.email=table2.email;

上記のクエリを実行すると、以下の出力に示すように、重複する値が削除されます。

＃2 – Row_Number（）関数

実装できる2番目のメソッドは、MySQLのrow_number（）関数を使用することです。この機能は、MySQLバージョン8以降でサポートされています。

これは、各行に順次int値を割り当て、重複する値を含む行が1より大きい値を取得することによって機能します。

この関数の詳細については、以下のリソースを使用してください。

https://dev.mysql.com/doc/refman/8.0/en/window-function-descriptions.html#function_row-number

重複する値を持つ行のIDを返す以下のクエリについて考えてみます。

選択する id から（（選択する id、ROW_NUMBER（（）。以上（（パーティションユーザー名で注文者ユーザー名）。なので row_var からユーザー）。t1 どこ row_var>> 1;

上記のクエリを実行すると、以下の出力に示すようなIDのリストが表示されます。

+ ---- +
|id|
+ ---- +
| 6 |
| 7 |
+ ---- +
2行の設定（（0.01秒）。

値を削除する場合は、以下に示すように、SELECTステートメントをDELETEステートメントに置き換えるだけです。

消去からユーザーどこ id の（（選択する id から（（選択する id、ROW_NUMBER（（）。以上（（パーティションユーザー名で注文者ユーザー名）。なので row_var からユーザー）。t1 どこ row_var>> 1）。;

最後に、SELECTステートメントを使用して、重複する値が削除されていることを確認できます。

結論

このチュートリアルでは、データベースから重複する値を削除する2つの方法について説明しました。大規模なデータベース、特に一般的に使用されているデータベースには、外部インポートやその他のエラーからの重複値が多数含まれている場合があります。したがって、アプリケーションが最適に実行されるようにするには、重複する値をパージし続ける必要があります。

MySQLが重複行を削除する方法

基本的な使用法

＃1-結合の削除

＃2 – Row_Number（）関数

結論

カテゴリ

人気の投稿

MATLAB での行列の除算はどのように機能するか

プレーン JavaScript の「hasClass」関数とは

Windows 用 GCC コンパイラーをインストールする方法

jQueryのscrollLeft()メソッドとは何ですか

PostgreSQL TO_CHAR() 日付の場合

jQuery で Hide() と fadeOut()、show() と fadeIn() を区別する方法は?

C# ステートメントを使用して

プロファイリングツールを使用して Python コードを最適化する方法

Xbox Live を Discord に追加する方法

Oracle シーケンス Nextval 関数

PowerShell で Out-String (Microsoft.PowerShell.Utility) コマンドレットを使用する方法

Microsoft Word の料金: 価格ガイド

Salesforce への LWC コンポーネントの追加

MySQL でリストをクエリする方法

Android でテキストメッセージが配信されないのはなぜですか

バッシュカットの例

C++ でブール式を使用する方法

DSM 7 を実行している Synology NAS に Porttainer Docker Web UI をインストールする方法

JavaScript でマップ値を配列に変換する方法

Windowsで「C:\Windows\System32\LogiLDA.dllを起動中に問題が発生しました」の7つの修正