Amazon Redshift データ ウェアハウス システム アーキテクチャとは何ですか?

Amazon Redshift Deta U Eahausu Shisutemu Akitekuchatoha Hedesuka



データベースやデータ ウェアハウスでのデータのホスティングと管理は、常に多忙で面倒な作業でした。データを理解するには多くのリソースと計算能力が必要です。アマゾン ウェブ サービスには、この目的のためのワンストップ ソリューションがあります。ユーザーのデータウェアハウスを完全に管理する Amazon Redshift と呼ばれるサービスがあります。

この記事では、Amazon Redshift とそのデータ ウェアハウス アーキテクチャについて詳しく説明します。 Redshift のデータ ウェアハウス システム アーキテクチャのすべてのコンポーネントについて詳しく説明します。







Amazon Redshift とは何ですか?

IT は Amazon が提供するデータ ウェアハウジング サービスです。分析とレポート作成のために大規模なデータセットを効率的に管理および分析します。これは、円柱型ストレージ モデルに基づいて構築されています。リーダー ノードによって制御される計算ノードのクラスターを使用して、高性能のデータ処理を提供します。



さまざまなソースからデータを取得し、それをプールしてデータ ウェアハウスを作成します。データ共有やリアルタイム分析などのさまざまな機能を提供します。 Amazon Redshift の特徴と機能を理解するには、以下の画像を参照してください。







ここで、そのデータ ウェアハウス システム アーキテクチャに目を向けましょう。

Amazon Redshift データ ウェアハウス システム アーキテクチャとは何ですか?

このシステム アーキテクチャには 3 つのコア部分があります。これらの部分は次のとおりです。



  • ストレージ
  • 加速度
  • 計算

それらの目的を理解しましょう。

ストレージ
ストレージ部分は Redshift が持つストレージ サービスを扱います。独自のマネージド ストレージ サービス オプションと S3 バケット オプションがあります。

加速度
高速化部分は、使用中のストレージ サービスと使用される計算能力に依存します。 Redshift 管理のストレージは他のストレージ オプションと比較して高速です

計算
計算部分は、使用中の計算能力を完全に扱います。計算はクラスターで行われ、クラスターにはノードがあります。ノードにはスライスが存在します。

このアーキテクチャのすべての要素とコンポーネントをより深く理解するには、以下の画像を参照してください。

その構成要素を一つ一つ理解していきましょう。

Amazon Redshift のアーキテクチャコンポーネントとは何ですか?

以下は、Amazon Redshift のアーキテクチャコンポーネントです。

  • クラスター
  • ノード
  • ノードスライス
  • ストレージ
  • 内部ネットワーク
  • データベース

これらについて 1 つずつ説明していきます。

クラスター
クラスターは基本的かつ中核的な単位です。それは多数のノードで構成されます。クラスターが複数の計算ノードで構成されている場合、追加のリーダー ノードが介入して、これらの計算ノードのアクティビティを調整し、外部通信を管理します。

ノード

クラスター内のノードには 2 つのタイプがあります。これらは:

  • リーダーノード
  • 計算ノード

これらを 1 つずつ理解してみましょう。

リーダーノード
クライアント プログラムとの通信を管理し、計算ノードとの対話を調整します。リーダー ノードは、複雑なクエリを実行する際に重要な役割を果たします。計算ノードに配布される実行計画に基づいてコードをコンパイルし、データ部分を個々の計算ノードに割り当てます。

計算ノード
コンピューティング ノードは、Amazon Redshift アーキテクチャのバックボーンです。データの保存と処理の両方を実行します。これらには、メモリや CPU などの専用リソースがあります。

ノードスライス
計算ノードはさらにスライスに分割されます。これらのスライスは連携して、割り当てられたワークロードを処理し、並列処理を実現してクエリ処理を強化します。

ストレージ
Amazon Redshift内のデータストレージは「Redshift Managed Storage(RMS)」によって管理されます。 「Amazon S3」ストレージを使用してストレージを独立して拡張する機能を備えています。 RMS は、高性能 SSD ベースのローカル ストレージを階層 1 キャッシュとして使用し、パフォーマンスを最適化します。

内部ネットワーク
Amazon Redshift のこの内部ネットワークは、リーダー ノードとコンピューティング ノード間の迅速かつ安全な通信に役立ちます。このネットワークはクライアント アプリケーションから直接アクセスできません。

データベース
クラスターには 1 つ以上のデータベースがあります。これらのデータベースのデータは計算ノード上にあります。クライアント アプリケーションはリーダー ノードと通信します。計算ノードは、計算ノード全体でのクエリの実行を管理します。

これは、Amazon Redshift とそのアーキテクチャ要素に関するすべてです。この記事では、Amazon Redshift の動作コンポーネントについて包括的に説明しました。

結論

Amazon Redshift のアーキテクチャが、その機能の基盤となっています。リーダー ノードはコンピューティング ノードを制御および管理し、ノード スライスは並列処理に役立ちます。 Redshift Managed Storage は、SSD ベースのストレージを使用してパフォーマンスを向上させます。この記事では、Amazon Redshift Data Warehouse システム アーキテクチャについて説明しました。