データベースやデータ ウェアハウスでのデータのホスティングと管理は、常に多忙で面倒な作業でした。データを理解するには多くのリソースと計算能力が必要です。アマゾン ウェブ サービスには、この目的のためのワンストップ ソリューションがあります。ユーザーのデータウェアハウスを完全に管理する Amazon Redshift と呼ばれるサービスがあります。
この記事では、Amazon Redshift とそのデータ ウェアハウス アーキテクチャについて詳しく説明します。 Redshift のデータ ウェアハウス システム アーキテクチャのすべてのコンポーネントについて詳しく説明します。
Amazon Redshift とは何ですか?
IT は Amazon が提供するデータ ウェアハウジング サービスです。分析とレポート作成のために大規模なデータセットを効率的に管理および分析します。これは、円柱型ストレージ モデルに基づいて構築されています。リーダー ノードによって制御される計算ノードのクラスターを使用して、高性能のデータ処理を提供します。
さまざまなソースからデータを取得し、それをプールしてデータ ウェアハウスを作成します。データ共有やリアルタイム分析などのさまざまな機能を提供します。 Amazon Redshift の特徴と機能を理解するには、以下の画像を参照してください。
ここで、そのデータ ウェアハウス システム アーキテクチャに目を向けましょう。
Amazon Redshift データ ウェアハウス システム アーキテクチャとは何ですか?
このシステム アーキテクチャには 3 つのコア部分があります。これらの部分は次のとおりです。
- ストレージ
- 加速度
- 計算
それらの目的を理解しましょう。
ストレージ
ストレージ部分は Redshift が持つストレージ サービスを扱います。独自のマネージド ストレージ サービス オプションと S3 バケット オプションがあります。
加速度
高速化部分は、使用中のストレージ サービスと使用される計算能力に依存します。 Redshift 管理のストレージは他のストレージ オプションと比較して高速です
計算
計算部分は、使用中の計算能力を完全に扱います。計算はクラスターで行われ、クラスターにはノードがあります。ノードにはスライスが存在します。
このアーキテクチャのすべての要素とコンポーネントをより深く理解するには、以下の画像を参照してください。
その構成要素を一つ一つ理解していきましょう。
Amazon Redshift のアーキテクチャコンポーネントとは何ですか?
以下は、Amazon Redshift のアーキテクチャコンポーネントです。
- クラスター
- ノード
- ノードスライス
- ストレージ
- 内部ネットワーク
- データベース
これらについて 1 つずつ説明していきます。
クラスター
クラスターは基本的かつ中核的な単位です。それは多数のノードで構成されます。クラスターが複数の計算ノードで構成されている場合、追加のリーダー ノードが介入して、これらの計算ノードのアクティビティを調整し、外部通信を管理します。
ノード
クラスター内のノードには 2 つのタイプがあります。これらは:
- リーダーノード
- 計算ノード
これらを 1 つずつ理解してみましょう。
リーダーノード
クライアント プログラムとの通信を管理し、計算ノードとの対話を調整します。リーダー ノードは、複雑なクエリを実行する際に重要な役割を果たします。計算ノードに配布される実行計画に基づいてコードをコンパイルし、データ部分を個々の計算ノードに割り当てます。
計算ノード
コンピューティング ノードは、Amazon Redshift アーキテクチャのバックボーンです。データの保存と処理の両方を実行します。これらには、メモリや CPU などの専用リソースがあります。
ノードスライス
計算ノードはさらにスライスに分割されます。これらのスライスは連携して、割り当てられたワークロードを処理し、並列処理を実現してクエリ処理を強化します。
ストレージ
Amazon Redshift内のデータストレージは「Redshift Managed Storage(RMS)」によって管理されます。 「Amazon S3」ストレージを使用してストレージを独立して拡張する機能を備えています。 RMS は、高性能 SSD ベースのローカル ストレージを階層 1 キャッシュとして使用し、パフォーマンスを最適化します。
内部ネットワーク
Amazon Redshift のこの内部ネットワークは、リーダー ノードとコンピューティング ノード間の迅速かつ安全な通信に役立ちます。このネットワークはクライアント アプリケーションから直接アクセスできません。
データベース
クラスターには 1 つ以上のデータベースがあります。これらのデータベースのデータは計算ノード上にあります。クライアント アプリケーションはリーダー ノードと通信します。計算ノードは、計算ノード全体でのクエリの実行を管理します。
これは、Amazon Redshift とそのアーキテクチャ要素に関するすべてです。この記事では、Amazon Redshift の動作コンポーネントについて包括的に説明しました。
結論
Amazon Redshift のアーキテクチャが、その機能の基盤となっています。リーダー ノードはコンピューティング ノードを制御および管理し、ノード スライスは並列処理に役立ちます。 Redshift Managed Storage は、SSD ベースのストレージを使用してパフォーマンスを向上させます。この記事では、Amazon Redshift Data Warehouse システム アーキテクチャについて説明しました。