操作シナリオ
データのフルロードを実行する際、TDSQL-C for MySQLの読み書きインスタンスにある程度のリソースオーバーヘッドが発生します。特にデータ量の多いクラスタで一括データロードを行う場合、リソース制約のあるインスタンスでは読み書きインスタンスのパフォーマンス安定性に影響を及ぼす可能性があります。以下の方法でデータロードプロセスにおけるTDSQL-C for MySQL読み書きインスタンスへの影響を制御し、ソース側のリソース消費を削減できます。ただしこのような操作は行指向ストレージから列指向ストレージへのデータロード効率を低下させるため、ビジネスの実際の状況に基づいて調整してください。
前提条件
インスタンス形態がプロビジョニングリソースであるクラスタをご用意ください。詳細についてはクラスタの作成をご参照ください。 クラスタの状態は稼働中です。
データロード速度の制御
フルデータロードシナリオにおける単一テーブルデータ読み出しの同時実行数を調整する
パラメータ調整機能を通じて、replication_dumper_select_parallelパラメータを変更します。このパラメータは、同一オブジェクトに対するデータ読み出しの同時実行数を表します。この値が大きいほど、テーブルデータの読み取り範囲が広くなり、リソースが十分なシナリオではロード効率が向上します。リソースが不足している場合は、この値をより小さく設定することをお勧めします。操作の詳細についてはインスタンスパラメータの設定をご参照ください。 フルデータロードシナリオにおける単一テーブルデータ読み出しの行数を調整する
パラメータ調整機能を通じて、replication_dumper_chunk_sizeパラメータを変更します。このパラメータは、同一オブジェクトに対する単一データ読み出し操作で取得するデータ行数を表します。この値が大きいほど、1回の読み出しで取得するデータ量が多くなります。リソースが十分なシナリオではロード効率が向上しますが、リソースが不足している場合は、この値をより小さく設定することをお勧めします。操作の詳細についてはインスタンスパラメータの設定をご参照ください。 フルデータロードシナリオにおける総データ読み出し同時実行数を調整する
パラメータ調整機能を通じて、replication_dumper_table_parallelパラメータを変更します。このパラメータは同時に何枚のテーブルに対してデータ読み出しを実行できるかを表し、値が大きいほど同時処理可能なテーブル数が増加します。リソースが十分な場合、データロードの効率がより速くなります。操作の詳細についてはインスタンスパラメータの設定をご参照ください。