tencent cloud

スマート字幕テンプレート

Download
フォーカスモード
フォントサイズ
最終更新日: 2026-03-17 17:17:27

利用シナリオ

スマート字幕機能は、オンデマンド動画やライブストリームの音声を認識し、字幕に変換して多言語翻訳を行うことができます。ライブ字幕や海外向け動画翻訳などに適用されます。カスタムテンプレートを作成することで、様々な用途に応じた処理パラメータを事前に設定して、ご利用いただけます。




前提条件

1. Tencent Cloudアカウントを登録していること。
2. Tencent CloudのMPSサービスを購入し、MPSコンソールにログインしていること。

テンプレート設定ガイド

1. テンプレート管理>メディアAIテンプレート>スマート字幕に移動してください。システムが提供するプリセットテンプレートをそのまま使用するか、スマート字幕テンプレートを作成をクリックしてカスタムテンプレートを作成できます。

2. スマート字幕テンプレート作成画面では、以下の設定パラメータをご利用いただけます。

処理タイプが「ASRによる字幕生成」の場合


以下の設定項目をサポートしています:
設定項目
説明
テンプレート名
中国語、英数字、アンダースコア(_)、ハイフン(-)、ピリオド(.)のみ使用できます。長さは64文字以内にする必要があります。
処理タイプ
ASRによる字幕生成:音声または動画ファイルを入力し、ASRで字幕ファイルを生成して翻訳します。
字幕ファイルの翻訳:入力は字幕ファイルである必要があり、大規模言語モデルを使用して多言語に翻訳し、新しい字幕ファイルを生成します。
処理タイプが「ASRによる字幕生成」の場合
動画言語
動画言語を選択してください。以下は対応している言語のリストです。
ASRのホットワード用語集と関連付ける
音声に含まれる一般的な語彙は正確に認識されますが、特定の人名、製品名、会社名、専門用語(ブランド名「智聆」、ビル名「浜海ビル」、保険業界の「契約査定」、クラウドストレージの「バケット」など)の認識精度は低下する可能性があります。この問題を解決するため、カスタムホットワード用語集機能を提供します。手動での入力やインポートで専門用語を追加し、ASRにおける認識精度を大幅に向上させることができます。詳細な設定方法については、カスタムホットワード用語集ドキュメントをご参照ください。
注意:
現在、用語集は中国語(標準語)および英語のみをサポートするため、動画のソース言語が中国語(簡体字)または英語の場合にのみ、用語集の関連付けがサポートされます。
翻訳を有効にする
有効にすると、ソース言語の字幕を指定された言語に翻訳できます。海外向け動画翻訳などに適しています。
説明:
一部の言語は現在選択できません。ご利用が必要な場合は、お問い合わせください。
ターゲット言語
字幕タイプ
翻訳機能を有効にしなかった場合、出力される字幕にはソース言語の内容のみが含まれます。
翻訳機能を有効にした場合、以下の字幕タイプをサポートしています。
単一言語(ターゲット言語)
二ヶ国語(ソース言語 + ターゲット言語)
字幕ファイル形式
現在、WebVTT、SRT形式をサポートしています。字幕内容のコールバックのみが必要で、字幕ファイルの出力を希望しない場合は、「字幕ファイルを生成しない」を選択できます。

対応言語

処理タイプ「文字認識(OCR)による字幕生成」


以下の設定項目に対応しています。
設定項目
説明
テンプレート名
中国語、英数字、アンダースコア(_)、ハイフン(-)、ピリオド(.)のみ使用できます。64文字以内で入力してください。
処理タイプが「文字認識(OCR)による字幕生成」の場合
字幕エリア
抽出する字幕の位置を選択します。デフォルトでは、動画の中央下部が設定されています。抽出漏れを防ぐため、カスタムに切り替えてプレビュー用の動画または画像をアップロードし、字幕エリアを手動で指定することをお勧めします。
ソース言語
中英:ソース言語が中国語、英語、または中英混合であることを示します。
その他:中国語・英語以外の多言語を示します。
翻訳の有効化
有効にすると、ソース言語の字幕を指定した言語に翻訳できます。動画のローカライズや海外展開などのシナリオに適しています。
注意:
一部の言語は現時点では選択できません。ご利用が必要な場合は、お問い合わせください。
翻訳先言語
字幕ファイル形式
WebVTT、SRTから選択できます。
字幕タイプ
翻訳機能を無効にしている場合、字幕はソース言語の単一言語となります。
翻訳機能を有効にしている場合、字幕は単一言語(翻訳先言語)またはバイリンガル(2行表示、ソース言語+翻訳先言語)を選択できます。

サポート言語

処理タイプは「字幕ファイルの翻訳」の場合


設定項目
説明
テンプレート名
中国語、英数字、アンダースコア(_)、ハイフン(-)、ピリオド(.)のみ使用できます。長さは64文字以内にする必要があります。
処理タイプが「字幕ファイルの翻訳」の場合
ソース言語
デフォルトは「自動認識」ですが、言語を指定することもできます。以下は対応しているソース言語のリストです。
ターゲット言語
有効にすると、ソース言語の字幕を指定した言語に翻訳できます。動画ローカライズや海外展開などのシナリオに適しています。以下は対応しているターゲット言語のリストです。
説明:
一部の言語は現在選択できません。ご利用が必要な場合は、お問い合わせください。
字幕ファイル形式
WebVTT、SRT、または「ソースファイルと同じ」から選択できます。
字幕タイプ
以下のオプションをサポートしています。
単一言語(ターゲット言語):生成される字幕ファイルは、ターゲット言語のみを1行で表示します。
二ヶ国語(ソース言語 + ターゲット言語):生成される字幕ファイルは、ソース言語とターゲット言語を2行で併記します。

対応言語

料金説明

音声認識(ASR)による字幕生成

ソース言語の認識のみの場合、音声認識料金が発生します

処理タイプで「ASRによる字幕生成」を選択し、翻訳を有効にしなかった場合、「音声認識」料金が発生します。料金については料金詳細ドキュメントをご参照ください。


翻訳先言語を1つ選択した場合、「音声翻訳」料金が発生します

処理タイプで「ASRによる字幕生成」を選択し、翻訳を有効にして、1つの翻訳ターゲット言語を選択した場合、「音声翻訳」料金が発生します。料金については料金詳細ドキュメントをご参照ください。


ターゲット言語数が1を超える場合、追加の言語ごとに「字幕翻訳(複数言語)」料金が発生します

処理タイプで「ASRによる字幕生成」を選択し、翻訳を有効にして、n個のターゲット言語を選択した場合、「音声翻訳」× 1 + 「字幕翻訳(複数言語)」× (n-1) の料金が発生します。
以下の設定例の場合、発生する料金は「音声翻訳」× 1 + 「字幕翻訳(複数言語)」× 3 となります。料金については料金詳細ドキュメントをご参照ください。


文字認識(OCR)による字幕生成

ソース言語のみ抽出する場合、「OCR字幕抽出」料金が発生します。

処理タイプで「文字認識(OCR)による字幕生成」を選択し、翻訳を無効にしている場合、「OCR字幕抽出」料金が発生します。料金については、課金説明ドキュメントをご参照ください。


翻訳先言語を1つ選択した場合、「OCR字幕抽出・翻訳」料金が発生します。

処理タイプで「文字認識(OCR)による字幕生成」を選択し、翻訳を有効にして翻訳先言語を1つ選択した場合、「OCR字幕抽出・翻訳」料金が発生します。料金については、課金説明ドキュメントをご参照ください。


翻訳先言語を2つ以上選択した場合、追加言語ごとに「字幕翻訳(追加言語)」料金が発生します。

処理タイプで「文字認識(OCR)による字幕生成」を選択し、翻訳を有効にして翻訳先言語をn個選択した場合、「OCR字幕抽出・翻訳」× 1 +「字幕翻訳(追加言語)」×(n-1)の料金が発生します。
以下の設定例では、「OCR字幕抽出・翻訳」× 1 +「字幕翻訳(追加言語)」× 3 の料金が発生します。料金については、課金説明ドキュメントをご参照ください。


字幕ファイルの翻訳

翻訳先言語を1つ選択した場合、「字幕翻訳」料金が発生します。

処理タイプで「字幕ファイルの翻訳」を選択し、翻訳先言語を1つ選択した場合、「字幕翻訳」料金が発生します。料金については、課金説明ドキュメントをご参照ください。


翻訳先言語を2つ以上選択した場合、追加言語ごとに「字幕翻訳(追加言語)」料金が発生します。

処理タイプで「字幕ファイルの翻訳」を選択し、翻訳先言語をn個選択した場合、「字幕翻訳」× 1 +「字幕翻訳(追加言語)」×(n-1)の料金が発生します。
以下の設定例では、「字幕翻訳」× 1 +「字幕翻訳(追加言語)」× 3 の料金が発生します。料金については、課金説明ドキュメントをご参照ください。



ヘルプとサポート

この記事はお役に立ちましたか?

フィードバック