tencent cloud

Media Processing Service

動向とお知らせ
Release Notes
お知らせ
製品の説明
製品概要
製品の機能
製品の優位性
ユースケース
購入ガイド
課金説明
購入ガイドライン
支払い更新の説明
支払い延滞の説明
返金説明
クイックスタート
コンソールガイド
概要
タスクの作成
タスク管理
編成管理
テンプレート管理
リソースパック管理
動画評価
AIGCコンテンツの生成
ターミナルSDK
字幕編集ツール
使用量統計
CAM例
導入ガイド
音声・動画トランスコードの導入
1 音声・動画エンハンスメントの導入
Audio Separation Integration
電子透かしと可視透かしの導入
メディアAI 導入ガイド
メディア品質検査の導入
クライアントサイドSDKの導入
ライブストリームの録画機能の導入
DRMの導入
その他の導入ガイド
シナリオ実践チュートリアル
画質向上シナリオ
音声・動画コスト最適化シナリオ
ショートドラマの海外展開シナリオ
コンテンツ生成シナリオ
オンライン教育シナリオ
よくある質問
製品の基本情報について
アカウントへの権限付与について
タスク設定について
タスク開始について
タスク結果の確認について
Related Agreement
Service Level Agreement
プライバシーポリシー
データ処理とセキュリティ契約

スマート認識テンプレート

PDF
フォーカスモード
フォントサイズ
最終更新日: 2025-11-05 14:18:57

利用シナリオ

MPSのスマート認識テンプレートは、顔認識、テキスト全文認識、音声完全認識、音声翻訳、物体認識など、動画に対してスマート認識が必要なシナリオに適しています。サービスオーケストレーション管理でプリセットテンプレートを直接使用するか、業務ニーズに応じてカスタムテンプレートを作成することが可能です。作成したテンプレートはテンプレート一覧に表示され、フィルターによる表示、編集、削除などの管理操作を行うことができます。

前提条件

1. Tencent Cloudアカウントを登録し、実名認証を完了していること。
2. Tencent CloudのMPSサービスを購入し、MPSコンソールにログインしていること。

操作説明

テンプレート管理スマート認識テンプレートに進み、スマート認識テンプレートを作成をクリックすると、テンプレートのカスタム設定画面が表示され、テンプレート名とコンテンツ認識項目を設定できます。
設定項目
説明
テンプレート名
中国語、英語、数字、アンダースコア(_)、ハイフン(-)、ピリオド(.)のみ使用できます。長さは64文字以内にする必要があります。
コンテンツ認識項目の設定
設定項目には、顔認識、テキスト全文認識、音声完全認識、音声翻訳、物体認識が含まれています。

注意:
MPSコンソール>スマート認識テンプレートページでシステムプリセットのスマート認識テンプレートを確認できます。

顔認識

顔認識では、フィルタリングスコアとフィルタリングタグを設定できます。
フィルタリングスコアは認識結果の信頼度を制限するために用いられます。範囲は0~100、デフォルト値は95です。認識結果が設定したスコアを上回った場合、認識結果が返されます。
フィルタリングタグには「芸能人」、「スポーツ選手」、「政治家」から選択可能です。選択した場合、対応するタグの結果のみが返され、選択しない場合はすべての結果が返されます。


音声完全認識

音声完全認識を有効化するには、動画のソース言語を選択する必要があります。音声認識後に字幕ファイルの同時生成を希望する場合は、字幕ファイル形式を選択する必要があります。
注意:
現在、字幕ファイル機能はオンデマンドタスクおよびオンデマンドファイルのみ対象としており、ライブストリームからのASRタスクには適用されません。

現在対応している言語は以下の通りです。
動画ソース言語
中国語(簡体字)
英語
日本語
韓国語
中国語・英語・広東語
中国語(医療分野向け)
広東語
ベトナム語
マレー語
インドネシア語
フィリピン語
タイ語
ポルトガル語
トルコ語
アラビア語
スペイン語
ヒンディー語
フランス語
ドイツ語
イタリア語
ロシア語
中国語方言
-
-

音声翻訳

音声翻訳機能を有効化するには、動画のソース言語と翻訳先言語を選択する必要があります。翻訳後に字幕ファイルの同時生成を希望する場合は、字幕ファイル形式を選択する必要があります。

注意:
現在、字幕ファイル機能はオンデマンドタスクおよびオンデマンドファイルのみ対象としており、ライブストリームからのASRタスクには適用されません。
現在対応している言語は以下の通りです。
動画ソース言語
中国語(簡体字)
英語
日本語
韓国語
ベトナム語
マレー語
タイ語
ポルトガル語
トルコ語
アラビア語
スペイン語
ヒンディー語
フランス語
-
-

テキスト全文認識

テキスト全文認識を有効化すると、コールバックにより動画内の文字認識結果が返されます。現在、中国語と英語の認識に対応しており、その他の言語はまだ対応していません。

物体認識

物体認識を有効化すると、コールバックにより動画内の物体認識結果が返されます。デフォルトでは一般的な物体を認識できます。特定の認識対象が必要な場合は、サポートチケットを作成するか、プロダクト開発チームまでお問い合わせください。

ヘルプとサポート

この記事はお役に立ちましたか?

フィードバック