説明:
2025年9月より、コンソールおよびAPIに「スマート消去」テンプレートが新たに追加されました。このチュートリアルでは、「スマート消去」テンプレートをベースにした各機能の導入方法について説明します。既存の「スマート分析」テンプレートを使用して除去機能をご利用のお客様は、スマート消去機能の導入(旧)ドキュメントをご参照ください。 「スマート消去」テンプレートは、より多くのカスタム設定をサポートしており、「スマート分析」テンプレートと比較して柔軟にご利用いただけます。両者は機能の利用方法においてのみ異なり、料金は同一で、課金に関する調整はありません。
スマート消去機能の概要
スマート消去機能は、ビデオ画面内のロゴ、字幕、顔、ナンバープレートなどの要素に、ぼかし、モザイク、または自然な除去処理を施すことで、コンテンツの配信と共有を容易にします。この機能は、ショートドラマプラットフォーム、短尺動画プラットフォーム、越境EC、個人メディアスタジオなど、多くの分野で広く利用されています。料金についてはスマート消去の課金に関する説明をご参照ください。 |
字幕削除 |
| ビデオ画面内のテキスト字幕を除去します。 自然な仕上がりでの処理。 |
ロゴ消去 | ベーシック版 | ベーシック版のロゴ消去。 ぼかし効果。 |
| プレミアム版 | プレミアム版のロゴ消去機能。 自然な仕上がりでの処理。 |
OCRによる字幕抽出 | 抽出のみ | OCRを通じて、動画画面内の字幕内容を抽出し、字幕ファイルを生成します。 |
| 抽出+翻訳 | 元の言語の字幕を抽出し、翻訳して、翻訳言語の字幕ファイルを生成します。 |
| 抽出+翻訳+焼き込み | 元の言語の字幕を抽出し、翻訳して、翻訳言語の字幕を生成し、ビデオ画面に焼き込みます。 |
音声合成・差し替え(AI音声) | 標準音声 | ビデオと翻訳言語の字幕ファイルを入力し、翻訳言語の音声吹き替えを生成して、元の音声を置き換えます。ビデオの翻訳などのシナリオに適しています。 標準音声。現在、日本語、英語、中国語のみをサポートしています。 |
| 音声クローニング | 最先端のAI音声クローニング技術に基づき、声の特徴を忠実に再現し、数十の言語をサポートします。 |
プライバシー保護処理(顔、ナンバープレート) |
| ビデオ画面に映る顔やナンバープレートを認識し、ぼかしやモザイク処理を行い、プライバシー情報を効果的に保護します。 |
無料で体験
体験ラボを開き、「スマート消去」の体験ページに移動します。右側でファイルと除去タイプを選択し、One-Click Processingをクリックします。処理が完了すると、結果を確認できます。 説明:
体験ラボの機能は限定的であり、基本的な効果を体験するためのものです。完全な機能をテストするには、このドキュメントの説明を参考に、コンソールおよびAPI経由で導入してください。
導入前の準備
スマート消去機能を導入する前に、MPS製品を正常にご利用いただくため、以下の準備を完了させていただく必要があります:Tencent Cloudアカウントの登録とログイン、MPS製品の有効化とサービスロールの権限付与。
導入ステップ1:テンプレートパラメータの設定
コンソールのスマート消去テンプレートページに移動します。パラメータの説明はスマート消去テンプレートをご参照ください。理解を深めるため、以下に機能別・応用シナリオ別のテンプレート設定例を示します。 字幕削除
課金に関する説明
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_fast",
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 2,
"score": 100,
"rect": {
"lt_x": 53,
"lt_y": 228,
"rb_x": 137,
"rb_y": 644
}
}
]
}
]
}
}
}
字幕削除機能を使用すると、自動消去、指定領域消去、除去漏れ領域の二次処理を含め、モデルが「領域版」「スタンダード版」のいずれも、「字幕削除」料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。 テンプレート設定シナリオ1:自動消去(デフォルトパラメータ)
テンプレートのデフォルトパラメータを使用すると、下の図のように、システムがAIモデルを通じてビデオ画面中央下部の字幕テキスト内容を認識し、自然な除去処理を行って新しいビデオを生成します。
このデフォルトパラメータは、字幕のスタイルが標準的で、背景のノイズが少ないビデオに適しています。
テンプレート設定シナリオ2:自動消去領域を調整し、除去不要な領域を保護し、誤除去の問題を軽減できます。
「自動消去」方式では、システムはOCRを通じて、動画画面全体に存在するテキスト領域を自動で認識し、「自動消去領域」の範囲内にあるテキストを処理します。
ビデオが下の例のように、画面中央下部に除去不要なテキストコンテンツがある場合、「自動消去領域」を設定することで誤除去の問題を軽減できます。
処理効果の例:
テンプレート設定シナリオ3:字幕位置が比較的一定している場合、除去領域を直接指定して除去漏れの問題を軽減
除去方式で「自動消去」を選択すると、通常はかなり正確な字幕位置が自動で認識されますが、下の図のような特殊なケースでは除去漏れが発生することがあります。
そのため、字幕位置が一定している場合は、「指定領域消去」を選択し、除去が必要な領域を指定することで、除去漏れを最大限に減らすことをお勧めします。
処理効果の例:
テンプレート設定シナリオ4:字幕のスタイルが特殊(影付き字幕、装飾フォント、アニメーション効果など)な場合、領域版モデルを使用
字幕削除では、異なる字幕スタイルに対応する2つのモデルバージョンを提供しています。
スタンダード版(推奨):通常はこのバージョンの選択を推奨します。標準的なスタイルの字幕ビデオに適しており、より自然な仕上がりで、ディテールの再現性に優れています。
領域版:特殊なスタイルの字幕(影付き字幕、装飾フォント、アニメーション効果など)に適しています。除去面積は大きくなりますが、仕上がりの自然さはスタンダード版に劣ります。
「指定領域消去」方式で「領域版」モデルを使用することを推奨します。
テンプレート設定シナリオ5:自動消去をベースに、追加の除去領域を指定
有効にすると、矩形領域を追加でき、システムは自動消去をベースに、追加でターゲット領域の除去も行います。この機能は主に、位置が比較的一定している除去対象テキストを指定し、除去漏れの問題を減らすために使用します。
以下の例では、「自動消去領域」(字幕位置)をベースに、追加で2つの「除去領域の追加」(左上の警告文と下部のドラマ名)を指定し、これらの位置が固定されたテキストが確実に除去されるようにしています。
字幕削除 + OCRによる字幕抽出を同時に実行
字幕を除去すると同時に、OCRテキスト認識に基づき、ビデオの元の言語の字幕を抽出し、翻訳を行うことができます。
説明:
消去シナリオでは、元のビデオに通常は元の言語の字幕が含まれているため、OCRで字幕を抽出する方が効果的で精度が高いです。そのため、スマート消去機能にはOCRのみが統合されています。ASRで字幕ファイルを生成したい場合は、スマート字幕をご利用ください。詳細はスマート字幕の導入をご参照ください。 課金に関する説明
「字幕削除」料金 + 「OCRによる字幕抽出」(翻訳を無効にした場合)料金、または「字幕削除」料金 + 「OCRによる字幕抽出と翻訳」(翻訳を有効にした場合)料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。 テンプレート設定例
「自動消去領域」で抽出および除去したい字幕の位置を指定し、OCRによる字幕抽出を有効にします。翻訳は必要に応じて有効にできます。
注意:
元の言語が中国語、英語、または中英混合の字幕は、OCRの抽出効果が最も高くなります。
「自動消去領域」の範囲内の文字のみが認識され、他の位置の文字は抽出も除去もされません。
「自動消去領域」の範囲内に複数のテキスト領域が存在する場合、システムは一つのテキスト領域のみを選択して抽出・除去します。通常は、出現時間が最も長く、最も安定しているテキスト領域が選択されます。
効果の例:
OCRによる字幕抽出のみ
除去は行わず、OCRテキスト認識に基づき、字幕の抽出と翻訳のみを行います。
課金に関する説明
元の言語の字幕のみを抽出する場合は「OCRによる字幕抽出」料金が、翻訳機能を有効にした場合は「OCRによる字幕抽出と翻訳」料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。 テンプレート設定例
現在、OCRによる字幕抽出のみの機能は、コンソールでのカスタム設定をサポートしていません。MPSの「スマート分析」機能にある25番テンプレートを使用し、拡張パラメータで開始する必要があります。詳細はスマート消去の導入(旧)- OCRによる字幕抽出をご参照ください。 音声合成・差し替え(音声を合成し、元のビデオの音声を置き換え)
前述の字幕削除、OCRによる字幕抽出機能を通じて、以下を取得できます。
1. 除去後の字幕なしビデオ。
2. 翻訳言語の字幕ファイル。
次に、これら2つのファイルを入力として、音声合成および元の音声との置き換えタスクを行い、翻訳言語の音声吹き替え付きの新しいビデオを取得できます。
課金に関する説明
標準音声を使用する場合は「音声合成・差し替え(標準音声)」料金が、クローン音色を使用する場合は「音声合成・差し替え(クローン音色)」料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。 テンプレート設定例
説明:
音声合成・差し替え機能は現在クローズドベータ版です。テストをご希望の場合は、ビジネス担当者にご連絡いただくか、サポートチケットを作成してください。 この機能では、標準音色と音声クローニングの2種類の音声を選択できます。
標準音色:中国語、英語、日本語をサポートし、複数の男性声、女性声、子供の声から選択できます。
音声クローニング:最先端のAI音声クローニング技術に基づき、声の特徴を忠実に再現し、以下の言語をサポートしています。
|
中国語 (Chinese) | zh |
英語 (English) | en |
日本語 (Japanese) | ja |
ドイツ語 (German) | de |
フランス語 (French) | fr |
韓国語 (Korean) | ko |
ロシア語 (Russian) | ru |
ウクライナ語 (Ukrainian) | uk |
ポルトガル語 (Portuguese) | pt |
イタリア語 (Italian) | it |
スペイン語 (Spanish) | es |
インドネシア語 (Indonesian) | id |
オランダ語 (Dutch) | nl |
トルコ語 (Turkish) | tr |
フィリピン語 (Filipino) | fil |
マレー語 (Malay) | ms |
ギリシャ語 (Greek) | el |
フィンランド語 (Finnish) | fi |
クロアチア語 (Croatian) | hr |
スロバキア語 (Slovak) | sk |
ポーランド語 (Polish) | pl |
スウェーデン語 (Swedish) | sv |
ヒンディー語 (Hindi) | hi |
ブルガリア語 (Bulgarian) | bg |
ルーマニア語 (Romanian) | ro |
アラビア語 (Arabic) | ar |
チェコ語 (Czech) | cs |
デンマーク語 (Danish) | da |
タミル語 (Tamil) | ta |
字幕削除 + OCRによる字幕抽出 + 翻訳 + 焼き込みを同時に実行
元の言語の字幕付きビデオを入力し、翻訳言語の字幕付きビデオを出力します(音声の置き換えは含みません)。
説明:
字幕焼き込みのみを単独で使用したい場合は、音声・動画トランスコード機能で実現できます。詳細は音声・動画トランスコード導入ガイドの字幕焼き込み、外部字幕をご参照ください。 課金に関する説明
テンプレート設定例
現在、この機能はコンソールでのカスタム設定をサポートしていません。MPSの「スマート分析」機能にある25番テンプレートを使用し、拡張パラメータで開始する必要があります。詳細はスマート消去の導入(旧)をご参照ください。 ロゴ消去
ロゴ消去とは、ビデオ画面内のロゴ、アイコン、ユーザーアイコンなどのグラフィックコンテンツを除去することです。ベーシック版とプレミアム版の2つのモードを提供しています。
ベーシック版:基本的なぼかし効果。コストパフォーマンスが高く、アニメーションや背景がシンプルなビデオに適しています。「スマート消去の基本料金(ロゴ消去-ベーシック版)」が発生します。
プレミアム版:より効果的な除去、ショートドラマなどの実写風ビデオに適しています。「ロゴ消去-プレミアム版」料金が発生します。
課金に関する説明
テンプレート設定例
ロゴ消去は「自動消去」と「指定領域消去」の2つの処理方式を提供ています。
一般的なインターネットロゴ、またはMPSのモデルライブラリに登録済みのカスタムロゴには、「自動消去」を使用できます。
自動消去:AIモデルを利用し、ビデオ全画面内のロゴを自動で認識・除去します。静的ロゴと動的ロゴの両方に対応しています。
現在、十数種類の一般的なインターネットロゴをサポートしています。サポート範囲外のロゴについては、カスタマイズされたモデルトレーニングサービスを提供しており、これには別途モデルトレーニング費用が発生します。
「自動消去領域」で「自動検出」を選択すると、デフォルトで全画面の透かしが認識されます。画面内に除去不要な透かしがある場合は、「自動消去領域」を調整して保護することができます。
効果の例:
位置が固定されたロゴには、「指定領域消去」を使用できます。
指定領域消去:位置が固定された静的ロゴには、指定領域消去を推奨します。除去漏れや誤除去の問題を減らすことができます。また、画面のノイズが自動消去に悪影響を与える場合も、指定領域消去で二次的な修正が可能です。
効果の例:
字幕削除 + ロゴ消去を同時に実行
課金に関する説明
字幕削除とロゴ消去を同時に行うと、「ロゴ消去-プレミアム版」と「字幕削除」の料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。 テンプレート設定例
現在、この機能はコンソールでのカスタム設定をサポートしていません。MPSの「スマート分析」機能にある25番テンプレートを使用し、拡張パラメータで開始する必要があります。詳細はスマート消去の導入(旧)をご参照ください。 プライバシー保護処理(顔、ナンバープレート)
課金に関する説明
プライバシー保護処理機能を使用すると、「プライバシー保護処理(顔、ナンバープレート)」料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。 テンプレート設定例
顔とナンバープレートに、ぼかしまたはモザイク処理を施すことができます。テンプレートで処理対象と処理効果を設定してください。
効果の例:
導入ステップ2:タスクの開始
タスクの開始には、コンソールでのタスク作成、APIによるタスク開始、タスクの自動実行の3つの方法があります。詳細は以下の表をご参照ください。
|
コンソールでのタスク作成 | ノーコード。毎回手動で単一のビデオを選択してタスクを開始します。テスト段階に適しています。 | コンソールのタスク作成ページに移動し、入力ファイルパス、処理フローとパラメータ、出力パスを設定してタスクを開始します。 |
APIでタスクを開始する | APIインターフェースを呼び出してタスクを開始します。ビジネスとの連携や一括処理に適しています。 | メディア処理APIを呼び出し、入力ファイルパス、スマート消去テンプレートIDまたはワークフローID、出力パスを設定してタスクを開始します。 |
タスクの自動実行 | ノーコード。指定したCOSパスに新しいファイルがアップロードされると、プリセットのフローとパラメータに従って自動的にタスクを開始します。一括での自動化操作に適しています。 | コンソールのワークフロー管理ページに移動し、ワークフローを作成して自動実行を有効にします。 |
コンソールからタスクを開始
1. コンソールのタスク作成ページに移動し、オンデマンド処理タスクをクイック作成をクリックします。 2. 順に入力ファイルパス、タスク処理フロー、出力パスを設定します。
タスク処理フローにはスマート消去ノードを追加し、スマート消去テンプレートを選択するか、カスタムパラメータを設定する必要があります。
3. 設定完了後、作成ボタンをクリックしてタスクを開始します。
タスクの自動実行
2. ページ内でトリガーディレクトリ、出力ディレクトリ、タスク設定を行い、ワークフローを作成します。
3. ワークフロー作成後、オンデマンドワークフローリストに移動し、そのワークフローを有効化します。以降、トリガーディレクトリに処理が必要なビデオファイルがアップロードされると、ワークフロー内のタスク設定に従って自動的に処理され、手動でタスクを作成する必要はありません。
説明:
ワークフローは、有効化後約3~5分で自動実行が有効になります。システムは、トリガーディレクトリに新しくアップロードされたビデオファイルに対してのみ有効で、それ以前に保存されていたファイルは自動処理されません。 APIでタスクを開始する
テンプレートIDの関連付け
ProcessMedia APIを呼び出し、SmartEraseTaskタスクを選択し、Definitionに必要なスマート消去テンプレートIDを設定します。ProcessMediaのJSONの例は以下の通りです。 {
"InputInfo":{
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",
"SmartEraseTask":{
"Definition":00000
},
"TaskNotifyConfig":{
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}
ワークフローIDの関連付け
ワークフローを作成した場合、ProcessMedia APIを呼び出し、ScheduleIdにワークフローIDを設定してタスクを開始することもできます。ProcessMediaのJSONの例は以下の通りです。 {
"InputInfo":{
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",
"ScheduleId": 12345,
"TaskNotifyConfig":{
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}