tencent cloud

Media Processing Service

動向とお知らせ
Release Notes
お知らせ
製品の説明
製品概要
製品の機能
製品の優位性
ユースケース
購入ガイド
課金説明
購入ガイドライン
支払い更新の説明
支払い延滞の説明
返金説明
クイックスタート
コンソールガイド
概要
タスクの作成
タスク管理
編成管理
テンプレート管理
リソースパック管理
動画評価
AIGCコンテンツの生成
ターミナルSDK
字幕編集ツール
使用量統計
CAM例
導入ガイド
音声・動画トランスコードの導入
1 音声・動画エンハンスメントの導入
Audio Separation Integration
電子透かしと可視透かしの導入
メディアAI 導入ガイド
メディア品質検査の導入
クライアントサイドSDKの導入
ライブストリームの録画機能の導入
DRMの導入
その他の導入ガイド
シナリオ実践チュートリアル
画質向上シナリオ
音声・動画コスト最適化シナリオ
ショートドラマの海外展開シナリオ
コンテンツ生成シナリオ
オンライン教育シナリオ
よくある質問
製品の基本情報について
アカウントへの権限付与について
タスク設定について
タスク開始について
タスク結果の確認について
Related Agreement
Service Level Agreement
プライバシーポリシー
データ処理とセキュリティ契約

スマート消去機能の導入(旧)

PDF
フォーカスモード
フォントサイズ
最終更新日: 2025-11-05 14:18:59

スマート消去機能の概要

スマート消去機能は、ビデオ画面内のロゴ、字幕、顔、ナンバープレートなどの要素に、ぼかし、モザイク、または自然な除去処理を施すことで、コンテンツの配信と共有を容易にします。この機能は、ショートドラマプラットフォーム、短尺動画プラットフォーム、越境EC、個人メディアスタジオなど、多くの分野で広く利用されています。

技術の強み

多様なシナリオをサポート:十数種類の一般的なロゴを自動で認識・処理できます。さらに、字幕や、顔・ナンバープレートなどの機密情報も除去対象とすることができ、ぼかし、モザイク、自然な除去など多様な効果を提供し、様々なシナリオのニーズに応えます。
高いカスタマイズ性:お客様の具体的なビデオシナリオに合わせ、モデルパラメータをカスタマイズ調整することをサポートします。これにより、除去の精度と処理効果を向上させ、最終的により自然で滑らかな映像を実現します。

無料で体験

1. 体験ラボを開き、「スマート消去」の体験ページに移動します。右側でオンデマンドファイルを選択し、処理を開始をクリックします。
2. 処理が完了すると、結果を確認できます。
説明:
体験ラボの機能は限定的であり、基本的な効果を体験するためのものです。完全な機能をテストするには、API経由で導入してください。


除去タスクの開始方法

説明:
コンソールから除去タスクを開始する場合、現在ExtendedParameterの入力はサポートされておらず、透かし除去のベーシック版のみが利用可能です。そのため、字幕削除やOCRによる字幕抽出などの機能が必要な場合は、下記を参考にAPI経由で除去タスクを開始してください。
ProcessMedia APIを呼び出し、AiAnalysisTaskタスクを選択し、Definition25(プリセットの除去テンプレートID)に設定します。ExtendedParameterには追加の拡張パラメータを記入し、これによって様々なスマート消去機能を実現します。設定値については、下記のシナリオ別APIパラメータ例をご参照ください。ProcessMediaのJSONの例は以下の通りです。
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\"}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}
API Explorerを使用して迅速に検証を行うことを推奨します。上記のJSONをAPI ExplorerのJSONモードにコピーし、「フォーム」モードに切り替えると自動的に解析されます。入力・出力パスなど必要なパラメータを調整した後、呼び出しを開始をクリックしてください。
API ExplorerのフォームモードとJSONモードにおける、ExtendedParameterの位置は以下の通りです。

注意:
API ExplorerのフォームモードでExtendedParameterを記入する場合、JSONを直接入力する必要があり、文字列への変換は不要です。しかし、JSONモードまたはAPIインターフェースを直接使用する場合は、エスケープされた文字列を渡す必要があります。
API Explorerフォームモードでは、ExtendedParameterにJSONを直接入力します。

API ExplorerのJSONモードでは、ExtendedParameterにエスケープされた文字列を渡す必要があります。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\"}}

シナリオ別 ExtendedParameter パラメータ例

スマート消去で最もよく使われるケイパビリティは字幕削除です。ショートドラマの海外展開やビデオ翻訳などのビジネスをサポートするため、字幕削除と同時に以下の処理もサポートしています。
OCRによる字幕抽出と翻訳:字幕を抽出して翻訳し、翻訳言語の字幕ファイルを生成します。
音声合成:字幕削除後のビデオと、校正済みの翻訳言語の字幕ファイルを入力とし、翻訳言語の音声吹き替え付きの新しいビデオを生成します。
字幕の焼き込み:字幕をビデオ画面に焼き込みます。
この他に、スマート消去は以下もサポートしています。
ロゴ消去:ビデオ上のロゴを除去します。
プライバシー保護処理:顔やナンバープレートに、ぼかしやモザイク処理を施します。
異なる機能を使用するには、以下の説明を参考に、対応するExtendedParameterを渡してください。

一、字幕削除

課金に関する説明


ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_fast",
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 2,
"score": 100,
"rect": {
"lt_x": 53,
"lt_y": 228,
"rb_x": 137,
"rb_y": 644
}
}
]
}
]
}
}
}

字幕削除機能を使用すると、自動消去、指定領域消去、除去漏れ領域の二次処理を含め、モデルが「領域版」「スタンダード版」のいずれも、「字幕削除」料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。
説明:
字幕削除では、出力ビデオに対して完全なエンコード・デコード処理が必要となるため、begin_msおよびend_msフィールドで指定された除去処理の時間帯ではなく、出力ビデオの総再生時間に基づいて課金されます。

1.1 字幕削除(自動消去)

字幕削除(自動消去)とは、AIモデルを通じてビデオ内の字幕テキスト内容を自動で認識し、自然な除去処理を行って新しいビデオを生成することです。画面のノイズや特殊な字幕スタイルにより、除去漏れや誤除去が発生する可能性があります。その場合は字幕削除(指定領域消去)で対処できます。
字幕削除(自動消去)機能を使用する場合、ExtendedParameterの基本的なパラメータは以下の通りです。
API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\"}}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\"}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_fast"
}
}

字幕のおおよその位置を指定し、除去不要な領域を保護する
字幕削除機能は、デフォルトでビデオ画面の中央下部にあるテキスト領域を自動認識し、除去します。
ビデオが下の例のように、中央下部に除去不要なテキストコンテンツがある場合、als_filterパラメータで字幕のおおよその位置を指定することで、誤除去の問題を軽減できます。
左:元のビデオ(下部の「不顧一切愛上你」は除去不要)。中:als_filterで字幕位置を指定した場合の除去効果。右:als_filterを指定しなかった場合の除去効果。
左:元のビデオ(下部の「不顧一切愛上你」は除去不要)。中:als_filterで字幕位置を指定した場合の除去効果。右:als_filterを指定しなかった場合の除去効果。

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"als_filter\\":{\\"active_areas\\":[{\\"lt_x\\":0.097,\\"lt_y\\":0.626,\\"rb_x\\":0.928,\\"rb_y\\":0.705}]}}}

/*
als_filter: 自動消去領域。字幕のおおよその位置を指定して、画面ノイズによる誤除去の問題を軽減するために使用します。
(lt_x, lt_y)は領域の左上隅の座標、(rb_x, rb_y)は右下隅の座標です。座標値の意味は以下の通りです。
[ 0, 1 ]:ビデオの幅または高さに対する比率を表します。
( 1, + ) :ピクセル値を表します
*/
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"als_filter\\":{\\"active_areas\\":[{\\"lt_x\\":0.097,\\"lt_y\\":0.626,\\"rb_x\\":0.928,\\"rb_y\\":0.705}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_fast",
"als_filter": {
"active_areas": [
{
"lt_x": 0.097,
"lt_y": 0.626,
"rb_x": 0.928,
"rb_y": 0.705
}
]
}
}
}

画面全体のテキストコンテンツを自動で除去したい場合は、als_filterの領域サイズをビデオ画面全体のサイズに近づけるように設定してください。参考:
API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"als_filter\\":{\\"active_areas\\":[{\\"lt_x\\":0,\\"lt_y\\":0,\\"rb_x\\":0.9999,\\"rb_y\\":0.9999}]}}}

/*
als_filter: 自動消去領域。字幕のおおよその位置を指定して、画面ノイズによる誤除去の問題を軽減するために使用します。
(lt_x, lt_y)は領域の左上隅の座標、(rb_x, rb_y)は右下隅の座標です。座標値の意味は以下の通りです。
[ 0, 1 ]:ビデオの幅または高さに対する比率を表します。
( 1, + ) :ピクセル値を表します
*/
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"als_filter\\":{\\"active_areas\\":[{\\"lt_x\\":0,\\"lt_y\\":0,\\"rb_x\\":0.9999,\\"rb_y\\":0.9999}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_fast",
"als_filter": {
"active_areas": [
{
"lt_x": 0,
"lt_y": 0,
"rb_x": 0.9999,
"rb_y": 0.9999
}
]
}
}
}


1.2 字幕削除(指定領域消去)

字幕削除(自動消去)は、通常かなり正確な字幕位置を自動で認識しますが、下の図のような特殊なケースでは除去漏れが発生することがあります。
左:赤枠部分の字幕と背景のコントラストが低すぎる。右:字幕のスタイルが装飾フォントで、グラデーション効果がかかっている。
左:赤枠部分の字幕と背景のコントラストが低すぎる。右:字幕のスタイルが装飾フォントで、グラデーション効果がかかっている。

そのため、字幕位置が比較的一定している場合は、custom_objsで除去領域を直接指定することで、除去漏れを最大限に減らすことを推奨します。
説明:
custom_objsを指定すると、システムは選択された領域のみを直接除去し、ビデオ内の他の位置にあるテキストコンテンツは自動認識も除去も行いません。そのため、除去対象の領域はすべて指定してください。
例:
左:元のビデオ。中:緑枠はcustom_objsで指定された除去領域。右:除去効果。
左:元のビデオ。中:緑枠はcustom_objsで指定された除去領域。右:除去効果。

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":53,\\"lt_y\\":228,\\"rb_x\\":137,\\"rb_y\\":644}}]}]}}}

/*
複数の除去領域を指定できます(10個以内を推奨)。
(lt_x, lt_y)は除去領域の左上隅の座標、(rb_x, rb_y)は右下隅の座標です。座標値の意味は以下の通りです。
[ 0, 1 ) :ビデオの幅/高さに対する比率を表します
[ 1, + ) :ピクセル値を表します
*/
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":53,\\"lt_y\\":228,\\"rb_x\\":137,\\"rb_y\\":644}}]}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_fast",
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 2,
"score": 100,
"rect": {
"lt_x": 53,
"lt_y": 228,
"rb_x": 137,
"rb_y": 644
}
}
]
}
]
}
}
}


1.3 特殊なスタイルの字幕への対応

字幕削除では、異なる字幕スタイルに対応する2つのモデルバージョンを提供しています。
スタンダード版(推奨):通常はこのバージョンの選択を推奨します。標準的なスタイルの字幕ビデオに適しており、より自然な仕上がりで、ディテールの再現性に優れています。
CustomerAppIdsubtitle_erase_fastを渡すと、「スタンダード版」が使用されます。
左:元のビデオ。中:領域版での処理効果。右:スタンダード版での処理効果。ビデオの字幕スタイルがこの例に似ている場合は、スタンダード版を選択してください。
左:元のビデオ。中:領域版での処理効果。右:スタンダード版での処理効果。ビデオの字幕スタイルがこの例に似ている場合は、スタンダード版を選択してください。

領域版:特殊なスタイルの字幕(ドロップシャドウ付き字幕、装飾フォント、GIFアニメーションなど)に適しています。除去面積は大きくなりますが、仕上がりの自然さはスタンダード版に劣ります。
「領域版」を指定するには、CustomerAppIdsubtitle_erase_areaを渡します。例:
左:元のビデオ。中:緑枠はcustom_objsで指定された除去領域。右:除去効果(字幕スタイルが特殊なため、領域版の除去モデルを使用)
左:元のビデオ。中:緑枠はcustom_objsで指定された除去領域。右:除去効果(字幕スタイルが特殊なため、領域版の除去モデルを使用)

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_area\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":879,\\"lt_y\\":169,\\"rb_x\\":997,\\"rb_y\\":761}}]}]}}}

/*
subtitle_erase_areaは、「領域版」の字幕削除モデルを使用することを意味し、特殊なスタイルの字幕に適しています。
複数の除去領域を指定できます(10個以内を推奨)。
(lt_x, lt_y)は除去領域の左上隅の座標、(rb_x, rb_y)は右下隅の座標です。座標値の意味は以下の通りです。
[ 0, 1 ) :ビデオの幅または高さに対する比率を表します
[ 1, + ) :ピクセル値を表します
*/
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_area\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":879,\\"lt_y\\":169,\\"rb_x\\":997,\\"rb_y\\":761}}]}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_area",
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 2,
"score": 100,
"rect": {
"lt_x": 879,
"lt_y": 169,
"rb_x": 997,
"rb_y": 761
}
}
]
}
]
}
}
}


1.4 字幕の除去漏れ領域の二次処理

字幕削除(自動消去)で処理した後、まだ除去漏れがある場合、通常は字幕のスタイルやビデオの背景などが影響しています。字幕削除モデルを「領域版」(subtitle_erase_area)に変更し、custom_objsで除去漏れ領域の位置を指定して修正できます。また、begin_msend_msフィールドで二次処理が必要な時間帯を指定することも可能です。注意:修正効果を保証するため、除去漏れ領域の位置と時間帯はできるだけ正確に指定してください。
API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_area\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"begin_ms\\":3000,\\"end_ms\\":5000,\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.0,\\"lt_y\\":10,\\"rb_x\\":10,\\"rb_y\\":20}}]}]}}}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_area\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"begin_ms\\":3000,\\"end_ms\\":5000,\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.0,\\"lt_y\\":10,\\"rb_x\\":10,\\"rb_y\\":20}}]}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_area",
"custom_objs": {
"type": 0,
"time_objs": [
{
"begin_ms": 3000,
"end_ms": 5000,
"objs": [
{
"type": 2,
"score": 100,
"rect": {
"lt_x": 0.0,
"lt_y": 10,
"rb_x": 10,
"rb_y": 20
}
}
]
}
]
}
}
}



二、OCRによる字幕抽出

OCRテキスト認識に基づき、ビデオの元の言語の字幕を抽出し、翻訳して、翻訳言語の字幕ファイルを生成します。
説明:
消去シナリオでは、元のビデオに通常は元の言語の字幕が含まれているため、OCRで字幕を抽出する方が効果的で精度が高いです。そのため、スマート消去機能にはOCRのみが統合されています。ASRで字幕ファイルを生成したい場合は、スマート字幕をご利用ください。詳細はスマート字幕の導入をご参照ください。
元の言語が中国語または英語の字幕は、OCRの抽出効果が最も高くなります。

課金に関する説明

OCRによる字幕抽出(自動)またはOCRによる字幕抽出(領域指定)を使用し、元の言語の字幕のみを抽出する場合は「OCRによる字幕抽出」料金が、translate_dst_languageでターゲット言語を指定して翻訳機能を有効にした場合は「OCRによる字幕抽出と翻訳」料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。

2.1 OCRによる字幕抽出(自動)

ビデオ画面の中央下部にあるテキストを自動認識し、字幕ファイルとして抽出します。
左側:元のビデオ。右側:抽出された字幕ファイル
左側:元のビデオ。右側:抽出された字幕ファイル

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"CustomerAppId\\":\\"subtitle_extract_v1\\",\\"subtitle_param\\":{\\"translate_dst_language\\":\\"\\",\\"subtitle_fmt\\":\\"srt\\"}}}

/*
CustomerAppId: subtitle_extract_v1を渡し、OCR抽出タスクを実行することを示します。
translate_dst_language: ターゲット言語を指定します。空に設定すると、翻訳は行われず、元の言語の字幕のみが出力されます。
その他の値と対応関係:en-英語、zh-中国語、ja-日本語、ko-韓国語、de-ドイツ語、pt-ポルトガル語、id-インドネシア語、th-タイ語、ms-マレー語。
上記はよく使われる言語のみをリストアップしています。数百の翻訳言語をサポートしていますので、完全なリストが必要な場合はお問い合わせください。
subtitle_fmt: 出力する字幕ファイルの形式を指定します。指定しない場合のデフォルトはWebVTT形式で、srtはSRT形式を示します。
min_sdur_ms: 1つの字幕が表示される最短時間(単位ms)。例えば1000に設定すると、1000ms未満の字幕は無視されます。
output_patten: 出力ファイル名を指定します。プレースホルダーは{}で、task_type、session_idをサポートしています。
指定しない場合、デフォルトで{task_type}-{session_id}が出力されます。
*/
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"CustomerAppId\\":\\"subtitle_extract_v1\\",\\"subtitle_param\\":{\\"translate_dst_language\\":\\"\\",\\"subtitle_fmt\\":\\"srt\\"}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"CustomerAppId": "subtitle_extract_v1",
"subtitle_param": {
"translate_dst_language": "",
"subtitle_fmt": "srt"
}
}
}


2.2 OCRによる字幕抽出(領域指定)、ノイズとなる文字のフィルタリング

ビデオ画面の中央下部に他のノイズとなる文字が存在する場合、自動抽出では誤検出が発生する可能性があります。そのため、字幕位置が比較的一定しているビデオでは、als_filterで抽出領域を指定することを推奨します。
左図:領域を指定しない場合、抽出されたテキストにノイズ情報が含まれている。右図:緑枠は指定された字幕領域。抽出された字幕がより正確になっている。
左図:領域を指定しない場合、抽出されたテキストにノイズ情報が含まれている。右図:緑枠は指定された字幕領域。抽出された字幕がより正確になっている。

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"CustomerAppId\\":\\"subtitle_extract_v1\\",\\"subtitle_param\\":{\\"translate_dst_language\\":\\"\\"},\\"als_filter\\":{\\"active_areas\\":[{\\"type\\":2,\\"lt_x\\":72,\\"lt_y\\":703,\\"rb_x\\":618,\\"rb_y\\":787}]}}}

/*
als_filter: 自動抽出領域。字幕のおおよその位置を指定して、誤検出の問題を軽減するために使用します。
(lt_x, lt_y)は領域の左上隅の座標、(rb_x, rb_y)は右下隅の座標です。座標値の意味は以下の通りです。
[ 0, 1 ]:ビデオの幅または高さに対する比率を表します。
( 1, + ) :ピクセル値を表します
translate_dst_language: ターゲット言語を指定します。空に設定すると、翻訳は行われず、元の言語の字幕のみが出力されます。
その他の値と対応関係:en-英語、zh-中国語、ja-日本語、ko-韓国語、de-ドイツ語、pt-ポルトガル語、id-インドネシア語、th-タイ語、ms-マレー語。
上記はよく使われる言語のみをリストアップしています。数百の翻訳言語をサポートしていますので、完全なリストが必要な場合はお問い合わせください。
*/
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"CustomerAppId\\":\\"subtitle_extract_v1\\",\\"subtitle_param\\":{\\"translate_dst_language\\":\\"\\"},\\"als_filter\\":{\\"active_areas\\":[{\\"type\\":2,\\"lt_x\\":72,\\"lt_y\\":703,\\"rb_x\\":618,\\"rb_y\\":787}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"CustomerAppId": "subtitle_extract_v1",
"subtitle_param": {
"translate_dst_language": ""
},
"als_filter": {
"active_areas": [
{
"type": 2,
"lt_x": 72,
"lt_y": 703,
"rb_x": 618,
"rb_y": 787
}
]
}
}
}


三、音声合成・差し替え(音声を合成し、元のビデオの音声を置き換え)

前述の字幕削除、OCRによる字幕抽出機能を通じて、以下を取得できます。
1. 除去後の字幕なしビデオ。
2. 翻訳言語の字幕ファイル。
次に、これら2つのファイルを入力として、音声合成および元の音声との置き換えタスクを行い、翻訳言語の音声吹き替え付きの新しいビデオを取得できます。
説明:
音声合成・差し替え機能は現在クローズドベータ版です。テストをご希望の場合は、弊社までお問い合わせください。
この機能では、標準音色と音声クローニングの2種類の音声を選択できます。
標準音色:中国語、英語、日本語をサポートし、複数の男性声、女性声、子供の声から選択できます。
音声クローニング:最先端のAI音声クローニング技術に基づき、声の特徴を忠実に再現し、以下の言語をサポートしています。
言語
Code
中国語 (Chinese)
zh
英語 (English)
en
日本語 (Japanese)
ja
ドイツ語 (German)
de
フランス語 (French)
fr
韓国語 (Korean)
ko
ロシア語 (Russian)
ru
ウクライナ語 (Ukrainian)
uk
ポルトガル語 (Portuguese)
pt
イタリア語 (Italian)
it
スペイン語 (Spanish)
es
インドネシア語 (Indonesian)
id
オランダ語 (Dutch)
nl
トルコ語 (Turkish)
tr
フィリピン語 (Filipino)
fil
マレー語 (Malay)
ms
ギリシャ語 (Greek)
el
フィンランド語 (Finnish)
fi
クロアチア語 (Croatian)
hr
スロバキア語 (Slovak)
sk
ポーランド語 (Polish)
pl
スウェーデン語 (Swedish)
sv
ヒンディー語 (Hindi)
hi
ブルガリア語 (Bulgarian)
bg
ルーマニア語 (Romanian)
ro
アラビア語 (Arabic)
ar
チェコ語 (Czech)
cs
デンマーク語 (Danish)
da
タミル語 (Tamil)
ta

課金に関する説明

標準音声を使用する場合は「音声合成・差し替え(標準音声)」料金が、クローン音色を使用する場合は「音声合成・差し替え(クローン音色)」料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。

四、字幕削除 + OCRによる字幕抽出 + 翻訳 + 焼き込みを同時に実行

翻訳言語の字幕付きビデオを出力します。
説明:
字幕焼き込みのみを単独で使用したい場合は、音声・動画トランスコード機能で実現できます。詳細は音声・動画トランスコード導入ガイドの字幕焼き込み外部字幕をご参照ください。
左図:元の中国語ショートビデオ。右図:処理後、英語字幕付きで出力されたビデオ。
左図:元の中国語ショートビデオ。右図:処理後、英語字幕付きで出力されたビデオ。


課金に関する説明

「字幕削除」料金 + 「OCRによる字幕抽出と翻訳+焼き込み」料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。

利用ガイド

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_and_translate\\",\\"subtitle_param\\":{\\"translate_dst_language\\":\\"en\\"}}}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_and_translate\\",\\"subtitle_param\\":{\\"translate_dst_language\\":\\"en\\"}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_and_translate",
"subtitle_param": {
"translate_dst_language": "en"
}
}
}


五、ロゴ消去

ロゴ消去は、ベーシック版とプレミアム版の2つのモードを提供しています。
ベーシック版:基本的なぼかし効果。コストパフォーマンスが高く、アニメーションや背景がシンプルなビデオに適しています。「スマート消去の基本料金(ロゴ消去-ベーシック版)」が発生します。
プレミアム版:より効果的な除去、ショートドラマなどの実写風ビデオに適しています。「ロゴ消去-プレミアム版」料金が発生します。
左:元のビデオ、赤枠内がロゴの位置。中:ベーシック版の処理効果。右:プレミアム版の処理効果
左:元のビデオ、赤枠内がロゴの位置。中:ベーシック版の処理効果。右:プレミアム版の処理効果


5.1 ロゴ消去(プレミアム版)

ロゴ消去ベーシック版より、プレミアム版の除去はより効果的です。CustomerAppIdai_delogo_v1を渡すと、ロゴ消去のプレミアム版が使用されます。
自動消去と指定領域消去の2つの処理方式をサポートしています。
自動消去:AIモデルを利用し、ビデオ全画面内のロゴを自動で認識・除去します。静的ロゴと動的ロゴの両方に対応しています。
現在、十数種類の一般的なインターネットロゴをサポートしています。サポート範囲外のロゴについては、カスタマイズされたモデルトレーニングサービスを提供しており、これには別途モデルトレーニング費用が発生します。
画面のノイズが自動消去に悪影響を与え、除去漏れや誤除去が発生する可能性があります。その場合は、領域を指定して消去することで二次的な修正が可能です。
指定領域消去:位置が固定された静的ロゴには、この方式を推奨します。除去漏れや誤除去の問題を減らすことができます。
赤枠:動き続ける動的ロゴ。自動消去を推奨します(一般的なインターネットロゴでない場合は、モデルトレーニングが必要です)。緑枠:位置が固定された静的ロゴ。「指定領域消去」で除去できます。
赤枠:動き続ける動的ロゴ。自動消去を推奨します(一般的なインターネットロゴでない場合は、モデルトレーニングが必要です)。緑枠:位置が固定された静的ロゴ。「指定領域消去」で除去できます。

課金に関する説明
ロゴ消去のプレミアム版を使用すると、「ロゴ消去-プレミアム版」料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。
5.1.1 自動消去
左:元のビデオ、左上と右上にそれぞれロゴ/アイコンがある。右:透かし除去のプレミアム版による自動消去効果
左:元のビデオ、左上と右上にそれぞれロゴ/アイコンがある。右:透かし除去のプレミアム版による自動消去効果

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\"}}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\"}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "ai_delogo_v1"
}
}

5.1.2 自動消去をベースに、除去が必要なロゴの位置を指定し、不要な領域を保護する
自動消去機能は、デフォルトでグローバルに認識されたロゴを除去します。als_filterを渡すと、ロゴのおおよその位置を指定でき、システムは自動消去の際にその領域外のロゴを無視するため、除去不要な部分を保護できます。
左:元のビデオ、左上と右上にそれぞれロゴ/アイコンがある。右:右上のアイコンのみを除去した内容。
左:元のビデオ、左上と右上にそれぞれロゴ/アイコンがある。右:右上のアイコンのみを除去した内容。

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\",\\"als_filter\\":{\\"active_areas\\":[{\\"type\\":1,\\"lt_x\\":527,\\"lt_y\\":13,\\"rb_x\\":701,\\"rb_y\\":78}]}}}

/*
als_filter: 自動抽出領域。字幕のおおよその位置を指定して、誤検出の問題を軽減するために使用します。
(lt_x, lt_y)は領域の左上隅の座標、(rb_x, rb_y)は右下隅の座標です。座標値の意味は以下の通りです。
[ 0, 1 ]:ビデオの幅または高さに対する比率を表します。
( 1, + ) :ピクセル値を表します
*/
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\",\\"als_filter\\":{\\"active_areas\\":[{\\"type\\":1,\\"lt_x\\":527,\\"lt_y\\":13,\\"rb_x\\":701,\\"rb_y\\":78}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "ai_delogo_v1",
"als_filter": {
"active_areas": [
{
"type": 1,
"lt_x": 527,
"lt_y": 13,
"rb_x": 701,
"rb_y": 78
}
]
}
}
}

5.1.3 指定領域消去
自動消去は、MPSのモデルライブラリ内のロゴのみを処理できます。一般的でないインターネットロゴは、通常モデルライブラリに含まれていないため、以下の2つのケースに応じて処理できます。
ロゴの位置が動的に変化する場合:モデルトレーニングによる除去が必要です。このプロセスには別途モデルトレーニング費用が発生します。
ロゴの位置が固定されている場合:custom_objsで除去領域を直接指定して除去でき、追加のモデルトレーニング費用は不要です。例は以下の通りです。
左図:元のビデオ、赤枠内は指定されたロゴ消去領域。右図:除去効果
左図:元のビデオ、赤枠内は指定されたロゴ消去領域。右図:除去効果

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "ai_delogo_v1",
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 1, //透かし除去。typeを1に設定
"value": "customobjs",
"score": 100,
"rect": {
"lt_x": 0.024,
"lt_y": 0.027,
"rb_x": 0.14,
"rb_y": 0.198
}
}
]
}
]
}
}
}



5.2 ロゴ消去 ベーシック版

ロゴ消去のベーシック版はぼかしによる除去効果で、自動消去と指定領域消去の2つの使用方法を提供しています。
課金に関する説明
ロゴ消去のベーシック版を使用すると、自動消去と指定領域消去を含め、「スマート消去の基本料金(ロゴ消去-ベーシック版)」が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。
5.2.1 自動消去
ExtendedParameterを渡さない場合、ロゴ消去のベーシック版(自動消去)のシナリオとなり、全画面でロゴが認識されます。
左:元のビデオ、左上と右上にそれぞれロゴ/アイコンがある。中:ロゴ消去のベーシック版(自動消去)の効果。
左:元のビデオ、左上と右上にそれぞれロゴ/アイコンがある。中:ロゴ消去のベーシック版(自動消去)の効果。

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterを渡す必要はありません。
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterを渡す必要はありません。

5.2.2 指定領域消去
ロゴ消去のプレミアム版と同様に、ベーシック版の自動消去もMPSのモデルライブラリ内のロゴのみを処理できます。一般的でないインターネットロゴは、通常MPSのモデルライブラリに含まれていないため、以下の2つのケースに応じて処理できます。
ロゴの位置が動的に変化する場合:モデルトレーニングによる除去が必要です。このプロセスには別途モデルトレーニング費用が発生します。
ロゴの位置が固定されている場合:custom_objsで除去領域を直接指定して除去でき、追加のモデルトレーニング費用は不要です。例は以下の通りです。
API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 1, //透かし除去。typeを1に設定
"value": "customobjs",
"score": 100,
"rect": {
"lt_x": 0.024,
"lt_y": 0.027,
"rb_x": 0.14,
"rb_y": 0.198
}
}
]
}
]
}
}
}


六、字幕削除 + ロゴ消去を同時に実行

課金に関する説明

字幕削除とロゴ消去を同時に行うと、「ロゴ消去-プレミアム版」と「字幕削除」の料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。

利用ガイド

ビデオ内に字幕(テキストコンテンツ)とロゴ(グラフィックコンテンツ)が両方存在する場合、CustomerAppIdsubtitle_logo_eraseに指定することで、字幕削除とロゴ消去を同時に処理できます。
一般的なインターネットロゴについては、ロゴの位置を指定する必要はありません。システムが自動で除去しますので、als_filterで字幕の位置を指定するだけで済みます。
左図:元のビデオ。右図:除去効果
左図:元のビデオ。右図:除去効果

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_logo_erase\\",\\"als_filter\\":{\\"active_areas\\":[{\\"type\\":2,\\"lt_x\\":0.106,\\"lt_y\\":0.733,\\"rb_x\\":0.901,\\"rb_y\\":0.825},{\\"type\\":2,\\"lt_x\\":0.612,\\"lt_y\\":0.911,\\"rb_x\\":0.988,\\"rb_y\\":0.984}]}}}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_logo_erase\\",\\"als_filter\\":{\\"active_areas\\":[{\\"type\\":2,\\"lt_x\\":0.106,\\"lt_y\\":0.733,\\"rb_x\\":0.901,\\"rb_y\\":0.825},{\\"type\\":2,\\"lt_x\\":0.612,\\"lt_y\\":0.911,\\"rb_x\\":0.988,\\"rb_y\\":0.984}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_logo_erase",
"als_filter": {
"active_areas": [
{
"type": 2, //字幕テキスト除去。typeを2に設定
"lt_x": 0.106,
"lt_y": 0.733,
"rb_x": 0.901,
"rb_y": 0.824
},
{
"type": 2, //字幕テキスト除去。typeを2に設定
"lt_x": 0.612,
"lt_y": 0.911,
"rb_x": 0.988,
"rb_y": 0.984
}
]
}
}
}

一般的でないインターネットロゴは、通常MPSのモデルライブラリに含まれていないため、以下の2つのケースに応じて処理できます。
ロゴの位置が動的に変化する場合:モデルトレーニングによる除去が必要です。このプロセスには別途モデルトレーニング費用が発生します。
ロゴの位置が固定されている場合:custom_objsで除去領域を直接指定して除去でき、追加のモデルトレーニング費用は不要です。例は以下の通りです。
API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_logo_erase\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_logo_erase\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_logo_erase",
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 1, //透かし除去。typeを1に設定
"value": "customobjs",
"score": 100,
"rect": {
"lt_x": 0.024,
"lt_y": 0.027,
"rb_x": 0.14,
"rb_y": 0.198
}
}
]
}
]
}
}
}


七、プライバシー保護処理(顔・ナンバープレート)

課金に関する説明

プライバシー保護処理機能を使用すると、「プライバシー保護処理(顔、ナンバープレート)」料金が発生します。料金についてはスマート消去の課金に関する説明をご参照ください。

7.1 顔処理

ビデオ画面を認識後、出現した顔にぼかしまたはモザイク処理を施し、新しいビデオを生成します。
ぼかし効果
左図:元のビデオ画面。右図:顔のぼかし処理
左図:元のビデオ画面。右図:顔のぼかし処理

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"CustomerAppId\\":\\"facial_blur\\"}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"CustomerAppId\\":\\"facial_blur\\"}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"CustomerAppId": "facial_blur"
}
}

モザイク効果
左図:元のビデオ画面。右図:処理後、すべての顔にモザイクがかけられている。
左図:元のビデオ画面。右図:処理後、すべての顔にモザイクがかけられている。

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"CustomerAppId\\":\\"facial_mosaic\\"}}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"CustomerAppId\\":\\"facial_mosaic\\"}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"CustomerAppId": "facial_mosaic"
}
}


7.2 顔とナンバープレートの同時処理

ビデオ画面を認識後、出現した顔とナンバープレートの情報に同時にぼかしまたはモザイク処理を施し、新しいビデオを生成します。
ぼかし効果
現在クローズドベータ版です。テストをご希望の場合は、弊社までお問い合わせください。
モザイク効果
左図:元のビデオ画面。右図:顔とナンバープレートの両方にモザイクがかけられている
左図:元のビデオ画面。右図:顔とナンバープレートの両方にモザイクがかけられている

API ExplorerのJSONモードを使用
API Explorerのフォームモードを使用

ExtendedParameterに以下のエスケープされた文字列を渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{\\"delogo\\":{\\"CustomerAppId\\":\\"facial_and_numberplate_mosaic_v2\\"}}
ProcessMediaを呼び出してタスクを開始する際のJSONの完全な例:
{
"InputInfo":{ //入力ビデオパス。ご自身の元のビデオに置き換えてください
"Type":"URL",
"UrlInputInfo":{
"Url":"https://test-1234567.cos.ap-nanjing.myqcloud.com/mps_test/myvideo.mp4"
}
},
"OutputStorage":{ //出力先のCOSバケット。置き換えてください
"Type":"COS",
"CosOutputStorage":{
"Bucket":"test",
"Region":"ap-nanjing"
}
},
"OutputDir":"/mps_test/output/",//出力先のフォルダパス。置き換えてください
"AiAnalysisTask":{
"Definition":25, //スマート消去のプリセットテンプレートID。25を記入してください
"ExtendedParameter":"{\\"delogo\\":{\\"CustomerAppId\\":\\"facial_and_numberplate_mosaic_v2\\"}}" //拡張パラメータ。異なる除去機能を選択するには、この部分を置き換える必要があります
},
"TaskNotifyConfig":{ //イベントコールバック通知設定。任意
"NotifyType":"URL",
"NotifyUrl":"http://www.qq.com/callback"
}
}

ExtendedParameterに以下のエスケープされていないJSONを渡します(各フィールドの具体的な説明は付録:ExtendedParameterフィールドの説明をご参照ください)。
{
"delogo": {
"CustomerAppId": "facial_and_numberplate_mosaic_v2"
}
}


付録:ExtendedParameterフィールドの説明

ExtendedParameterがサポートするすべてのフィールドとその説明は以下の通りです。
"delogo":{
"CustomerAppId": "subtitle_extract", # string;プリセットのシナリオパラメータ。シナリオによって、以下のパラメータの一部のみが使用される場合があります。通常、パラメータの変更には弊社内部での確認が必要です。
"cluster_id": "", # string;予約フィールド。ポリシーによるクラスタのスケジューリングに使用されます。特定のタスクは特定のクラスタで実行する必要があり、任意に変更はできません
"output_patten": "{task_type}-{session_id}", # string;出力ファイル名。特殊文字は使用できず、長さは200未満。プレースホルダーは{}で、task_type、session_idをサポートします
"als_filter": { # jsonオブジェクト、ターゲット検査分析フィルター
"min_ocr_height": 10, # float、0以上で有効。文字認識用:文字の最小サイズ。注:1以下はビデオの高さに対する比率、1より大きい場合はピクセル値を表します
"max_ocr_height": 0.06, # float、0以上で有効。文字認識用:文字の最大サイズ
"active_areas": [ # json配列。領域フィルター。認識結果の中心点がこの領域内にある場合のみ採用されます
{
"lt_x": 0.1, # float、0以上で有効。領域の左上隅のx座標。注:1以下は比率、1より大きい場合はピクセル値を表します
"lt_y": 0.6, # float、0以上で有効。領域の左上隅のy座標
"rb_x": 0.9, # float、0以上で有効。領域の右下隅のx座標
"rb_y": 0.95 # float、0以上で有効。領域の右下隅のy座標
}
]
},
"custom_objs": { # json オブジェクト。カスタム領域
"type": 0, # in、0を記入。タイプを指定
"time_objs": [# json 配列。時間領域情報
{
"begin_ms": 0, # int;開始時間(単位ms)。未入力の場合はビデオの開始時刻と同じになります
"end_ms": 100, # int;終了時間(単位ms)。未入力の場合はビデオの終了時刻と同じになります
"objs": [ # json 配列。領域情報
{
"rect": { # jsonオブジェクト。ターゲット領域
"lt_x": 55, # float、0以上で有効。領域の左上隅のx座標。注:1未満は比率、1以上はピクセル値を表します
"lt_y": 143, # float、0以上で有効。領域の左上隅のy座標
"rb_x": 327, # float、0以上で有効。領域の右下隅のx座標
"rb_y": 192 # float、0以上で有効。領域の右下隅のy座標
},
"score": 100, # int、ここに100を記入。ターゲットの参考スコア
"type": 2, # int;ターゲットタイプ。1はロゴなどのターゲット、2はテキストを指します
"value": "LUSN" # string;ターゲットの値。例えば、文字認識の場合は対応するテキストを記入します
}
]
}
]
}
"subtitle_param" : { # jsonオブジェクト。字幕関連パラメータ
"margin_bottom": 0.2, # float、0以上で有効。字幕ファイルのレンダリング用。字幕の下辺からの距離。1以下はビデオの高さに対する比率、1より大きい場合はピクセル値を表します
"font_size": 50, # float、0以上で有効。字幕ファイルのレンダリング用。字幕のフォントサイズ。1以下はビデオの高さに対する比率、1より大きい場合はピクセル値を表します
"font_type": "simkai", # string;字幕のレンダリングフォント:simkai-楷書体、hei-ゴシック体、song-明朝体
"translate_dst_language": "en" # string;字幕翻訳用。空に設定すると翻訳は行われず、元の言語の字幕のみが出力されます。その他の値と対応関係:en-英語、zh-中国語、ja-日本語、ko-韓国語、de-ドイツ語、pt-ポルトガル語、id-インドネシア語、th-タイ語、ms-マレー語。上記はよく使われる言語のみです。数百の翻訳言語をサポートしていますので、完全なリストが必要な場合はお問い合わせください。
}
}

よくあるご質問

ASRで字幕生成できますか?

はい、サポートしています。スマート字幕機能で実現できます。詳細はスマート字幕の導入をご参照ください。
除去シナリオでは、元のビデオに通常は元の言語の字幕が含まれているため、OCRで字幕を抽出する方が効果的で正確です。そのため、スマート消去機能にはOCRのみが統合されています。

字幕の焼き込みや外部字幕機能を単独で使用することはできますか?

除去を伴わない、単純な字幕の焼き込みや外部字幕の利用は、音声・動画トランスコード機能で実現できます。詳細は音声・動画トランスコード導入ガイドの字幕焼き込み外部字幕をご参照ください。

既存の音声ファイルがある場合、それをビデオファイルと合成して新しいビデオを生成するにはどうすればよいですか?

ビジネスシナリオ:
他の方法でAIによるナレーション音声ファイルを生成済みで、ビデオのボーカルと背景音を分離し、そのAIナレーションと背景音を元のビデオに合成して、元の音声を置き換えたい。
実現方法:
ボーカルと背景音を分離するには、コンソールで音声・動画エンハンスメントタスクを作成し、音源分離機能を有効にします。タスク開始後、背景音ファイルが取得できます。

次に、ビデオ編集APIを呼び出し、合成タスクを選択して、AIナレーション、背景音、ビデオを合成し、新しいビデオを生成します。JSONの例は以下の通りです。
POST / HTTP/1.1
Host: mps.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: EditMedia
<共通リクエストパラメータ>
{
"FileInfos": [//合成が必要なファイル情報を入力
{
"InputInfo": {//入力ビデオパス
"Type": "URL",
"UrlInputInfo": {
"Url": "https://test.cos.ap-nanjing.myqcloud.com/MPS/sourcevideo.mp4"
}
},
"Id": "SOURCE_VIDEO"
},
{
"InputInfo": {//入力ボーカルパス
"Type": "URL",
"UrlInputInfo": {
"Url": "https://test.cos.ap-nanjing.myqcloud.com/MPS/voices.mp3"
}
},
"Id": "AUDIO_VOICES"
},
{
"InputInfo": {//入力背景音パス
"Type": "URL",
"UrlInputInfo": {
"Url": "https://test.cos.ap-nanjing.myqcloud.com/MPS/background.mp3"
}
},
"Id": "AUDIO_BACKGROUND"
}
],
"OutputStorage": {//出力先COSディレクトリ
"Type": "COS",
"CosOutputStorage": {
"Bucket": "test",
"Region": "ap-nanjing"
}
},
"OutputObjectPath": "/editmedia/compose/final_video.{format}",//出力フォルダパスおよびファイル名の定義
"ComposeConfig": {
"TargetInfo": {//出力ビデオパラメータ
"Container": "mp4",
"RemoveVideo": 0,
"RemoveAudio": 0,
"VideoStream": {
"Codec": "H.264",
"Fps": 18
},
"AudioStream": {
"Codec": "AAC",
"SampleRate": 32000,
"AudioChannel": 1
}
},
"Tracks": [//トラック情報
{
"Type": "Video",//トラック1、ビデオ
"Items": [
{
"Type": "Video",
"Video": {
"SourceMedia": {
"FileId": "SOURCE_VIDEO"
},
"AudioOperations": [
{
"Type": "Volume",
"Volume": 0 //ビデオ内の元の音声をミュート
}
]
}
}
]
},
{
"Type": "Audio",//トラック2、ボーカル
"Items": [
{
"Type": "Audio",
"Audio": {
"SourceMedia": {
"FileId": "AUDIO_VOICES"
},
"TrackTime": {
"Duration": "10s" //トラックの継続時間。未入力の場合はSourceMediaの長さと同じになります
},
"AudioOperations": [
{
"Type": "Volume",
"Volume": 5 //音量設定
}
]
}
}
]
},
{
"Type": "Audio",//トラック3、背景音
"Items": [
{
"Type": "Audio",
"Audio": {
"SourceMedia": {
"FileId": "AUDIO_BACKGROUND"
},
"TrackTime": {
"Duration": "10s" //トラックの継続時間。未入力の場合はSourceMediaの長さと同じになります
},
"AudioOperations": [
{
"Type": "Volume",
"Volume": 5 //音量設定
}
]
}
}
]
}
]
}
}

ロゴ消去機能は具体的にどのロゴをサポートしていますか?

現在、十数種類のロゴの自動認識と除去をサポートしています。サポート範囲外のロゴについては、カスタマイズされたモデルトレーニングサービスを提供しており、これには別途モデルトレーニング費用が発生します。
ロゴの位置が固定されている場合は、除去領域を指定して処理することも可能で、追加のモデルトレーニング費用は不要です。

ロゴのないビデオでも課金されますか?

はい、課金されます。ビデオにロゴがない場合でも、サービスは正常に分析・認識処理を行うため、計算リソースを消費するためです。

ライブ配信はサポートしていますか?

現在、公開されているインターフェースはオンデマンドファイルのみをサポートしています。ライブストリームの処理が必要な場合は、開発担当者にご連絡ください。

除去後の出力ファイル名はどのように指定しますか?

拡張パラメータ内のoutput_pattenパラメータで出力ファイル名を指定できます。
プレースホルダーは{}で、task_type、session_idをサポートしています。デフォルトの出力は {task_type}-{session_id}です。
使用例:
//エスケープ前のサンプルコード。API Explorerでのみ使用可能です:
{
"delogo": {
"CustomerAppId": "subtitle_extract",
"subtitle_param": {
"translate_dst_language": ""
},
"output_patten": "custom-{task_type}-{session_id}"
}
}
// APIを直接使用する場合は、上記のコードをエスケープして文字列として渡してください:{\\"delogo\\":{\\"CustomerAppId\\":\\"subtitle_extract\\",\\"subtitle_param\\":{\\"translate_dst_language\\":\\"\\"},\\"output_patten\\": \\"custom-{task_type}-{session_id}\\"}}

// 上記パラメータの出力ファイル名は次のようになります:custom-delogo-02EF93096ADCC84F4ACF156F3A0D1120DD_1721359047292.vtt


スマート消去はCOSの自動トリガーをサポートしていますか?

スマート消去テンプレートは現在開発中で、2025年7月にコンソールに実装される予定です。その際には、コンソールでワークフローを設定し、自動トリガーを有効にすることができます。
現在、自動トリガーのニーズがある場合は、オフラインでの設定について弊社までご連絡ください。ご理解のほど、よろしくお願いいたします。


ヘルプとサポート

この記事はお役に立ちましたか?

フィードバック