tencent cloud

音声・動画強化テンプレート

Download
フォーカスモード
フォントサイズ
最終更新日: 2025-11-05 14:18:57
MPS業界最先端の音声・動画AI処理モデルと豊富な業務データの蓄積により、音声・動画強化は音声と動画の品質を大幅に向上させ、OTT、Eコマース、スポーツイベントなどのシナリオで広く活用され、QoEやQoSの向上といった業務価値をもたらします。


利用シナリオ

システムはプリセット強化テンプレートを提供します。また、業務ニーズに応じて、カスタム音声・動画強化テンプレートを作成することで、様々な用途に応じた処理パラメータを事前に設定して、ご利用いただけます。以下では、コンソールとAPIを使用してカスタム音声・動画強化テンプレートを作成する方法について詳しく説明します。

シナリオ1:コンソールで強化テンプレートを作成

1. コンソールで強化テンプレートを作成するには、テンプレート管理>音声・動画強化テンプレートに進み、音声・動画強化テンプレートを作成をクリックし、カスタムテンプレートを作成します。

2. 音声・動画強化テンプレート作成画面では、以下のパラメータを設定できます。パラメータの詳細については、下記の 設定説明をご参照ください。
注意:
コンソールで強化テンプレートを作成する際、トランスコード関連のパラメータ設定をすべてカバーすることはできません。トランスコード関連のパラメータ設定が必要な場合は、APIで強化テンプレートを作成することを推奨します。詳細は下記のAPIで強化テンプレートを作成をご参照ください。


設定説明

設定項目
説明
テンプレート名
中国語、英語、数字、スペース、アンダースコア(_)、ハイフン(-)、ピリオド(.)のみ使用できます。長さは64文字以内にする必要があります。
コンテナ
MP4、FLV、HLS。
強化タイプ
動画強化、または音声強化を選択できます。
基本出力設定
コーデック
H264、H265、AV1。
解像度
動画の幅と高さ、または長辺・短辺を基準にした設定に対応しています。
動画強化の詳細パラメータ設定
推奨パラメータ
ショート動画、高画質映画・ドラマ、ゲーム、旧作映像の修復などのシナリオ向けに、推奨パラメータをプリセットしています。各シナリオをクリックすると対応する強化設定が自動的に適用され、お好みで微調整し、最適な効果を得ることができます。
フレームレート
ソース動画と同じまたはカスタム設定ができます。カスタムフレームレートは[1, 120]の範囲で設定可能です。
超解像度
超解像度技術は、動画のコンテンツと輪郭を認識し、ディテールや局所的な特徴を高精細に再構築することで、低解像度の動画を高解像度に変換します。旧作映像の修復などのシナリオに適しています。低解像度モデル、高解像度モデル(デフォルト)から選択できます。
1. 低解像度モデル:低解像度のビデオフレームの処理に特化しており、その主な目的は、これらのフレームからディテールと情報を復元することです。このモデルは処理速度が速く、ビデオの迅速な処理に適しています。
2. 高解像度モデル(デフォルト):より高品質な高解像度のビデオフレームを生成することを目的としており、低解像度から高解像度へのマッピングを学習することで実現されます。このモデルはより複雑で、多くの計算リソースを必要としますが、通常はより鮮明でリアルなビデオフレームを生成できます。
低照度補正
撮影環境やカメラのハードウェア性能上、一部のシーンで撮影された映像は、輝度やコントラストが低くなったり、画面が暗くなったり、暗部が見づらくなったりすることがあります。低照度補正機能を使用すると、暗部のディテールとコントラストを大幅に向上させ、画質品質を高めます。
HDR
HDR10、HLGに対応し、より広い色域を獲得し、色彩のディテールを豊かに表現することで、さらに高品質な動画コンテンツを提供します。
1. HDR10:静的HDR規格で、より広い色域と輝度範囲を提供します。
2. HLG(Hybrid Log-Gamma):SDRとHDRの長所を組み合わせ、単一のビデオストリームにSDRとHDR両方の情報を含めることができます。放送やストリーミング配信のアプリケーションに適しています。
総合強化
AIの総合的な分析能力により、映像内のテクスチャのバランスを自動で調整し、圧縮によるアーティファクトや乱れを除去すると同時に、重要なディテールを強調することで、画面全体から受ける直感的な印象を向上させます。
色調補正
色調補正により、画面をよりリアルな色に近づけ、かつ人間の視覚特性に合わせた色彩表現を実現できます。
ディテール強化
ディテール強化は、動画内で注目すべきディテール(例:競技場の芝生)に対して強調処理を施し、画面のコンテンツをより鮮明で豊かにします。
顔補正
顔検出技術により、人間の視覚が特に関心を寄せる顔部分を補正し、その領域のディテールをより鮮明にし、主観的な視覚体験を向上させます。
傷除去
傷除去は、動画の傷やノイズなどの問題を修復できます。
アーティファクト除去
動画がトランスコードまたは複数回のトランスコードプロセスで複数回圧縮された場合、ブロック、リンギング、色彩浸透、ノイズなどが発生し、視覚効果に影響を与える歪みが発生します。圧縮による歪みの除去は、エンコード処理中に生じた歪みを効果的に修復できます。
動画ノイズリダクション
映像撮影中にはカメラや環境によってランダムノイズが発生することがあります。ここでは、細部を損なわずに画面のランダムノイズを除去するノイズリダクションサービスを提供します。
音声強化の詳細パラメータ設定
音声ノイズリダクション
音声スマートノイズリダクションは、機材のノイズや環境騒音などを除去でき、講義の録画や屋外での撮影のポストプロダクションなどのシナリオに適しています。
音源分離
音声・動画ファイルから、人の声と背景音、またはボーカルと伴奏を分離し、独立した音声素材を生成します。これにより、ポストプロダクションでの様々なスタイルの芸術的な加工が容易になります。
イコライザー
1. ラウドネス正規化:全体のラウドネスレベルを均一に維持し、再生時に音量が同じ程度に聞こえるように調整します。これにより、音量が大きすぎたり小さすぎたりする問題を解消し、より良い聴覚体験を提供します。
2. 音量急変抑制:音量が大きすぎる音声区間を正規化することで、音量の急激な変化を防ぎ、よりスムーズな視聴体験を提供します。
音質補正
1. ノイズ除去:音声に含まれる不要なノイズや雑音を減らし、音質と明瞭度を向上させます。
2. 歯擦音抑制:歯擦音とは音声中の鋭く耳障りな音で、通常は音源がマイクに近づきすぎた際に発生します。歯擦音抑制機能は、この不自然な音を低減または除去し、音質を改善することを目的とします。

シナリオ2:APIで強化テンプレートを作成

APIでテンプレートを作成する場合、トランスコード関連のパラメータを設定できます。詳細なパラメータについては、トランスコードテンプレートの作成をご参照ください。以下は強化テンプレートの作成例です。
{
"Container": "mp4",
"Name": "test",
"VideoTemplate": { //動画トランスコードパラメータ設定
"Codec": "h264",
"Fps": 50,
"Bitrate": 5000,
"Width": 0,
"Height": 0,
"Gop": 0
},
"AudioTemplate": { //音声トランスコードパラメータ設定
"Codec": "aac",
"Bitrate": 60
},
"EnhanceConfig": { //強化パラメータ設定
"VideoEnhance": { //動画強化設定
"FrameRate": { //フレーム補間
"Switch": "ON",
"Fps": 50
},
"SuperResolution": { //超解像
"Switch": "ON",
"Type": "lq"
}
},
"AudioEnhance": { //音声強化設定
"Denoise": { //音声ノイズ除去
"Switch": "ON"
}
}
}
}
注意:
API Explorerで迅速な認証を実現できます。ページにアクセスし、関連パラメータを入力すると、オンラインでAPIを呼び出せます。


ヘルプとサポート

この記事はお役に立ちましたか?

フィードバック