概要
大規模言語モデルによる音声・動画コンテンツの生成には、膨大な量の高品質トレーニング素材が必要です。業界の競争トレンドもまた、より高精細で、よりスムーズで、よりリアルなAIGCコンテンツの提供へと向かっています。このような背景の中、Tencent Cloudメディアサービスは品質検査、音声・動画強化、画面超解像技術をコンテンツ生成シナリオと深く融合させることで、生成結果の品質を大幅に向上させています。
シナリオ
トレーニング素材の収集とクリーニング段階における品質選別
ニーズ:品質の悪い動画をスクリーニングにより選別・除外する必要があります。
ソリューション:動画トレーニングデータのクリーニング段階で、メディア品質検査機能により、形式や画質問題のあるトレーニング素材を除去し、トレーニング動画の全体的な品質を向上させることができます。
生成動画の解像度、フレームレート、色彩効果の向上
ニーズ:生成動画の解像度、フレームレート、色彩効果を向上させ、画質をより鮮明でスムーズにする必要があります。
ソリューション:動画生成シナリオにおいて、動画超解像機能によりAI生成動画の解像度をさらに向上させ、スマートフレーム補間機能でよりスムーズな画面効果を実現できます。
生成結果のコンプライアンスと情報のトレースバック要件を満たす
ニーズ:生成結果に必要な透かし情報を追加し、情報のトレースバックとコンプライアンス要件を満たす必要があります。
ソリューション:大規模言語モデルの生成結果に浮き彫り透かしと隠し透かしを追加し、情報のトレースバックとコンプライアンスを確保します。
大規模言語モデルによる音声・動画コンテンツの生成には、膨大な量の高品質トレーニング素材が必要です。業界の競争トレンドもまた、より高精細で、よりスムーズで、よりリアルなAIGCコンテンツの提供へと向かっています。このような背景の中、Tencent Cloudメディアサービスは品質検査、音声・動画強化、画面超解像技術をコンテンツ生成シナリオと深く融合させることで、生成結果の品質を大幅に向上させています。
機能紹介と導入方法
|
メディア品質検査 | メディア品質検査は以下の項目をサポートします。 形式品質検査 動画&音声コンテンツ品質検査 ノンリファレンス型評価 この機能は、モデルトレーニング素材のクリーニング段階で、動画形式の問題を検出し、色の歪み、低照度、ビネッティング、コントラスト異常、ゴースト、モザイクなどの画質問題を識別できます。品質検査によって問題のある動画を除去することで、トレーニング素材全体の品質は大幅に向上します。 | |
音声・動画強化 | 音声・動画強化機能は、動画のぼかし除去、ノイズリダクション、ディテール強化、文字補強、色調補正、顔補正、動画超解像、フレーム補間などの機能を提供します。 大規模言語モデルによる動画生成において、元々生成された720Pまたは1080P解像度の動画を、超解像技術によって2Kや4K解像度に高めるとともに、フレーム補間、ディテール強化、色調補正などの機能で画面品質をさらに向上させることができます。 | |
動画透かし | 動画に浮き彫り透かしと隠し透かしの追加をサポートします。これにより、情報のトレースバックとコンプライアンス要件を満たすことができます。 透かし画像、透かし位置、透かしサイズなどのカスタマイズに対応しています。 |
|