機能名 | 機能説明 | 活用例 |
フェイスレコグニション | 画面内に登場する顔の認識 | スターが画面に登場する位置のタグ付けを行います。 画面に登場した話題の人物について調べます。 |
音声全文認識 | 音声内に登場する全テキストの認識 | スピーチ内容について字幕を生成します。 ビデオの音声内容に対するデータ分析を行います。 |
テキスト全文認識 | 画面内に登場する全テキストの認識 | 画面内のテキストに対するデータ分析を行います。 |
音声キーワード認識 | 音声内に存在するキーワードの認識 | 音声内のセンシティブワードを調べます。 音声内に出てきた特定のキーワードを検索します。 |
テキストキーワード認識 | 画面内に存在するキーワードの認識 | 画面内のセンシティブワードを調べます。 画面内に登場した特定のキーワードを検索します。 |
ビデオ先頭末尾認識 | ビデオの先頭と末尾の認識 | プログレスバーの中の先頭、末尾、本編の位置にタグ付けを行います。 ビデオの前後の不要な部分を一括削除します。 |
AiRecognitionTask
パラメータでオーディオビデオコンテンツ認識テンプレートのテンプレートIDを指定します。MediaProcessTask.AiRecognitionTask
の中で指定)。コンソールでこのタスクフローを使用してビデオ処理を開始します。MediaProcessTask.AiRecognitionTask
の中で指定)。アップロードの申請のprocedure
パラメータでこのタスクフローを指定します。MediaProcessTask.AiRecognitionTask
の中で指定)。クライアントからのアップロード署名のprocedure
でこのタスクフローを指定します。MediaProcessTask.AiRecognitionTask
の中で指定)。コンソールでビデオをアップロードし、アップロードと同時にビデオに対する処理操作を実行を選択して、ビデオアップロード後にこのタスクフローを実行するよう指定します。{"EventType":"ProcedureStateChanged","ProcedureStateChangeEvent":{"TaskId":"1400155958-Procedure-2e1af2456351812be963e309cc133403t0","Status":"FINISH","FileId":"5285890784363430543","FileName":"名作選","FileUrl":"http://1400155958.vod2.myqcloud.com/xxx/xxx/aHjWUx5Xo1EA.mp4","MetaData":{"AudioDuration":243,"AudioStreamSet":[{"Bitrate":125599,"Codec":"aac","SamplingRate":48000}],"Bitrate":1459299,"Container":"mov,mp4,m4a,3gp,3g2,mj2","Duration":243,"Height":1080,"Rotate":0,"Size":44583593,"VideoDuration":243,"VideoStreamSet":[{"Bitrate":1333700,"Codec":"h264","Fps":29,"Height":1080,"Width":1920}],"Width":1920},"AiRecognitionResultSet":[{"Type":"FaceRecognition","FaceRecognitionTask":{"Status":"SUCCESS","ErrCode":0,"Message":"","Input":{"Definition":10},"Output":{"ResultSet":[{"Id":183213,"Type":"Default","Name":"張三","SegmentSet":[{"StartTimeOffset":10,"EndTimeOffset":12,"Confidence":97,"AreaCoordSet":[830,783,1030,599]},{"StartTimeOffset":12,"EndTimeOffset":14,"Confidence":97,"AreaCoordSet":[844,791,1040,614]}]},{"Id":236099,"Type":"Default","Name":"lisi","SegmentSet":[{"StartTimeOffset":120,"EndTimeOffset":122,"Confidence":96,"AreaCoordSet":[579,903,812,730]}]}]}}}],"TasksPriority":0,"TasksNotifyMode":""}}
ProcedureStateChangeEvent.AiRecognitionResultSet
にType
がFaceRecognition
となる認識結果があり、顔認識を表します。Type
がFaceRecognition
の結果では、Output.ResultSet
の中に認識した人物が2人含まれており、それぞれ張三
とlisiとなっています。SegmentSet
には人の顔がビデオに登場した時間帯(StartTimeOffset
とEndTimeOffset
により確定)および画面の中の座標(AreaCoordSet
により確定)が示されています。
この記事はお役に立ちましたか?