tencent cloud

Media Processing Service

업데이트 및 공지 사항
Release Notes
공지 사항
제품 소개
Overview
제품 기능
제품 장점
Use Cases
구매 가이드
과금 안내
구매 가이드
연장 안내
연체 안내
환불 설명
시작하기
콘솔 가이드
개요
Creating Tasks
Tasks
Orchestrations
템플릿 관리
리소스 팩 관리
Video Evaluation
AIGC Content Generation
Terminal SDK
Subtitle Editing Tool
사용량 통계
Cloud Access Management Sample
FAQs
서비스 기본 개념 관련
Account Authorization
업로드 콜백 관련
트랜스코딩 다운로드 관련
기능 구현 관련
Related Agreement
Service Level Agreement
개인 정보 보호 정책
데이터 처리 및 보안 계약

제품 기능

PDF
포커스 모드
폰트 크기
마지막 업데이트 시간: 2025-08-20 16:43:08
MPS는 멀티미디어 파일을 다른 비트레이트 및 해상도로 변환하여 각종 대역폭과 다양한 장치에서 원활하게 재생될 수 있도록 합니다. 다음과 같은 기능이 있습니다.

멀티미디어 트랜스코딩

트랜스코딩은 다양한 재생 장치 및 네트워크 조건에 맞게 오디오/비디오 스트림의 코덱, 해상도, 비트레이트 등을 변경하는 오프라인 작업입니다. 트랜스코딩의 효과는 다음과 같습니다.
구현 가능한 기능
설명
호환 가능 단말 확대
더 강력한 단말 호환 성능을 갖춘 포맷(예: MP4)으로 원본 비디오를 트랜스 코딩하여 더 많은 디바이스에서 비디오 리소스를 재생할 수 있습니다
호환 가능 대역폭 확대
비디오를 FLU, SD, HD, FHD 출력으로 변환하여 네트워크 환경에 따라 적합한 비트 레이트의 비디오를 재생할 수 있습니다
재생 효율성 향상
MOOV 아톰은 MP4 파일의 끝에서 시작 부분으로 이동할 수 있으므로 비디오가 완전히 다운로드되기 전에 재생할 수 있습니다
대역폭 절약
트랜스코딩에 고급 인코딩 모드(예: H.265)를 사용하여 원본 품질을 유지하면서 비디오의 비트레이트를 줄여 투자 회수 대역폭 사용량을 줄입니다
트랜스 코딩의 타깃 사양은 인코딩 포맷, 해상도, 비트레이트 등의 매개변수를 포함합니다. 다음과 같은 트랜스 코딩 관련 매개변수를 사용자 정의할 수 있습니다.
매개변수
유형
상세 설명
입력 형식
컨테이너 형식
3GP, AVI, FLV, MP4, M3U8, MPG, ASF, WMV, MKV, MOV, TS, WebM, MXF
비디오 코덱
AV1, AVS2, H.264/AVC, H.263, H.263+, H.265, MPEG-1, MPEG-2, MPEG-4, MJPEG, VP8, VP9, RealVideo, Windows Media Video, Quicktime
오디오 코덱
AAC, ADPCM, AMR, DSD, MP1, MP2, MP3, PCM, RealAudio, Windows Media Audio, VORBIS, AC-3
출력 형식
컨테이너 형식
비디오: FLV, MP4, HLS(m3u8+ts), MXF
오디오: MP3, MP4, OGG, FLAC, m4a
이미지: GIF, WEBP
비디오 코덱
H.264/AVC, H.265/HEVC, AV1
오디오 코덱
MP3, AAC, FLAC, MP2, VORBIS
패키징
비디오 스트림 삭제
활성화 후 트랜스코딩 결과에는 오디오 스트림만 포함됩니다.
오디오 스트림 삭제
활성화 후 트랜스코딩 결과에는 비디오 스트림만 포함됩니다.

멀티미디어 향상

이미지 복원 및 향상 모듈과 AI 알고리즘을 기반으로 해상도를 높이는 동시에 비디오 노이즈 제거, 윤곽 복원, 초해상도 재구성 등의 기능을 제공하며 UGC/PGC 비디오 품질 향상, 오래된 필름 리뉴얼 및 4K 제작 등의 비즈니스 시나리오에 적합합니다.
능력
설명
비디오 노이즈 감소
디테일을 유지하는 동시에 비디오 캡처 과정에서 발생하는 노이즈를 줄입니다.
아티팩트 제거(글리치)
트랜스 코딩 중 비디오 압축으로 인해 블로킹 아티팩트, 링잉 아티팩트, 모기 노이즈 및 색상 왜곡이 발생할 수 있습니다. 이 기능은 이러한 문제를 해결합니다.
스크래치 제거
촬영과 저장 및 이전 저장 과정에서 알 수 없는 요인으로 필름에 스크래치와 눈꽃 점 등이 발생할 수 있습니다. 이 기능은 비디오의 스크래치나 눈꽃 점 등 훼손된 내용을 수정할 수 있습니다.
디테일 향상
카메라 품질, 저장 및 트랜스코딩 과정으로 인해 비디오 디테일이 충분히 선명하지 않을 수 있습니다. 이 기능은 비디오의 디테일을 높이고, 비디오의 선명도를 높입니다.
종합적인 향상
AI 기술을 활용하여 이미지 텍스처의 균형을 맞추고, 아티팩트를 제거하고, 비디오 이미지를 매끄럽게 만들고, 이미지 세부 정보를 개선하여 시각적 경험을 개선합니다.
초해상도
일부 영화는 해상도가 낮아 고해상도 영화에 대한 요구에 부응하지 못합니다. 이 기능은 디테일을 향상하고, AI 알고리즘을 이용해 고해상도 출력과 함께 디테일을 더 선명하게 합니다.
안면 인식 향상
안면 인식 기술을 기반으로 주요 얼굴 특징을 개선합니다.
색상 향상
촬영 장비의 색상 문제나 영화의 보존 문제로 인해 영화의 색상이 일정하게 왜곡되거나 강화되는 경우가 있습니다. 색상 향상은 색상을 더 사실적으로 만들고, 색상을 일정 수준 향상하여, 시각적 경험을 개선합니다.
저조도 향상
환경 상황 및 촬영 카메라의 하드웨어 제약으로 인해 일부 장면에서 촬영된 화면의 밝기와 콘트라스트가 누락되어 화면이 어둡거나 또는 화면의 어두운 영역의 디테일을 볼 수 없습니다. 따라서 저조도 장면 향상은 장면을 자동으로 식별하고 화면 적응을 향상하여, 저조도 장면의 디테일과 콘트라스트를 향상시켜 시각적 경험을 개선합니다.
HDR
SDR to HDR 기능은 일반 SDR 비디오를 HDR 비디오로 변환할 수 있으며, 색 심도를 10bit로 높여 더 넓은 색상 범위와 더 많은 색상 세부 정보를 제공합니다.
프레임 삽입
원본 비디오 프레임간에 새로운 비디오 프레임을 보충하여, 사용자에게 보다 매끄러운 시각 효과를 제공합니다. 또한 낮은 프레임 레이트의 오래된 비디오에서 랙, 지터 등 화질 문제도 해결합니다.

워터마크

워터마킹은 지정된 위치에서 트랜스코딩된 비디오 또는 스크린샷에 이미지를 추가하는 오프라인 작업입니다. MPS는 다음 유형의 워터마크를 지원합니다.
정적 이미지 워터마크: PNG 포맷의 이미지 워터마크로, 저작권 소유자의 LOGO, 방송국 마크 등 비디오의 저작권 속성을 나타내는 데 자주 쓰입니다.
애니메이션 이미지 워터마크: APNG 포맷의 애니메이션 이미지 워터마크로, 워터마크 이미지의 동적 변화 효과를 구현할 수 있습니다.
미디어 또는 스크린샷의 다른 위치에 크기가 다른 여러 워터마크를 추가할 수 있습니다. 워터마킹에 지정할 수 있는 매개변수에는 워터마크 유형, 화면비, 위치 등이 있습니다.
매개변수
설명
워터마크 유형(Type)
정적 또는 애니메이션 워터마크 지원
워터마크 위치(Position)
비디오에서 워터마크의 상대적 위치
이미지 크기(ImageSize)
워터마크의 크기
이미지 콘텐츠(ImageContent)
워터마크의 이진법 데이터

비디오 화면 캡처

스크린샷은 지정된 시간에 비디오의 스크린샷을 찍는 오프라인 작업입니다. MPS는 다음 유형의 스크린샷을 지원합니다.
시점 스크린샷: 지정 시점 스크린샷.
샘플 스크린샷: 일정 간격의 스크린샷.
스프라이트 스크린샷: 일정한 간격으로 스크린샷을 찍어 하나의 큰 스프라이트 이미지로 결합합니다.
스크린샷을 위해 지정할 수 있는 매개변수에는 스크린샷 형식, 화면비 등이 포함됩니다.

시점 스크린샷

매개변수
설명
포맷(Format)
스크린샷 형식, 현재 JPG만 지원됨
폭(Width)
스크린샷 너비, 값 범위: 128px - 4096px
높이(Height)
스크린샷 높이, 값 범위: 128px - 4096px
채우기 모드(FillType)
채우기 모드는 종횡비가 스크린샷의 지정된 종횡비와 일치하지 않을 때 원본 비디오 이미지가 처리되는 방식을 지정합니다. 다음 채우기 모드가 지원됩니다.
늘이기: 원본 비디오 이미지가 스크린샷의 종횡비와 일치하도록 늘어납니다. 이미지가 왜곡될 수 있습니다.
검은색 막대: 원본 비디오 이미지의 종횡비는 유지되고 빈 공간은 검은색으로 채워집니다.
흰색 막대: 원본 비디오 이미지의 종횡비는 유지되고 빈 공간은 흰색으로 채워집니다.
가우시안 블러: 원본 비디오 이미지의 종횡비는 유지되고 빈 공간에는 가우시안 블러가 적용됩니다.

샘플 스크린샷

매개변수
설명
포맷(Format)
스크린샷 형식, 현재 JPG만 지원됨
폭(Width)
스크린샷 너비, 값 범위: 128px - 4096px
높이(Height)
스크린샷 높이, 값 범위: 128px - 4096px
샘플링 방식(SampleType)
샘플링 방식은 두 가지로 나뉩니다.
백분율 간격 샘플링: 5% 간격으로 샘플링할 경우, 스크린샷 20장 생성.
시간 간격 샘플링: 10s 간격으로 샘플링할 경우 스크린샷 장수는 비디오 길이에 따라 달라짐.
샘플링 간격(Interval)
샘플링 간격:
백분율 간격 샘플링인 경우 이 매개변수는 퍼센트 값입니다.
시간 간격 샘플링인 경우 이 매개변수는 시간 값(초)입니다.
채우기 모드(FillType)
채우기 모드는 종횡비가 스크린샷의 지정된 종횡비와 일치하지 않을 때 원본 비디오 이미지가 처리되는 방식을 지정합니다. 다음 채우기 모드가 지원됩니다.
늘이기: 원본 비디오 이미지가 스크린샷의 종횡비와 일치하도록 늘어납니다. 이미지가 왜곡될 수 있습니다.
검은색 막대: 원본 비디오 이미지의 종횡비는 유지되고 빈 공간은 검은색으로 채워집니다.
흰색 막대: 원본 비디오 이미지의 종횡비는 유지되고 빈 공간은 흰색으로 채워집니다.
가우시안 블러: 원본 비디오 이미지의 종횡비는 유지되고 빈 공간에는 가우시안 블러가 적용됩니다.

스프라이트 이미지

매개변수
설명
포맷(Format)
이미지 스프라이트 형식. 현재 JPG만 지원됨
작은 이미지의 폭(Width)
스프라이트의 작은 이미지 너비
작은 이미지의 높이(Height)
스프라이트의 작은 이미지 높이
작은 이미지의 행 수(Rows)
스프라이트의 이미지 행 수
작은 이미지의 열 수(Columns)
스프라이트의 이미지 열 수
샘플링 방식(SampleType)
샘플링 방식. 현재 시간별 샘플링만 지원됩니다.
샘플링 간격(Interval)
이미지 샘플링 시간 간격
주의:
Width × Columns는 128px - 4096px 사이여야 합니다(큰 이미지의 폭은 128px - 4096px 사이).
Height × Rows는 128px - 4096px 사이여야 합니다(큰 이미지의 높이는 128px - 4096px 사이).

비디오 애니메이션 이미지

애니메이션 이미지는 비디오의 일정 부분을 선택해 움직이는 이미지(GIF, WEBP 등)를 생성하는 오프라인 작업입니다. 애니메이션 이미지는 연속 프레임의 매끄러운 순환이며, 적은 용량으로 애니메이션 효과를 구현합니다. 애니메이션 이미지 생성을 위해 설정할 수 있는 매개변수에는 형식, 너비, 높이, 프레임 속도 등이 있습니다.
매개변수
설명
포맷(Format)
애니메이션 이미지 형식. 현재 GIF 및 WEBP만 지원
폭(Width)
애니메이션 이미지 너비. 값 범위 128px - 4096px
높이(Height)
애니메이션 이미지 높이. 값 범위: 128px - 4096px
프레임 레이트(FPS)
값 범위: 1fps - 60fps

콘텐츠 디스커버리

콘텐츠 인식

Tencent Lab의 최신 연구 성과를 기반으로 비디오 콘텐츠에 대한 전방위적인 인식을 제공하고 비디오 내의 인물, 음성, 텍스트 및 프레임 태그 인식해 비디오에 대한 다차원 구조화 분석을 지원합니다.
인식 유형
기능 설명
Face Recognition
딥러닝 솔루션을 기반으로 고객이 영상 속 얼굴 정보를 빠르게 식별하고 영상 속 인물의 프레임과 얼굴이 위치한 영역을 빠르게 찾을 수 있도록 도와줍니다. 고객은 캐릭터 라이브러리를 사용자 지정하거나 Face Recognition을 위해 비디오 AI 공개 캐릭터 라이브러리를 호출할 수 있습니다.
음성 인식
딥러닝 솔루션을 기반으로 고객이 비디오 속 음성을 빠르게 식별하여 텍스트로 변환할 수 있도록 도와주며, 고객이 키워드를 사용자 지정하고, 비디오에서 키워드가 위치한 시점을 찾을 수 있도록 지원합니다.
광학 문자 인식
비디오에 나타난 텍스트 정보를 고객이 인식할 수 있도록 도와주어, 비디오 내 사용자 지정 키워드 추출에 사용할 수 있으며 세로형 텍스트 인식도 지원합니다.
프레임 태그 인식
딥러닝 솔루션을 기반으로 고객에 따라 비디오 프레임 간격을 사용자 정의하고, 프레임 캡처에서 태그를 자동으로 식별하고, 태그가 있는 비디오 위치 찾기를 지원합니다. 프레임 태그는 인물, 풍경, 인공물, 건축, 동식물, 음식 등 9가지 카테고리를 포함한 일상생활의 각 정보 차원을 포함하고 있으며 태그 시스템에 기반한 사용자 정의 태그 사용을 지원합니다. 또한 마이그레이션 러닝 기능이 있으며, 원본 사용자 데이터만 제공하면 분류기를 사용자 정의하여 다양한 유형의 사용자 요구를 충족시키고 태그 분류 유연성을 높입니다.
오프닝 및 엔딩 크레딧 식별
영상 화면 특징, 텍스트, 음성 등의 정보에 따라 영화/드라마의 오프닝 및 엔딩 크레딧을 자동으로 식별합니다.

콘텐츠 분석

분석 유형
기능 설명
분류 식별
비디오 콘텐츠를 분석해 비디오 카테고리를 추천합니다. 현재 음식, 여행, 애니메이션, 음악 등 19개 카테고리를 지원합니다(사용자 정의 지원(유료)).
비디오 태그 인식
Tencent 딥러닝 솔루션을 기반으로 동영상 콘텐츠에 가장 적합한 상위 5개 태그 요약을 지능적으로 인식해 동영상 추천, 검색 등 시나리오에 사용되며, 사용자는 인터페이스에서 반환할 태그 개수를 선택할 수 있습니다.
지능형 커버
영상 화면 텍스처, 장면 인식 등의 특징 정보와 결합하여 자동으로 파일 커버를 생성하며, 정적 커버 출력을 지원하여 동영상 커버 체험과 클릭 전환율을 향상시킵니다.

지능형 심사

지능형 심사에는 보안 심사와 품질 심사의 두 가지 유형이 있습니다. 보안 심사 AI를 통해 동영상 콘텐츠(화면, 오디오 및 텍스트의 3차원)의 음란물,불법 및 규정 위반 여부를 검사합니다. 품질 심사 라이브 방송, VOD 비디오의 화면 프레임 및 음질을 지원하며, 크래쉬 화면, 검은색 테두리, 모자이크, 노이즈 등 전방위 13가지 검사 유형을 포함하고, 앵커 동영상 전체의 품질 검사 평점을 제공합니다.
심사 유형
검사 유형
검사 항목 설명
보안 심사
영상 화면 심사
영상 화면에 대한 음란물 및 규정 위반, 구체적인 검사 항목은 다음과 같습니다.
음란물 검사
porn: 포르노
vulgar: 저속
intimacy: 애정 행위
sexy: 선정적
불법 및 규정 위반 검사
guns: 무기와 총
bloody: 유혈이 낭자한 장면
explosion: 폭발
violation_photo: 규정 위반 아이콘
오디오 심사
오디오에서 텍스트를 검사합니다. 특정 검사 항목은 다음과 같습니다.
음란물 검사: 음성 텍스트에 대한 음란물 여부를 확인하고, 의심되는 키워드 식별
불법 및 규정 위반 검사: 음성 텍스트에 대한 불법 및 규정 위반 여부를 확인하고, 의심되는 키워드 식별
텍스트 심사
화면에서 텍스트를 검사합니다. 구체적인 검사 항목은 다음과 같습니다.
음란물 검사: 화면 텍스트에 대한 음란물 여부를 확인하고, 의심되는 키워드 식별
불법 및 규정 위반 검사: 화면 텍스트에 대한 불법 및 규정 위반 여부를 확인하고, 의심되는 키워드 식별
품질 심사
화면 품질
영상의 화질 검사를 지원하며, 구체적인 검사 항목은 다음과 같습니다.
JitterResults: 지터
BlurResults: 블러
AbnormalLightingResults: 저조도, 과다 노출
CrashScreenResults: 크래쉬
BlackWhiteEdgeResults: 블랙 엣지, 화이트 엣지, 블랙 스크린, 화이트 스크린, 퓨어 컬러 스크린 시간대
NoiseResults: 노이즈
MosaicResults: 모자이크
QRCodeResults: QR 코드
음질
영상의 음질 검사를 지원하며, 구체적인 검사 항목은 다음과 같습니다.
VoiceResults: 음소거, 저음, 폭음을 포함한 오디오 이상

지능형 편집

지능형 편집은 AI 및 Tencent의 다년간의 멀티미디어 기술을 기반으로 비디오 콘텐츠, 지능형 컬렉션 및 지능형 세분화 능력을 다차원적으로 이해하고 비디오 콘텐츠 생성을 보조할 수 있도록 지원합니다.
능력 유형
기능 설명
세분화
비디오 콘텐츠를 구조화해 분석하고 비디오의 장면 정보, 음성 정보 및 텍스트 정보에 따라 비디오에 대해 지능형 세분화를 생성하고, 뉴스 세분화, 광고 세분화를 지원합니다.
지능형 컬렉션
비디오의 시간적/공간적 특징 매칭, 장면 인식, 타깃 검사 등의 기술을 기반으로 비디오 하이라이트를 자동으로 생성하며 축구, 농구, 배틀그라운드, Honor of Kings 등의 비디오 장면을 지원합니다(사용자 정의 지원(유료)).
편집 제작
비디오 자르기, 스플라이싱, 이미지-비디오 변환, 롤 이미지, 텍스팅, PIP(Picture-in-Picture), 오디오 편집 등의 작업을 지원합니다

도움말 및 지원

문제 해결에 도움이 되었나요?

피드백