tencent cloud

实时音视频

文档实时音视频

Cartesia

Download
聚焦模式
字号
最后更新时间: 2026-05-11 17:31:15
本文主要介绍如何在接口中配置 Cartesia。
Cartesia 专为实时语音 AI 打造,提供超低延迟流式 TTS,输出自然度高。其 Sonic 模型支持多语言合成和音色混合。当端到端延迟至关重要时——例如每个毫秒都影响体验的交互式语音智能体——Cartesia 是出色的选择。

使用方式

如需使用 Cartesia 作为 TTS 引擎,请在 StartAIConversation API 的 TTSConfig 字段中传入以下 JSON:
// json — TTSConfig
{
"TTSType": "cartesia",
"Model": "sonic-3-2026-01-12",
"APIKey": "<your_cartesia_api_key>",
"VoiceId": "eda5bbff-1ff1-4886-8ef1-4e69a77640a0"
}
完整 TTSConfig 参数参考,请参阅 Text-to-Speech Configuration

参数参考

字段
类型
必填
说明
TTSType
String
固定值:"cartesia"
Model
String
Cartesia 模型名称(如 sonic-3-2026-01-12)。请参阅 Cartesia 模型
APIKey
String
你的 Cartesia API 密钥。请从 Cartesia Console 获取。
VoiceId
String
Voice ID。请在 Cartesia 音色库 中浏览音色。
更多 Cartesia 的详细信息,请参阅 Cartesia 文档

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈