

SendCustomMode 参数指定接收转录和翻译文本的方式。Lang 参数填入 16k_zh_en 即可。VADSilenceTime 参数用于配置语音识别 VAD 的时间。版本类型 | 特性说明 | 语种与模型型号 | |
ASR 引擎 | 基础版语言引擎 | 基础语音识别模型。在近场、非复杂噪声的声学环境下具备良好的响应速度与识别准确率。 | "zh":8k 采样率中文识别模型,主要用于电话音频。 |
| 标准版语言引擎 | 基于大模型引擎,语音识别性能大幅增强,在噪声回音大、人声远小等复杂音频环境的识别准确率显著提升。常见应用场景如会议、直播、语聊、游戏等实时字幕以及实时转写记录等。高度契合 RTC 实时互动相关场景。 | "8k_zh_large": 8k 中文大模型引擎,针对电话音频支持较好。 "16k_zh_large": 16k 大模型引擎,同时支持中文、英文、多种中文方言口音等语言的识别。 "16k_zh_en":最新 16k 中英大模型引擎,同时支持中文、英语、多种中文方言口音的识别,对中英混说场景识别更优。 |
| 高级版语言引擎 | 覆盖小语种、方言的精准识别需求。 | "vi":越南语 "ja":日语 "ko":韩语 "id":印度尼西亚语 "th":泰语 "pt":葡萄牙语 "tr":土耳其语 "ar":阿拉伯语 "es":西班牙语 "hi":印地语 "fr": 法语 "ms":马来语 "fil":菲律宾语 "de":德语 "it":意大利语 "ru":俄语 "sv":瑞典语 "da":丹麦语 "no":挪威语 "zh-yue":中国粤语 |
翻译目标语言代码 | 对应语种 |
"zh" | 中文 |
"en" | 英语 |
"es" | 西班牙语 |
"pt" | 葡萄牙语 |
"fr" | 法语 |
"de" | 德语 |
"ru" | 俄语 |
"ar" | 阿拉伯语 |
"ja" | 日语 |
"ko" | 韩语 |
"vi" | 越南语 |
"ms" | 马来语 |
"id" | 印度尼西亚语 |
"it" | 意大利语 |
"th" | 泰语 |
TranscriberStore 的响应式数据中监听回调并刷新 UI。build.gradle 中添加 依赖,然后执行 Gradle Sync。implementation 'io.trtc.uikit:atomicx-core:4.0.0.110'implementation "com.tencent.liteav:LiteAVSDK_Professional:13.1.0.19861"implementation "com.tencent.imsdk:imsdk-plus:8.7.7201"
TranscriberMessage 的列表。// 假如以 RecyclerView 显示消息列表,则通过 submitList 发送消息列表即可。AITranscriberStore.shared.transcriberState.realtimeMessageList.collect { messages ->adapter.submitList(messages.toList())}
TranscriberMessage 参数说明:参数名 | 类型 | 描述 |
segmentId | String | 用户的每句话都对应一个唯一的 segmentId。 |
speakerUserId | String | 说话用户的 ID。 |
speakerUserName | String | 说话用户的昵称。 |
sourceText | String | 用户的语音转文本。 |
translationTexts | Map<TranslationLanguage, String> | 用户语音文本对应的翻译文本,可翻译成多种语言。 |
timestamp | Long | 当前句子的时间戳。 |
isCompleted | Boolean | 当前句子是否已经完成。 |
pod install。target 'xxxx' dopod 'AtomicXCore'end
// 假如以 UITableView 显示消息列表,更新消息后,reloadData 即可。AITranscriberStore.shared.state.subscribe(StatePublisherSelector(keyPath: \\.realtimeMessageList)).receive(on: RunLoop.main).sink { [weak self] in self?.updateMessages($0) }.store(in: &cancellables)
TranscriberMessage 参数说明参数名 | 类型 | 描述 |
segmentId | String | 用户的每句话都对应一个唯一的 segmentId。 |
speakerUserId | String | 说话用户的 ID。 |
speakerUserName | String | 说话用户的昵称。 |
sourceText | String | 用户的语音转文本。 |
translationTexts | [TranslationLanguage: String] | 用户语音文本对应的翻译文本,可翻译成多种语言。 |
timestamp | Int64 | 当前句子的时间戳。 |
isCompleted | Bool | 当前句子是否已经完成。 |
CreateCloudTranscription 请求后,请关注 HTTP response,如果请求失败,那么需要根据具体的状态码采取相应的重试策略。错误码是由“一级错误码”和“二级错误码”组合而成,例如:InvalidParameter.SdkAppId。具体情况说明可参考下表:返回错误码 | 问题说明 | 解决措施 |
InvalidParameter.xxxxx | 输入的参数有误。 | 请根据具体提示检查参数填写。 |
InternalError.xxxxx | 遇到服务端错误。 | 可以使用相同的参数重试多次,直到返回正常,拿到 taskid 为止。 建议使用退避重试策略,如第一次3s 重试,第二次6s 重试,第三次12s 重试,以此类推。 |
FailedOperation.RestrictedConcurrency | 并发转录任务数超过了后台预留的资源(默认是 100路)。 |
CreateCloudTranscription 接口时,指定的 UserId/UserSig 是转录作为单独的机器人用户加入房间的 ID,请不要和 TRTC 房间内的其他用户重复。同时,TRTC 客户端加入的房间类型必须和转录接口指定的房间类型保持一致,例如 SDK 创建房间用的是字符串房间号,那么转录任务的房间类型也需要相应设置成字符串房间号。CreateCloudTranscription 任务后 15s 左右,调用 DescribeCloudTranscription 接口查询转录任务对应的信息,如果查询到状态为 Idle 说明转录机器人没有拉到上行的音频流,请检查房间内是否有主播上行。文档反馈