Conformer-2:语音识别的新突破
Conformer-2 是我们最新推出的 AI 语音识别模型,它在多个方面实现了显著的提升。该模型经过了 110 万小时的英语音频数据训练,相较于 Conformer-1,在处理专有名词、字母数字和抗噪能力方面有了显著的改进。
核心特点:
- 数据增强:通过增加训练数据量至 110 万小时的英语音频数据,以及使用多个强大的教师模型进行标注,提高了模型的泛化能力和鲁棒性。
- 性能提升:在字母数字转录准确性上提高了 31.7%,在专有名词错误率上降低了 6.8%,在抗噪能力上提高了 12.0%。
- 速度优化:尽管模型规模增大,但通过对服务基础设施的大量投入,Conformer-2 的速度比 Conformer-1 快了高达 55%。
基本用法:
- 用户可以通过我们的 API 轻松访问 Conformer-2,作为默认模型,现有用户将自动切换并享受更好的性能。
- 我们还推出了新的 API 参数
speech_threshold
,用户可根据需要设置音频文件中必须存在的语音比例阈值,以控制成本。 - 您可以在我们的 Playground 中上传文件或输入 YouTube 链接,轻松查看转录结果。也可以免费试用我们的 API,只需注册获取免费 API 令牌,即可在几分钟内开始使用。
总之,Conformer-2 为语音识别领域带来了新的突破,为用户提供了更准确、更快速、更强大的语音识别服务。