logo
产品简介 产品简介
基本概念 基本概念
平台新手指引 平台新手指引
计价模式 计价模式
开发者文档下拉
开放平台计价
定制服务计价
获取访问令牌 获取访问令牌
语音合成 语音合成
开发者文档下拉
接口说明
发音人列表
短文本合成 开发者文档下拉
Android SDK
iOS SDK
C++(Linux) SDK
RESTful API
Websocket API
长文本合成 开发者文档下拉
长文本合成API
离线合成 开发者文档下拉
模型文件说明
离线合成(普通版) Android SDK
离线合成(普通版) iOS SDK
离线合成(精品版) Android SDK
离线合成(精品版) iOS SDK
XML标签
SSML标签
语音合成时间戳功能
语音识别 语音识别
开发者文档下拉
音频格式说明
一句话识别 开发者文档下拉
RESTful API
Websocket API
Android SDK
iOS SDK
实时长语音识别 开发者文档下拉
Websocket API
Android SDK
iOS SDK
录音文件识别 开发者文档下拉
RESTful API
自学习工具 开发者文档下拉
热词
个性化模型
声音复刻 声音复刻
开发者文档下拉
定制模型 开发者文档下拉
RESTful API
Android SDK
iOS SDK
定制声音合成 开发者文档下拉
RESTful API
声音转换 声音转换
开发者文档下拉
发音人列表
Websocket API
Android SDK
iOS SDK
离线声音转换 离线声音转换
开发者文档下拉
发音人列表
Android SDK
iOS SDK
声纹识别 声纹识别
开发者文档下拉
RESTful API
语音评测 语音评测
开发者文档下拉
RESTful API
声音理解 声音理解
开发者文档下拉
RESTful API
协议规则 协议规则
开发者文档下拉
平台服务协议
平台通用规则
法律声明及隐私政策
服务等级协议SLA
常见问题 常见问题
开发者文档下拉
语音合成
语音识别

自学习-热词

功能介绍

在语音识别ASR服务中,对于常用的词汇等识别效果较好,但在部分使用者的专有业务领域存在部分词汇(人名、地名、领域专有词)默认识别效果不好的情况,例如姓名“李禾”默认识别为“李合”。

通过标贝科技强大的算法团队自主研发的ASR自学习引擎,使用者自主完成热词的配置,可有效提高专有领域场景下的语音识别准确率,达到定制训练、自助优化的效果。

使用限制

  • 1、保存到生效的时间:秒级生效。
  • 2、单个应用-语音识别下最多可创建10个词组,每个词组内上限为300个词,每个热词之间以回车键区分(每行一个热词),单个词长度不超过10个字(如超出限制请使用个性化模型)。
  • 3、上传的txt文件必须为 UTF-8 编码格式,不能包含标点和特殊字符。
  • 4、应用识别服务:一句话识别、长文本识别、录音文件识别。
  • 5、支持语言类型:中文普通话、粤语、英文。
  • 6、热词支持采样率模型:8K、16K采样率。
  • 7、创建修改热词:控制台方式。
  • 8、控制台完成热词创建后,后续开发者在请求语音识别服务时,通过热词id的传参可直接使用此热词组,达到提升优化的效果。

特别注意

  • 1、常见的通用词汇(例如我们、学习、成功等等)不建议加入热词,加入过多的通用词汇会降低专有词汇的识别率。
  • 2、使用热词功能的前期是,请首先确认音频的清晰度和质量是否达标,达标的标准是普通人听一遍录音就能正确识别出文字。
  • 3、热词不建议过长,不支持标点符号。
  • 4、词语中的数字需要进行替换:
    ① 中文语言类型中数字需用汉字代替。例如:“9.8元”需要替换为“九点八元”。
    ② 英文语言类型中数字需用英文代替。例如:“9.8 meters”需要替换为“nine point eight meters”。

使用方法

  • 1、 登录开放平台-创建应用。
  • 2、 点击左侧导航栏,选择语音识别下【自学习工具】,进入热词页面。
  • 3、 点击【新增热词组】上传热词TXT文件,进行热词添加。
  • 4、 获取热词组id,识别调用,测试效果。