logo
产品简介 产品简介
基本概念 基本概念
平台新手指引 平台新手指引
计价模式 计价模式
开发者文档下拉
开放平台计价
定制服务计价
获取访问令牌 获取访问令牌
语音合成 语音合成
开发者文档下拉
接口说明
发音人列表
短文本合成 开发者文档下拉
Android SDK
iOS SDK
C++(Linux) SDK
RESTful API
Websocket API
长文本合成 开发者文档下拉
长文本合成API
离线合成 开发者文档下拉
模型文件说明
离线合成(普通版) Android SDK
离线合成(普通版) iOS SDK
离线合成(精品版) Android SDK
离线合成(精品版) iOS SDK
XML标签
SSML标签
语音合成时间戳功能
语音识别 语音识别
开发者文档下拉
音频格式说明
一句话识别 开发者文档下拉
RESTful API
Websocket API
Android SDK
iOS SDK
实时长语音识别 开发者文档下拉
Websocket API
Android SDK
iOS SDK
录音文件识别 开发者文档下拉
RESTful API
自学习工具 开发者文档下拉
热词
个性化模型
声音复刻 声音复刻
开发者文档下拉
定制模型 开发者文档下拉
RESTful API
Android SDK
iOS SDK
定制声音合成 开发者文档下拉
RESTful API
声音转换 声音转换
开发者文档下拉
发音人列表
Websocket API
Android SDK
iOS SDK
离线声音转换 离线声音转换
开发者文档下拉
发音人列表
Android SDK
iOS SDK
声纹识别 声纹识别
开发者文档下拉
RESTful API
语音评测 语音评测
开发者文档下拉
RESTful API
声音理解 声音理解
开发者文档下拉
RESTful API
协议规则 协议规则
开发者文档下拉
平台服务协议
平台通用规则
法律声明及隐私政策
服务等级协议SLA
常见问题 常见问题
开发者文档下拉
语音合成
语音识别

语音评测 Restful API

功能介绍

通过GOP基本算法和精确的语音分析技术,以音素为粒度,对发音的准确度、流利度、完整度进行全方位评测,客观反映用户发音综合水平。

音频要求

  • 音频时长:最小3秒,最大60秒
  • 支持音频格式:pcm
  • 音频采样率:16000Hz
  • 位深:16bit
  • 声道:单声道
  • 音频对应文本:最少1个字,最长1000个字

使用方法

1. 创建账号和应用,详见 平台新手指引 ,通过 标贝开放平台 应用/服务获取client_id,client_secret

2. 发送请求获取access_token,详见 获取访问令牌

3. 获取token后,发送语音评测请求:按照请求说明发送请求,具体参数详见 请求说明

服务地址

访问类型 说明 URL Host
外网访问 只支持中文普通话 https://openapi.data-baker.com/cap/getCapScore openapi.data-baker.com

交互流程

请求说明

功能介绍:通过GOP基本算法和精确的语音分析技术,以音素为粒度,对发音的准确度、流利度、完整度进行全方位评测,客观反映用户发音综合水平。

接口类型: REST API

接口详情

接口说明

上传音频文本,获取评测信息

接口参数

参数名称 类型 是否必填项 说明
accsee_token String yes 通过 client_id,client_secret 调用授权服务获得见 获取访问令牌
format String yes pcm
txt String yes 音频数据对应的文本(最少1个字最长1000个字)目前仅支持纯中文,暂不支持英文字母和数字
lan String yes 文本语言类型(cn:中文)
audio String yes 音频数据需进行base64(单声道,采样率16K,位深16位,pcm音频,最短3秒,最长60秒)

请求示例

        { 
            "access_token" : " your_access_token ",
            "format":"wav",
            "txt":"测试音频",
            "lan":"cn"
            "audio":"AAAAAA"
        }
      

响应结果

接口响应

参数名称 类型 说明
err_msg String 错误信息
log_id String 日志标识
err_no Int 错误码
result Object 返回结果数据

result

参数名称 类型 说明
acc_score Int 句子准确度得分
flu_score Int 句子流利度得分
int_score Int 句子完整度得分
all_score Int 总得分
syms String 句子展示文本
start_time Float 开始时间
end_time Float 结束时间
word Object 字得分数据

word

参数名称 类型 说明
sym String 字文本
score Int 字得分
start_time Float 开始时间
end_time Float 结束时间
phone Object 音素得分数据

phone

参数名称 类型 说明
sym String 字文本
score Int 字得分
start_time Float 开始时间
end_time Float 结束时间

响应示例

{
    "err_msg": "SUCCESS",
    "log_id": "1644994601628125",
    "err_no": 90000,
    "result": {
        "acc_score": 25,
        "flu_score": 33,
        "int_score": 50,
        "all_score": 26,
        "syms": "测试音频",
        "start_time": 2.1449999809265138,
        "end_time": 4.164999961853027,
        "word": [{
            "sym": "测",
            "score": 50,
            "start_time": 2.1449999809265138,
            "end_time": 2.315000057220459,
            "phone": [{
                "sym": "c",
                "score": 0,
                "start_time": 2.1449999809265138,
                "end_time": 2.1649999618530275
            },
            {
                "sym": "e_4",
                "score": 100,
                "start_time": 2.1649999618530275,
                "end_time": 2.315000057220459
            }]
        },
        {
            "sym": "试",
            "score": 50,
            "start_time": 3.565000057220459,
            "end_time": 3.7850000858306886,
            "phone": [{
                "sym": "sh",
                "score": 100,
                "start_time": 3.565000057220459,
                "end_time": 3.7249999046325685
            },
            {
                "sym": "i_4",
                "score": 0,
                "start_time": 3.7249999046325685,
                "end_time": 3.7850000858306886
            }]
        },
        {
            "sym": "音",
            "score": 0,
            "start_time": 3.7950000762939455,
            "end_time": 4.025000095367432,
            "phone": [{
                "sym": "y",
                "score": 0,
                "start_time": 3.7950000762939455,
                "end_time": 3.9549999237060549
            },
            {
                "sym": "in_1",
                "score": 0,
                "start_time": 3.9549999237060549,
                "end_time": 4.025000095367432
            }]
        },
        {
            "sym": "频",
            "score": 0,
            "start_time": 4.034999847412109,
            "end_time": 4.164999961853027,
            "phone": [{
                "sym": "p",
                "score": 0,
                "start_time": 4.034999847412109,
                "end_time": 4.054999828338623
            },
            {
                "sym": "in_2",
                "score": 0,
                "start_time": 4.054999828338623,
                "end_time": 4.164999961853027
            }]
        }]
    }
}
      

错误码

err_no 描述
90000 成功
10001 请求参数错误
10002 请求体格式错误
10003 请求头错误
20001 数据库错误
20002 资源请求错误
20003 REDIS数据库错误
30001 音频时长过长
30002 音频时长过短
30010 并发超出限制
40001 文本解析错误
40002 文本长度过短
40003 文本长度过长
40005 中文文本错误,目前仅支持纯中文,暂不支持英文字母和数字
50001 校验token错误
50002 token无效错误