logo
产品简介 产品简介
基本概念 基本概念
平台新手指引 平台新手指引
计价模式 计价模式
开发者文档下拉
开放平台计价
定制服务计价
获取访问令牌 获取访问令牌
语音合成 语音合成
开发者文档下拉
接口说明
发音人列表
短文本合成 开发者文档下拉
Android SDK
iOS SDK
C++(Linux) SDK
RESTful API
Websocket API
长文本合成 开发者文档下拉
长文本合成API
离线合成 开发者文档下拉
模型文件说明
离线合成(普通版) Android SDK
离线合成(普通版) iOS SDK
离线合成(精品版) Android SDK
离线合成(精品版) iOS SDK
XML标签
SSML标签
语音合成时间戳功能
语音识别 语音识别
开发者文档下拉
音频格式说明
一句话识别 开发者文档下拉
RESTful API
Websocket API
Android SDK
iOS SDK
实时长语音识别 开发者文档下拉
Websocket API
Android SDK
iOS SDK
录音文件识别 开发者文档下拉
RESTful API
自学习工具 开发者文档下拉
热词
个性化模型
声音复刻 声音复刻
开发者文档下拉
定制模型 开发者文档下拉
RESTful API
Android SDK
iOS SDK
定制声音合成 开发者文档下拉
RESTful API
声音转换 声音转换
开发者文档下拉
发音人列表
Websocket API
Android SDK
iOS SDK
离线声音转换 离线声音转换
开发者文档下拉
发音人列表
Android SDK
iOS SDK
声纹识别 声纹识别
开发者文档下拉
RESTful API
语音评测 语音评测
开发者文档下拉
RESTful API
声音理解 声音理解
开发者文档下拉
RESTful API
协议规则 协议规则
开发者文档下拉
平台服务协议
平台通用规则
法律声明及隐私政策
服务等级协议SLA
常见问题 常见问题
开发者文档下拉
语音合成
语音识别

声音理解 Restful API

功能介绍

机器对说话者的年龄大小、性别属性进行分析,可以通过收到的音频数据判定发音人的基本信息

音频要求

  • 音频时长:最小5秒,最大60秒
  • 支持音频格式:pcm
  • 音频采样率:16000Hz
  • 位深:16bit

使用方法

1. 创建账号和应用,详见 平台新手指引 ,通过 标贝开放平台 应用/服务获取client_id,client_secret

2. 发送请求获取access_token,详见 获取访问令牌

3. 获取token后,发送声音理解接口:按照请求说明发送请求,具体参数详见 请求说明

请求说明

功能介绍:机器对说话者的年龄大小、性别属性进行分析,可以通过收到的音频数据判定发音人的基本信息

接口类型: REST API

服务接口

https://openapi.data-baker.com/vcf/voiceClassification

请求参数

请求参数采用json方式,content_type为application/json

请求示例

{
  "access_token":" your_access_token",
  "format":"wav",
  "audio":"AAAAAA",
  "request_type":"all"
}

params字段说明

参数名称 类型 是否必填项 说明
access_token string yes 通过 client_id,client_secret 调用授权服务获得见 获取访问令牌
format string yes pcm
audio string yes 音频数据需进行base64(单声道,采样率16K,位深16位,pcm音频,最短5秒,最长60秒)
request_type string yes gender:性别,
age:年龄,
category:类别,
all:全部

返回示例

{
  "err_msg": "SUCCESS",
  "log_id": "1637549378324843",
  "err_no": 90000,
  "result": {
    "age": "middle",
    "category": "speech",
    "gender": "male"
  }
}

响应结果

Content-Type 为 application/json

返回数据为 json 格式,err_msg 字段为 SUCCESS 表示调用成功

参数名称 类型 说明
err_msg String 错误信息
log_id String 日志标识
err_no Int 错误码
result Object 返回结果数据

result:

参数名称 类型 说明
gender String 性别:male,female
age String 年龄:child,middle,old
category String 类型:speech,noise

错误码

错误码分类

err_no 描述
100xx 请求参数错误
200xx 链接服务器错误
300xx 业务调用错误
400xx 引擎内部错误
500xx 授权相关错误

详细错误码

err_no 描述
90000 成功
10001 请求参数错误
10002 请求体格式错误
10003 请求头错误
20001 数据库错误
20002 资源请求错误
20003 REDIS数据库错误
30001 语音过长错误
30002 语音过短错误
30003 语音数据错误
30004 调用数量已达上限
30005 并发超出限制
30006 请求类型错误
40001 引擎内部错误
50001 校验token错误
50002 token无效错误