语音识别接口
版本要求: 标准版 及以上
介绍
语音识别接口,可将语音文件转为文本内容,支持多种语言。
在线接口调试:API接口调试
接口定义
接口地址
POST https://api.link-ai.tech/v1/audio/transcriptions
请求头
参数 | 取值 | 说明 |
---|---|---|
Authorization | Bearer YOUR_API_KEY | 参考 接口鉴权说明 创建 API Key 并填入 |
Content-Type | multipart/form-data | 表明使用form表单格式上传语音文件 |
请求体
参数 | 类型 | 是否必传 | 说明 |
---|---|---|---|
file | file | 是 | 语音文件,支持 mp3, mp4, mpeg, mpga, m4a, ogg, wav, or webm, flac, amr 类型 |
响应结果
text 字段中为识别出的文本内容:
{
"text": "你好,我需要一些帮助"
}
错误说明
当接口异常时会返回以下结构:
{
"success": false,
"code": 408,
"message": "当前版本无该API访问权限",
"data": null
}
根据 HTTP状态码 (status code) 和错误信息 判断错误类型:
HTTP状态码 | 描述 |
---|---|
400 | 请求格式错误 |
401 | 接口鉴权失败,请检查 API Key 是否填写正确 |
402 | 应用不存在,请检查 app_code 参数是否正确 |
403 | 无访问权限,对于未公开应用,只有创建者账号才能调用 |
406 | 账号积分额度不足 |
408 | 无API访问权限,该API支持标准版及以上版本调用 |
409 | 内容审核不通过,问题、回答、检索的知识库中可能存在敏感词 |
503 | 接口调用异常,联系客服处理 |
示例代码
1.CURL请求
curl https://api.link-ai.tech/v1/audio/transcriptions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F file="@/path/to/file/audio.mp3"
注意:在 YOUR_API_KEY
处填入你创建的 API Key
,在file
参数中填入音频文件的本地路径。
2.Python代码请求
import requests
file_path = '/path/to/file/audio.mp3' # 替换为你要上传的音频文件路径
url = 'https://api.link-ai.tech/v1/audio/transcriptions'
headers = {
'Authorization': f'Bearer YOUR_API_KEY'
}
files = {
'file': open(file_path, 'rb')
}
res = requests.post(url, headers=headers, files=files)
if res.status_code == 200:
res_json = res.json()
reply_text = res_json.get("text")
print(f"text={reply_text}")
else:
error = res.json()
print(f"请求异常, 错误码={error.get('code')}, 错误信息={error.get('message')}")
注意:在 YOUR_API_KEY
处填入你创建的 API Key
,在 file_path
变量中填入音频文件的本地路径。
3.更多语言和在线调试
其他编程语言的接入代码可以在 API调试页面 进行代码生成,同时支持在线进行接口调试。