开发者社区 问答 正文

在阿里语音AI假如这个是实时接受语音流的话,这个入参应该是什么格式?

问题1:在阿里语音AI假如这个是实时接受语音流的话,这个入参应该是什么格式?问题2:这边使用的是那个一句话识别。

展开
收起
三分钟热度的鱼 2023-06-06 13:05:07 201 分享 版权
2 条回答
写回答
取消 提交回答
  • 一般来说,实时接受语音流的API需要使用流式传输(streaming)方式,入参可能是音频流的二进制数据。至于具体格式,需要根据API文档中的要求来确定。

    至于问题2,您可能指的是阿里云的“语音转写”API中的“实时语音转写”功能,该功能支持一句话识别。

    2023-06-11 15:49:14
    赞同 展开评论
  • 针对问题1的回答:实时语音识别支持的输入格式:PCM(无压缩的PCM或WAV文件)、16 bit采样位数、单声道(mono)。您可以看一下我们的官网文档:https://help.aliyun.com/document_detail/84428.html?spm=a2c4g.84424.0.0.274b1c7aezbiWs 针对问题2:支持的输入格式:单声道(mono)16bit采样位数音频,包括无压缩的PCM、WAV、OPUS、AMR格式。具体您看一下这个哈:https://help.aliyun.com/document_detail/84442.html?spm=a2c4g.84441.0.0.8c065398IHzpEQ 此回答整理自钉群“阿里语音AI【6群】”

    2023-06-06 15:04:10
    赞同 展开评论
问答分类:
问答地址: