问题1:在阿里语音AI假如这个是实时接受语音流的话,这个入参应该是什么格式?问题2:这边使用的是那个一句话识别。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
一般来说,实时接受语音流的API需要使用流式传输(streaming)方式,入参可能是音频流的二进制数据。至于具体格式,需要根据API文档中的要求来确定。
至于问题2,您可能指的是阿里云的“语音转写”API中的“实时语音转写”功能,该功能支持一句话识别。
针对问题1的回答:实时语音识别支持的输入格式:PCM(无压缩的PCM或WAV文件)、16 bit采样位数、单声道(mono)。您可以看一下我们的官网文档:https://help.aliyun.com/document_detail/84428.html?spm=a2c4g.84424.0.0.274b1c7aezbiWs 针对问题2:支持的输入格式:单声道(mono)16bit采样位数音频,包括无压缩的PCM、WAV、OPUS、AMR格式。具体您看一下这个哈:https://help.aliyun.com/document_detail/84442.html?spm=a2c4g.84441.0.0.8c065398IHzpEQ 此回答整理自钉群“阿里语音AI【6群】”