备案控制台

开发者社区问答正文

在阿里语音AI假如这个是实时接受语音流的话，这个入参应该是什么格式？

问题1：在阿里语音AI假如这个是实时接受语音流的话，这个入参应该是什么格式？问题2：这边使用的是那个一句话识别。

展开

收起

三分钟热度的鱼 2023-06-06 13:05:07 201 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

vohelon

一般来说，实时接受语音流的API需要使用流式传输（streaming）方式，入参可能是音频流的二进制数据。至于具体格式，需要根据API文档中的要求来确定。

至于问题2，您可能指的是阿里云的“语音转写”API中的“实时语音转写”功能，该功能支持一句话识别。

2023-06-11 15:49:14

赞同展开评论
圆不溜秋的小猫猫

针对问题1的回答：实时语音识别支持的输入格式：PCM（无压缩的PCM或WAV文件）、16 bit采样位数、单声道（mono）。您可以看一下我们的官网文档：https://help.aliyun.com/document_detail/84428.html?spm=a2c4g.84424.0.0.274b1c7aezbiWs 针对问题2：支持的输入格式：单声道（mono）16bit采样位数音频，包括无压缩的PCM、WAV、OPUS、AMR格式。具体您看一下这个哈：https://help.aliyun.com/document_detail/84442.html?spm=a2c4g.84441.0.0.8c065398IHzpEQ 此回答整理自钉群“阿里语音AI【6群】”

2023-06-06 15:04:10

赞同展开评论

问答分类：

人工智能

问答标签：

AI阿里阿里AI AI格式 AI语音语音AI

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

阿里云语音AI通过API调取文字转换成语音，然后再通过语音服务打电话给用户，需要哪几种阿里服务组合？

313

1

0

在阿里语音AI中，在智能媒体服务可以直接调用选择么，如果不行就得分两个步骤？

88

1

0

AI Earth中shp格式的范围界限上传不了是怎么回事呢？

139

1

0

阿里云百炼新版知识检索增强AI应用的知识上传接口、以及FAQ格式文档的支持，有具体日期了吗？

151

1

0

想咨询下阿里语音AI实时语音转文本功能，那么这个计费的时长是按照29秒计算还是39秒计算的？

165

1

0

AI Earth页面中的建筑物识别后的数据，可以下载吗？格式是shp数据吗？

110

1

0

阿里语音AI项目gradle是5.4.1，是必须升级到6.0吗？

126

1

0

阿里语音AI有几个问题想咨询下，私有化信创环境容器化部署是否支持？

141

1

0

我现在需要使用阿里语音AI的实时长文本语音合成提供的sdk文件不支持易语言想知道数据是怎么处理的

378

4

0

请问阿里语音AI 怎么购买资源包？

194

3

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

创业项目：AI 拟人化中层解决方案

阿里云 GPU 如何更换公网 IP？

RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢

PolarDB这个PXD部署这个端口可以指定吗？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

相关文章

什么是RESTful

2025年MES系统哪个好？从趋势、选型到落地的全流程决策指南

阿里云无影 GPU 云电脑（NVIDIA RTX 5880 显卡）收费价格表：月付与年付费用详解

Claude官方开源16个技能库，老金帮你挑出5个必装神器

宝塔部署AstrBot及Napcat防踩坑教程

还有其他疑问?