1. 环境准备与SDK获取
在Windows系统上使用Python调用科大讯飞语音唤醒SDK前,需要完成以下准备工作:
硬件要求:
- 支持音频输入的麦克风设备
- Windows 10或更高版本操作系统
- x64架构处理器(推荐)
软件依赖:
- Python 3.7+(建议使用3.8版本)
- Visual C++ Redistributable(SDK依赖项)
- PyAudio库(用于音频采集)
安装Python依赖:
pip install pyaudio ctypes numpy loguru
SDK获取步骤:
- 访问讯飞开放平台控制台(https://console.xfyun.cn)
- 创建新应用并开通"语音唤醒"服务
- 下载Windows平台的语音唤醒SDK包
- 解压后得到以下关键文件:
SDK/ ├── bin/ │ ├── msc_x64.dll # 64位主库文件 │ └── msc/res/ivw/ │ └── wakeupresource.jet # 唤醒资源文件 ├── include/ # 头文件(Python不需要) └── libs/ # 开发库(Python不需要)
> 注意:实际使用时只需要`bin`目录下的文件,建议将整个`bin`目录复制到项目根目录
## 2. 项目结构与配置
推荐的项目目录结构如下:
your_project/ ├── bin/ # 从SDK复制的文件 │ ├── msc_x64.dll │ └── msc/res/ivw/wakeupresource.jet ├── config/ │ └── config.ini # 配置文件 ├── lib/ │ └── ivw_engine.py # 语音唤醒封装类 └── main.py # 主程序
创建配置文件`config/config.ini`:
```ini
[IVW]
app_id = 你的APPID
ivw_threshold = 0:1450 # 唤醒阈值
jet_path = ./bin/msc/res/ivw/wakeupresource.jet
常见问题处理:
- 如果遇到
10102错误码,通常是因为:- SDK文件路径配置错误
- 未正确设置工作目录
- 麦克风权限未开启
3. 核心代码实现
3.1 SDK初始化与登录
创建lib/ivw_engine.py基础类:

5917

被折叠的 条评论
为什么被折叠?



