NAO机器人语音识别(二):调用讯飞SDK

0 views

准备工作

ALSoundProcessing模块 下载地址

讯飞LINUX SDK 讯飞官网

安装 SDK

将sdk中的 libs include 文件夹拷贝到ALSoundProcessing文件夹下
编辑CMakeList.txt添加环境变量

导入asr_sample

  1. 将讯飞识别的单文件直接复制拷到alsoundprocessing.cpp文件中
  2. 将讯飞login函数放入init函数内启动(以便模块启动后调用)
  3. 将讯飞logout函数放入~ALSoundProcessing函数中(模块停止后退出,避免下次模块启动出现异常)
  4. 清空process函数并编辑,实现将nao缓存区的音频数据同时QISRAudioWrite函数实时上传到讯飞服务器
  5. 通过QISRGetResult获取所有音频结果并解析。

(初步完成语音识别功能)

调整

将模块名修改为ALSoundRecognition(避免冲突,可定义) 在头文件中加入方法,方便外部调用。

public:
  void process(const int & nbOfChannels,
               const int & nbrOfSamplesByChannel,
               const AL_SOUND_FORMAT * buffer,
               const ALValue & timeStamp);

  void startSession();

  void stopSession();

  void restartSession();

  int getStatus();

  std::string getResult();

  void restart();

编译执行

成功运行以后运行如下代码(默认选择remote模式)

qibuild make

即可在电脑上运行测试了。

PREVIOUSNAO机器人语音识别(三):自定义模块快速调用
NEXTNAO机器人语音识别(一):配置环境