Electron对接语音唤醒Windows SDK

示例代码: klren0312/electron_voice_wake_up (github.com)

一、项目主要依赖

  • vue
  • vue-cli-plugin-electron-builder
  • electron
  • ffi-napi nodejs操作c++的dll库
  • ref-napi c++类型转换
  • js-audio-recorder 录音插件

二、下载SDK

设置好唤醒词后, 下载windowsSdk, 项目需要/bin目录下的msc_x64.dllmsc.dll (分别是64位和32位的dll, 按需使用), 以及/bin/msc/res/ivw目录下的wakeupresource.jet(语音唤醒资源文件)

三、配置项目

1. 配置externals, 用于调用第三方库

module.exports = {
  pluginOptions: {
    electronBuilder: {
      externals: ['ffi-napi', 'ref-napi'],
    }
  }
}

2. 配置sdk路径

由于开发模式和打包后的环境, 文件路径会产生差别, 所以需要将打包后的sdk路径进行配置

例如将sdk放在根目录的libs文件夹下, 则可以按下面配置:

module.exports = {
  pluginOptions: {
    electronBuilder: {
      builderOptions: {
        extraResources: {
          from: 'libs/',
          to: './'
        }
      }
    }
  }
}

在代码中配置路径时, 需要进行判断

let libPath = path.resolve('libs/bin/msc_x64.dll')
if (process.env.NODE_ENV !== 'development') {
  libPath = path.resolve('resources/bin/msc_x64.dll')
}

3. 通过ffi调用dll

image.png

1. 主要需要使用sdk的以下方法:

  • MSPLogin 登录方法
  • QIVWSessionBegin 开启语音唤醒
  • QIVWRegisterNotify 注册唤醒监听事件
  • QIVWAudioWrite 写入音频

头文件都可以在下载的sdk的include文件夹找到

int MSPAPI MSPLogin(const char* usr, const char* pwd, const char* params);

typedef int( *ivw_ntf_handler)( const char *sessionID, int msg, int param1, int param2, const void *info, void *userData );

const char* MSPAPI QIVWSessionBegin(const char *grammarList, const char *params, int *errorCode);

int MSPAPI QIVWSessionEnd(const char *sessionID, const char *hints);

int MSPAPI QIVWAudioWrite(const char *sessionID, const void *audioData, unsigned int audioLen, int audioStatus);

int MSPAPI QIVWRegisterNotify(const char *sessionID, ivw_ntf_handler msgProcCb, void *userData);

int MSPAPI QIVWGetResInfo(const char *resPath, char *resInfo, unsigned int *infoLen, const char *params);

2. ffi配置方法定义

方法的类型需要用到ref-napi进行转义
例如,

char* => string
int => ref.types.int
int* => ref.refType(ref.types.int)
unsigned int => ref.types.uint
回调方法 => 'pointer'

注意: char*char *性质是一样的, 都是字符串

所以, 可以把需要的方法定义如下,

const libm = ffi.Library(libPath, {
  MSPLogin: [ref.types.int, ['string', 'string', 'string']],
  QIVWSessionBegin: ['string', ['string', 'string', ref.refType(ref.types.int)]],
  QIVWSessionEnd: [ref.types.int, ['string', 'string']],
  QIVWAudioWrite: [ref.types.int, ['string', ref.refType(ref.types.void), ref.types.uint, ref.types.int]],
  QIVWRegisterNotify: [ref.types.int, ['string', 'pointer', ref.refType(ref.types.void)]]
})

方法的使用,就是通过 libm.MSPLogin()来调用即可

唯一需要注意的就是QIVWRegisterNotify方法, 需要传入的是一个回调函数, 上面定义时, 可以使用'pointer'占位

在调用时, 需要使用ffi.Callback创建一个回调, 传入函数中, 例如:

先查看回调函数的定义

typedef int( *ivw_ntf_handler)( const char *sessionID, int msg, int param1, int param2, const void *info, void *userData );

ffi.Callback的第一个参数是返回参数的类型, 第二个参数是传入回调函数的参数类型, 第三个参数是回调的处理

const notifyCallback = ffi.Callback(
  ref.types.int,
  ['string', ref.types.int, ref.types.int, ref.types.int, ref.refType(ref.types.void), ref.refType(ref.types.void)],
  (sessionID, msg, param1, param2, info, userData) => {
    if (msg === 2) {
      console.log('err', param1)
    } else if (msg === 1) {
      console.log('唤醒了', info, userData)
      this.wakeText = '唤醒了' + Date.now()
    }
    global.sharedObj = notifyCallback
    return 0
  }
)

const notifyResCode = libm.QIVWRegisterNotify(this.sessionId, notifyCallback, null)

注意, 由于callback会被垃圾回收, 所以需要在调用的时候, 赋值到一个全局变量上, 比如global['变量名'] = 回调函数

3. 实时录音传递

初始化录音, 使用单声道, 16位, 16000采样率

this.recorder = new Recorder({
  sampleBits: 16, // 采样位数,支持 8 或 16,默认是16
  sampleRate: 16000, // 采样率,支持 11025、16000、22050、24000、44100、48000,根据浏览器默认值,我的chrome是48000
  numChannels: 1,
  compiling: true
})

需要使用js-audio-recorder的 V0.5.7 版本, 通过定时调用getNextData方法, 获取当前音频转成buffer传入QIVWAudioWrite方法

由于录音是一直存在缓存中的, 时间长了就会把内存占满, 导致程序崩了.

而我们使用语音唤醒, 不需要留存录音, 所以需要对使用过的音频缓存进行清除

当前的库里清除缓存的方法是clear, 而clear方法没有清除tempPCM, 还是会导致问题, 所以需要重新写个方法, 重新打包

clearCache(): void {
  this.lBuffer.length = 0;
  this.rBuffer.length = 0;
  this.size = 0;
  this.fileSize = 0;
  this.PCM = null;
  this.tempPCM = []
  this.audioInput = null;
  this.duration = 0;
  this.ispause = false;
  this.isplaying = false;
  this.playTime = 0;
  this.totalPlayTime = 0;
}

之后, 我们就可以定时调用下面方法, 来进行音频写入了

async getBuffer () {
  const data = this.recorder.getWholeData()
  let arr = []
  data.forEach(d => {
    arr = arr.concat(...Buffer.from(d.buffer))
  })
  if (this.isBegin) {
    const buffer = Buffer.from(arr)
    if (buffer.length === 0) {
      return
    }
    // this.ws.send(buffer)
    const writeRes = libm.QIVWAudioWrite(this.sessionId, buffer, buffer.length, 2)
    if (writeRes !== 0) {
      console.log('写入失败')
    }
  }
  this.recorder.clearCache()
}

4. 参考资料

  1. https://www.xfyun.cn/doc/asr/awaken/Windows-SDK.html#_2%E3%80%81sdk%E9%9B%86%E6%88%90%E6%8C%87%E5%8D%97
  2. https://juejin.cn/post/6844903645905977357
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,560评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,104评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,297评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,869评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,275评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,563评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,833评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,543评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,245评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,512评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,011评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,359评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,006评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,062评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,825评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,590评论 2 273
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,501评论 2 268

推荐阅读更多精彩内容