240 发简信
IP属地:安徽
  • Resize,w 360,h 240
    Kaldi 说话人识别以及xvector和PLDA介绍

    原理部分 主要来自Dan 2017年在interspeech上的论文Deep Neural Network Embeddings for Tex...

  • Resize,w 360,h 240
    kaldi grammar on-the-fly 解决未登录词识别

    背景 场景一:互联网技术大会,主讲人中有不少国外大牛,演讲中经常中英文夹杂。现在需要你们组做现场语音识别支持。如何在中文识别很好的前提下,对中英...

  • Resize,w 360,h 240
    Ngram discount计算

    参考 http://www.speech.sri.com/projects/srilm/manpages/ngram-discount.7.ht...

  • Resize,w 360,h 240
    Ngram 语言模型

    参考资料 http://52opencourse.com/111/%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%A4%A7%E5...

  • Resize,w 360,h 240
    从笑林广记到缸中之脑

    一耳聋人探友。犬见之吠声不绝。其人茫然不觉。入见主人。揖毕告曰:“府上尊犬,想是昨夜不曾睡来。”主人问:“何以见得?”答曰:“见了小弟,只是打呵...

  • 刻意练习快速浏览

    提问在阅读之前,你才会收获知识,No Question,No Answer。实践在阅读之后,你才会收获成功,No Practise,No Gai...

  • Resize,w 360,h 240
    Kaldi中解码代码解析

    解码就是输入音频,利用声学模型、构建好的WFST解码网络,输出最优状态序列的过程。以Kaldi中LatticeFasterOnlineDecod...

  • Resize,w 360,h 240
    Kaldi Chain model 文件解析

    nnet3-info 可以查看训练好的chain model 模型结构,如下: 注意点 两个output,是因为有两个目标函数,一个是基于线性的...

  • Resize,w 360,h 240
    语音识别Viterbi解码

    语音识别解码过程使用的是Viterbi算法,本质上是一种动态规划算法,能够得到全局最优解。为了进一步减少计算复杂度,引用了Beam Search...

个人介绍
语音识别从业人员
哲学历史地理爱好者