首页 / 更多教程 / AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了AIBigKaldi（十七）| Kaldi的DNN模型（源码解析），小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3105字，纯文字阅读大概需要5分钟。

内容图文

本文来自公众号“AI大道理”

单音素模型词错误率为50.58%，三音子模型词错误率为36.03%，lda-mllt模型词错误率为32.12%，说话人自适应模型词错误率为28.41%，quick模型词错误率为27.94%。

可见quick模型识别率继续有了一定的提高。

能否继续优化模型？又要从哪些方面入手进行优化呢？

火热的深度学习进入了我们的视野。

第一个被取代的就是对发射概率建模的GMM，即DNN-HMM模型。

Kaldi 中实现的 dnn 共 4 种：

a） nnet1 - 基于 Karel's 的实现，特点：简单，仅支持单 GPU, 由 Karel 维护。

b） nnet2 - 基于 Daniel Povey p-norm 的实现，特点：灵活，支持多 GPU、CPU，由 Daniel 维护。

c） nnet3 - nnet2 的改进，由 Daniel 维护。

d.）(nnet3 + chain) - Daniel Povey 改进的 nnet3，特点：可以实现实时解码，解码速率为 nnet3 的 3~5 倍。

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

以kaldi的thchs30为例。

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?总过程

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?9 DNN模型训练

run_dnn.sh

源码解析：

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

DNN模型训练要用到cuda。

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

训练过程：

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

thchs-30里面的DNN不是完整的nnet1，使用的特征不一样，也没有进行rbm预训练。

特征提取：

nnet1一般使用 40 维的 fmllr 特征，但在thchs-30中使用的是fbank特征。

为了提高神经网络模型的建模能力，通过拼帧的方法提供上下文。

拼帧后需要进行归一化、去相关操作。若是使用fmllr特征，则在此之前要使用CMVN规整各个维度的均值和方差进行去相关。

而直接使用fbank特征则不用再进行去相关操作，fbank特征本就是不相关的特征。

在fbank特征基础上得到的MFCC特征是相关的。

GMM-HMM模型的假设是输入特征具有独立性，不相关性，上下两帧数据没有关系，因此使用MFCC特征。这个假设本身存在一定问题，不是很合理。

DNN-HMM模型不需要这个假设，相反提供相关性反而有助于模型的提高，因此使用fbank特征。

DNN模型初始化：

在thchs30中，初始化模型在读取一个nnet.proto的文件，这个文件里面每一行都是一个组件component。

所谓组件就是神经网络中的节点和激活函数。

多个组件组成网络，组件之间以矩阵传递输入和输出。

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

dnn的输出个数对应tree的叶子节点数3456。

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

train.sh

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

nnet-initialize

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

Nnet类函数的实现

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

训练：

训练数据需要进行随机化，否则如果数据具有某种稳定变化的分布，最终输出的网络就会倾向于拟合后面若干批次的训练样本。

随机化就是打乱训练样本顺序，对于非序列递归的神经网络来说是按帧打乱的，对于序列递归的网络来说以数据块为单位进行随机化，保留数据块内部的时序性。

nnet1使用单GPU进行训练，读取feats.scp作为训练数据，强制对齐文件作为标签。

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

训练完毕。

训练好的DNN模型：

DNN模型部分解码识别（词级别）：

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

真正结果（标签词）：

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

单音素模型词错误率为50.58%，三音子模型词错误率为36.03%，lda-mllt模型词错误率为32.12%，说话人自适应模型词错误率为28.41%，quick模型词错误率为27.94%。
DNN模型词错误率为23.33%。

可见DNN模型识别率继续提高。

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

DNN模型部分解码识别（音素级别）：

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

真正结果（标签音素）：

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

单音素模型音素错误率为32.43%，三音素模型音素错误率为20.44%，lda-mllt模型音素错误率为17.06%，说话人自适应模型音素错误率为14.98%，quick模型音素错误率为13.53%。
DNN模型音素错误率为10.15%。

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?总结

可见DNN模型识别率继续提高。

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ?

——————

浅谈则止，细致入微AI大道理

扫描下方“AI大道理”，选择“关注”公众号

—————————————————————

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析） - 文章图片 ? ?

—————————————————————

投稿吧? | 留言吧

内容总结

以上是互联网集市为您收集整理的AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）全部内容，希望文章能够帮你解决AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/591195.html

来源：【匿名】

【上一篇】RDD编程【下一篇】关于IE的RegExp.exec的问题

更多 ►

【AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）】教程文章相关的互联网学习教程文章

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）【图】

本文来自公众号“AI大道理” 单音素模型词错误率为50.58%，三音子模型词错误率为36.03%，lda-mllt模型词错误率为32.12%，说话人自适应模型词错误率为28.41%，quick模型词错误率为27.94%。可见quick模型识别率继续有了一定的提高。能否继续优化模型？又要从哪些方面入手进行优化呢？火热的深度学习进入了我们的视野。第一个被取代的就是对发射概率建模的GMM，即DNN-HMM模型。 Kaldi 中实现的 dnn 共 4 种： a） nnet1...

（tornado源码分析_004）HTTP服务器处理解析出来的http数据【代码】

tornado中HTTP服务器是承上启下的作用，它通过tornado.http1connection.HTTP1ServerConnection与tornado.http1connection.HTTP1Connection从socket中读取并解析http消息然后调用application处理解析出来的http消息，具体方法为：将application作为数据处理类传给上述两个读取数据的类具体代码如下#常见的torando启动方式 application = tornado.web.Application(Handlers) application.listen(8888) class Application(ReversibleR...

Spring源码学习(十八)---基于注解配置Aop的aspectj-autoproxy解析【代码】【图】

这里主要是使用org.springframework:spring-beans:5.2.0.RELEASE进行分析文章目录 ①. aspectj-autoproxy标签1. proxy-target-class属性2. expose-proxy属性 ②. aspectj-autoproxy标签解析③. DefaultBeanDefinitionDocumentReader类的parseBeanDefinitions方法④. 通过parseCustomElement解析自定义标⑤. Namespacehandler接口⑥. 获取NamespaceHandler⑦. AopNamespaceHandler的init方法⑧. 通过NamespaceHandler的parse方法解...

ELF格式解析库之抽象数据类型【代码】

抽象？抽谁的象？ELF是一种链接执行格式，它规定了对于一个ELF文件的基本数据类型是什么样的.可是，要解析一个ELF文件，而这个ELF文件或者是32Bits 或者是 64Bits，反正字长是未定的，怎么办？难道我们要定义两套解析的接口，以对应不同的字长的ELF文件吗？如果要这样做，不是不可以，只是那样做为接口的设计增加了太大的负担。这里我们采用“抽象”的方式，将已有的两套基础数据结构封装成一个兼容的数据结构。这样，我们设计解析...

2020年数据库系统工程师下午真题及答案解析【图】

2020年数据库系统工程师下午真题及答案解析试题一（15分）某小区快递驿站代为收发各家快递公司的包裹，为规范包裹收发流程，提升效率，需要开发一个信息系统。请根据下述需求描述完成该系统的数据库设计。【需求描述】 (1)记录快递公司和快递员的信息。快递公司信息包括：公司名称、地址和一个电话；快递员信息包括：姓名、手机号码和所属公司名称。一个快递公司可以有若干快递员，一个快递员只能属于一家快递公司。 (2)记...

深入浅出MyBatis技术原理与实战-学习-源码解析-MyBatis 运行原理(四)【代码】【图】

集中 MyBatis 框架的设计和核心代码的实现上，一些无关细节将会适当的忽略。 MyBatis 的运行分为两部分，一部分是读取配置文件缓存到 Configuration对象，用以创建 SqlSessionFactory，第二部分是 SQLSession 的执行过程，相对而言，SqlSessionFactory 创建比较容易，而 SqlSession 的执行过程远远不是那么简单。构建SqlSessionFactory 过程 SqlSessionFactory 是 MyBatis 的核心类之一，其最重要的功能就是提供创...

数据结构-ArrayList源码解析

一、ArrayList简介 1.1、ArrayList概述1）ArrayList是个动态数组，它是基于数组实现的List类。2）该类封装了一个动态再分配的Object[]数组，每一个类对象都有一个capacity属性，表示它们所封装的Object[]数组的长度，当向ArrayList中添加元素时，该属性值会自动增加。如果想ArrayList中添加大量元素，可使用ensureCapacity方法一次性增加capacity，可以减少增加重分配的次数提高性能。3）ArrayList的用法和Vector向类似，但是Vecto...

Test run failed: Instrumentation run failed due to 'Process crashed.'解析

在使用基于Instrumentation测试框架如robotium时，Test run failed: Instrumentation run failed due to ‘Process crashed.‘这个报错估计大多数人都遇到过，Android的应用是以Linux进程的概念在运行的，而Instrumentation与被测应用运行在同一个进程中，当被测应用的进程在Instrumentation本身退出前被关闭了，则会抛出Testrun failed: Instrumentation run failed due to ‘Process crashed.‘这样的错误。测试过程中引起这种情...

数据解析基础之Xpath解析基础【代码】

一、Xpath 1.1、Xpath介绍XPath是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。 XML是和HTML格式类似的标记语言。拥有标签，节点等元素。但是HTML会被浏览器识别，并根据标签的含义生成对应的样式。xml则不会被识别，且他的标签是自定义的，HTML的标签则是固定的。所以xml常被用于数据传输。但是现在并不常用，我只在maven配置文件中看到使用这种文件。现在一般数据传输度使用的JSON文件。（...

张正友相机标定Opencv实现以及标定流程&&标定结果评价&&图像矫正流程解析（附标定程序和棋盘图）

https://my.oschina.net/abcijkxyz/blog/787659 #include "opencv2/core/core.hpp" #include "opencv2/imgproc/imgproc.hpp" #include "opencv2/calib3d/calib3d.hpp" #include "opencv2/highgui/highgui.hpp" #include <iostream> #include <fstream>using namespace cv; using namespace std;void main() {ifstream fin("calibdata.txt"); /* 标定所用图像文件的路径 */ofstream fout("caliberation_result.txt"); /* 保存标定...

Spring源码解析 – @Configuration配置类是怎么生效的，并将bean解析到spring容器中【代码】【图】

首先被@Configuration注解的类是由ConfigurationClassPostProcessor bean后处理器来处理的，下面看一下ConfigurationClassPostProcessor bean后处理器是怎么被加载到的，下面时序图说明spring容器从启动倒注册ConfigurationClassPostProcessor bean后处理器的过程2.ConfigurationClassPostProcessor 的org.springframework.context.annotation.ConfigurationClassPostProcessor#processConfigBeanDefinitions方法实现如下/*** De...

学生信息管理系统中遇到的问题解析

项目概述：做一个简单的学生信息管理系统要求：学生信息的增删查改，成绩的增删。自动生成的编号。工具：微软企业库与MiniUI遇到的问题与解决方法：（前面的博文也有类似的问题和解决方法，这里不再写冗余的文字了）1 整体思路（数据的传输思路）我从后台说起：数据库获取数据(DataTable) --> (ArrayList)--->Hashtable--->【业务处理】--(JSON类)解析成json-->(mini.decode)-->js对象---（页面展示）2 唯一约束取代触发器前面的博...

关于虚拟空间与物理空间思想的解析

其实寻址这个问题，站在虚拟空间角度来看，就是通过线性地址寻找页表。站在物理空间角度来看，是通过地址总线寻找物理页框。中间的MMU起到承上启下的作用。说的通俗一点，我举个例子。虚拟空间好比阴间，物理空间好比阳间，阴间与阳间各有各自的法则，在保护着各自世界。使其正确平稳的运作。阴间的东西不能随便来到阳间，而阳间的东西也不能随便去到阴间，比如：阳间的人们一直在探索存不存在灵魂究竟有没有阴间，而阴间的东西其实...

mybatis源码配置文件解析之四：解析plugins标签【代码】

在前边的博客在分析了mybatis解析typeAliases标签，《mybatis源码配置文件解析之三：解析typeAliases标签》。下面来看解析plugins标签的过程。一、概述在mybatis的核心配置文件（mybatis-config.xml）文件中，有关plugins的配置如下，<plugins><plugin interceptor="cn.com.mybatis.plugins.MyInterceptor" /></plugins>在mybatis的plugins叫做插件，其实也可以理解为拦截器。在plugins标签中配置plugin子标签，p...

深度解析（图文）JVM垃圾收集器（二）【图】

通过上篇文章，我们知道在JVM中对象的分配、哪些对象是需要回收以及垃圾回收器中用到的算法，这篇文件主要讲解在JVM中所有的垃圾回收器以及各个垃圾回收器是如何回收一：垃圾收集器搭配以及概念如图所示，按照对空间的划分垃圾收集器可分为年轻代和老年代垃圾收集器年轻代收集器：Serial、ParNew、Parallel Scavenge 老年代收集器：CMS、Serial Old、Parallel Old 整堆收集器：G1 并行收集器：指多条垃圾收集线程并行工作，但此...

首页 / 更多教程 / AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）

内容导读

内容图文

内容总结

内容备注

内容手机端

【AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）】教程文章相关的互联网学习教程文章

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）【图】

（tornado源码分析_004）HTTP服务器处理解析出来的http数据【代码】

Spring源码学习(十八)---基于注解配置Aop的aspectj-autoproxy解析【代码】【图】

ELF格式解析库之抽象数据类型【代码】

2020年数据库系统工程师下午真题及答案解析【图】

深入浅出MyBatis技术原理与实战-学习-源码解析-MyBatis 运行原理(四)【代码】【图】

数据结构-ArrayList源码解析

Test run failed: Instrumentation run failed due to 'Process crashed.'解析

数据解析基础之Xpath解析基础【代码】

张正友相机标定Opencv实现以及标定流程&&标定结果评价&&图像矫正流程解析（附标定程序和棋盘图）

Spring源码解析 – @Configuration配置类是怎么生效的，并将bean解析到spring容器中【代码】【图】

学生信息管理系统中遇到的问题解析

关于虚拟空间与物理空间思想的解析

mybatis源码配置文件解析之四：解析plugins标签【代码】

深度解析（图文）JVM垃圾收集器（二）【图】

更多教程 - 最新教程

更多教程 - 最热教程