首页 > 其他 > 详细

语音识别 -- 概述

时间:2020-11-20 15:08:19      阅读:58      评论:0      收藏:0      [点我收藏+]

1. 语音合成
zhrtvc:https://github.com/KuangDD/zhrtvc

2.离线语音识别

mozilla deepspeech:https://github.com/mozilla/DeepSpeech

PaddlePaddle deepspeech:https://github.com/PaddlePaddle/DeepSpeech

deepspeech2:

技术分享图片

 

 

 

kaldi:https://github.com/kaldi-asr/kaldi

介绍:Kaldi是一个C++实现的语音识别工具,它使用Apache v2.0开源协议。 其主要目标用户为语音识别的研究者,由Dan Povey博士和捷克的BUT大学联合开发。

优点:

  • 代码级别集成WFST:Kaldi 将 OpenFST 作为一个库编译进来。(而不是脚本的方式集成)。
  • 广泛的线性代数支持:Kaldi包括封装了标准BLAS和LAPACK库的矩阵库。 易于扩展。
  • 完整的recipe:对于很多常见语音数据集都提供完整的recipe,从而可以完整的复现整个过程。

缺点:

  • 由于贡献者比较多,所以会有不稳定或有问题的代码更新。
  • 对使用者的要求较高。相比于HTK那种解释透彻的文档,大部分Kaldi的文档都是给领域的专家使用的,上手较为困难。

athena:https://github.com/didi/athena   https://github.com/athena-team/athena

vosk api: https://github.com/alphacep/vosk-api
传统vs深度学习

技术分享图片

 

深度学习--> 端到端

 

 技术分享图片

 

 

 

3. 相关中文数据集

thchs30:http://www.openslr.org/

技术分享图片

Aishell:http://www.aishelltech.com/kysjcp

  Aishell开源178小时的中文语音语料及基本训练脚本, 400个人讲,其中训练集340个人,测试解20个人,验证集40个人

 

语音识别 -- 概述

原文:https://www.cnblogs.com/Towerb/p/14009846.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!