ASRT_v0.4.2
所属分类:matlab编程
开发工具:Python
文件大小:13920KB
下载次数:5
上传日期:2019-11-21 11:27:08
上 传 者:
fine1
说明: 中文语言理解测评基准,包括代表性的数据集、基准(预训练)模型、语料库、排行榜。
我们会选择一系列有一定代表性的任务对应的数据集,做为我们测试基准的数据集。这些数据集会覆盖不同的任务、数据量、任务难度。
(Language Understanding Evaluation benchmark for Chinese: datasets, baselines, pre-trained models, corpus and leaderboard)
文件列表:
ASRT_v0.4.2 (0, 2019-01-09)
ASRT_v0.4.2\asrserver.py (3454, 2019-01-09)
ASRT_v0.4.2\ASRT_GitHub_repo.txt (53, 2018-05-14)
ASRT_v0.4.2\ASRT_GitHub_repo.url (141, 2018-05-14)
ASRT_v0.4.2\ASRT_Wiki_Document.url (146, 2019-01-09)
ASRT_v0.4.2\dict.txt (34278, 2018-07-20)
ASRT_v0.4.2\Donate.url (153, 2019-01-09)
ASRT_v0.4.2\general_function (0, 2019-01-09)
ASRT_v0.4.2\general_function\file_dict.py (605, 2018-04-25)
ASRT_v0.4.2\general_function\file_wav.py (7591, 2018-06-12)
ASRT_v0.4.2\general_function\gen_func.py (534, 2018-04-15)
ASRT_v0.4.2\general_function\muti_gpu.py (4116, 2018-06-22)
ASRT_v0.4.2\general_function\__init__.py (166, 2017-01-02)
ASRT_v0.4.2\LanguageModel.py (7887, 2018-06-18)
ASRT_v0.4.2\LICENSE (35823, 2017-08-22)
ASRT_v0.4.2\log.md (3710, 2018-07-06)
ASRT_v0.4.2\model_language (0, 2019-01-09)
ASRT_v0.4.2\model_language\dic_pinyin.txt (2196088, 2018-05-02)
ASRT_v0.4.2\model_language\language_model1.txt (55019, 2018-05-02)
ASRT_v0.4.2\model_language\language_model2.txt (5782659, 2018-05-02)
ASRT_v0.4.2\model_speech (0, 2019-01-09)
ASRT_v0.4.2\model_speech\speech_model251_e_0_step_12000.model (5932816, 2018-07-23)
ASRT_v0.4.2\model_speech\speech_model251_e_0_step_12000.model.base (5929608, 2018-07-23)
ASRT_v0.4.2\readdata24.py (9159, 2018-07-06)
ASRT_v0.4.2\SpeechModel251.py (17180, 2018-07-23)
ASRT_v0.4.2\SpeechModel251_p.py (16582, 2018-07-23)
ASRT_v0.4.2\test.py (2000, 2018-11-16)
ASRT_v0.4.2\testClient.py (546, 2018-05-28)
ASRT_v0.4.2\test_mspeech.py (1819, 2019-01-09)
ASRT_v0.4.2\train_mspeech.py (1373, 2018-07-23)
# A Deep-Learning-Based Chinese Speech Recognition System
基于深度学习的中文语音识别系统
ReadMe Language 中文版 [English](https://github.com/nl8590687/ASRT_SpeechRecognition/blob/master/README_EN.md)
## Introduction 简介
本项目使用Keras、TensorFlow基于深度卷积神经网络和长短时记忆神经网络、注意力机制以及CTC实现。
This project uses Keras, TensorFlow based on deep convolutional neural network and long-short memory neural network, attention mechanism and CTC to implement.
[查看本项目的Wiki页面](https://github.com/nl8590687/ASRT_SpeechRecognition/wiki) (正在完善中)
本项目目前已经可以正常进行训练了。
通过git克隆仓库以后,需要将datalist目录下的文件全部拷贝到dataset目录下,也就是将其跟数据集放在一起。
```shell
$ cp -rf datalist/* dataset/
```
目前可用的模型有22、24和25
本项目开始训练请执行:
```shell
$ python3 train_mspeech.py
```
本项目开始测试请执行:
```shell
$ python3 test_mspeech.py
```
测试之前,请确保代码中填写的模型文件路径存在。
ASRT API服务器启动请执行:
```shell
$ python3 asrserver.py
```
如果要训练和使用模型251,请在代码中 `import SpeechModel` 的相应位置做修改。
如果程序运行期间或使用中有什么问题,可以及时在issue中提出来,我将尽快做出答复。
提问前可以先 [查看常见问题](https://github.com/nl8590687/ASRT_SpeechRecognition/wiki/issues)
## Model 模型
### Speech Model 语音模型
CNN + LSTM/GRU + CTC
* 关于下载已经训练好的模型的问题
可以在Github本仓库下[releases](https://github.com/nl8590687/ASRT_SpeechRecognition/releases)里面的查看发布的各个版本软件的压缩包里获得完整源程序。
### Language Model 语言模型
基于概率图的最大熵隐马尔可夫模型
## About Accuracy 关于准确率
当前,最好的模型在测试集上基本能达到80%的汉语拼音正确率
不过由于目前国际和国内的部分团队能做到97%,所以正确率仍有待于进一步提高
* 目前可知的可以继续提高准确率的一个方案就是纠正数据集标注错误,尤其是ST-CMDS里面关于syllable文件中拼音的错误,这里面有一定比例的错误标注,如果走过路过的各位有意愿尽自己的能力帮助纠正一些数据标注错误的,我将非常欢迎,可以通过提交Pull Request来纠正,并且将登上本仓库的贡献者名单。
样例:`不是: bu4 shi4 -> bu2 shi4` `一个:yi1 ge4 -> yi2 ge4` `了解:le5 jie3 -> liao3 jie3`
* 已订正部分:
ST-CMDS
train: 20170001P00001A 20170001P00001I 20170001P00002A
## Python Import
Python的依赖库
* python_speech_features
* TensorFlow
* Keras
* Numpy
* wave
* matplotlib
* math
* Scipy
* h5py
## Data Sets 数据集
* 清华大学THCHS30中文语音数据集
data_thchs30.tgz
test-noise.tgz
resource.tgz
* Free ST Chinese Mandarin Corpus
ST-CMDS-20170001_1-OS.tar.gz
特别鸣谢!感谢前辈们的公开语音数据集
如果提供的数据集链接无法打开和下载,请点击该链接 [OpenSLR](http://www.openslr.org)
## Log
日志
链接:[进展日志](https://github.com/nl8590687/ASRT_SpeechRecognition/blob/master/log.md)
## Contributors 贡献者们
@ZJUGuoShuai @williamchenwl
@nl8590687 (repo owner)
近期下载者:
相关文件:
收藏者: