• PUDN用户
    了解作者
  • Visual C++
    开发工具
  • 1.1MB
    文件大小
  • zip
    文件格式
  • 0
    收藏次数
  • 10 积分
    下载积分
  • 18
    下载次数
  • 2014-08-05 14:29
    上传日期
我们设计并实现了一种用于实时检测语音基频(pitch)、提取音乐旋律(melody)的软件。 语音或者音乐的基频是一种很重要的特征,可以用在很多研究与应用中。比如:用于普通话语音声调的识别和确认;语音流利度的分析;音乐旋律的提取用于哼唱检索等。读者可以参考我们之前的博文:http://blog.sciencenet.cn/home.php?mod=space&uid=907554&do=blog&id=723808
DEMO.zip
  • DEMO
  • melody_2.bmp
    1.3MB
  • a0183.wav
    133KB
  • ltass.dat
    7.9KB
  • 吻别_3.wav
    511.6KB
  • T0043G0005S0097.wav
    107.5KB
  • filh.dat
    3.8KB
  • cf.dat
    5.4KB
  • transT.dat
    30.7KB
  • melody_4.bmp
    693.1KB
  • myfilter.dat
    106KB
  • melody_1.bmp
    697.1KB
  • LillyMELODY.exe
    70.5KB
  • melody_5.bmp
    664.8KB
  • diffauxf.dat
    5.8KB
  • melody_3.bmp
    684.1KB
  • fr-sb-417.wav
    107.5KB
评论
    相关推荐
    • sdhumming.zip
      盛大创新院开发的哼唱检索的开源软件 有c++的源代码
    • 0078.rar
      提取基因周期方法运用了MATLAB程序,还可以看看吧
    • KTVscore.rar
      实现Ktv评分系统的设计,算法描述,不包含源码
    • read_wav.rar
      读取wav音频数据的函数,可用于绘制WAV波形图,进行语音识别哼唱别等。最基础的函数,但网上真正开源的C或C++版代码少,特别是将语音数据规范化的函数部分。代码是C++,但很容易改为C版,1:动态内存部分和释放内存...
    • DFT的matlab源代码-MachineLearningDOC:图像、人脸、OCR、语音相关算法整理
      图像、人脸、OCR、语音相关算法整理 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 概述-图像语音机器学习(Outline-Image & Audio & Machine Learning) 图像: 1. 变换(Transform),分为旋转、放缩、平移、...
    • 盛大开源哼唱识别代码(C++)
      盛大开源哼唱识别代码,该版本是2.0,1.0的代码还未公开,期待中
    • 讯飞WebAPI.rar
      实时语音转写, 语音合成, 印刷文字识别, 场景识别, 哼唱识别, 机器翻译, 语音评测
    • matlab运动目标提取代码-HumDetection:语音信号处理的最终课程项目设计
      识别:对用户输入的一段语音识别得到其频率,经处理后在界面输出旋律,并可以用钢琴来弹奏此旋律 评分:预先设置旋律和节拍,提取处理用户输入的语音文件与设置的旋律及节拍进行对比,根据评分规则输出实际得分 2. ...
    • deeplearning-ahem-detector
      波动检测器是一种深度卷积神经网络,可对经过转换的音频信号进行训练,以识别“波动”声音。 该网络已经过培训,可以在“家庭数据科学”(有关有关数据科学的播客)的情节中检测到此类信号。 幻灯片和一些技术细节...
    • 视频会议系统.rar
      一套商用的视频会议程序(cool)。