sh-1993 在 2024-03-04 22:14:27 上传
说明:高保真神经语音后验图
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-03-05 02:54:17 上传
说明:African Whisper是一个开源项目,旨在增强非洲语言的自动语音识别(ASR)功能。利用先进机器学习技术的力量,该项目微调OpenAI开发的Whisper ASR模型,以更好地识别和转录非洲语言
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-02-29 19:06:12 上传
说明:用于抓取和创建音频数据集的工具
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-02-28 12:11:14 上传
说明:使用TextSoundSaver应用程序,可以将文本转换为真实的合成语音。该应用程序实现流畅自然的文本到语音转换。除了提供出色的语音合成功能外,该应用程序还允许您轻松导出微调的音频文件。
开发平台:Others | 大小:0KB | 下载0次
sh-1993 在 2024-02-27 04:17:41 上传
说明:将epub电子书文件转换为mp3有声读物文件。
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-02-19 03:52:39 上传
说明:语音合成API最简单实现的JavaScript库
开发平台:JavaScript | 大小:0KB | 下载0次
sh-1993 在 2024-02-15 22:58:04 上传
说明:用于计算语音音频质量的工具包。与原始作者无关
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-02-16 02:06:43 上传
说明:构建开源交互式AI毛绒玩具。
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-02-14 12:51:57 上传
说明:漂移透镜:一种无监督的漂移检测框架
开发平台:Jupyter Notebook | 大小:0KB | 下载0次
sh-1993 在 2024-02-10 21:39:18 上传
说明:Linux的按键语音到文本
开发平台:Shell | 大小:0KB | 下载0次
sh-1993 在 2024-02-07 14:45:54 上传
说明:人工智能用于人类级语音智能
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-02-04 22:16:45 上传
说明:使用MESD、Whisper和Pysentimiento在墨西哥西班牙语中进行语音和文本情感识别。
开发平台:Jupyter Notebook | 大小:0KB | 下载0次
sh-1993 在 2024-02-04 17:14:43 上传
说明:本地未经审查的人工智能实体。
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-01-29 18:43:16 上传
说明:TorchSpectralGate是一种基于PyTorch的Spectral Gating实现,Spectral Gating是一种音频信号去噪算法。
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-01-26 00:20:23 上传
说明:用于语音情感识别的韵律感知图神经网络
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-01-23 05:02:43 上传
说明:一个MATLAB实时脚本,用于测试说话速率(以每分钟单词数为单位)语音变得不可理解
开发平台:matlab | 大小:0KB | 下载0次
sh-1993 在 2024-01-19 09:01:09 上传
说明:语音读取器,支持Epub,URL,文本。
开发平台:TypeScript | 大小:0KB | 下载0次
sh-1993 在 2024-01-15 17:33:21 上传
说明:基于肌肉和压力的物理模拟为3D舌头设置动画。
开发平台:Pascal | 大小:0KB | 下载0次
sh-1993 在 2024-01-16 14:49:57 上传
说明:音频编解码器语音处理通用性能基准测试
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-01-13 23:00:45 上传
说明:一款帮助团队管理每日例会的应用程序。
开发平台:Swift | 大小:0KB | 下载0次
sh-1993 在 2024-01-13 16:51:36 上传
说明:增强的RVC变体:通过修改优化性能,构建在Mangio RVC分叉上。
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-01-03 09:57:39 上传
说明:带AVSpeech的Apple CoreML
开发平台:Swift | 大小:0KB | 下载0次
sh-1993 在 2024-01-03 23:41:23 上传
说明:使用Google translator API生成文本到语音音频。
开发平台:HTML | 大小:0KB | 下载0次
sh-1993 在 2024-01-01 22:57:23 上传
说明:众包和自动语音突出度估计
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2023-12-31 21:30:27 上传
说明:语音到文本应用程序
开发平台:HTML | 大小:0KB | 下载0次
sh-1993 在 2023-12-29 08:05:40 上传
说明:由24018个单个说话人阅读波兰语句子的短音频剪辑组成的自由语音数据集
开发平台:Others | 大小:0KB | 下载0次
sh-1993 在 2023-12-28 18:38:53 上传
说明:一个离线运行的本地语音识别转文字服务,输出json、srt字幕带时间戳、纯文字格式
开发平台:Python | 大小:0KB | 下载1次
sh-1993 在 2023-12-25 06:08:31 上传
说明:ggml(C++)重新实现tourite tts。正在建设中,正在寻找贡献者。
开发平台:C | 大小:0KB | 下载0次
sh-1993 在 2023-12-25 17:31:00 上传
说明:结合Pygame、OpenAI Whisper、OpenAIAPI和ElevenLabs的交互式聊天工具。
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2023-12-23 13:02:59 上传
说明:ВОсПрОиВеДениетекстаВГОЛос
开发平台:CSS | 大小:0KB | 下载0次