新一代 Kaldi¶
新一代 Kaldi 是一个开源的智能语音工具集,几乎涵盖了构建智能语音系统的方方面面。下图简单罗列了新一代 Kaldi 的项目矩阵,包括数据、训练到部署全链条。更多的项目见项目的 github 主页。 你也可以从这篇旧文中了解新一代 Kaldi 的起源与故事。
特性及功能¶
智能语音领域包含非常多的子任务和子领域,新一代 Kaldi 目前支持语音识别(ASR)、语音合成(TTS)、关键词检测(KWS)、话音检测(VAD)、说话人识别(Speaker identification)、语种识别(Spoken language identification) 等等。其中有些提供了包含训练和部署全链路的技术,有些是基于优秀的第三方开源库做的部署支持,具体细节如下所示:
任务 | 训练 | 部署 | 相关文档 |
---|---|---|---|
语音识别(ASR) | 训练 部署 | ||
语音合成(TTS) | 训练 部署 | ||
关键词(KWS) | 训练 部署 | ||
话音检测(VAD) | 部署 | ||
说话人识别(Speaker identification) | 部署 | ||
语种识别(Spoken language identification) | 部署 |
评论
如果您通过 github 登录评论有困难,可以在留言板把你的问题告诉我们。
您也可以加入我们的微信和QQ群与广大开发者一起交流,也欢迎大家关注我们的微信公众号。