跳转至

新一代 Kaldi

新一代 Kaldi 是一个开源的智能语音工具集,几乎涵盖了构建智能语音系统的方方面面。下图简单罗列了新一代 Kaldi 的项目矩阵,包括数据、训练到部署全链条。更多的项目见项目的 github 主页。 你也可以从这篇旧文中了解新一代 Kaldi 的起源与故事。

特性及功能

智能语音领域包含非常多的子任务和子领域,新一代 Kaldi 目前支持语音识别(ASR)、语音合成(TTS)、关键词检测(KWS)、话音检测(VAD)、说话人识别(Speaker identification)、语种识别(Spoken language identification) 等等。其中有些提供了包含训练和部署全链路的技术,有些是基于优秀的第三方开源库做的部署支持,具体细节如下所示:

任务 训练 部署 相关文档
语音识别(ASR) 训练 部署
语音合成(TTS) 训练 部署
关键词(KWS) 训练 部署
话音检测(VAD) 部署
说话人识别(Speaker identification) 部署
语种识别(Spoken language identification) 部署

评论

如果您通过 github 登录评论有困难,可以在留言板把你的问题告诉我们。
您也可以加入我们的微信QQ群与广大开发者一起交流,也欢迎大家关注我们的微信公众号