跳转至

语音识别

新一代 Kaldi 不仅提供语音识别模型训练部署的方案,我们还发布了众多的预训练模型和相应的演示程序,供广大开发者体验学习。

Huggingface space

体验新一代 Kaldi 最直接最便捷的方式是用浏览器访问我们提供的 Huggingface space,目前支持包括中文、英文、中英文、中英粤、粤语、藏语、阿拉伯语、德语、法语、俄语等语言数十个个模型的体验。

体验地址huggingface 🤗

对于大陆用户,如无法访问 huggingface,可以使用 hf-mirror 🤗 体验。

Webassembly

新一代 Kaldi 还提供了 webassembly 支持,将模型的推理和解码完全迁移到浏览器端,不需花费服务器的计算资源。我们提供了如下一些模型的体验地址,如果你想用 webassembly 打包自己的模型,可以参考 sherpa-onnx 文档sherpa-ncnn 文档

语言 声学编码器 引擎 体验地址 模型地址
英文 zipformer onnxruntime huggingface modelscope 模型文档
中英文 zipformer onnxruntime huggingface modelscope 模型文档
中英文 paraformer onnxruntime huggingface modelscope 模型文档
中英粤(方言) paraformer onnxruntime huggingface modelscope 模型文档
英文 zipformer ncnn huggingface modelscope 模型文档
中英文 zipformer ncnn huggingface modelscope 模型文档

视频字幕提取

字幕提取功能是我们基于语音识别制作的一个小工具,用户只需上传视频即可生成对应的字幕文件,中文、英文、中英文、俄语体验地址:Huggingface 🤗, Huggingface 镜像站。 演示视频见 Bilibili

视频

为了便于大家快速看到演示的效果,我们还制作了很多视频供大家预览,请移步 Bilibili自行选择阅看。

apk & exe

我们同样提供了一些编译好的安卓 APK 和 Windows 可执行程序,大家自行下载安装即可试用。

语言 引擎 平台 下载地址
中文 onnxruntime 安卓 链接
英文 onnxrumtime 安卓 链接
中英文 onnxrumtime 安卓 链接
中英文 ncnn 安卓 链接
全语言(自行下载模型) onnxruntime Windows 链接
全语言(自行下载模型) ncnn Windows 链接

评论

如果您通过 github 登录评论有困难,可以在留言板把你的问题告诉我们。
您也可以加入我们的微信QQ群与广大开发者一起交流,也欢迎大家关注我们的微信公众号