语音识别
新一代 Kaldi 不仅提供语音识别模型训练和部署的方案,我们还发布了众多的预训练模型和相应的演示程序,供广大开发者体验学习。
Huggingface space¶
体验新一代 Kaldi 最直接最便捷的方式是用浏览器访问我们提供的 Huggingface space,目前支持包括中文、英文、中英文、中英粤、粤语、藏语、阿拉伯语、德语、法语、俄语等语言数十个个模型的体验。
体验地址huggingface 。
对于大陆用户,如无法访问 huggingface,可以使用 hf-mirror 体验。
Webassembly¶
新一代 Kaldi 还提供了 webassembly 支持,将模型的推理和解码完全迁移到浏览器端,不需花费服务器的计算资源。我们提供了如下一些模型的体验地址,如果你想用 webassembly 打包自己的模型,可以参考 sherpa-onnx 文档和 sherpa-ncnn 文档。
语言 | 声学编码器 | 引擎 | 体验地址 | 模型地址 |
---|---|---|---|---|
英文 | zipformer | onnxruntime | huggingface modelscope | 模型文档 |
中英文 | zipformer | onnxruntime | huggingface modelscope | 模型文档 |
中英文 | paraformer | onnxruntime | huggingface modelscope | 模型文档 |
中英粤(方言) | paraformer | onnxruntime | huggingface modelscope | 模型文档 |
英文 | zipformer | ncnn | huggingface modelscope | 模型文档 |
中英文 | zipformer | ncnn | huggingface modelscope | 模型文档 |
视频字幕提取¶
字幕提取功能是我们基于语音识别制作的一个小工具,用户只需上传视频即可生成对应的字幕文件,中文、英文、中英文、俄语体验地址:Huggingface , Huggingface 镜像站。 演示视频见 Bilibili。
视频¶
为了便于大家快速看到演示的效果,我们还制作了很多视频供大家预览,请移步 Bilibili自行选择阅看。
apk & exe¶
我们同样提供了一些编译好的安卓 APK 和 Windows 可执行程序,大家自行下载安装即可试用。
语言 | 引擎 | 平台 | 下载地址 |
---|---|---|---|
中文 | onnxruntime | 安卓 | 链接 |
英文 | onnxrumtime | 安卓 | 链接 |
中英文 | onnxrumtime | 安卓 | 链接 |
中英文 | ncnn | 安卓 | 链接 |
全语言(自行下载模型) | onnxruntime | Windows | 链接 |
全语言(自行下载模型) | ncnn | Windows | 链接 |
评论
如果您通过 github 登录评论有困难,可以在留言板把你的问题告诉我们。
您也可以加入我们的微信和QQ群与广大开发者一起交流,也欢迎大家关注我们的微信公众号。