值得一看
广告
彩虹云商城
广告

热门广告位

工业级ASR工具推荐:FunASR 一键部署,音视频语音高效转文本

一、简介

  • FunASR 是一个基本的语音识别工具包,提供多种功能,包括语音识别ASR等
  • 基于FunASR,有很多可以直接使用的学术和工业级预训练模型,具有准确率高、效率高、部署便捷等优点,支撑语音识别业务的快速建设
  • FunASR开源项目地址:https://github.com/modelscope/FunASR
  • hello_asr是一个使用docker快速部署FunASR并转成API服务的工具,代码地址:https://github.com/luler/hello_asr

二、安装

  • 准备好docker、docker-compose环境,可以不使用GPU,直接在CPU上运行
  • 新建docker-compose.yml配置文件,配置内容如下:
    version: '3'
    services:
      hello_asr:
        image: dreamplay/hello_asr:latest
        ports:
          - 12369:12369
        restart: always
  • 在docker-compose.yml文件下一键运行(注意镜像包含模型和软件环境,会有点大,请耐心下载)
    docker-compose up -d

三、使用示例

提供的接口:POST: http://127.0.0.1:12369/asr

  • mp3、wav等音视频文件转成文字
    • 使用funasr直接把上传的音频转换成文本信息
    • 再根据funasr的转换结果,提取生成SRT字幕

  • mp4等视频文件转文字
    • 原理就是通过ffmpeg把视频转成wav音频,再使用funasr对wav音频进行文本转换

四、总结

  • 简单的提取音视频文本还是可以胜任的,音频识别准确率还是不错的
  • 如果需要提高转换性能,需要使用GPU来启动
温馨提示: 本文最后更新于2025-09-30 16:05:03,某些文章具有时效性,若有错误或已失效,请在下方留言或联系在线客服
文章版权声明 1 本网站名称: 创客网
2 本站永久网址:https://new.ie310.com
1 本文采用非商业性使用-相同方式共享 4.0 国际许可协议[CC BY-NC-SA]进行授权
2 本站所有内容仅供参考,分享出来是为了可以给大家提供新的思路。
3 互联网转载资源会有一些其他联系方式,请大家不要盲目相信,被骗本站概不负责!
4 本网站只做项目揭秘,无法一对一教学指导,每篇文章内都含项目全套的教程讲解,请仔细阅读。
5 本站分享的所有平台仅供展示,本站不对平台真实性负责,站长建议大家自己根据项目关键词自己选择平台。
6 因为文章发布时间和您阅读文章时间存在时间差,所以有些项目红利期可能已经过了,能不能赚钱需要自己判断。
7 本网站仅做资源分享,不做任何收益保障,创业公司上收费几百上千的项目我免费分享出来的,希望大家可以认真学习。
8 本站所有资料均来自互联网公开分享,并不代表本站立场,如不慎侵犯到您的版权利益,请联系79283999@qq.com删除。

本站资料仅供学习交流使用请勿商业运营,严禁从事违法,侵权等任何非法活动,否则后果自负!
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容