依星源码资源网,依星资源网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

【好消息,好消息,好消息】VIP会员可以发表文章赚积分啦 !
查看: 30|回复: 0

使用winsper语音识别开源模型封装成openai chatgpt兼容接口,高性能处理

[复制链接] 主动推送

2万

主题

2万

帖子

2万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
21287
发表于 昨天 23:27 | 显示全部楼层 |阅读模式
使用winsper语音识别开源模型封装成openai chatgpt兼容接口,高性能处理
介绍
使用winsper语音识别开源模型封装成openai chatgpt兼容接口
软件架构
使用uvicorn、fastapi、openai-whisper等开源库实现高性能接口
使用说明
  • 下载代码
  • 安装 ffmpeg https://ffmpeg.org/download.html
  • 安装依赖 项目根目录下执行命令 pip install -r requirements.txt
  • 运行代码 项目根目录下执行命令 python main.py
这里的 http://0.0.0.0:3003 就是连接地址。
  • 首次启动会下载模型,如果下载失败,请手动下载模型,放在项目根目录下,并修改 main.py 里的 model_size 参数。
可用型号和语言
您可能还需要安装 rust,以防 tiktoken 没有为您的平台提供预编译的轮子。如果在上述 pip install 命令过程中遇到安装错误,请按照 入门页面 的指引来安装 Rust 开发环境。此外,您可能需要配置 PATH 环境变量,例如 export PATH="$HOME/.cargo/binPATH"。如果安装过程中出现 No module named 'setuptools_rust' 错误,您需要安装 setuptools_rust,可以通过运行类似命令来完成。
[td]
尺寸参数大小纯英文型号多语言模型所需显存相对速度
tiny39 Mtiny.entiny~1 GB~32x
base74 Mbase.enbase~1 GB~16x
small244 Msmall.ensmall~2 GB~6x
medium769 Mmedium.enmedium~5 GB~2x
large1550 M不适用large~10 GB1x
针对仅英文应用的.en模型往往表现更佳,尤其是对于tiny.en和base.en模型。我们观察到,对于small.en和medium.en模型,这种差异变得不那么明显。
Whisper的表现因语言而异,幅度很大。下图展示了使用WER(词错误率)或CER(字符错误率,以斜体显示)在Common Voice 15和Fleurs数据集上评估的large-v3和large-v2模型按语言划分的性能分解。其他模型和数据集对应的更多WER/CER指标,以及用于翻译评估的BLEU(双语评估替代)分数,可以在论文的附录D.1、D.2和D.4中找到。
可识别语言细分
  • Dutch: 荷兰语
  • Spanish: 西班牙语
  • Korean: 韩语
  • Italian: 意大利语
  • German: 德语
  • Thai: 泰语
  • Russian: 俄语
  • Portuguese: 葡萄牙语
  • Polish: 波兰语
  • Indonesian: 印度尼西亚语
  • Mandarin (TW): 普通话(台湾)
  • Swedish: 瑞典语
  • Czech: 捷克语
  • English: 英语
  • Japanese: 日语
  • French: 法语
  • Romanian: 罗马尼亚语
  • Cantonese (CN): 粤语(中国大陆)
  • Turkish: 土耳其语
  • Mandarin (CN): 普通话(中国大陆)
  • Catalan: 加泰罗尼亚语
  • Hungarian: 匈牙利语
  • Ukrainian: 乌克兰语
  • Greek: 希腊语
  • Bulgarian: 保加利亚语
  • Arabic: 阿拉伯语
  • Serbian: 塞尔维亚语
  • Macedonian: 马其顿语
  • Cantonese (HK): 粤语(香港)
  • Latvian: 拉脱维亚语
  • Slovenian: 斯洛文尼亚语
  • Hindi: 印地语
  • Galician: 加利西亚语
  • Danish: 丹麦语
  • Urdu: 乌尔都语
  • Slovak: 斯洛伐克语
  • Hebrew: 希伯来语
  • Finnish: 芬兰语
  • Azerbaijani: 阿塞拜疆语
  • Lithuanian: 立陶宛语
  • Estonian: 爱沙尼亚语
  • Nynorsk: 新挪威语
  • Welsh: 威尔士语
  • Punjabi: 旁遮普语
  • Afrikaans: 南非荷兰语
  • Persian: 波斯语
  • Basque: 巴斯克语
  • Vietnamese: 越南语
  • Bengali: 孟加拉语
  • Nepali: 尼泊尔语
  • Marathi: 马拉地语
  • Belarusian: 白俄罗斯语
  • Kazakh: 哈萨克语
  • Armenian: 亚美尼亚语
  • Swahili: 斯瓦希里语
  • Tamil: 泰米尔语
  • Albanian: 阿尔巴尼亚语


链接: https://pan.baidu.com/s/1AvpSJqWpmIDEjR_Qaabueg
提取码下载:
文件名称:提取码下载.txt 
下载次数:0  文件大小:16 Bytes  售价:19金钱 [记录]
下载权限: 不限 [购买VIP]   [充值]   [在线充值]   【VIP会员6折;永久VIP4折】
安全检测,请放心下载





相关帖子

扫码关注微信公众号,及时获取最新资源信息!下载附件优惠VIP会员6折;永久VIP4折
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

免责声明:
1、本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与商业和非法行为,请在24小时之内自行删除!
2、本站所有内容均由互联网收集整理、网友上传,并且以计算机技术研究交流为目的,仅供大家参考、学习,请勿任何商业目的与商业用途。
3、若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
4、论坛的所有内容都不保证其准确性,完整性,有效性,由于源码具有复制性,一经售出,概不退换。阅读本站内容因误导等因素而造成的损失本站不承担连带责任。
5、用户使用本网站必须遵守适用的法律法规,对于用户违法使用本站非法运营而引起的一切责任,由用户自行承担
6、本站所有资源来自互联网转载,版权归原著所有,用户访问和使用本站的条件是必须接受本站“免责声明”,如果不遵守,请勿访问或使用本网站
7、本站使用者因为违反本声明的规定而触犯中华人民共和国法律的,一切后果自己负责,本站不承担任何责任。
8、凡以任何方式登陆本网站或直接、间接使用本网站资料者,视为自愿接受本网站声明的约束。
9、本站以《2013 中华人民共和国计算机软件保护条例》第二章 “软件著作权” 第十七条为原则:为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。若有学员需要商用本站资源,请务必联系版权方购买正版授权!
10、本网站如无意中侵犯了某个企业或个人的知识产权,请来信【站长信箱312337667@qq.com】告之,本站将立即删除。
郑重声明:
本站所有资源仅供用户本地电脑学习源代码的内含设计思想和原理,禁止任何其他用途!
本站所有资源、教程来自互联网转载,仅供学习交流,不得商业运营资源,不确保资源完整性,图片和资源仅供参考,不提供任何技术服务。
本站资源仅供本地编辑研究学习参考,禁止未经资源商正版授权参与任何商业行为,违法行为!如需商业请购买各资源商正版授权
本站仅收集资源,提供用户自学研究使用,本站不存在私自接受协助用户架设游戏或资源,非法运营资源行为。
 
在线客服
点击这里给我发消息 点击这里给我发消息 点击这里给我发消息
售前咨询热线
312337667

微信扫一扫,私享最新原创实用干货

QQ|免责声明|小黑屋|依星资源网 ( 鲁ICP备2021043233号-3 )|网站地图

GMT+8, 2025-8-30 13:31

Powered by Net188.com X3.4

邮箱:312337667@qq.com 客服QQ:312337667(工作时间:9:00~21:00)

快速回复 返回顶部 返回列表