使用winsper语音识别开源模型封装成openai chatgpt兼容接口,高性能处理
介绍使用winsper语音识别开源模型封装成openai chatgpt兼容接口 软件架构使用uvicorn、fastapi、openai-whisper等开源库实现高性能接口 使用说明- 下载代码
- 安装 ffmpeg https://ffmpeg.org/download.html
- 安装依赖 项目根目录下执行命令 pip install -r requirements.txt
- 运行代码 项目根目录下执行命令 python main.py
- 首次启动会下载模型,如果下载失败,请手动下载模型,放在项目根目录下,并修改 main.py 里的 model_size 参数。
可用型号和语言您可能还需要安装 rust,以防 tiktoken 没有为您的平台提供预编译的轮子。如果在上述 pip install 命令过程中遇到安装错误,请按照 入门页面 的指引来安装 Rust 开发环境。此外,您可能需要配置 PATH 环境变量,例如 export PATH="$HOME/.cargo/bin PATH"。如果安装过程中出现 No module named 'setuptools_rust' 错误,您需要安装 setuptools_rust,可以通过运行类似命令来完成。 [td]尺寸 | 参数大小 | 纯英文型号 | 多语言模型 | 所需显存 | 相对速度 | tiny | 39 M | tiny.en | tiny | ~1 GB | ~32x | base | 74 M | base.en | base | ~1 GB | ~16x | small | 244 M | small.en | small | ~2 GB | ~6x | medium | 769 M | medium.en | medium | ~5 GB | ~2x | large | 1550 M | 不适用 | large | ~10 GB | 1x |
针对仅英文应用的.en模型往往表现更佳,尤其是对于tiny.en和base.en模型。我们观察到,对于small.en和medium.en模型,这种差异变得不那么明显。 Whisper的表现因语言而异,幅度很大。下图展示了使用WER(词错误率)或CER(字符错误率,以斜体显示)在Common Voice 15和Fleurs数据集上评估的large-v3和large-v2模型按语言划分的性能分解。其他模型和数据集对应的更多WER/CER指标,以及用于翻译评估的BLEU(双语评估替代)分数,可以在论文的附录D.1、D.2和D.4中找到。 可识别语言细分- Dutch: 荷兰语
- Spanish: 西班牙语
- Korean: 韩语
- Italian: 意大利语
- German: 德语
- Thai: 泰语
- Russian: 俄语
- Portuguese: 葡萄牙语
- Polish: 波兰语
- Indonesian: 印度尼西亚语
- Mandarin (TW): 普通话(台湾)
- Swedish: 瑞典语
- Czech: 捷克语
- English: 英语
- Japanese: 日语
- French: 法语
- Romanian: 罗马尼亚语
- Cantonese (CN): 粤语(中国大陆)
- Turkish: 土耳其语
- Mandarin (CN): 普通话(中国大陆)
- Catalan: 加泰罗尼亚语
- Hungarian: 匈牙利语
- Ukrainian: 乌克兰语
- Greek: 希腊语
- Bulgarian: 保加利亚语
- Arabic: 阿拉伯语
- Serbian: 塞尔维亚语
- Macedonian: 马其顿语
- Cantonese (HK): 粤语(香港)
- Latvian: 拉脱维亚语
- Slovenian: 斯洛文尼亚语
- Hindi: 印地语
- Galician: 加利西亚语
- Danish: 丹麦语
- Urdu: 乌尔都语
- Slovak: 斯洛伐克语
- Hebrew: 希伯来语
- Finnish: 芬兰语
- Azerbaijani: 阿塞拜疆语
- Lithuanian: 立陶宛语
- Estonian: 爱沙尼亚语
- Nynorsk: 新挪威语
- Welsh: 威尔士语
- Punjabi: 旁遮普语
- Afrikaans: 南非荷兰语
- Persian: 波斯语
- Basque: 巴斯克语
- Vietnamese: 越南语
- Bengali: 孟加拉语
- Nepali: 尼泊尔语
- Marathi: 马拉地语
- Belarusian: 白俄罗斯语
- Kazakh: 哈萨克语
- Armenian: 亚美尼亚语
- Swahili: 斯瓦希里语
- Tamil: 泰米尔语
- Albanian: 阿尔巴尼亚语

链接: https://pan.baidu.com/s/1AvpSJqWpmIDEjR_Qaabueg
提取码下载:
|