⭐ Stars: 38,000+ | 语言: C++ | 今日新增: 120⭐
项目简介
OpenAI Whisper模型的C++移植版本,提供轻量级语音识别解决方案。无需复杂配置,即可在本地享受与OpenAI Whisper相同的识别精度,告别繁琐的云端API调用,实现开箱即用的语音识别体验。
核心功能
• 跨平台支持:支持Windows、macOS、Linux、iOS、Android
• 高性能推理:纯C++实现,无外部依赖
• 多语言识别:支持99种语言的自动语音识别
• 量化支持:支持4/5/8位量化,大幅降低内存占用
• 实时转录:支持实时音频流处理
• GPU加速:支持CUDA、Metal、Vulkan等加速
技术栈
C/C++、GGML、CUDA/Metal
适用场景
• 会议记录与字幕生成
• 语音助手开发
• 音频内容分析与转写
• 嵌入式设备语音识别
源码地址:游客,本帖隐藏的内容需要积分高于 20 才可浏览,您当前积分为 0
|