★热门 | 语言: Go/TypeScript
项目简介
TEN Framework是一个实时对话式Voice Agent引擎,帮助开发者快速搭建可音视频交互的AI Agent。支持多模态传输、低延迟可打断交互,已支持全球各大主流STT、LLM、TTS厂商。
核心功能
多模态传输:支持语音、文本和图像的输入与输出
低延迟可打断:内置优化后的实时通信能力,最佳延迟仅650ms
自带VAD:在与AI语音交流过程中可以随时打断
丰富插件:支持接入全球主流STT、LLM和TTS
级联模式与端到端模式:支持STT-LLM-TTS和End to End
接入Dify与Coze:只需配置bot ID/API就能让bot开口说话
可视化界面:提供WebRTC界面,实时查看对话记录和事件日志
详细事件日志:便于调试和优化
快速开发:24小时内完成新模型接入
跨平台支持
技术栈
Go + TypeScript + WebRTC + 实时通信 + 多模型API
适用场景
语音助手开发、实时对话AI、智能客服系统、语音交互应用、多模态AI应用、AI语音产品、实时翻译系统、会议助手开发
游客,本帖隐藏的内容需要积分高于 20 才可浏览,您当前积分为 0 |