|
python语音识别、文本转语音、文档重排、数据库连接、知识库文本处理和MCP服务的一键式API服务
功能特性- 语音转录:将音频文件转换为文本。
- 文本转语音:将文本转换为语音文件(支持多种语音风格):默认使用zh-CN-XiaoyiNeural音色。
- 文档重排:基于查询对文档进行相关性排序。
- MySQL数据库API:数据库连接并执行SQL查询和更新操作。
- MCP服务:支持构建MCP工具、接口,可在任意MCP客户端调用。
- 自动清理:生成的临时音频文件会在响应后自动删除。
- 文本处理:将文本分块、关键词提取、文本追加写入、知识库处理。
- API文档:自动生成API使用说明,可通过浏览器访问:http://localhost:8888/docs#/
新增: - MCP工具构建:可在core/mcp_tools.py中任意添加MCP工具,默认提供了两个整数的加、减、乘和除的计算。
- MCP工具注册:在app.py中引入对应的模块,如from core.mcp_tools import add, sub, mul, div,并在mcp.tool()函数中注册。
- MCP服务服务启动:运行启动命令:python cli.py或a4a-run,服务将运行在: http://localhost:9999/sse
前置环境要求- wsl2 (Windows Subsystem for Linux):windows系统下的必要条件。
- Conda (Anaconda or Miniconda):用于管理Python环境。
- Docker-desktop:windows系统下的Docker桌面应用,用于运行dify服务。
相关开源项目- edge-tts:https://github.com/rany2/edge-tts
- SenseVoice:https://github.com/FunAudioLLM/SenseVoice
- bge-reranker-base:https://hf-mirror.com/BAAI/bge-reranker-base
- dify:https://github.com/langgenius/dify
- fastapi:https://github.com/fastapi/fastapi

链接: https://pan.baidu.com/s/1EfmndcK6ZHE1u_St5UxJXQ
提取码下载:
|
|