依星源码资源网,依星资源网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

八字排盘系统济宁依星网络
查看: 8|回复: 0

开源文档问答系统 - AI驱动的PDF智能分析工具 | 技术栈:Python / Streamlit / LangChain / ChromaDB

[复制链接] 主动推送

2万

主题

2万

帖子

2万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
25798
发表于 前天 12:02 | 显示全部楼层 |阅读模式
⭐ Stars: 15,000+ | 语言: Python | 今日新增: 42⭐

项目简介
一个专门针对 PDF 文档的智能问答系统,用户上传 PDF 后可以通过自然语言提问,系统自动检索相关内容并生成回答。

核心功能
• PDF解析:支持扫描件OCR和矢量图形提取
• 智能问答:基于文档内容的精准问答
• 多文档对比:同时上传多份文档进行对比分析
• 引用溯源:回答时标注具体页码和段落
• 批量处理:支持文件夹批量上传

技术栈
Python / Streamlit / LangChain / ChromaDB / PyMuPDF / Tesseract

详细描述
系统采用先进的 RAG 技术,将 PDF 文档切分为语义块并建立向量索引。支持中英文文档混合处理,内置多种大模型接口。提供简洁的 Web 界面,用户无需编程知识即可使用。特别适合学术论文阅读、合同审查、技术文档查询等场景。已在多家企业和研究机构部署使用。

游客,本帖隐藏的内容需要积分高于 20 才可浏览,您当前积分为 0
扫码关注微信公众号,及时获取最新资源信息!下载附件优惠VIP会员6折;永久VIP4折
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

 
在线客服
点击这里给我发消息 点击这里给我发消息 点击这里给我发消息
售前咨询热线
312337667

微信扫一扫,私享最新原创实用干货

QQ|免责声明|小黑屋|依星资源网 ( 鲁ICP备2021043233号-3 )|网站地图

GMT+8, 2026-4-25 02:29

Powered by Net188.com X3.4

邮箱:312337667@qq.com 客服QQ:312337667(工作时间:9:00~21:00)

快速回复 返回顶部 返回列表