⭐ Stars: 未知 | 语言: Python | 今日新增: 未知⭐
项目简介
系统整理大语言模型长上下文建模相关论文、资源和技术的知识库,涵盖Attention优化、位置编码等核心话题。
核心功能
• 论文整理:系统整理长上下文相关的核心论文
• 技术分类:涵盖Sparse Attention、Ring Attention、Flash Attention等技术
• 资源汇总:汇集相关开源项目、数据集和工具
• 持续更新:跟进大模型上下文扩展最新进展
• 深度解读:提供核心论文的解读和分析
技术栈
Python / PyTorch / Transformer / JAX
详细描述
知识库系统整理了LLM上下文扩展领域的核心技术和资源。涵盖从早期的Position Interpolation到最新的Ring Attention、YaRN等方案。适合LLM研究者和希望深入理解大模型技术的开发者。资料整理系统,论文解读深入,是学习长上下文建模的优质资源。
游客,本帖隐藏的内容需要积分高于 20 才可浏览,您当前积分为 0 |