2.5 参考项目分类与关键要点
本页只回答“为什么选这些项目、怎么分类、分别借鉴什么”。每个项目先给出业务问题、架构位置和可迁移机制,再提供对应 DeepWiki 中文译文入口;完整章节索引、来源链接和正文阅读统一放到 2.6 译文库。
相关来源文件
ai_agent_huge_data_report/docs/13-reference-projects-deepwiki-granularity.md· 参考项目关键要点。ai_agent_huge_data_report/deepwiki_crawl/manifest.json· DeepWiki 仓库、章节、源码线索。ai_agent_huge_data_report/deepwiki_fulltext_zh_status.json· 中文译文覆盖状态。
从需求到项目的逻辑关系
flowchart TD
REQ["总体需求:SVN 资料事实源、权限继承、可追溯问答"] --> INGEST["入库与文档对象"]
INGEST --> GOVERN["治理、版本、权限与人审"]
GOVERN --> SEARCH["解析、检索、引用与应用编排"]
SEARCH --> WORKBENCH["应用工作台"]
WORKBENCH --> MEMORY["图谱、长期记忆与代理运行时"]
INGEST --> P1["Paperless-ngx"]
GOVERN --> P2["Mayan EDMS / Argilla / Onyx"]
SEARCH --> P3["RAGFlow / Dify / LightRAG / Open WebUI"]
MEMORY --> P4["Graphiti / Mem0 / Cognee / jcode"]
MEMORY --> P5["LongParser / Hindsight / MemOS"]图 2.5 · 参考项目与企业资料知识中枢能力链路。
模块分类
文档治理与复核
先解决资料如何进入系统、如何保持权限与版本、如何由人确认事实。
- Paperless-ngx文档归档与消费管道 · 译文 22/22
- Mayan EDMS企业电子文档治理 · 译文 25/25
- Argilla人工复核与反馈数据 · 译文 28/28
- Onyx企业连接器与统一搜索 · 译文 73/73
应用、检索与解析
再解决复杂文档如何解析、证据如何被召回,以及如何接入业务应用。
- Dify应用编排与外部知识接入 · 译文 68/68
- RAGFlow复杂文档理解与引用检索 · 译文 62/62
- LightRAG轻量图谱增强检索 · 译文 52/52
- Open WebUI多模型对话工作台与知识应用入口 · 译文 107/107
图谱、记忆与运行时
最后验证长期记忆、时序事实、图谱增强召回和代理式研究工作台。
补充参考项目
补齐长文档解析、经验学习记忆和记忆控制面,不计入 DeepWiki 全文译文页数。
- longparser长文档解析任务图 · 补充参考
- hindsight代理经验学习记忆 · 补充参考
- memosMemory OS 控制面 · 补充参考
项目清单
| 项目 | 层级 | 定位 | 阶段 | 重点借鉴 | DeepWiki 中文译文 |
|---|---|---|---|---|---|
| 2.5.1 Paperless-ngx | 资料入库 | 文档归档与消费管道 | 一期可借鉴 | 消费目录、派生文本、自动分类候选、原件与衍生物关系。 | 中文译文 22/22 完整 |
| 2.5.2 Mayan EDMS | 文档治理 | 企业电子文档治理 | 一期治理模型借鉴 | 文档容器、版本链、对象级权限、可查询工作流。 | 中文译文 25/25 完整 |
| 2.5.3 Argilla | 人审反馈 | 人工复核与反馈数据 | 一期可接入 | 建议与确认分离、反馈数据集、低置信样本队列。 | 中文译文 28/28 完整 |
| 2.5.4 Dify | 应用编排 | 应用编排与外部知识接入 | 二期验证 | 外部知识接口、工作流、工具调用、应用级日志。 | 中文译文 68/68 完整 |
| 2.5.5 RAGFlow | 文档解析 | 复杂文档理解与引用检索 | 二期算法验证 | 版面解析、片段可视化、引用定位、解析版本化。 | 中文译文 62/62 完整 |
| 2.5.6 Onyx | 连接器与搜索 | 企业连接器与统一搜索 | 一期连接器借鉴 | 连接器生命周期、同步游标、权限快照、搜索与对话双入口。 | 中文译文 73/73 完整 |
| 2.5.7 Graphiti | 时序图谱 | 时序知识图谱与动态事实记忆 | 三期研究 | 实体、关系、事件、时间边、事实失效判断。 | 中文译文 52/52 完整 |
| 2.5.8 Mem0 | 智能体记忆 | 长期记忆与上下文管理 | 三期研究 | 用户记忆、会话摘要、作用域隔离、记忆删除。 | 中文译文 82/82 完整 |
| 2.5.9 Cognee | 记忆管道 | 记忆管道与知识图谱构建 | 二期后段验证 | 添加、认知化、图谱、向量化、可更新索引。 | 中文译文 83/83 完整 |
| 2.5.10 LightRAG | 图谱检索 | 轻量图谱增强检索 | 二期算法验证 | 实体抽取、关系抽取、混合召回、图索引。 | 中文译文 52/52 完整 |
| 2.5.11 jcode | 代理运行时 | 代理式研究运行时 | 二期后段到三期验证 | 工具注册、会话日志、上下文压缩、人工审批、多智能体协作。 | 中文译文 54/54 完整 |
| 2.5.15 Open WebUI | 应用工作台 | 多模型对话工作台与知识应用入口 | 二期验证 | 聊天工作台、RAG 入口、模型聚合、工具调用、权限与审计、管理面板。 | 中文译文 107/107 完整 |
| 2.5.12 longparser | 长文档解析 | 长文档解析任务图 | 补充参考 | 任务图、长上下文解析、跨页结构、章节级证据。 | 补充参考 无 DeepWiki 全文 |
| 2.5.13 hindsight | 经验记忆 | 代理经验学习记忆 | 补充参考 | 经验日志、失败复盘、策略记忆、复用边界。 | 补充参考 无 DeepWiki 全文 |
| 2.5.14 memos | 记忆治理 | Memory OS 控制面 | 补充参考 | 记忆类型、生命周期策略、适配器、召回审计。 | 补充参考 无 DeepWiki 全文 |
阅读顺序
- 先看文档治理链路:Paperless-ngx → Mayan EDMS → Argilla → Onyx。
- 再看检索与应用链路:RAGFlow → Dify → LightRAG → Open WebUI。
- 最后看研究能力链路:Graphiti → Mem0 → Cognee → jcode,并用 LongParser、Hindsight、MemOS 补齐长文档解析、经验学习和记忆控制面。