1.3 · 部署模型（Deployment Models）

长期记忆与上下文管理 · 本章是 Mem0 DeepWiki 中文译文的独立章节页，保留原始链接、源码锚点、模块标签和章节层级。

项目Mem0 章节1.3 状态全文译文模块模型调用与提供方适配、界面与交互、系统架构、测试、发布与运维

项目要点页2.5 参考项目项目章节目录Mem0 DeepWiki 原始章节Deployment Models 上一章1.2 下一章2

源码线索

docs/api-reference/entities/delete-user.mdx
docs/api-reference/entities/get-users.mdx
docs/api-reference/events/get-event.mdx
docs/api-reference/events/get-events.mdx
docs/cookbooks/essentials/building-ai-companion.mdx
docs/cookbooks/essentials/controlling-memory-ingestion.mdx
docs/cookbooks/essentials/entity-partitioning-playbook.mdx
docs/cookbooks/essentials/exporting-memories.mdx
docs/cookbooks/integrations/healthcare-google-adk.mdx
docs/cookbooks/integrations/openai-tool-calls.mdx

模块标签

模型调用与提供方适配
界面与交互
系统架构
测试、发布与运维
记忆与上下文

中文译文

部署模型（中文译文）

原始 DeepWiki 页面：https://deepwiki.com/mem0ai/mem0/1.3-deployment-models

翻译时间：2026-05-27T08:44:57.386Z

翻译模型：deepseek-chat

原文字符数：10395

项目：Mem0 (mem0)

---

部署模型

架构总览

Mem0 的双部署模型将基础设施管理与内存功能分离。两种路径都实现了相同的内存操作，但在底层服务的配置和扩展方式上有所不同。

平台版架构（托管服务）

平台版部署使用 MemoryClient 与 Mem0 托管的 API（api.mem0.ai）进行通信。认证通过 API 密钥处理。托管基础设施负责处理向量存储、图数据库、大语言模型（LLM）编排，以及 Webhook 和自定义分类等高级功能。

graph TB
    subgraph "应用层"
        App["您的应用"]
    end

    subgraph "客户端SDK_平台版"
        MemoryClient["MemoryClient<br/>(mem0.client.main.MemoryClient)"]
        AsyncClient["AsyncMemoryClient"]
    end

    subgraph "托管平台_api_mem0_ai"
        RestAPI["REST API<br/>/v1/ping/, /v3/memories/"]
        Auth["API 密钥认证"]
        Webhooks["Webhook 系统"]
        Dashboard["仪表盘 UI<br/>app.mem0.ai"]
    end

    subgraph "托管基础设施"
        VectorDB["向量存储<br/>(托管 Qdrant/Pinecone)"]
        GraphDB["图存储<br/>(托管 Neo4j/Neptune)"]
        LLMProvider["大语言模型提供商<br/>(托管提取)"]
    end

    App --> MemoryClient
    MemoryClient -->|"HTTPS + Authorization: Token"| RestAPI
    RestAPI --> Auth
    RestAPI --> VectorDB
    RestAPI --> GraphDB
    RestAPI --> LLMProvider
    RestAPI -.->|"POST"| Webhooks
    Dashboard --> RestAPI

来源： mem0/client/main.py:62-127, docs/llms.txt:7-11, docs/platform/overview.mdx:7-15, docs/core-concepts/memory-operations/add.mdx:57-74

开源版架构（自托管）

开源版部署直接在您的进程中实例化 Memory 类。您需要自行配置大语言模型（LLM）、嵌入向量生成器和向量存储。默认情况下，它使用 OpenAI 作为大语言模型（LLM）/嵌入向量生成器，并使用本地 Qdrant 实例进行存储。

graph TB
    subgraph "应用层"
        App["您的应用"]
    end

    subgraph "客户端SDK_开源版"
        MemoryClass["Memory<br/>(mem0.memory.main.Memory)"]
    end

    subgraph "本地存储"
        SQLite["SQLiteManager<br/>(~/.mem0/history.db)"]
        VectorStore["VectorStoreBase<br/>(Qdrant/Chroma/PGVector)"]
    end

    subgraph "外部提供商"
        LLM["LLMFactory<br/>(OpenAI/Ollama/Anthropic)"]
        Embedder["EmbedderFactory<br/>(OpenAI/HuggingFace)"]
    end

    App --> MemoryClass
    MemoryClass --> SQLite
    MemoryClass --> VectorStore
    MemoryClass --> LLM
    MemoryClass --> Embedder

来源： docs/open-source/python-quickstart.mdx:80-87, docs/llms.txt:85-108, docs/open-source/overview.mdx:1-10

---

部署对比

功能对等矩阵

能力	平台版（托管）	开源版（OSS）	实现细节
事实提取	✅	✅	使用大语言模型（LLM）从消息中提取事实 `docs/core-concepts/memory-operations/add.mdx:40-42`
冲突解决	✅	✅	检查现有记忆是否存在重复/矛盾 `docs/core-concepts/memory-operations/add.mdx:43-45`
图记忆	✅	✅	支持 Neo4j、Kuzu、Neptune 等 `docs/platform/features/platform-overview.mdx:24-25`
异步支持	✅	✅	`AsyncMemoryClient`（平台版）vs `AsyncMemory`（开源版） `docs/llms.txt:170-171`
Webhook	✅	❌	仅平台版提供的事件通知系统 `docs/llms.txt:103-107`
自定义分类	✅	❌	在项目级别定义的 AI 分配分类 `docs/cookbooks/essentials/building-ai-companion.mdx:185-195`
批量删除	✅	❌	`batch_delete` 支持最多 1000 条记忆 `docs/core-concepts/memory-operations/delete.mdx:22-23`
历史追踪	托管	本地 SQLite	开源版将历史存储在 `~/.mem0/history.db` `docs/open-source/python-quickstart.mdx:85`

来源： docs/llms.txt:7-12, docs/core-concepts/memory-operations/add.mdx:170-177, docs/open-source/python-quickstart.mdx:80-87, docs/core-concepts/memory-operations/delete.mdx:10-24

客户端代码对比

SDK 为每种模型提供了不同的入口点。MemoryClient 面向托管的 API，而 Memory 则在本地运行逻辑。

平台版（托管）：

from mem0 import MemoryClient

# 使用 API 密钥向 api.mem0.ai 进行认证
client = MemoryClient(api_key="your-api-key")
client.add([{"role": "user", "content": "我是素食主义者"}], user_id="user123")

开源版（自托管）：

from mem0 import Memory

# 本地运行；需要提供商 API 密钥（例如 OPENAI_API_KEY）
m = Memory()
m.add("我是素食主义者", user_id="user123")

来源： mem0/client/main.py:75-127, docs/llms.txt:25-51, docs/llms.txt:85-108

---

决策矩阵

何时使用平台版（托管）

选择平台版，如果：

零基础设施： 您希望避免管理向量数据库、图存储和扩展问题 docs/platform/overview.mdx:22-23。
高级功能： 您需要托管的重新排序器、Webhook 或 AI 驱动的自定义分类 docs/llms.txt:7-8。
企业级管控： 您需要 SOC 2 Type II 合规性、审计日志和组织级治理 docs/platform/overview.mdx:25。
性能要求： 您需要由 Mem0 团队优化的亚 50 毫秒检索 docs/llms.txt:23。

何时使用开源版（自托管）

选择开源版，如果：

数据隐私： 您必须将所有数据保留在自己的基础设施或 VPC 内 docs/llms.txt:23。
本地模型： 您希望使用本地大语言模型（LLM）（通过 Ollama）或特定的开源向量存储 docs/cookbooks/essentials/building-ai-companion.mdx:16-17。
完全自定义： 您需要修改提取提示或内部记忆逻辑 docs/open-source/overview.mdx:160-161。
成本敏感： 您的使用量极高，托管 API 成本超过了自托管基础设施的成本。

来源： docs/llms.txt:21-24, docs/platform/overview.mdx:20-27, docs/cookbooks/essentials/building-ai-companion.mdx:86-120

---

技术实现细节

平台版验证流程

当 MemoryClient 初始化时，它会通过 /v1/ping/ 端点验证 API 密钥，以获取组织和项目上下文。

sequenceDiagram
    participant App as "您的应用"
    participant Client as "MemoryClient"
    participant API as "api.mem0.ai"

    App->>Client: __init__(api_key)
    Client->>Client: 对 API 密钥进行哈希处理作为 user_id
    Client->>API: GET /v1/ping/ (认证令牌)
    API-->>Client: 200 OK (org_id, project_id, user_email)
    Client->>App: 就绪

来源： mem0/client/main.py:105-154

开源版组件默认值

开源版 Memory 类默认使用一套技术栈，只需 OpenAI API 密钥即可立即使用。

组件	默认提供商	配置 `docs/open-source/python-quickstart.mdx:80-87`
大语言模型（LLM）	OpenAI	`gpt-4o-mini` 用于事实提取
嵌入向量生成器	OpenAI	`text-embedding-3-small`（1536 维）
向量存储	Qdrant	本地存储于 `/tmp/qdrant`
历史记录	SQLite	本地数据库位于 `~/.mem0/history.db`

来源： docs/open-source/python-quickstart.mdx:80-87, mem0/client/main.py:29-30