增加LLMHub 产品需求文档（PRD）

2025-04-23 15:09:18 +08:00 · 2025-04-23 15:09:18 +08:00 · 651089fd6a
commit 651089fd6a
parent afbfbcf9ec
11 changed files with 460 additions and 33 deletions
--- a/CN/LLM-Hub/Gewuyou/国内大模型平台与开源大模型汇总.md
+++ b/CN/LLM-Hub/Gewuyou/国内大模型平台与开源大模型汇总.md
@ -1,24 +0,0 @@
 ## 一、国内多模型聚合平台
 | 平台名称                   | 官网地址                                                     | 文档地址                                                     |
 | -------------------------- | ------------------------------------------------------------ | ------------------------------------------------------------ |
 | 阿里云百炼（Model Studio） | [官网](https://www.alibabacloud.com/zh/product/modelstudio?_p_lc=1) | [模型文档](https://help.aliyun.com/zh/model-studio/models) / [API文档](https://api.aliyun.com/document/bailian) |
 | 百度文心千帆平台           | [官网](https://cloud.baidu.com/product-s/qianfan_home)       | [文档](https://cloud.baidu.com/doc/API/index.html)           |
 | 智谱AI开放平台             | [官网](https://bigmodel.cn/)                                 | [文档](https://bigmodel.cn/dev/welcome)                      |
 | DMXAPI 多模态聚合平台      | [官网](https://www.dmxapi.cn/)                               | [文档](https://www.dmxapi.cn/python)                         |
 ------
 ## 二、模型提供商平台
 以下是国内主要的大模型提供商及其平台信息，涵盖模型名称、GitHub地址、文档地址等。
 | 模型名称               | GitHub地址                                      |
 | ---------------------- | ----------------------------------------------- |
 | DeepSeek               | [GitHub](https://github.com/deepseek-ai)        |
 | 通义千问（阿里云）     | [GitHub](https://github.com/QwenLM)             |
 | 文心一言（百度）       | [GitHub](https://github.com/PaddlePaddle/ERNIE) |
 | 智谱AI（GLM系列）      | [GitHub](https://github.com/THUDM)              |
 | 商汤科技（SenseChat）  | [GitHub](https://github.com/SenseTime)          |
 | 百川智能（Baichuan）   | [GitHub](https://github.com/baichuan-inc)       |
 | 科大讯飞（星火大模型） | [GitHub](https://github.com/iflytek)            |
--- a/CN/LLM-Hub/LLM-Hub-Glossary/LLM-Hub-Glossary.md
+++ b/CN/LLM-Hub/LLM-Hub-Glossary/LLM-Hub-Glossary.md
@ -0,0 +1,26 @@
 ## 📘 LLMHub 术语表（Glossary）
 | 术语                       | 定义                                                   |
 |--------------------------|------------------------------------------------------|
 | **LLM（大语言模型）**           | Large Language Model，基于深度学习构建的自然语言理解与生成模型。           |
 | **API**                  | Application Programming Interface，应用程序编程接口。用于程序之间通信。 |
 | **RESTful API**          | 一种基于资源的 Web 接口设计风格，使用 HTTP 方法表达操作。                   |
 | **OpenAPI**              | 一种规范，用于描述 REST API 的结构、参数和响应格式。                      |
 | **MVP**                  | Minimum Viable Product，最小可行产品，最基础但可运行的产品版本。          |
 | **多模态模型（Multimodal）**    | 支持文本、图像、语音等多种输入类型的 AI 模型。                            |
 | **部署（Deployment）**       | 将模型或服务安装、配置并运行在目标环境（如本地或云端）的过程。                      |
 | **Kubernetes（K8s）**      | 一种容器编排系统，用于自动部署、扩展和管理容器化应用。                          |
 | **微服务架构（Microservices）** | 一种软件架构方式，将应用划分为一组小服务，每个服务可独立开发、部署、扩展。                |
 | **多租户（Multi-tenancy）**   | 一个系统支持多个用户组织（租户），彼此之间数据和配置隔离。                        |
 | **SDK**                  | Software Development Kit，开发工具包，封装接口调用的代码集合。          |
 | **RBAC**                 | Role-Based Access Control，基于角色的访问控制系统。               |
 | **OAuth2.0**             | 一种行业标准的授权协议，用于第三方访问用户资源时的认证授权。                       |
 | **JWT**                  | JSON Web Token，一种轻量级的身份令牌，用于安全传输用户认证信息。              |
 | **Web UI**               | 基于浏览器的用户界面。                                          |
 | **CLI**                  | Command Line Interface，命令行界面，常用于开发和部署场景。             |
 | **SLA**                  | Service Level Agreement，服务等级协议，定义系统可用性目标。            |
 | **A/B 实验**               | 一种测试不同版本模型或服务的实验设计方法，衡量效果差异。                         |
 | **Webhook**              | 一种由服务端主动向客户端推送事件通知的机制，通常用于异步通信。                      |
 | **模型适配器（Adapter）**       | 用于连接具体模型平台（如 OpenAI、阿里百炼）的接口转换组件。                    |
 | **模型注册表**                | 用于管理可部署模型清单、版本和元数据的服务模块。                             |
 | **Ensemble 推理**          | 模型集成推理，结合多个模型的预测结果提升精度或稳健性。                          |
--- a/CN/LLM-Hub/LLM-Hub-PRD/LLM-Hub-PRD.md
+++ b/CN/LLM-Hub/LLM-Hub-PRD/LLM-Hub-PRD.md
@ -0,0 +1,297 @@
 LLMHub 产品需求文档（PRD）
 ---
 ## 1. 文档版本与修订记录
 | 版本号 | 日期         | 作者      | 变更说明      |
 |-----|------------|---------|-----------|
 | 0.1 | 2025-04-23 | JCNC 团队 | 初始版本，完成大纲 |
 ---
 ## 2. 产品概述
 ### 2.1 背景与现状
 - 各大模型平台 API 标准差异大，调用繁琐；
 - 企业对数据隐私、合规、高可用性需求日益提升；
 - 多模态 AI 场景需求快速增长，但集成成本高。
 ### 2.2 产品愿景与价值
 - **愿景**：打造 "一站式" 大模型接入与管理平台，让组织零门槛使用 AI 能力；
 - **核心价值**：
    - 降本增效：统一抽象、多云/本地混合部署；
    - 安全合规：企业级权限、审计、加密；
    - 可观察：全链路监控、告警、日志分析；
    - 可扩展：插件化架构、生态开放。
 ---
 ## 3. 目标用户与用户画像
 | 用户类型      | 角色        | 关键需求                          |
 |-----------|-----------|-------------------------------|
 | 企业管理员     | CTO/IT 经理 | 快速部署与版本回滚；多租户隔离；权限管控；成本可视化    |  
 | 开发者       | 后端/AI 工程师 | 统一 SDK、丰富样例；自动化测试；调试日志；扩展性能调优 |
 | 运维工程师     | DevOps    | 健康检测；自动弹性伸缩；日志告警；灾备策略         |
 | 产品经理&业务团队 | PM/产品     | 接口易用；版本管理；调用监控；成本中心分摊         |
 | 最终用户（消费者） | 普通用户      | 简洁对话界面；快速响应；多端体验一致性           |
 ---
 ## 5. 用户旅程与场景
 ### 5.1 企业管理员一键部署场景
 1. 登录控制台 → 选择模型版本 → 填写环境配置 → 点击 "部署"。
 2. 平台触发 Helm 安装或 Kubernetes Operator → 自动化健康探针 → 部署成功通知。
 3. 回滚与报警：若探针失败，自动回滚到上一次稳定版本，并在控制台与邮件/钉钉通知中推送告警。
 ### 5.2 开发者统一调用场景
 1. 安装 SDK → 配置 API Key 与 Endpoint → 引入统一 "LLMHubSDK"。
 2. 支持本地 Mock 模式与远程模式切换，便于本地调试。
 ### 5.3 运维监控与告警场景
 - 引入 Prometheus Exporter → Grafana 可视化面板。
 - 设定 QPS、延迟、错误率阈值 → 告警策略（短信/邮件/WebHook）。
 - 日志聚合：Elasticsearch + Kibana，支持结构化日志查询与异常追溯。
 ---
 ## 6. 技术架构与模块设计
 ![](../Mermaid/LLMHub-Architecture-Diagram/LLMHub-Architecture-Diagram.png)
 ### 6.1 总体架构
 ### 6.2 模块细化
 | 模块        | 功能点                                                    |
 |-----------|--------------------------------------------------------|
 | API 网关    | 认证鉴权、限流、请求路由、熔断                                        |
 | 适配器层      | 各供应商 API 封装、参数映射、版本兼容                                  |
 | 编排模块      | Helm/Operator 调用、健康探针、回滚逻辑                             |
 | 调度模块      | GPU/CPU 利用率监控、Pod 弹性伸缩、分区隔离                            |
 | 监控告警      | Exporter、Grafana 仪表、Prometheus Alertmanager、WebHook 集成 |
 | 日志审计      | 调用链追踪、ELK 日志聚合、审计报告导出                                  |
 | 权限管理      | RBAC、OAuth2.0、SSO 集成                                   |
 | SDK & CLI | 多语言 SDK、CLI 工具、Mock 本地模式                               |
 | 运维工具      | 灾备脚本、升级回滚脚本、备份恢复脚本                                     |
 ---
 ### 7. 接口规范与示例
 ```yaml
 openapi: 3.0.1
 info:
  title: LLMHub API
  version: 1.0.0
 paths:
  /v1/models:
    get:
      summary: 列出可用模型
      responses:
        '200':
          description: 模型列表
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ModelList'
  /v1/deploy:
    post:
      summary: 部署模型
      requestBody:
        required: true
        content:
          application/json:
            schema:
              $ref: '#/components/schemas/DeployRequest'
      responses:
        '202':
          description: 部署已接受
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/DeployResponse'
 components:
  schemas:
    ModelList:
      type: object
      properties:
        models:
          type: array
          items:
            $ref: '#/components/schemas/Model'
    Model:
      type: object
      properties:
        id:
          type: string
        name:
          type: string
        description:
          type: string
    DeployRequest:
      type: object
      required:
        - modelId
        - cluster
      properties:
        modelId:
          type: string
          description: 要部署的模型 ID
        cluster:
          type: string
          description: 目标集群名称
        resources:
          type: object
          properties:
            cpu:
              type: integer
              description: CPU 核数
            gpu:
              type: integer
              description: GPU 卡数
        env:
          type: object
          description: 环境变量列表
          additionalProperties:
            type: string
    DeployResponse:
      type: object
      properties:
        deploymentId:
          type: string
          description: 部署任务 ID
        status:
          type: string
          description: 当前状态
        startedAt:
          type: string
          format: date-time
          description: 启动时间
 ```
 ---
 ### 7.2 样例请求与响应
 #### 请求
 ```http
 POST /v1/deploy HTTP/1.1
 Host: api.llmhub.example.com
 Authorization: Bearer <token>
 Content-Type: application/json
 {
  "modelId": "openai-gpt-4-xlarge",
  "cluster": "private-cloud-1",
  "resources": {
    "cpu": 16,
    "gpu": 2
  },
  "env": {
    "MAX_TOKENS": "2048"
  }
 }
 ```
 #### 响应
 ```http
 HTTP/1.1 202 Accepted
 Content-Type: application/json
 {
  "deploymentId": "dep-123456",
  "status": "initializing",
  "startedAt": "2025-04-24T10:00:00+08:00"
 }
 ```
 ## 8. 非功能需求
 1. **性能**：
    - 平均响应时长 ≤ 200ms（P95）;
    - 系统峰值 QPS ≥ 2000;
 2. **可用性**：
    - SLA ≥ 99.9%（月度);
    - 支持多 AZ 部署与链路故障切换;
 3. **安全**：
    - OAuth2.0 / JWT / RBAC;
    - TLS 全链路加密;
    - 日志审计覆盖 100% 调用;
 4. **可扩展性**：
    - 插件化适配器动态加载;
    - 支持 0-100+ 模型实例线性扩容;
 5. **可观测性**：
    - Prometheus + Grafana 指标;
    - ELK 日志搜索;
    - 分布式追踪 (Jaeger);
 6. **合规**：
    - GDPR、ISO27001、等保二级;
    - 数据脱敏与访问日志保留策略;
 ---
 ## 9. UX/UI 细节说明
 - **部署向导**：多步骤分屏设计，当前步骤突出，支持中途保存;
 - **仪表盘**：实时 QPS、延迟、资源利用率图表;
 - **日志中心**：关键字搜索，高亮、过滤、导出;
 - **权限控制**：角色列表页面，支持批量授权、权限树视图;
 - **暗黑/明亮主题**：一键切换，跟随系统主题配置;
 ---
 ## 10. 测试与验收
 1. 单元测试覆盖率 ≥ 90%;
 2. 集成测试场景覆盖：部署、回滚、扩容、调用限流;
 3. 安全渗透测试：无高危漏洞;
 4. 性能压测：最大并发 2000 QPS 无误;
 5. 用户验收：按用户故事完成演示并通过评审;
 ---
 ## 11. 风险与缓解措施
 | 风险             | 概率 | 影响 | 缓解措施                                    |
 |----------------|----|----|-----------------------------------------|
 | 第三方模型接口变动      | 中  | 高  | 定期兼容性测试 + 自动化适配层升级                      |
 | 私有云网络隔离导致部署失败  | 中  | 高  | 与运维团队协作，提供脚本化网络检测与自动重试机制                |
 | 多租户资源争抢        | 低  | 中  | 引入优先级调度与资源隔离（Namespace + ResourceQuota） |
 | 审计日志量大导致存储成本上升 | 高  | 中  | 日志冷热分离，归档策略与压缩存储                        |
 ---
 ## 12. 迭代计划与里程碑
 | 阶段    | 时间范围               | 目标                               |
 |-------|--------------------|----------------------------------|
 | Alpha | 2025-05-01 ~ 05-15 | 完成架构设计、API 抽象与一键部署 POC；          |
 | Beta  | 2025-05-16 ~ 06-15 | 完成基础文本服务、多租户 & 权限系统、监控 & 告警集成；   |
 | RC    | 2025-06-16 ~ 06-30 | 完成图像/语音多模态接入、系统性能 & 安全测试，Bug 修复； |
 | GA    | 2025-07-01         | 对外发布文档、部署指南、SDK & CLI，客服支持渠道就绪；  |
 | V1.1+ | 2025 Q3 ~ Q4       | 插件生态开放、多模态深度优化、行业解决方案模板；         |
 ---
 ## 13. 附录
 - **术语表**：[点击查看](../LLM-Hub-Glossary/LLM-Hub-Glossary.md)
 - **部署指南**：
 - **运维手册**：
 - **用户手册（PDF）**：
--- a/CN/LLM-Hub/LLM-Hub.md
+++ b/CN/LLM-Hub/LLM-Hub.md
--- a/CN/LLM-Hub/Mermaid/LLMHub-Architecture-Diagram/LLMHub-Architecture-Diagram.md
+++ b/CN/LLM-Hub/Mermaid/LLMHub-Architecture-Diagram/LLMHub-Architecture-Diagram.md
@ -0,0 +1,52 @@
 graph TD
 UI[控制台 / UI]
 UI --> APIGW[API 网关 & 认证层]
 subgraph 核心功能模块
 APIGW --> Abstraction[统一抽象接口层]
 APIGW --> Adapter[多云模型适配器层]
 APIGW --> Orchestration[部署编排模块<br>Helm / Operator]
 APIGW --> Scheduler[资源调度模块]
 APIGW --> AsyncQueue[异步任务队列<br>Celery / KEDA]
 APIGW --> ConfigCenter[统一配置中心<br>Apollo / Nacos]
 APIGW --> Auth[权限与认证<br>OAuth2 / RBAC / SSO]
 end
 subgraph 运维与可观测
 Orchestration --> HealthProbe[健康探针 & 回滚逻辑]
 Scheduler --> AutoScaling[Pod 弹性伸缩 & 节点隔离]
 AsyncQueue --> LogArchiver[日志归档任务 / 审计导出]
 APIGW --> Monitor[监控告警模块<br>Prometheus + Grafana]
 APIGW --> Trace[分布式追踪<br>Jaeger + OpenTelemetry]
 APIGW --> LogAudit[日志审计模块<br>ELK]
 end
 subgraph 模型服务层
 Abstraction --> ModelCluster[本地 / 多云模型服务集群]
 Adapter --> ModelAPI[供应商 API 调用<br>OpenAI, Baichuan...]
 end
 subgraph DevOps & 安全
 GitRepo[Git 仓库<br>IaC + GitOps]
 GitRepo --> CI_CD[CI/CD 管道<br>ArgoCD, Jenkins]
 CI_CD --> ConfigCenter
 CI_CD --> Orchestration
 ConfigCenter --> Monitor
 Auth --> AuditExport[审计报告导出]
 end
 Monitor --> AlertSys[告警系统<br>短信 / 邮件 / WebHook]
 Trace --> Dashboard[追踪仪表盘]
 LogAudit --> KibanaUI[Kibana 分析界面]
 subgraph HA 架构
 ModelCluster --> ServiceMesh[服务网格<br>Istio / Envoy]
 ServiceMesh --> MultiAZ[多 AZ 支持 + 弹性负载]
 MultiAZ --> Failover[故障自动切换]
 end
 subgraph PluginRuntime[插件生态与沙箱]
 APIGW --> PluginEngine[插件运行时引擎<br>WASM / Lua Sandbox]
 PluginEngine --> PluginStore[插件市场 / SDK 插件]
 end
--- a/CN/LLM-Hub/Mermaid/LLMHub-Architecture-Diagram/LLMHub-Architecture-Diagram.png
+++ b/CN/LLM-Hub/Mermaid/LLMHub-Architecture-Diagram/LLMHub-Architecture-Diagram.png
--- a/CN/LLM-Hub/Model-List/Model-List.md
+++ b/CN/LLM-Hub/Model-List/Model-List.md
@ -0,0 +1,24 @@
 # 模型列表
 ## 一、模型聚合平台
 | 平台名称                | 官网地址                                                              | 文档地址                                                                                                      |
 |---------------------|-------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------|
 | 阿里云百炼（Model Studio） | [官网](https://www.alibabacloud.com/zh/product/modelstudio?_p_lc=1) | [模型文档](https://help.aliyun.com/zh/model-studio/models) / [API文档](https://api.aliyun.com/document/bailian) |
 | 百度文心千帆平台            | [官网](https://cloud.baidu.com/product-s/qianfan_home)              | [文档](https://cloud.baidu.com/doc/API/index.html)                                                          |
 | 智谱AI开放平台            | [官网](https://bigmodel.cn/)                                        | [文档](https://bigmodel.cn/dev/welcome)                                                                     |
 | DMXAPI 多模态聚合平台      | [官网](https://www.dmxapi.cn/)                                      | [文档](https://www.dmxapi.cn/python)                                                                        |
 ------
 ## 二、模型提供商平台
 | 模型名称            | GitHub地址                                        |
 |-----------------|-------------------------------------------------|
 | DeepSeek        | [GitHub](https://github.com/deepseek-ai)        |
 | 通义千问（阿里云）       | [GitHub](https://github.com/QwenLM)             |
 | 文心一言（百度）        | [GitHub](https://github.com/PaddlePaddle/ERNIE) |
 | 智谱AI（GLM系列）     | [GitHub](https://github.com/THUDM)              |
 | 商汤科技（SenseChat） | [GitHub](https://github.com/SenseTime)          |
 | 百川智能（Baichuan）  | [GitHub](https://github.com/baichuan-inc)       |
 | 科大讯飞（星火大模型）     | [GitHub](https://github.com/iflytek)            |
--- a/CN/LLM-Hub/Model-List/assets/大模型平台调研/image-20250423102056154.png
+++ b/CN/LLM-Hub/Model-List/assets/大模型平台调研/image-20250423102056154.png
--- a/CN/LLM-Hub/Model-List/assets/大模型平台调研/image-20250423102141585.png
+++ b/CN/LLM-Hub/Model-List/assets/大模型平台调研/image-20250423102141585.png
--- a/CN/LLM-Hub/RESTful-API/RESTful-API.md
+++ b/CN/LLM-Hub/RESTful-API/RESTful-API.md
@ -0,0 +1,52 @@
 RESTful API（Representational State Transfer 风格的接口）是一种常见的 Web 服务设计规范，其核心思想和特点包括：
 1. **资源（Resource）为中心**
    - 把系统中的一切“对象”都看作资源，每个资源通过一个唯一的 URI（路径）来标识。
    - 例如：`/models` 可能对应“模型列表”资源，`/models/123` 对应“ID 为 123 的模型”资源。
 2. **使用 HTTP 方法表示操作**
    - **GET**：读取资源（不应改变服务器状态），
    - **POST**：创建资源，
    - **PUT/PATCH**：更新资源，
    - **DELETE**：删除资源。  
      这样可以让接口语义清晰、与 HTTP 协议天然契合。
 3. **无状态性（Stateless）**
    - 每一次请求都包含完成该请求所需的所有信息，服务端不在请求之间保留客户端状态。
    - 优点是易于扩展与负载均衡；缺点是每次请求都要重复认证/传递上下文。
 4. **表现层（Representation）**
    - 客户端与服务端通过“表现层”交换资源状态，通常是 JSON、XML 或其他格式。
    - 比如 `GET /models/123` 返回如下 JSON：
      ```json
      {
        "id": 123,
        "name": "gpt-4",
        "status": "deployed"
      }
      ```
 5. **超媒体驱动（HATEOAS，可选）**
    - 在响应中带上“链接”（links），告诉客户端可以做哪些后续操作，比如：
      ```json
      {
        "id": 123,
        "links": [
          { "rel": "update", "href": "/models/123", "method": "PUT" },
          { "rel": "delete", "href": "/models/123", "method": "DELETE" }
        ]
      }
      ```
    - 这样客户端无须硬编码所有路径，能动态发现可用操作。
 ---
 ### 在 LLMHub 中的应用
 在我们的 PRD 里，“统一抽象接口层”采用 RESTful API 设计，并以 OpenAPI 3.0 规范来描述，这意味着：
 - 每个大模型相关的功能（列出模型、部署模型、调用模型）都被定义为一种资源操作；
 - 开发者通过标准的 HTTP 方法和约定好的路径，就能对接各种底层模型平台；
 - 文档会自动生成（Swagger UI），并确保接口清晰、一致且易于测试。
 这样，无论后端具体集成了哪家大模型服务，上层调用逻辑都保持不变——真正达到了“屏蔽底层差异、统一使用体验”的目标。
--- a/CN/LLM-Hub/项目目标.md
+++ b/CN/LLM-Hub/项目目标.md
@ -15,15 +15,15 @@
 ### 🧱 二、核心模块架构
-| 模块                        | 说明                                                         |
+| 模块                      | 说明                                              |
-| --------------------------- | ------------------------------------------------------------ |
+|-------------------------|-------------------------------------------------|
-| `api-core`                  | 定义统一 AI 能力接口 + SPI 扩展点（如 chat、embedding、vision） |
+| `api-core`              | 定义统一 AI 能力接口 + SPI 扩展点（如 chat、embedding、vision） |
-| `api-core-service`          | 实现模型服务注册发现、调度策略、模型调度器 Dispatcher        |
+| `api-core-service`      | 实现模型服务注册发现、调度策略、模型调度器 Dispatcher                |
-| `model-provider-*`          | 每个模型服务模块（独立部署），实现具体能力并注册到核心服务   |
+| `model-provider-*`      | 每个模型服务模块（独立部署），实现具体能力并注册到核心服务                   |
-| `model-ability-service`     | 可选扩展层，用于实现更高层 AI 能力（如对话管理、RAG）        |
+| `model-ability-service` | 可选扩展层，用于实现更高层 AI 能力（如对话管理、RAG）                  |
-| `model-gateway`（门面服务） | 提供统一入口，转发请求到核心服务，并封装对外 API             |
+| `model-gateway`（门面服务）   | 提供统一入口，转发请求到核心服务，并封装对外 API                      |
-| `model-admin`（后台）       | 模型安装、服务绑定、状态监控、服务管理                       |
+| `model-admin`（后台）       | 模型安装、服务绑定、状态监控、服务管理                             |
-| `auth-center`（可选）       | 提供租户、用户、权限、配额、访问日志等能力（SaaS专属）       |
+| `auth-center`（可选）       | 提供租户、用户、权限、配额、访问日志等能力（SaaS专属）                   |
 ------