docs/CN/LLM-Hub/项目目标.md

73 lines
2.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

------
## ✅ 项目目标:插件化大模型服务平台
------
### 🧠 一、平台定位
构建一个**支持插件化大模型接入、可扩展调度策略、多能力融合、运营级管理的 AI 服务平台**,支持 SaaS 和私有化部署两种模式:
- **SaaS 版本(我们自己运营)**:需要多租户、权限、日志、配额等
- **私有部署版本**:更精简,可由企业自行维护,不强依赖权限系统
------
### 🧱 二、核心模块架构
| 模块 | 说明 |
|-------------------------|-------------------------------------------------|
| `api-core` | 定义统一 AI 能力接口 + SPI 扩展点(如 chat、embedding、vision |
| `api-core-service` | 实现模型服务注册发现、调度策略、模型调度器 Dispatcher |
| `model-provider-*` | 每个模型服务模块(独立部署),实现具体能力并注册到核心服务 |
| `model-ability-service` | 可选扩展层,用于实现更高层 AI 能力如对话管理、RAG |
| `model-gateway`(门面服务) | 提供统一入口,转发请求到核心服务,并封装对外 API |
| `model-admin`(后台) | 模型安装、服务绑定、状态监控、服务管理 |
| `auth-center`(可选) | 提供租户、用户、权限、配额、访问日志等能力SaaS专属 |
------
### 📦 三、模型能力与服务设计
- **模型能力抽象(由 core 模块定义)**
- Chat对话
- Completion补全
- Embedding向量
- Vision图像识别
- Audio语音识别/合成)
- RAG知识库问答
- **能力服务层Ability Service**
- 聚合多个 provider 能力
- 实现会话记忆、内容预处理、后处理等上层逻辑
- 支持能力复合与流程编排
------
### 🔁 四、服务调用与调度策略
- 支持按以下维度调用模型服务:
- 🔹 单模型(指定模型 ID
- 🔹 多模型(自定义多个 ID 同时调用)
- 🔹 策略驱动本地优先、Web 优先、负载均衡、加权)
- **调度器 Dispatcher**:支持能力感知与服务自动选择
- **能力注册中心**:所有服务启动时自动注册能力和元信息
------
### 🔐 五、权限 / 日志 / 配额管理SaaS 专属)
- 用户、租户系统
- 模型服务调用日志与统计
- 按用户/模型设置调用频率限制和配额
- Key 管理与调用权限绑定(可对接 Auth 中心)
------
### 🌐 六、接入方式
- ✅ RESTful API 接口
- ✅ 支持封装 SDK供前端/业务系统调用
- 🧩 IDE 插件支持(可后续扩展)
- 🚪 管理后台支持模型一键安装、本地部署监控、状态查看等功能