AidGenSE RAG 服务部署指南
介绍
RAG (Retrieval-Augmented Generation,检索增强生成) 是一种结合了信息检索和文本生成的技术架构,广泛应用于问答系统、企业搜索、文档助手等生成式AI场景中。它的基本思想是在生成答案前先从外部知识源中检索相关信息,从而提升回答的准确性和可控性。
AidGenSE 内置了 RAG 相关组件,方便开发者快速部署自己的 RAG 应用。
支持情况
目前内置了两个 Demo 知识库
知识库名称 | 使用 Embedding Model |
---|---|
特斯拉使用手册 | BAII/bge-large-zh-v1.5 |
汽车维修手册 | BAII/bge-large-zh-v1.5 |
快速开始
安装
安装 AidGenSE 相关组件,请参考 AidGenSE 安装
安装 RAG 组件
bash
# 安装 RAG 服务
sudo aidllm install rag
查看可用向量知识库
bash
aidllm remote-list rag
示例输出:
pgsql
Name EmbeddingModel CreateTime
---- ---------------------------- --------------------
tesla BAII/bge-large-zh-v1.5 2025-04-14 09:59:43
mechanical BAII/bge-large-zh-v1.5 2025-04-14 09:59:43
下载指定知识库
bash
# 下载指定知识库
aidllm pull rag tesla
# 查看已下载的知识库
aidllm list rag
启动服务
bash
# 指定模型启动
aidllm start api -m <model_name>
# 启动指定知识库
aidllm start rag -n <rag_name>
对话测试
使用 Web UI 对话测试
bash
# 安装 UI 前端服务
sudo aidllm install ui
# 启动 UI 服务
aidllm start ui
# 查看 UI 服务状态
aidllm status ui
# 停止 UI 服务
aidllm stop ui
💡注意
UI 服务启动后访问 http://ip:51104
使用 Python 对话测试
python
创建自定义 RAG 知识库
一、准备工作
注册账号
访问 aidlux 官网,注册并登录一个 Aidlux 账号。登录 aidllm-cms
打开浏览器访问 https://aidllm.aidlux.com,使用你的 Aidlux 账号登录。
二、创建 RAG 知识库
进入知识库管理界面
登录后点击左侧“知识库”菜单,进入管理页面,点击“新建”。填写知识库信息
名称:仅支持英文字母和数字(如:
MyRAG2025
)。嵌入模型:选择当前已加载的 embedding 模型。
切片方法:可选
General
或Q&A
,具体说明如下:切片方法 支持格式 说明 General
文本(.txt / .pdf) 将连续文本按“分段标识符”分割,再按 Token 数量不超过“最大长度”合并为一块。 Q&A
.xlsx / .csv / .txt 用于问答格式:Excel 两列(无表头:问题 / 答案);CSV / TXT 使用 Tab 分隔,UTF-8 编码。
注意事项
- 创建的知识库默认仅对自己可见。
- 使用命令行工具时,仅可查看公开知识库及自己创建的私有知识库。
三、知识库服务启动
登录远程 cms
bashaidllm login
使用注册的 Aidlux 账号进行登录。
该操作仅用于执行远程知识库相关命令。查看知识库列表
bashaidllm remote-list rag Name EmbeddingModel CreateTime aidluxdocs BAAI/bge-large-zh-v1.5 2025-07-09 14:56:31 MyRAG2025 BAAI/bge-large-zh-v1.5 2025-07-21 16:08:14
拉取知识库
bashaidllm pull rag <知识库名称> aidllm pull rag MyRAG2025
启动 RAG 服务
bashaidllm start rag -n <rag_name> Use rag: MyRAG2025 Use model: bge-large-zh-v1.5 Rag server starting... Rag server starting... Rag server starting... Rag server starting... Rag server starting... Rag server starting... Rag server start successfully.
成功后本地将开启知识检索服务。