Skip to content

AidGenSE RAG 服务部署指南

介绍

RAG (Retrieval-Augmented Generation,检索增强生成) 是一种结合了信息检索和文本生成的技术架构,广泛应用于问答系统、企业搜索、文档助手等生成式AI场景中。它的基本思想是在生成答案前先从外部知识源中检索相关信息,从而提升回答的准确性和可控性。

AidGenSE 内置了 RAG 相关组件,方便开发者快速部署自己的 RAG 应用。

支持情况

目前内置了两个 Demo 知识库

知识库名称使用 Embedding Model
特斯拉使用手册BAII/bge-large-zh-v1.5
汽车维修手册BAII/bge-large-zh-v1.5

快速开始

安装

  1. 安装 AidGenSE 相关组件,请参考 AidGenSE 安装

  2. 安装 RAG 组件

bash
# 安装 RAG 服务
sudo aidllm install rag

查看可用向量知识库

bash
aidllm remote-list rag

示例输出:

pgsql
Name        EmbeddingModel                CreateTime
----        ----------------------------  --------------------
tesla       BAII/bge-large-zh-v1.5        2025-04-14 09:59:43
mechanical  BAII/bge-large-zh-v1.5        2025-04-14 09:59:43

下载指定知识库

bash
# 下载指定知识库
aidllm pull rag tesla

# 查看已下载的知识库
aidllm list rag

启动服务

bash
# 指定模型启动
aidllm start api -m <model_name>

# 启动指定知识库
aidllm start rag -n <rag_name>

对话测试

使用 Web UI 对话测试

bash
# 安装 UI 前端服务
sudo aidllm install ui

# 启动 UI 服务
aidllm start ui

# 查看 UI 服务状态
aidllm status ui

# 停止 UI 服务
aidllm stop ui

💡注意

UI 服务启动后访问 http://ip:51104

使用 Python 对话测试

python

创建自定义 RAG 知识库

一、准备工作

  1. 注册账号
    访问 aidlux 官网,注册并登录一个 Aidlux 账号

  2. 登录 aidllm-cms
    打开浏览器访问 https://aidllm.aidlux.com,使用你的 Aidlux 账号登录。

二、创建 RAG 知识库

  1. 进入知识库管理界面
    登录后点击左侧“知识库”菜单,进入管理页面,点击“新建”。

    image-20250721160511340

  2. 填写知识库信息

    image-20250721160741842

    • 名称:仅支持英文字母和数字(如:MyRAG2025)。

    • 嵌入模型:选择当前已加载的 embedding 模型。

    • 切片方法:可选 GeneralQ&A,具体说明如下:

      切片方法支持格式说明
      General文本(.txt / .pdf)将连续文本按“分段标识符”分割,再按 Token 数量不超过“最大长度”合并为一块。
      Q&A.xlsx / .csv / .txt用于问答格式:Excel 两列(无表头:问题 / 答案);CSV / TXT 使用 Tab 分隔,UTF-8 编码。
  3. 注意事项

    • 创建的知识库默认仅对自己可见。
    • 使用命令行工具时,仅可查看公开知识库及自己创建的私有知识库。

三、知识库服务启动

  1. 登录远程 cms

    bash
    aidllm login

    使用注册的 Aidlux 账号进行登录。
    该操作仅用于执行远程知识库相关命令。

  2. 查看知识库列表

    bash
    aidllm remote-list rag
    
    Name                           EmbeddingModel                 CreateTime     
    aidluxdocs                     BAAI/bge-large-zh-v1.5         2025-07-09 14:56:31
    MyRAG2025                      BAAI/bge-large-zh-v1.5         2025-07-21 16:08:14
  3. 拉取知识库

    bash
    aidllm pull rag <知识库名>
    aidllm pull rag MyRAG2025
  4. 启动 RAG 服务

    bash
    aidllm start rag -n <rag_name>
    
    Use rag:  MyRAG2025
    Use model:  bge-large-zh-v1.5
    Rag server starting...
    Rag server starting...
    Rag server starting...
    Rag server starting...
    Rag server starting...
    Rag server starting...
    Rag server start successfully.

    成功后本地将开启知识检索服务。