Skip to main content

ubuntu24.04 部署 ragflow + 阿里百炼大模型 + docker ,系统使用阿里源,采用纯cpu 无gpu方案 详细的部署方法2

可以,而且这是目前企业知识库比较推荐的一种方案

你的环境(根据之前的聊天记录):

  • Ubuntu 24.04 LTS

  • Docker / Docker Compose

  • 纯 CPU(无 GPU)

  • 希望使用阿里云百炼(DashScope)作为大模型

  • 公司内部知识库

  • 后续可能接入 OpenWebUI、Agent、企业智能体

这种情况下不建议部署 Ollama/vLLM,因为你已经使用阿里百炼,大模型推理全部走云端 API,本地服务器仅负责:

  • RAGFlow

  • Elasticsearch

  • MySQL

  • MinIO

  • Redis

  • 文档解析

  • 向量检索

CPU 即可,8C16G 起步即可运行,小型企业推荐 16C32G。RAGFlow 官方支持通过 Docker Compose 部署,并可配置外部模型服务。(ragflow.com.cn)


一、整体架构

                用户浏览器
                      │
                http://IP:9380
                      │
                ┌────────────┐
                │ RAGFlow UI │
                └─────┬──────┘
                      │
      ┌───────────────┼──────────────┐
      │               │              │
      ▼               ▼              ▼
 Elasticsearch      MySQL         Redis
      │
      ▼
   MinIO(文件)

      │
      ▼

阿里百炼 API
(Qwen3 / Qwen-Max /
Embedding)

整个推理流程:

上传PDF
↓

RAGFlow解析

↓

Embedding(调用百炼)

↓

ES存向量

↓

提问

↓

检索ES

↓

把上下文发送给百炼

↓

返回答案

二、服务器配置建议

最低配置:

CPU:8 Core
内存:16GB
SSD:100GB
Ubuntu24.04

推荐:

CPU:16 Core
RAM:32GB
SSD:500GB NVMe

因为:

  • OCR

  • PDF解析

  • Elasticsearch

都比较吃CPU。


三、更换Ubuntu阿里源

先备份:

sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak

Ubuntu24.04:

sudo tee /etc/apt/sources.list >/dev/null <<EOF
deb https://mirrors.aliyun.com/ubuntu/ noble main restricted universe multiverse
deb https://mirrors.aliyun.com/ubuntu/ noble-updates main restricted universe multiverse
deb https://mirrors.aliyun.com/ubuntu/ noble-backports main restricted universe multiverse
deb http://security.ubuntu.com/ubuntu noble-security main restricted universe multiverse
EOF

更新:

sudo apt update
sudo apt upgrade -y

四、安装Docker

sudo apt install \
docker.io \
docker-compose-v2 \
git \
curl \
wget \
unzip \
vim \
htop \
net-tools \
jq \
-y

启动:

sudo systemctl enable docker

sudo systemctl start docker

检查:

docker version

五、优化Docker镜像源

编辑:

sudo mkdir -p /etc/docker
sudo vim /etc/docker/daemon.json

例如:

{
  "registry-mirrors": [
    "https://docker.m.daocloud.io",
    "https://dockerproxy.com"
  ]
}

然后:

sudo systemctl restart docker

六、下载RAGFlow

cd /opt

git clone https://github.com/infiniflow/ragflow.git

进入:

cd ragflow/docker

官方提供 Docker Compose 和配置模板,可通过 .envdocker-compose.ymlservice_conf.yaml.template 调整端口及服务配置。(ragflow.com.cn)


七、修改.env

例如:

vim .env

建议:

RAGFLOW_IMAGE=infiniflow/ragflow:latest

SVR_HTTP_PORT=9380

MYSQL_PASSWORD=ragflow123

MINIO_PASSWORD=ragflow123

REDIS_PASSWORD=ragflow123

CPU模式:

不用配置

CUDA

GPU

NVIDIA

全部保持默认。


八、启动

docker compose up -d

第一次需要下载:

ragflow

mysql

redis

minio

elasticsearch

约4~6GB。

查看:

docker ps

正常会看到:

ragflow-server

mysql

redis

minio

es01

九、访问

浏览器:

http://服务器IP:9380

首次:

admin

password

(实际以当前镜像默认账号为准,如官方镜像更新请参考发布说明。)


十、申请阿里百炼API

登录阿里云百炼:

https://bailian.console.aliyun.com

创建:

API Key

得到:

sk-xxxxxxxx

十一、RAGFlow配置百炼

后台:

Model Providers

↓

OpenAI Compatible

百炼兼容 OpenAI API,可在 RAGFlow 中配置兼容接口。

填写:

Base URL

https://dashscope.aliyuncs.com/compatible-mode/v1

API Key

sk-xxxxxxxx

Chat Model 可选择:

qwen-max

或者

qwen-plus

或者

qwen3

Embedding 推荐:

text-embedding-v4

或者官方当前推荐Embedding模型

十二、测试

创建:

Knowledge Base

上传:

PDF

Word

Excel

TXT

等待:

Parsing...

Embedding...

Completed

然后:

Chat

提问:

公司的请假制度是什么?

流程:

ES

↓

召回TopK

↓

发送百炼

↓

回答

十三、CPU部署建议

建议:

Document Parser

4线程

Worker:

2

不要:

16线程

32线程

否则 ES 会占满 CPU。


十四、生产环境建议

建议将数据目录映射到宿主机:

/data/ragflow/

├── mysql
├── redis
├── minio
├── elasticsearch
├── logs
└── ragflow

这样容器升级时数据不会丢失。

建议每天备份:

MySQL

MinIO

ES Snapshot

十五、针对你的企业场景的推荐架构

结合你之前提到的目标(企业 AI 平台、多个专业智能体、Ubuntu + Docker、自建运维),我更建议采用下面这套统一架构:

Ubuntu24.04
│
├── Docker
│
├── RAGFlow(企业知识库)
│
├── Open WebUI(统一聊天入口)
│
├── Nginx(反向代理)
│
├── Redis
│
├── Elasticsearch
│
├── MySQL
│
├── MinIO
│
└── 阿里百炼
      ├── Qwen3
      ├── Qwen-Max
      └── Embedding

这种方案的优点是:

  • 服务器无需 GPU,降低硬件成本。

  • 所有模型能力由阿里百炼提供,无需维护本地模型。

  • 后续可以继续接入 Open WebUI、MCP、Agent、企业微信/钉钉 等组件,形成统一的企业 AI 平台,而无需更换底层架构。