ubuntu24.04 部署 ragflow + 阿里百炼大模型 + docker ,系统使用阿里源,采用纯cpu 无gpu方案 详细的部署方法2
可以,而且这是目前企业知识库比较推荐的一种方案。
你的环境(根据之前的聊天记录):
-
Ubuntu 24.04 LTS
-
Docker / Docker Compose
-
纯 CPU(无 GPU)
-
希望使用阿里云百炼(DashScope)作为大模型
-
公司内部知识库
-
后续可能接入 OpenWebUI、Agent、企业智能体
这种情况下不建议部署 Ollama/vLLM,因为你已经使用阿里百炼,大模型推理全部走云端 API,本地服务器仅负责:
-
RAGFlow
-
Elasticsearch
-
MySQL
-
MinIO
-
Redis
-
文档解析
-
向量检索
CPU 即可,8C16G 起步即可运行,小型企业推荐 16C32G。RAGFlow 官方支持通过 Docker Compose 部署,并可配置外部模型服务。(ragflow.com.cn)
一、整体架构
用户浏览器
│
http://IP:9380
│
┌────────────┐
│ RAGFlow UI │
└─────┬──────┘
│
┌───────────────┼──────────────┐
│ │ │
▼ ▼ ▼
Elasticsearch MySQL Redis
│
▼
MinIO(文件)
│
▼
阿里百炼 API
(Qwen3 / Qwen-Max /
Embedding)
整个推理流程:
上传PDF
↓
RAGFlow解析
↓
Embedding(调用百炼)
↓
ES存向量
↓
提问
↓
检索ES
↓
把上下文发送给百炼
↓
返回答案
二、服务器配置建议
最低配置:
CPU:8 Core
内存:16GB
SSD:100GB
Ubuntu24.04
推荐:
CPU:16 Core
RAM:32GB
SSD:500GB NVMe
因为:
-
OCR
-
PDF解析
-
Elasticsearch
都比较吃CPU。
三、更换Ubuntu阿里源
先备份:
sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak
Ubuntu24.04:
sudo tee /etc/apt/sources.list >/dev/null <<EOF
deb https://mirrors.aliyun.com/ubuntu/ noble main restricted universe multiverse
deb https://mirrors.aliyun.com/ubuntu/ noble-updates main restricted universe multiverse
deb https://mirrors.aliyun.com/ubuntu/ noble-backports main restricted universe multiverse
deb http://security.ubuntu.com/ubuntu noble-security main restricted universe multiverse
EOF
更新:
sudo apt update
sudo apt upgrade -y
四、安装Docker
sudo apt install \
docker.io \
docker-compose-v2 \
git \
curl \
wget \
unzip \
vim \
htop \
net-tools \
jq \
-y
启动:
sudo systemctl enable docker
sudo systemctl start docker
检查:
docker version
五、优化Docker镜像源
编辑:
sudo mkdir -p /etc/docker
sudo vim /etc/docker/daemon.json
例如:
{
"registry-mirrors": [
"https://docker.m.daocloud.io",
"https://dockerproxy.com"
]
}
然后:
sudo systemctl restart docker
六、下载RAGFlow
cd /opt
git clone https://github.com/infiniflow/ragflow.git
进入:
cd ragflow/docker
官方提供 Docker Compose 和配置模板,可通过 .env、docker-compose.yml、service_conf.yaml.template 调整端口及服务配置。(ragflow.com.cn)
七、修改.env
例如:
vim .env
建议:
RAGFLOW_IMAGE=infiniflow/ragflow:latest
SVR_HTTP_PORT=9380
MYSQL_PASSWORD=ragflow123
MINIO_PASSWORD=ragflow123
REDIS_PASSWORD=ragflow123
#如果无法pull启用下行
RAGFLOW_IMAGE=swr.cn-north-4.myhuaweicloud.com/infiniflow/ragflow:v0.26.1
CPU模式:
不用配置
CUDA
GPU
NVIDIA
全部保持默认。
八、启动
docker compose up -d
第一次需要下载:
ragflow
mysql
redis
minio
elasticsearch
# 逐个拉取,无并发,不会触发请求超限
docker compose pull redis
docker compose pull es01
docker compose pull minio
docker compose pull mysql
docker compose pull ragflow-cpu
约4~6GB。
查看:
docker ps
正常会看到:
ragflow-server
mysql
redis
minio
es01
九、访问
浏览器:
http://服务器IP:9380
首次:
admin
password
(实际以当前镜像默认账号为准,如官方镜像更新请参考发布说明。)
十、申请阿里百炼API
登录阿里云百炼:
https://bailian.console.aliyun.com
创建:
API Key
得到:
sk-xxxxxxxx
十一、RAGFlow配置百炼
后台:
Model Providers
↓
OpenAI Compatible
百炼兼容 OpenAI API,可在 RAGFlow 中配置兼容接口。
填写:
Base URL
https://dashscope.aliyuncs.com/compatible-mode/v1
API Key
sk-xxxxxxxx
Chat Model 可选择:
qwen-max
或者
qwen-plus
或者
qwen3
Embedding 推荐:
text-embedding-v4
或者官方当前推荐Embedding模型
十二、测试
创建:
Knowledge Base
上传:
PDF
Word
Excel
TXT
等待:
Parsing...
Embedding...
Completed
然后:
Chat
提问:
公司的请假制度是什么?
流程:
ES
↓
召回TopK
↓
发送百炼
↓
回答
十三、CPU部署建议
建议:
Document Parser
4线程
Worker:
2
不要:
16线程
32线程
否则 ES 会占满 CPU。
十四、生产环境建议
建议将数据目录映射到宿主机:
/data/ragflow/
├── mysql
├── redis
├── minio
├── elasticsearch
├── logs
└── ragflow
这样容器升级时数据不会丢失。
建议每天备份:
MySQL
MinIO
ES Snapshot
十五、针对你的企业场景的推荐架构
结合你之前提到的目标(企业 AI 平台、多个专业智能体、Ubuntu + Docker、自建运维),我更建议采用下面这套统一架构:
Ubuntu24.04
│
├── Docker
│
├── RAGFlow(企业知识库)
│
├── Open WebUI(统一聊天入口)
│
├── Nginx(反向代理)
│
├── Redis
│
├── Elasticsearch
│
├── MySQL
│
├── MinIO
│
└── 阿里百炼
├── Qwen3
├── Qwen-Max
└── Embedding
这种方案的优点是:
-
服务器无需 GPU,降低硬件成本。
-
所有模型能力由阿里百炼提供,无需维护本地模型。
-
后续可以继续接入 Open WebUI、MCP、Agent、企业微信/钉钉 等组件,形成统一的企业 AI 平台,而无需更换底层架构。
No Comments