# 完全可以由运维团队主导落地企业AI智能体平台，不一定需要开发团队

以您目前的背景来看（30多年运维经验、熟悉Linux、Docker、数据库、中间件、服务器部署），**完全可以由运维团队主导落地企业AI智能体平台，不一定需要开发团队**。

不过要分阶段实施，否则容易投入几十万最后变成一个没人用的平台。

# 一、先回答核心问题

## 1. 仅靠运维人员能实现吗？

答案：

**80%能实现。**

以下场景基本不用开发：

<table id="bkmrk-%E6%99%BA%E8%83%BD%E4%BD%93-%E9%9A%BE%E5%BA%A6-%E8%BF%90%E7%BB%B4%E8%83%BD%E5%90%A6%E5%AE%8C%E6%88%90-%E5%86%99%E6%96%87%E7%AB%A0-%E2%98%85-"><thead><tr><th>智能体</th><th>难度</th><th>运维能否完成</th></tr></thead><tbody><tr><td>写文章</td><td>★</td><td>√</td></tr><tr><td>写方案</td><td>★</td><td>√</td></tr><tr><td>PPT生成</td><td>★★</td><td>√</td></tr><tr><td>图片生成</td><td>★★</td><td>√</td></tr><tr><td>视频生成</td><td>★★</td><td>√</td></tr><tr><td>文档总结</td><td>★</td><td>√</td></tr><tr><td>知识库问答</td><td>★★</td><td>√</td></tr><tr><td>运维助手</td><td>★★</td><td>√</td></tr><tr><td>SQL分析</td><td>★★</td><td>√</td></tr><tr><td>合同审查</td><td>★★★</td><td>√</td></tr><tr><td>OA流程审批</td><td>★★★★</td><td>需开发</td></tr><tr><td>ERP集成</td><td>★★★★</td><td>需开发</td></tr><tr><td>CRM集成</td><td>★★★★</td><td>需开发</td></tr></tbody></table>

所以：

### 第一阶段

完全不需要开发团队

直接用：

- 阿里云百炼Agent
- Dify
- FastGPT
- Coze
- MaxKB

即可。

---

# 二、推荐方案

如果公司规模：

### 100人以下

推荐：

## 方案A

阿里云百炼 + 企业知识库

架构：

```text
员工
  │
  ▼
阿里云百炼Agent
  │
  ├── 写文章Agent
  ├── 法务Agent
  ├── 运维Agent
  ├── HR Agent
  ├── PPT Agent
  └── 客服Agent

```

优点：

- 不用买GPU
- 不用训练模型
- 直接开通

1周内可上线

---

# 三、如果公司想做长期AI平台

我更推荐：

## 方案B

Dify + 阿里百炼API

架构：

```text
用户
 │
 ▼
Dify
 │
 ├── Qwen3
 ├── DeepSeek
 ├── Claude
 ├── GPT
 │
 └── 企业知识库

```

优点：

### 1

所有Agent统一管理

例如：

```text
AI写作助手

AI法务助手

AI运维助手

AI人事助手

AI销售助手

```

都在一个平台。

---

### 2

支持RAG知识库

上传：

```text
Word

PDF

Excel

制度文件

合同模板

运维手册

SOP文档

```

即可。

---

### 3

无需编程

拖拽式。

运维即可维护。

---

# 四、合同审查Agent怎么实现

这是很多企业最需要的。

例如上传：

```text
采购合同.pdf

```

Agent自动分析：

```text
付款条款

违约责任

风险点

知识产权

保密条款

争议解决

```

输出：

```text
高风险

中风险

低风险

```

实现方式：

```text
Dify
 +
Qwen-Max
 +
合同知识库

```

即可。

无需训练模型。

---

# 五、图片和视频Agent

## 图片

推荐：

- 通义万相
- Flux
- Midjourney

阿里云体系：

[通义万相官网](https://tongyi.aliyun.com/wanxiang?utm_source=chatgpt.com)

可实现：

```text
宣传海报

公众号配图

产品效果图

PPT插图

```

---

## 视频

推荐：

- 通义万相视频
- 即梦
- Kling

生成：

```text
宣传视频

培训视频

产品演示

```

---

# 六、是否需要自建服务器

我的建议：

## 第一阶段

不要自建GPU

直接云端API。

原因：

假设用Qwen3 235B：

```text
单机部署

至少：
4 × A800

或

4 × H20

```

硬件：

```text
50万~100万+

```

还不算：

```text
机房
电力
维护
升级

```

不划算。

---

## 第二阶段

如果员工大量使用

例如：

```text
200+
员工

每天：
5000+
问答

```

再考虑本地部署：

### 推荐

```text
DeepSeek-R1 70B

Qwen3 32B

Qwen3 72B

```

部署：

```text
Ubuntu 24.04
Docker
vLLM
Ollama
OpenWebUI

```

---

# 七、结合贵公司实际情况的推荐

从您的运维背景来看，我会采用：

```text
阶段1（1个月）

阿里云百炼
+
Dify
+
企业知识库

```

实现：

```text
运维助手
合同助手
写作助手
PPT助手
图片助手

```

---

```text
阶段2（3个月）

统一SSO登录
部门知识库
权限控制
审计日志

```

---

```text
阶段3（半年）

本地私有化部署

OpenWebUI
+
Dify
+
Qwen3
+
DeepSeek

```

形成公司AI平台。

---

# 推荐的最终架构

```text
             员工
               │
               ▼
          Dify门户
               │
 ┌─────────────┼─────────────┐
 │             │             │
 ▼             ▼             ▼

写作Agent   合同Agent   运维Agent

 │             │             │

 └─────────────┼─────────────┘
               │
               ▼

          阿里百炼API

               │

      Qwen3 / DeepSeek

               │

          企业知识库

```

对于大多数中小企业，这是投入最小、见效最快、后期又能平滑升级到私有化部署的方案。以您现有的运维团队能力，部署 Dify、OpenWebUI、向量数据库（如 [Milvus](https://milvus.io/?utm_source=chatgpt.com) 或 [Qdrant](https://qdrant.tech/?utm_source=chatgpt.com)）以及对接阿里云百炼，基本不需要专职开发人员即可完成。

如果您计划在公司内部搭建私有AI平台，采用：

```text
Ubuntu 24.04
Docker
vLLM
Ollama
OpenWebUI

```

这是目前企业私有化部署中比较成熟且维护成本较低的方案。

# 一、整体架构

建议采用如下架构：

```text
                     用户浏览器
                           │
                           ▼
                     OpenWebUI
                           │
          ┌────────────────┴──────────────┐
          │                               │
          ▼                               ▼
      Ollama                        vLLM Server
    （小模型）                     （大模型）
          │                               │
          ▼                               ▼
      Qwen3:8B                     Qwen3:32B
      Qwen3:14B                    DeepSeek-R1
      Gemma3                       Llama3

```

用途：

<table id="bkmrk-%E6%9C%8D%E5%8A%A1-%E4%BD%9C%E7%94%A8-openwebui-chat"><thead><tr><th>服务</th><th>作用</th></tr></thead><tbody><tr><td>OpenWebUI</td><td>ChatGPT风格界面</td></tr><tr><td>Ollama</td><td>管理小模型</td></tr><tr><td>vLLM</td><td>高性能推理</td></tr><tr><td>Docker</td><td>容器化</td></tr><tr><td>Nginx</td><td>反向代理</td></tr><tr><td>PostgreSQL</td><td>数据库</td></tr><tr><td>Redis</td><td>缓存</td></tr></tbody></table>

---

# 二、硬件建议

## 最低配置

测试环境

```text
CPU：
32 Core

内存：
128GB

GPU：
RTX4090 24GB

系统盘：
1TB NVMe

```

可运行：

```text
Qwen3:8B
Qwen3:14B
DeepSeek-R1:8B

```

---

## 推荐配置

企业环境

```text
CPU：
64 Core

内存：
256GB

GPU：
2 × RTX4090

```

可运行：

```text
Qwen3 32B
DeepSeek-R1 32B

```

---

# 三、安装 Docker

更新系统

```bash
apt update
apt upgrade -y

```

安装基础组件

```bash
apt install -y \
curl \
wget \
git \
vim \
unzip

```

安装Docker

```bash
curl -fsSL https://get.docker.com | bash

```

验证

```bash
docker version

```

加入docker组

```bash
usermod -aG docker $USER

```

重新登录。

---

# 四、安装 NVIDIA 驱动

查看显卡

```bash
lspci | grep NVIDIA

```

安装驱动

```bash
ubuntu-drivers autoinstall

```

重启

```bash
reboot

```

检查

```bash
nvidia-smi

```

应看到类似：

```text
Driver Version: 575.xx
CUDA Version: 12.x

```

---

# 五、安装 NVIDIA Container Toolkit

添加仓库

```bash
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey \
| gpg --dearmor \
-o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg

```

安装

```bash
apt install -y nvidia-container-toolkit

```

配置

```bash
nvidia-ctk runtime configure --runtime=docker

```

重启docker

```bash
systemctl restart docker

```

测试

```bash
docker run --rm \
--gpus all \
nvidia/cuda:12.4.1-runtime-ubuntu22.04 \
nvidia-smi

```

---

# 六、安装 Ollama

官方安装

```bash
curl -fsSL https://ollama.com/install.sh | sh

```

查看

```bash
systemctl status ollama

```

开放监听

编辑：

```bash
/etc/systemd/system/ollama.service

```

修改：

```ini
Environment="OLLAMA_HOST=0.0.0.0:11434"

```

重载

```bash
systemctl daemon-reload

systemctl restart ollama

```

验证

```bash
ss -lntp | grep 11434

```

---

# 七、下载模型

例如：

```bash
ollama pull qwen3:8b

```

或

```bash
ollama pull deepseek-r1:8b

```

查看

```bash
ollama list

```

运行

```bash
ollama run qwen3:8b

```

---

# 八、部署 vLLM

推荐Docker方式。

创建目录

```bash
mkdir -p /data/vllm

```

启动

```bash
docker run -d \
--name vllm \
--gpus all \
-p 8000:8000 \
-v /data/models:/models \
vllm/vllm-openai:latest \
--model /models/Qwen3-32B

```

验证

```bash
curl http://127.0.0.1:8000/v1/models

```

返回：

```json
{
  "data":[]
}

```

表示正常。

---

# 九、部署 OpenWebUI

创建目录

```bash
mkdir -p /data/openwebui

```

启动

```bash
docker run -d \
--name open-webui \
--restart always \
-p 3000:8080 \
-v open-webui:/app/backend/data \
-e OLLAMA_BASE_URL=http://IP地址:11434 \
ghcr.io/open-webui/open-webui:main

```

查看

```bash
docker ps

```

访问

```text
http://服务器IP:3000

```

首次访问创建管理员账号。

---

# 十、连接 vLLM

OpenWebUI后台：

```text
Admin Settings
↓
Connections
↓
OpenAI API

```

填写：

```text
URL:
http://服务器IP:8000/v1

API KEY:
EMPTY

```

保存。

---

# 十一、配置 HTTPS

安装 Nginx

```bash
apt install nginx -y

```

配置

```nginx
server {

    listen 443 ssl;
    server_name ai.company.com;

    location / {

        proxy_pass http://127.0.0.1:3000;

        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;

    }

}

```

重载

```bash
nginx -t

systemctl reload nginx

```

---

# 十二、企业生产环境建议

结合您的运维经验，建议直接使用 Docker Compose 管理。

目录结构：

```text
/data/ai-platform

├── openwebui
├── ollama
├── vllm
├── postgres
├── redis
├── nginx
└── backup

```

推荐增加：

```text
PostgreSQL
Redis
MinIO
OpenWebUI
Ollama
vLLM
Nginx

```

形成完整平台：

```text
OpenWebUI
    │
    ├── Ollama
    │      ├── Qwen3 8B
    │      └── DeepSeek 8B
    │
    └── vLLM
           ├── Qwen3 32B
           ├── Qwen3 72B
           └── DeepSeek-R1

```

对于您公司这种已有 Ubuntu、Docker、Tomcat、MySQL 运维经验的团队，预计 **2~3天即可完成基础平台搭建，1~2周可完成企业知识库和多智能体接入**。后续再增加 Dify 或 MaxKB，即可实现“运维助手、合同助手、知识库助手、写作助手、图片助手”等企业级智能体。