Skip to main content

nat会话数60万对hyper-v服务器及路由器进行的优化操作

# 问题根因总结
NAT **NAT在前端两台路由器做端口映射 NAT,单台路由器硬件 NAT 上NAT上 40 万40万会话;晚高峰总 NAT≈60 万60万,两台负载不均,其中一台路由器 NAT 会NAT会话触达 40 万40万硬件上限,新连接被丢弃、存量连接老化断开,造成外网上传大量丢连接。
60** > 60万总会话>单台 40 万40万阈值,负载不均衡时单路由打满上限,就是断连元凶,Hyper-V 侧V侧是流量承载端,次要优化。
 ## 一、路由器侧核心整改(优先做,根治瓶颈)
 ### 1. 两台路由器做 NAT 负NAT负载分担(必做)
 当前 60 万 NAT 会60万NAT会话,**两台路由均分:每台 30 万30万40 万40万单台上限**,彻底避开硬件 NAT 阈NAT阈值。
 1. 组网现状:路由器做端口映射(目的 NAT DNAT)+ 外网源 IP SNAT,两台上联汇聚到锐捷交换机,下联 Hyper-V 宿V宿主机。
 2. 负载分担方案二选一:
 #### 方案 A:基于源 IP 哈IP哈希分流(最省事,现有拓扑不改)
 前端两台路由做**等价路由 ECMP,ECMP**,外网回包、入方向上传流量根据外网源 IP 哈IP哈希,自动分摊 DNAT/NAT 会NAT会话到两台路由器。
 - 交换机配置两条等价默认路由指向两台路由器,实现入向流量负载均衡;
 - 效果:60 万60万会话自动打散,单路由承载 30W 左30W左右,低于 40W 硬40W硬件上限。
 #### 方案 B:端口段拆分 DNAT 映DNAT映射(固定分流)
 把外网端口段拆分:
 - 路由器 A:映射外网端口段 1~30000 → Hyper-V 内V内网业务
 - 路由器 B:映射外网端口段 30001~65535 → Hyper-V 内V内网业务
 流量天然按端口分到两台路由,会话天然均分。
 ### 2. 路由器 NAT 老NAT老化优化(快速回收空闲会话,临时应急)
 两台路由器统一缩短空闲 NAT 老NAT老化时间,快速释放僵尸空会话,腾出硬件表项:
 ```ios
 # 通用路由器命令参考(华为/锐捷/华三通用逻辑)
 ip nat translation timeout 300 # TCP空闲5分钟老化
 ip nat translation udp-timeout 60 # UDP空闲1分钟老化
 ``` 作用:避免无效连接长期占用 NAT 表NAT表,防止会话堆积快速碰 40W 上40W上限。
 ### 3. 路由器 NAT 超NAT超限保护配置
 开启路由器 NAT 超NAT超限丢弃新连接保护,满 40W 后40W后不再疯狂挤占存量会话:
 ```ios
 # 限制单设备NAT最大会话,防止单个恶意IP占满表项
 ip nat limit per-host 8000
 # 整机NAT告警阈值设35万,提前预警
 ``` ## 二、Windows Hyper-V 宿V宿主机配套优化(解决内网侧次生瓶颈,你之前网卡 + 端口问题)
 ### 1. TCP 动TCP动态端口扩容(已查到默认仅 16384 源16384源端口,必须扩容)
 管理员 CMD 执CMD执行,把 TCP 临TCP临时端口从 1.6W 扩6W扩容至 6.4W,内网虚拟机大量出站不缺端口:
 ```cmd
 netsh int ip set dynamicport tcp start=1025 num=64511
 netsh int ip show dynamicport tcp
 ``` ### 2. Intel 82599 万82599万兆网卡高级参数固定配置(Hyper-V 高V高并发最优)
表格
 | 参数 | 配置值 | 作用
 | | ---- | ---- | ---- | | Receive Side Scaling(RSS) | Enabled | 开启多队列中断分流
 | | RSS load balancing profile NUMAScalingStatic| NUMA**NUMAScalingStatic** | NUMA静态均分 RSS 队RSS队列,多核均衡,杜绝单核满载丢包
 | | Virtual Machine Queues(VMQ) | Enabled | Hyper-V 虚V虚拟机队列,vSwitch 转vSwitch转发硬件分流,海量虚拟机互访不堵
 | | RX/TX Receive/Transmit Buffers | 拉到最大值 | 加大网卡硬件缓存,突发上传报文不溢出丢弃
 | | TCP/UDP Checksum Offload | 全部Enabled Enabled| 校验卸载下放网卡,节省宿主机CPU CPU
| > 改完网卡参数后,Hyper-V 虚V虚拟交换机属性勾选**启用虚拟机队列(VMQ)**,和网卡硬件配置联动。
 ### 3. Windows 系Windows系统连接跟踪优化(RRAS / RRAS/防火墙conntrack) conntrack)
注册表路径:`HKLM\SYSTEM\CurrentControlSet\Services\SharedAccess\Parameters\FirewallPolicy
FirewallPolicy` 新建 DWORD:MaxNATEntries,`MaxNATEntries`,十进制 =**2000000(200 万200万**,放开 Windows 系Windows系统连接跟踪上限;
PowerShell PowerShell执行:
 ```powershell
 Set-NetNatGlobal -ConcurrentConnectionCountThreshold 2000000
 ``` ## 三、临时应急 & 验证步骤
 1. **应急:先改路由器 NAT 老NAT老化时间**,当晚高峰立刻减少存量会话堆积;
 2. **短期:交换机配置 ECMP 等ECMP等价路由实现 NAT 两NAT两台均分**,60W→每台 30W<40W 硬40W硬件上限,彻底解决超限断连;
 3. **长期:Hyper-V 主V主机优化端口 + 网卡 RSS + RSS+注册表 NAT 上NAT上**,消除内网侧次生瓶颈。
 ## 补充关键说明
 1. 断连**主瓶颈在前端路由器单台 NAT 硬NAT硬 40 万40万上限、负载不均**,Windows Hyper-V 是V是次要瓶颈;
 2. 外网上传流量是DNAT 目**DNAT目的地址转换**,会话全部占用前端路由器 NAT 表NAT表,和后端交换机、宿主机 NAT 无NAT无关;
 3. 若两台路由现在负载差距极大(一台 38W、一台 22W),就是路由引流不均,ECMP 分ECMP分流是最优解。