上一篇
h3c负载均衡如何调试
- 行业动态
- 2025-05-13
- 9
检查配置参数,启用健康检查,通过命令行或Web界面查看设备状态及日志,确认后端服务器连通性
H3C负载均衡调试全流程解析
基础环境检查与配置验证
检查项 | 操作步骤 | 预期结果 |
---|---|---|
物理连接检查 | 确认负载均衡器与服务器/交换机的网线连接正常 使用 display interface 查看接口状态 | 接口状态为”UP”,无链路断开或错包告警 |
路由配置验证 | 执行display ip routing-table 检查默认路由与回包路由是否可达 | 目标服务器网段路由条目存在且下一跳正确 |
系统时间同步 | 通过ntp client 配置时间服务器使用 display time 确认时间同步状态 | 所有设备时间偏差小于1分钟 |
许可证有效性 | 执行display license 查看授权信息 | 显示”永久授权”或”授权有效” |
负载均衡策略配置验证
虚拟服务器配置检查
- 执行
display lb virtual-server
查看VS配置 - 重点核对:
- 监听IP与端口(如VIP:10.1.1.100:80)
- 调度算法(轮询/加权轮询/最小连接数)
- 健康检查模板绑定情况
- 执行
真实服务器状态确认
- 使用
display lb real-server
查看RS状态 - 关键参数:
RS状态 = Enable/Disable(需全部启用) 权重值 = 数值型(0-100,0表示禁用) 延迟上线 = 关闭(避免新加服务器延迟生效)
- 使用
会话表实时监控
display lb session
查看当前会话分布- 正常情况应满足:
- 会话数随访问量动态变化
- 各RS负载比例符合权重设置
- 无长期静止的老化会话
健康检查深度调试
检测类型 | 核心参数 | 调试方法 |
---|---|---|
TCP探测 | 间隔时间/超时时间/重试次数 | 使用ping 测试基础连通性capture packet 抓取SYN报文调整超时时间为服务器响应时间的1.5倍 |
HTTP探测 | URL路径/期望状态码/Header匹配 | 浏览器直接访问检测URL 检查防火墙是否拦截GET请求 启用 debug lb health-check 查看详细日志 |
SSL探测 | 证书验证/加密套件 | 开放服务器443端口 使用 openssl s_client 测试证书关闭负载均衡器的证书严格验证(仅测试阶段) |
典型问题处理:
- 健康检查始终失败:
- 检查RS的ACL规则是否允许负载均衡器网段
- 对比服务器日志与健康检查参数(如HTTP路径是否匹配)
- 捕获报文分析协议兼容性(如HTTP/1.1 vs HTTP/2)
会话保持策略验证
源IP绑定测试
- 配置命令示例:
lb policy source-ip sticky source-ip sticky enable
- 验证方法:
- 固定客户端IP连续发送请求
- 检查
display lb session
中的RS分配记录
- 配置命令示例:
Cookie插入验证
- 配置要求:
lb cookie insert enable lb cookie persistence enable
- 测试步骤:
- 清除浏览器缓存后首次访问
- 获取Set-Cookie头信息
- 再次请求携带Cookie验证会话连续性
- 配置要求:
URL参数保持
- 特殊场景配置:
lb policy url-parameter sticky url-key userid
- 验证方式:
- 构造带唯一参数的请求(如userid=123)
- 观察后续请求是否定向到同一RS
- 特殊场景配置:
性能优化关键指标
优化维度 | 监测命令 | 调优建议 |
---|---|---|
并发连接数 | display lb statistic | 根据业务峰值调整最大连接数(建议预留20%余量) |
新建连接速率 | display lb new-session-rate | 启用连接池复用,调整TCP队列长度 |
SSL卸载性能 | display lb ssl statistic | 开启硬件加速卡,限制单RS最大SSL连接数 |
流量分发均衡度 | display lb throughput | 检查权重配置,排除RS性能差异过大的情况 |
故障排查矩阵表
故障现象 | 可能原因 | 解决步骤 |
---|---|---|
所有请求都指向同一RS | 其他RS健康检查失败/权重设置为0 | 强制启用所有RS 临时修改权重为相同值测试 检查RS业务端口 |
VIP无法访问 | 监听端口未开放/ACL拦截 | display firewall 查看过滤规则telnet VIP 端口 测试连通性 |
间歇性连接中断 | 会话表溢出/心跳链路不稳定 | 增大会话表容量lb parameter session-table-size 检查物理链路质量 |
健康检查日志频繁出现超时 | RS响应缓慢/网络抖动 | 延长健康检查超时时间 部署探针服务器靠近负载均衡器 |
FAQs:
Q1:健康检查显示服务器正常,但业务访问仍然异常怎么办?
- 可能原因:
- RS业务进程未监听正确端口(如监听在127.0.0.1)
- 存在中间设备(如FW/IDS)拦截业务流量
- SSL证书不匹配导致客户端连接被重置
- 处理流程:
- 在RS侧执行
netstat -an
确认监听地址 - 负载均衡器开启报文捕获
capture packet interface
- 对比客户端与RS的SSL握手日志
- 在RS侧执行
Q2:开启源IP会话保持后,部分用户仍然出现负载漂移?
- 根因分析:
- 客户端使用NAT导致源IP变化
- 存在多出口网络环境(如CDN节点)
- Cookie过期或被清理
- 解决方案:
- 改用Cookie+源IP双绑定策略
- 对NAT后地址段单独配置静态绑定表
- 调整Cookie持久化时间至业务会话