上一篇                     
               
			  zstack添加物理机
- 物理机
- 2025-07-24
- 2967
 在ZStack中添加物理机需通过管理界面或API(如AddKVMHost)完成,配置IP、主机名及账号,需开启虚拟化,添加后纳入资源池统一管理
 
ZStack添加物理机全流程解析
前期准备工作
(1)硬件兼容性检查
需确保物理机满足ZStack的硬件要求,以下是关键指标:
| 组件 | 最低要求 | 备注 | 
|---|---|---|
| CPU | 双核以上(建议4核及以上) | 支持VT-x/AMD-V虚拟化 | 
| 内存 | 8GB(生产环境建议32GB+) | 实际负载决定 | 
| 存储 | 50GB可用空间(不含系统盘) | 推荐SSD加速 | 
| 网络接口 | 千兆网卡(建议双网卡冗余) | 支持PXE/ISO安装 | 
| IPMI | BMC管理模块(可选但推荐) | 用于远程带外管理 | 
(2)系统镜像准备
根据物理机用途选择合适镜像:
- 计算节点:CentOS 7.6+/Ubuntu 20.04+ 最小化安装
- 存储节点:需额外Raid驱动(如MegaRAID SAS 9361-8i驱动)
- 网络节点:集成Open vSwitch内核版本
(3)账户权限配置
需具备以下权限角色:
- Primary管理员(全局资源操作)
- NetworkAdmin(VLAN/IP范围配置)
- StorageAdmin(数据存储策略制定)
物理机注册流程
(1)登录管理门户
通过https://
 
(2)进入物理机管理模块
导航路径:资源 > 物理机 > 添加物理机
(3)基础信息配置
必填字段说明:
- 名称规范:建议采用地区-功能-序号格式(如BJ-COMPUTE-01)
- 集群选择:根据业务类型选择计算/存储/网络集群
- 主机类型: 
  - 计算型:承担虚拟机运行
- 存储型:提供块存储服务
- 混合型:需开启NUMA优化
 
(4)硬件参数配置
关键配置项:
- CPU拓扑:保持默认Socket/Cores分配
- 内存预留:建议保留总内存的10%给系统
- 电源管理: 
  - 支持IPMI时启用远程电源控制
- 设置ACPowerOn/Reset策略
 
(5)存储网络配置
典型配置示例:
| 存储类型 | 配置要点 | 
|---|---|
| 本地磁盘 | 创建/dev/vdb1作为Cinder卷(XFS文件系统) | 
| FC SAN | 配置多路径(alua模式) | 
| iSCSI | CHAP认证必须与存储端一致 | 
网络配置方案:

- 管理网:独立VLAN(建议1001-2000)
- 存储网:绑定Bond0(LACP模式)
- 迁移网:万兆网卡建议划分Trunk模式
操作系统安装
(1)安装方式选择
- PXE自动化安装:需配置TFTP服务器(172.26.8.10:69)
- ISO安装:上传镜像至/opt/zstack/iso目录
- Kickstart文件:指定/var/lib/zstack/ks/路径下的文件
(2)驱动注入配置
特殊场景处理:
- 华为鲲鹏架构:加载Hi1620网卡驱动
- 飞腾FT-2000+:添加Dhyana内核模块
- 超融合部署:集成Spice远程协议驱动
(3)初始化脚本
推荐执行命令:
# 关闭防火墙 systemctl disable firewalld # 配置YUM源 cat <<EOF > /etc/yum.repos.d/zstack.repo [zstack] name=ZStack Repository baseurl=http://$ZSTACK_REPO/centos7 enabled=1 gpgcheck=0 EOF # 安装必要组件 yum install -y zstack-control-node zstack-primary-storage
验证与调试
(1)状态检查
执行命令:
zstack-cli list physicalmachine
正常状态应为Connected,异常状态处理:
- Disconnected:检查IPMI网络/证书
- Error:查看- /var/log/zstack/cloud.log
(2)性能测试
使用工具栈:

- 计算性能:UnixBench跑分对比
- 网络吞吐:iperf3压测(10Gbps阈值)
- 存储IO:fio测试(随机读写≥5000IOPS)
(3)高可用配置
关键操作:
- 启用HA代理:zstack-ctl enable ha-agent
- 配置心跳网络:绑定Bonding1(优先级100)
- 设置故障转移策略:zstack-cli set vm haLevel high
常见问题解决方案
问题1:物理机添加后显示”Unresponsive”
可能原因:
- IPMI配置错误(BMC IP/用户名/密码不匹配)
- SSL证书未信任(需导入CA证书)
- 防火墙拦截(开放623/664端口)
解决步骤:
- 通过ipmitool -I lanplus -H <bmc_ip> chassis power status测试连接
- 在ZStack控制台重新上传BMC证书
- 检查管理网络ACL规则
问题2:存储网络延迟过高
优化方案:
- 启用RDMA传输:zstack-cli set host networkRoCE enabled
- 调整QoS策略: <qos> <max-bandwidth>10Gbps</max-bandwidth> <priority>high</priority> </qos> 
- 升级光模块:从SFP+改为QSFP28
维护与监控
日常巡检项 | 正常指标 | 检查频率 |
|——————|————————|———–|
| 系统负载 | ≤60% (top命令) | 每小时 |
| 内存使用率 | ≤80% | 实时监控 |
| 存储剩余空间 | ≥15%总量 | 每日 |
| 网络丢包率 | ≤0.1%(ping测试) | 每分钟 |
日志分析
关键日志路径:

- 系统日志:/var/log/messages
- ZStack日志:/var/log/zstack/
- IPMI日志:/var/log/ipmi/
异常代码对照表:
| 错误码 | 含义 | 处理方案 | 
|---|---|---|
| 0x1002 | 内存检测失败 | 执行memtest86+ | 
| 0x2005 | 存储链路中断 | 检查光纤跳线/重启iscsi服务 | 
| 0x300F | 虚拟化授权过期 | 更新KVM许可证文件 | 
固件升级流程
标准操作步骤:
- 备份当前配置:zstack-ctl backup config --output /root/backup.tar
- 下载厂商固件:从Dell/HP/超微官网获取
- 离线升级:通过Lifecycle Controller更新
- 兼容性验证:执行zstack-cli test hardware compatibility
FAQs
Q1:添加物理机时提示”Driver not found”如何解决?
A1:该错误通常由以下原因导致:
- 未正确挂载驱动ISO:需在控制台”驱动管理”页面上传对应架构的驱动包
- 内核版本不匹配:检查物理机操作系统内核是否与ZStack版本兼容
- 特殊硬件支持:如使用NVIDIA Mellanox网卡,需单独下载ofed驱动包
 解决方法:进入控制台→驱动管理→重新上传驱动→重启添加流程
Q2:如何安全移除已添加的物理机?
A2:完整移除流程如下:
- 卸载虚拟机:zstack-cli list vm | grep <physical_id> → zstack-cli destroy vm <vm_id>
- 解除资源绑定:取消与存储/网络资源的关联
- 标记下线:在物理机详情页点击”Set Offline”
- 彻底删除:确认无关联资源后执行删除操作
- 清除残留数据:手动删除/data/zstack/primary-storage/下的残留卷
(全文共计约1400字,因排版需要
 
  
			