我们正在使用 SAN 进行数据存储。我最近使用 EMC PowerPath 软件和在 CentOS 上运行的 Navisphere Agent 将 SAN 连接到 CentOS 5.3 服务器。但是我现在已经收到了最终的生产服务器,需要重新设置。让 PowerPath 工作是一个大问题,我正在尝试确定最佳的行动方案。
- 我应该使用 CentOS 上已有的内置多路径吗?
- 如果我这样做可能行不通?
- 设置多路径是否比设置 PowerPath 更难?
笔记
- 服务器需要在引导时将 SAN 挂载为 LVM 卷
- 服务器启动它自己的内部驱动器,只有 SAN 上的软件和数据
- CentOS 5.3 已加载并已更新
- 服务器有 2 个网卡连接到 SAN,在故障转移中设置路径 A 和 B。我没有设置这个,它是由网络团队完成的。我只处理操作系统方面的事情
附加信息
dmesg | grep ql
ACPI:INT_SRC_OVR(总线 0 bus_irq 0 global_irq 2 dfl dfl) ACPI:INT_SRC_OVR(总线0 bus_irq 9 global_irq 9高电平) PCI:如果设备不工作,请尝试“pci=routeirq”。如果有帮助,请发布报告 VFS:磁盘配额 dquot_6.5.1 Dquot-cache 哈希表条目:512(顺序 0,4096 字节) io scheduler cfq 已注册(默认) serial8250: I/O 0x3f8 (irq = 0) 处的 ttyS0 是 16550A serial8250: I/O 0x2f8 (irq = 0) 处的 ttyS1 是 16550A 00:05: I/O 0x3f8 (irq = 4) 处的 ttyS0 是 16550A 00:06: I/O 0x2f8 (irq = 3) 处的 ttyS1 是 16550A 序列号:i8042 KBD 端口位于 0x60,0x64 irq 1 序列号:i8042 AUX 端口位于 0x60,0x64 irq 12 ehci_hcd 0000:00:1a.7: 中断 50,io 内存 0xdf0ff800 ehci_hcd 0000:00:1d.7: 中断 58,io 内存 0xdf0ffc00 uhci_hcd 0000:00:1a.0: irq 66, io base 0x0000cc40 uhci_hcd 0000:00:1a.1: irq 74, io base 0x0000cc60 uhci_hcd 0000:00:1d.0: irq 58, io base 0x0000cc80 uhci_hcd 0000:00:1d.1: irq 82, io base 0x0000cca0 ata1: SATA 最大 UDMA/133 cmd 0xcc10 ctl 0xcc08 bmdma 0xcc20 irq 98 ata2: SATA 最大 UDMA/133 cmd 0xcc18 ctl 0xcc0c bmdma 0xcc28 irq 98 qla2xxx 0000:04:00.0: 找到一个 ISP2532, irq 106, iobase 0xffffc2000000e000 qla2xxx 0000:04:00.0:配置 PCI 空间... qla2xxx 0000:04:00.0:配置 NVRAM 参数... qla2xxx 0000:04:00.0:正在验证加载的 RISC 代码... qla2xxx 0000:04:00.0:为 EFT 分配 (64 KB)... qla2xxx 0000:04:00.0:已分配 (1414 KB) 用于固件转储... scsi3:qla2xxx qla2xxx 0000:04:00.0: qla2xxx 0000:05:00.0: 找到一个 ISP2532, irq 114, iobase 0xffffc20000022000 qla2xxx 0000:05:00.0:配置 PCI 空间... qla2xxx 0000:05:00.0:配置 NVRAM 参数... qla2xxx 0000:05:00.0:正在验证加载的 RISC 代码... qla2xxx 0000:05:00.0:为 EFT 分配 (64 KB)... qla2xxx 0000:05:00.0:已分配 (1414 KB) 用于固件转储... scsi4:qla2xxx qla2xxx 0000:05:00.0: qla2xxx 0000:04:00.0:发生 LIP 重置 (f8f7)。 qla2xxx 0000:04:00.0:发生 LIP (f8f7)。 qla2xxx 0000:04:00.0:发生 LIP 重置 (f700)。 qla2xxx 0000:04:00.0:检测到 LOOP UP (4 Gbps)。 qla2xxx 0000:05:00.0:发生 LIP 重置 (f8f7)。 qla2xxx 0000:05:00.0:发生 LIP (f8f7)。 qla2xxx 0000:05:00.0:发生 LIP 重置 (f700)。 qla2xxx 0000:05:00.0:检测到 LOOP UP (4 Gbps)。 SELinux:已初始化(dev mqueue,类型 mqueue),使用转换 SID
我正在使用来自 Dell EMC 的相同 SAN,可以提供 dmesg |grep ql* 或者您可以在 .html 中运行 emcgrab如果没有 switch bcoz 那么你将有 2 条路径 A 和 B 你需要找出一些有用的提示如下
http://www.linuxquestions.org/questions/linux-enterprise-47/connect-debian-etch-to-ibm-san-meaning-of-sns-scan-failed-570598/
http://forums13.itrc.hp.com/service/forums/bizsupport/questionanswer.do?admit=109447627+1249019619056+28353475&threadId=1154098
http://forums.novell.com/novell-product-support-forums/suse-linux-enterprise-server-sles/sles-configure-administer/362473-lun-not-visible.html
迪亚哥,
multipathd 易于使用,但我建议您查看 EMC 的最佳实践指南以开始使用。它同样适用于 iSCSI 或光纤通道,并直接插入 linux 的设备管理器。
光纤通道上多路径的有用开关:
简而言之,我已经成功地在光纤通道上的 centos 上使用了多路径和 qla2xxx 驱动程序(尽管是在 3PAR 存储阵列上)。
迭戈,
我们之前(1-2 年前)尝试过 powerpath,CentOS 4.x 通过 FC 连接到 EMC clarrion。
设置本机多路径在 IMO 中更容易,但实际上在难度上并没有太大差异。
请注意,这是一个较旧的版本,但我们看到的不同之处在于,powerpath 削弱了我们的磁盘 IO。
我们让 EMC 支持上下发誓我们的设置很好,但吞吐量很差。奇怪的是,当我们卸载 powerpath 时,本地磁盘 IO(我们一直在测试以进行比较)也得到了显着改善。
我很想知道它是否仍然存在相同的问题。
我们决定使用原生多路径:不足为奇。上个月我们连接新的 EMC 时,我们选择坚持使用本机多路径。服务器和 EMC 仍在测试中,但到目前为止,没有问题。
Sill,我很想听听您使用和不使用 powerpath 的经验。
——凯尔
查看您的 dmesg|grep ql* 我发现问题您是否为您的 SAN 盒创建了分区,并且您是否能够看到您在 SAN 盒上创建的分区的 fdisk -l new /dev/sda /dev/sdb在同一时间我会为你上传一个屏幕截图
cd /opt/Navisphere/bin/
./naviserverutilcli
欢迎使用 Navisphere Server Utility - 版本:6.28.20.1.40
从以下选项之一中选择: 或 选择“0”退出应用程序。
更新服务器信息 - 选择此选项可将有关服务器的信息发送到所有连接的存储系统。
快照任务(仅限 Navisphere Express)- 选择此选项可在源服务器或辅助服务器上执行快照任务。
生成高可用性报告。
显示应用程序的帮助。
扫描...
连接的存储系统:
HBA/NIC 端口 存储系统 SP 端口 SP IP 地址
0 FCNPR063600473 B 0 10.5.1.82
0 FCNPR063600473 B 1 10.5.1.82
外部存储系统上的虚拟磁盘:
设备名称 文件系统 虚拟磁盘 SP IP 地址 SP
SDF BCINICSM001_1 10.5.1.82 B
SDK BCINICSM001_1 10.5.1.82 B
SDB SDB
BCINICSMS001_2 10.5.1.1.82 B
SDG
BCINICSMS001_2
10.5.1.5.1.1.82
sdh SMS1_XEN 10.5.1.82 B
sdd SMS2_XEN 10.5.1.82 B
sdi SMS2_XEN 10.5.1.82 B
请核实以上信息。如果正确,您可以使用附加的存储系统更新服务器。如果信息不正确,您可以再次扫描然后更新。
请选择 [u]pdate, [s]can, [c]ancel:
如果已经完成了正确的分区方式,那么你应该在重新启动服务器后得到