Xen集群管理与Ganeti在Debian Lenny

Xen集群管理与Ganeti在Debian Lenny Ganeti是基于Xen的集群虚拟化管理系统。在本教程中,我将介绍...

Xen集群管理与Ganeti在Debian Lenny上

版本1.0
作者:Falko Timme

Ganeti是基于Xen的集群虚拟化管理系统。 在本教程中,我将介绍如何在两个物理节点的群集上创建一个虚拟Xen机器(称为实例 ),以及如何在两个物理节点之间管理和故障转移此实例。

本文档不附带任何形式的保证! 我不会保证这将为您工作!

1初步说明

在本教程中,我将使用物理节点node1.example.comnode2.example.com

  • node1.example.com:IP地址192.168.0.100 ; 将成为集群的主人。
  • node2.example.com:IP地址192.168.0.101 ; 将是虚拟机的主节点(aka instance )。

两个都有一个500GB的硬盘驱动器,我使用20GB的/分区,1GB的互换,并让其余的未分区,以便它可以被Ganeti使用(最小是20GB!)。 当然,您可以将分区更改为您的喜好,但请记住最小的未使用空间。

我要创建的集群将被命名为cluster1.example.com ,它的IP地址为192.168.0.102 。 群集IP 192.168.0.102将始终绑定到群集主机,因此即使您不知道主节点是哪个节点,也可以使用群集IP(或主机名cluster1.example.com )连接到主节点使用SSH。

Xen虚拟机(在Ganeti中称为实例 )将被命名为inst1.example.com ,IP地址为192.168.0.105inst1.example.com将使用DRBD在两个物理节点之间镜像 - 您可以将其视为一种网络RAID1。

如您所见, node1.example.com将是集群主控,即可以从中控制和管理集群的机器,而node2.example.com将是inst1.example.com的主要节点,即inst1.example .com将在node2.example.com上运行(将inst1.example.com上的所有更改镜像到具有DRBD的node1.example.com ),直到将其故障转移到node1.example.com (如果要将node2 .example.com进行维护,例如)。 这是主动 - 被动配置。

我认为拆分两个节点之间的角色是很好的做法,这样一个节点就不会丢失群集主节点和主节点。

这里提到的所有主机名都应该可以解析到所有主机,这意味着它们必须存在于DNS中,或者必须将所有主机名放在所有主机上的所有/ etc / hosts文件中(这是我将在这里做的) 。

所有群集节点必须使用相同的网络接口(如eth0 )。 如果一个节点使用eth0 ,而另一个节点使用eth1 ,则Ganeti将无法正常工作。

好的,我们开始吧

2准备物理节点

node1:

我想要node1具有192.168.0.100的静态IP地址,因此我的/ etc / network / interfaces文件看起来如下(请注意,我用auto eth0替换了allow-hotplug eth0 ,否则重启网络不起作用, '必须重新启动整个系统):

vi /etc/network/interfaces

# The loopback network interface
auto lo
iface lo inet loopback
# The primary network interface
#allow-hotplug eth0
#iface eth0 inet dhcp
auto eth0
iface eth0 inet static
        address 192.168.0.100
        netmask 255.255.255.0
        network 192.168.0.0
        broadcast 192.168.0.255
        gateway 192.168.0.1

如果您修改了文件,请重新启动网络:

/etc/init.d/networking restart

然后编辑/ etc / hosts 。 看起来像这样:

vi /etc/hosts

127.0.0.1       localhost.localdomain   localhost
192.168.0.100   node1.example.com       node1
192.168.0.101   node2.example.com       node2
192.168.0.102   cluster1.example.com    cluster1
192.168.0.105   inst1.example.com       inst1
# The following lines are desirable for IPv6 capable hosts
::1     localhost ip6-localhost ip6-loopback
fe00::0 ip6-localnet
ff00::0 ip6-mcastprefix
ff02::1 ip6-allnodes
ff02::2 ip6-allrouters
ff02::3 ip6-allhosts

接下来我们必须确保命令

hostname

hostname -f

打印出完整的主机名( node1.example.com )。 如果你得到不同的东西(例如,只有node1 ),请执行以下操作:

echo node1.example.com > /etc/hostname
/etc/init.d/hostname.sh start

之后, hostname命令应显示完整的主机名。

然后更新系统:

aptitude update

aptitude safe-upgrade

node2:

现在我们在node2.example.com上再次做同样的事情 (请记住, node2具有不同的IP!):

vi /etc/network/interfaces

# The loopback network interface
auto lo
iface lo inet loopback
# The primary network interface
#allow-hotplug eth0
#iface eth0 inet dhcp
auto eth0
iface eth0 inet static
        address 192.168.0.101
        netmask 255.255.255.0
        network 192.168.0.0
        broadcast 192.168.0.255
        gateway 192.168.0.1

/etc/init.d/networking restart

vi /etc/hosts

127.0.0.1       localhost.localdomain   localhost
192.168.0.100   node1.example.com       node1
192.168.0.101   node2.example.com       node2
192.168.0.102   cluster1.example.com    cluster1
192.168.0.105   inst1.example.com       inst1
# The following lines are desirable for IPv6 capable hosts
::1     localhost ip6-localhost ip6-loopback
fe00::0 ip6-localnet
ff00::0 ip6-mcastprefix
ff02::1 ip6-allnodes
ff02::2 ip6-allrouters
ff02::3 ip6-allhosts

echo node2.example.com > /etc/hostname
/etc/init.d/hostname.sh start

aptitude update

aptitude safe-upgrade

3在可用硬盘空间上设置LVM

node1 / node2:

我们来看看我们的硬盘驱动器:

fdisk -l

node1:~# fdisk -l

Disk /dev/sda: 500.1 GB, 500107862016 bytes
255 heads, 63 sectors/track, 60801 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x00023cd1

   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *           1          62      497983+  83  Linux
/dev/sda2              63        6141    48829567+  8e  Linux LVM
node1:~#

我们现在将使用剩余的硬盘驱动器创建分区/ dev / sda3 (在两个物理节点上),并为LVM准备:

fdisk /dev/sda

node1:〜#fdisk / dev / sda

此磁盘的柱面数设置为60801。
没有什么问题,但是这大于1024,
并且在某些设置中可能会导致以下问题:
1)在引导时运行的软件(例如,LILO的旧版本)
2)从其他操作系统启动和分区软件
(例如DOS FDISK,OS / 2 FDISK)

命令(m帮助): < - n
命令行动
e扩展
p主分区(1-4)
< - p
分区号(1-4): < - 3
第一个柱面(6142-60801,默认6142): < - ENTER
使用默认值6142
最后一个圆柱体或+大小或+ sizeM或+ sizeK(6142-60801,默认为60801): < - ENTER
使用默认值60801

命令(m为帮助): < - t
分区号(1-4): < - 3
十六进制代码(L型列表代码): < - L

0空1e隐藏W95 FAT1 80旧Minix是Solaris启动
1 FAT12 24 NEC DOS 81 Minix / old Lin bf Solaris
2 XENIX root 39计划9 82 Linux交换/ So c1 DRDOS / sec(FAT-
3 XENIX usr 3c PartitionMagic 83 Linux c4 DRDOS / sec(FAT-
4 FAT16 <32M 40 Venix 80286 84 OS / 2隐藏C:c6 DRDOS /秒(FAT-
5扩展41 PPC PReP引导85 Linux扩展c7 Syrinx
6 FAT16 42 SFS 86 NTFS卷集da非FS数据
7 HPFS / NTFS 4d QNX4.x 87 NTFS卷集db CP / M / CTOS /。
8 AIX 4e QNX4.x第2部分88 Linux纯文本戴尔实用程序
9 AIX可启动4f QNX4.x第3部分8e Linux LVM df BootIt
OS / 2 Boot Manag 50 OnTrack DM 93变形虫e1 DOS访问
b W95 FAT32 51 OnTrack DM6 Aux 94变形虫BBT e3 DOS R / O
c W95 FAT32(LBA)52 CP / M 9f BSD / OS e4 SpeedStor
e W95 FAT16(LBA)53 OnTrack DM6 Aux a0 IBM Thinkpad Hi eb BeOS fs
f W95 Ext'd(LBA)54 OnTrackDM6 a5 FreeBSD ee EFI GPT
10 OPUS 55 EZ-Drive a6 OpenBSD ef EFI(FAT-12/16 /
11隐藏FAT12 56金弓a7 NeXTSTEP f0 Linux / PA-RISC b
12 Compaq diagnostics 5c Priam Edisk a8达尔文UFS f1 SpeedStor
14隐藏FAT16 <3 61 SpeedStor a9 NetBSD f4 SpeedStor
16隐藏FAT16 63 GNU HURD或Sys ab达尔文启动f2 DOS二级
17 Hidden HPFS / NTF 64 Novell Netware b7 BSDI fs fd Linux raid auto
18 AST SmartSleep 65 Novell Netware b8 BSDI交换fe LANstep
1b隐藏W95 FAT3 70 DiskSecure多bb启动向导隐藏ff BBT
1c隐藏W95 FAT3 75 PC / IX
十六进制代码(类型L列出代码): < - 8e
更改系统类型的分区3到8e(Linux LVM)

命令(m为帮助): < - w
分区表已被更改!

调用ioctl()重新读取分区表。

警告:重新读取分区表失败,错误16:设备或资源繁忙。
内核仍然使用旧表。
新表将在下次重新启动时使用。
同步磁盘
node1:〜#

现在我们再来看看我们的硬盘驱动器:

fdisk -l

node1:~# fdisk -l

Disk /dev/sda: 500.1 GB, 500107862016 bytes
255 heads, 63 sectors/track, 60801 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x00023cd1

   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *           1          62      497983+  83  Linux
/dev/sda2              63        6141    48829567+  8e  Linux LVM
/dev/sda3            6142       60801   439056450   8e  Linux LVM
node1:~#

看起来不错。 现在我们必须重新启动两个物理节点,以便内核可以在新的分区表中读取:

reboot

重新启动后,我们安装LVM(可能已安装,但最好是去确定):

aptitude install lvm2

重新启动后,我们为两个节点上的LVM准备/ dev / sda3 ,并将其添加到卷组xenvg中

pvcreate /dev/sda3
vgcreate xenvg /dev/sda3

(Ganeti想要使用自己的卷组,这就是为什么我们创建xenvg ;理论上我们可以使用一个具有足够的未分配空间的现有卷组,但gnt-cluster verify命令将会抱怨这一点)。