远行的心 发表于 2019-2-1 13:46:04

Openstack 之 ceph存储池分级

http://s1.运维网.com/images/20180323/1521770916999323.png http://s1.运维网.com/images/20180323/1521771461255911.png
上面左边是我的个人微信,如需进一步沟通,请加微信。右边是我的公众号“Openstack私有云”,如有兴趣,请关注。
  上篇《Openstack 之使用外部ceph存储》中提到,为了达到不同的pool可以使用不同类型的硬盘组成的存储池,对于只是需要解决存储分级的小规模集群场景来说,先使用kolla进行统一部署ceph,在部署完成之后,然后通过手动调整ceph crush存储规则,新建rule,将相应的osd划入对应的rule,最后将相应的pool调整到相应的rule。这里我们就这个想法进行实际验证。
  Openstack集群环境:
  系统centos7.3
  Openstack版本 Ocata 4.0.2.1 ,使用kolla部署
  Openstack集群服务器分配如下:
节点服务IPcontrol01control+compute+network192.168.1.130control02control+compute+network192.168.1.131control03control+compute+network192.168.1.132  已经成功部署了3个节点的控制+存储+计算+网络的融合节点,ceph的osd初始分布如下:
  ceph> osd tree
  ID WEIGHTTYPE NAME            UP/DOWN REWEIGHT PRIMARY-AFFINITY
  

  -1 9.00000 root default
  -2 3.00000   host 192.168.1.132
  0 1.00000         osd.0               up1.00000          1.00000
  3 1.00000         osd.3               up1.00000          1.00000
  6 1.00000         osd.6               up1.00000          1.00000
  -3 3.00000   host 192.168.1.130
  1 1.00000         osd.1               up1.00000          1.00000
  5 1.00000         osd.5               up1.00000          1.00000
  7 1.00000         osd.7               up1.00000          1.00000
  -4 3.00000   host 192.168.1.131
  2 1.00000         osd.2               up1.00000          1.00000
  4 1.00000         osd.4               up1.00000          1.00000
  8 1.00000         osd.8               up1.00000          1.00000
  我们的目标是,将ssd硬盘 osd.0/osd.1/osd.2 等3个ssd类型硬盘osd划入一个新的root根ssd,新的host组ssd-hosts ,新的host,将这3个osd分别移入新的host中,同时新建一个rule规则ssd-rule ,使这个根ssd的所有设备使用这个ssd-rule规则。最后,将openstack存放虚拟机的pool池vms设置使用这个ssd-rule规则,这样,就达到了虚拟机池vms使用ssd硬盘池的目的。同样的道理,对于glance和cinder-backup可以使用慢速硬盘SATA盘组成的慢速存储池,也可以用同样的方法进行调整。
  操作记录:
  创建ssd root
  docker exec -it ceph_mon ceph osd crush add-bucket ssd root
  //创建一个新的桶叫ssd ,级别是root最高级
  创建chassis
  docker exec -it ceph_mon ceph osd crush add-bucket ssd-hosts chassis
  //创建一个新的桶叫ssd-hosts ,级别是机框
  docker exec -it ceph_mon ceph osd crush move ssd-hosts root=ssd
  //将ssd-hosts归入ssd
  创建host
  docker exec -it ceph_mon ceph osd crush add-bucket ssd-132 host
  docker exec -it ceph_mon ceph osd crush add-bucket ssd-130 host
  docker exec -it ceph_mon ceph osd crush add-bucket ssd-131 host
  //创建3个新的桶叫ssd-132/ssd-130/ssd-131 ,级别是host
  docker exec -it ceph_mon ceph osd crush move ssd-132chassis=ssd-hosts
  docker exec -it ceph_mon ceph osd crush move ssd-130chassis=ssd-hosts
  docker exec -it ceph_mon ceph osd crush move ssd-131chassis=ssd-hosts
  //将ssd-132/ssd-130/ssd-131归入ssd-hosts
  移动osd
  docker exec -it ceph_mon ceph osd crush set osd.0 1.0 host=ssd-132
  docker exec -it ceph_mon ceph osd crush set osd.1 1.0 host=ssd-130
  docker exec -it ceph_mon ceph osd crush set osd.2 1.0 host=ssd-131
  //将osd.0/osd.1 /osd.2移动到对应的host 中
  创建crush rule
  docker exec -it ceph_mon ceph osd crush rule create-simple ssd-rule ssd host firstn
  //创建crush rule,rule名称是ssd-rule,root=ssd,tpye=host,mode=firstn
  经过调整之后osd的分布如下:
  ceph> osd tree
  ID WEIGHTTYPE NAME            UP/DOWN REWEIGHT PRIMARY-AFFINITY
  -5 3.00000 root ssd
  -6 3.00000   chassis ssd-hosts
  -7 1.00000         host ssd-132
  0 1.00000             osd.0         up1.00000          1.00000
  -8 1.00000         host ssd-130
  1 1.00000             osd.1         up1.00000          1.00000
  -9 1.00000         host ssd-131
  2 1.00000             osd.2         up1.00000          1.00000
  -1 6.00000 root default
  -2 2.00000   host 192.168.1.132
  3 1.00000         osd.3               up1.00000          1.00000
  6 1.00000         osd.6               up1.00000          1.00000
  -3 2.00000   host 192.168.1.130
  5 1.00000         osd.5               up1.00000          1.00000
  7 1.00000         osd.7               up1.00000          1.00000
  -4 2.00000   host 192.168.1.131
  4 1.00000         osd.4               up1.00000          1.00000
  8 1.00000         osd.8               up1.00000          1.00000
  crush rule规则如下:
  # docker exec -it ceph_mon ceph osd crush rule dump
  [
  {
  "rule_id": 0,
  "rule_name": "replicated_ruleset",
  "ruleset": 0,
  "type": 1,
  "min_size": 1,
  "max_size": 10,
  "steps": [
  {
  "op": "take",
  "item": -1,
  "item_name": "default"
  },
  {
  "op": "chooseleaf_firstn",
  "num": 0,
  "type": "host"
  },
  {
  "op": "emit"
  }
  ]
  },
  {
  "rule_id": 1,
  "rule_name": "disks",
  "ruleset": 1,
  "type": 1,
  "min_size": 1,
  "max_size": 10,
  "steps": [
  {
  "op": "take",
  "item": -1,
  "item_name": "default"
  },
  {
  "op": "chooseleaf_firstn",
  "num": 0,
  "type": "host"
  },
  {
  "op": "emit"
  }
  ]
  },
  {
  "rule_id": 2,
  "rule_name": "ssd-rule",
  "ruleset": 2,
  "type": 1,
  "min_size": 1,
  "max_size": 10,
  "steps": [
  {
  "op": "take",
  "item": -5,
  "item_name": "ssd"
  },
  {
  "op": "chooseleaf_firstn",
  "num": 0,
  "type": "host"
  },
  {
  "op": "emit"
  }
  ]
  }
  ]
  可以看到新增的ssd-rule的ruleid是2。
  更改vms pool的rule:
  设置openstack的虚拟机存储池vms使用的rule为ssd-rule:
  docker exec -it ceph_mon ceph ceph osd pool set vms crush_ruleset 2
  验证:

  1. 列出vms中的images:
  # docker exec -it ceph_mon rbd -p vms ls
  4ba3e273-b729-4a24-8040-629b9b58fe43_disk
  2. 查看images是不是分布在osd.0/osd.1/osd.2这3块ssd盘中:
  # docker exec -it ceph_mon bash
  (ceph-mon)# vi rbd_loc.sh
  #!/bin/bash
  # USAGE:./rbd-loc
  if [ -z ${1} ] || [ -z ${2} ];
  then
  echo "USAGE: ./rbd-loc"
  exit 1
  fi
  rbd_prefix=$(rbd -p ${1} info ${2} | grep block_name_prefix | awk '{print $2}')
  for i in $(rados -p ${1} ls | grep ${rbd_prefix})
  do
  ceph osd map ${1} ${i}
  done
  (ceph-mon)# chmod +x rbd_loc.sh
  (ceph-mon)# ./rbd_loc.sh vms 4ba3e273-b729-4a24-8040-629b9b58fe43_disk
  osdmap e685 pool 'vms' (9) object 'rbd_data.2744fe204970c8.0000000000000004' -> pg 9.eec101a0 (9.20) -> up (, p2) acting (, p2)
  osdmap e685 pool 'vms' (9) object 'rbd_data.2744fe204970c8.0000000000000006' -> pg 9.9f03d335 (9.35) -> up (, p1) acting (, p1)
  osdmap e685 pool 'vms' (9) object 'rbd_data.2744fe204970c8.0000000000000001' -> pg 9.67b18ab5 (9.35) -> up (, p1) acting (, p1)
  osdmap e685 pool 'vms' (9) object 'rbd_data.2744fe204970c8.0000000000000003' -> pg 9.5897ddc8 (9.48) -> up (, p0) acting (, p0)
  osdmap e685 pool 'vms' (9) object 'rbd_data.2744fe204970c8.0000000000000007' -> pg 9.dbace74b (9.4b) -> up (, p2) acting (, p2)
  osdmap e685 pool 'vms' (9) object 'rbd_data.2744fe204970c8.0000000000000000' -> pg 9.f1ab8f4d (9.4d) -> up (, p0) acting (, p0)
  osdmap e685 pool 'vms' (9) object 'rbd_data.2744fe204970c8.0000000000000005' -> pg 9.20dc9e6c (9.6c) -> up (, p1) acting (, p1)
  osdmap e685 pool 'vms' (9) object 'rbd_data.2744fe204970c8.0000000000000002' -> pg 9.7f6d55f7 (9.77) -> up (, p2) acting (, p2)
  从上面的结果可以看到,所有的数据副本object所在的pg,都放在0,1,2上 。
  验证成功!
  总结:
  可以看到,通过这种先使用自动化容器部署方式kolla进行自动化部署,然后再对存储池进行调整的方式是可行的。

  存储分级无论对于openstack大集群还是小集群的应用场景都是很有用的,我们个人使用的笔记本系统盘都开始使用ssd固态硬盘了,作为云平台更加有这个需求,分配的虚拟机,系统盘使用ssd固态硬盘池子,数据盘可以使用普通硬盘,卷备份和glance镜像就可以使用慢速盘。这种存储分级是非常有实用价值的。

  这里只是列举了ssd存储池的实现,同样的,SAS盘存储池、SATA盘存储池的实现都是一样的方法。

  存储池的实现在ceph luminous版本中的实现方式更加简便,可以直接通过crush class的方式完成,相应的osd纳入不同的class,实现原理应该还是一样的,就是通过新建rule来实现osd的归类。
  
  2018年7月13日注:
  ceph的crush规则经过调整后,经过测试,如果后面重新通过kolla部署,ceph所做的相关调整不会因为重新通过kolla部署变化。这里就提供了一个比较舒服的灵活调整空间,ceph的osd tree分布以及crush存储规则,都可以通过kolla部署后根据实际应用场景进行调整。
  另外,文章中osd tree 调整的时候多加了一层chassis ,这一层级可以省掉。甚至,如果为了简便,可以只新建一个ssd-host ,把所有的ssd osd都划入这一个host。




页: [1]
查看完整版本: Openstack 之 ceph存储池分级