磨磨的技术笔记

parted会启动你的ceph osd，意外不？

parted会启动你的ceph osd，意外不？

前言如果看到标题，你是不是第一眼觉得写错了，这个怎么可能，完全就是两个不相关的东西，最开始我也是这么想的，直到我发现真的是这样的时候，也是很意外，还是弄清楚下比较好，不然在某个操作下，也许就会出现意想不到的情况定位如果你看过我的博客，正好看过这篇 <<ceph在centos7下一个不容易发现的改变>> ，那么应该还记得这个讲的是centos 7 下面通过udev来实现了o

2018-03-23

暂未分类

#暂未分类

REDHAT 7.5beta 新推出的VDO功能

REDHAT 7.5beta 新推出的VDO功能

前言关于VDOVDO的技术来源于收购的Permabit公司，一个专门从事重删技术的公司，所以技术可靠性是没有问题的 VDO是一个内核模块，目的是通过重删减少磁盘的空间占用，以及减少复制带宽，VDO是基于块设备层之上的，也就是在原设备基础上映射出mapper虚拟设备，然后直接使用即可，功能的实现主要基于以下技术：零区块的排除：在初始化阶段，整块为0的会被元数据记录下来，这个可以用水杯里面的水和

2018-02-10

暂未分类

#暂未分类

定位一个网络问题引起的ceph异常

定位一个网络问题引起的ceph异常

前言有一个ceph环境出现了异常，状态就是恢复异常的慢，但是所有数据又都在走，只是非常的慢，本篇将记录探测出问题的过程，以便以后处理类似的问题有个思路处理过程问题的现象是恢复的很慢，但是除此以外并没有其它的异常，通过iostat监控磁盘，也没有出现异常的100%的情况，暂时排除了是osd底层慢的问题检测整体写入的速度通过rados bench写入 1rados -p rbd bench 5 w

2018-01-16

暂未分类

#暂未分类

Kernel RBD的QOS配置方案

Kernel RBD的QOS配置方案

前言关于qos的讨论有很多，ceph内部也正在实现着一整套的基于dmclock的qos的方案，这个不是本篇的内容，之前在社区的邮件列表看过有研发在聊qos的相关的实现的，当时一个研发就提出了在使用kernel rbd的时候，可以直接使用linux的操作系统qos来实现，也就是cgroup来控制读取写入 cgroup之前也有接触过，主要测试了限制cpu和内存相关的，没有做io相关的测试，这个当然可以

2018-01-05

暂未分类

#暂未分类

Ceph对象主本损坏的修复方法

Ceph对象主本损坏的修复方法

前言问题的触发是在进行一个目录的查询的时候，osd就会挂掉，开始以为是osd操作超时了，后来发现每次访问这个对象都有问题 12log [WRN] ： slow request 60.793196 seconds old, received at osd_op(mds.0.188:728345234100006c6ddc.00000000 [o map-get-header 0-0,omap-get

2018-01-02

暂未分类

#暂未分类

mds的cpu占用问题分析以及解决办法

mds的cpu占用问题分析以及解决办法

前言mds是ceph里面处理文件接口的组件，一旦使用文件系统，不可避免的会出现一种场景就是目录很多，目录里面的文件很多，而mds是一个单进程的组件，现在虽然有了muti mds，但稳定的使用的大部分场景还是单acitve mds的这就会出现一种情况，一旦一个目录里面有很多文件的时候，去查询这个目录里的文件就会在当前目录做一次遍历，这个需要一个比较长的时间，如果能比较好的缓存文件信息，也能避免一些

2017-12-04

暂未分类

#暂未分类

CentOS GRUB损坏修复方法

CentOS GRUB损坏修复方法

前言博客很久没有更新了，一个原因就是原来存放部署博客的环境坏了，硬盘使用的是SSD，只要读取到某个文件，整个磁盘就直接识别不到了，还好博客环境之前有做备份，最近一直没有把部署环境做下恢复，今天抽空把环境做下恢复并且记录一篇基础的GRUB的处理文档这两天正好碰到GRUB损坏的事，很久前处理过，但是没留下文档，正好现在把流程梳理一下，来解决grub.cfg损坏的情况,或者无法启动的情况实践步骤安装

2017-11-30

暂未分类

#暂未分类

掉电后osdmap丢失无法启动osd的解决方案

掉电后osdmap丢失无法启动osd的解决方案

前言本篇讲述的是一个比较极端的故障的恢复场景，在整个集群全部服务器突然掉电的时候，osd里面的osdmap可能会出现没刷到磁盘上的情况，这个时候osdmap的最新版本为空或者为没有这个文件还有一种情况就是机器宕机了，没有马上处理，等了一段时间以后，服务器机器启动了起来，而这个时候osdmap已经更新了，全局找不到需要的旧版本的osdmap和incmap，osd无法启动一般情况下能找到的就直接从

2017-09-27

暂未分类

#暂未分类

怎样禁止Ceph OSD的自动挂载

怎样禁止Ceph OSD的自动挂载

前言本篇来源于群里一个人的问题，有没有办法让ceph的磁盘不自动挂载，一般人的问题都是怎样让ceph能够自动挂载，在centos 7 平台下 ceph jewel版本以后都是有自动挂载的处理的，这个我之前也写过两篇文章《ceph在centos7下一个不容易发现的改变》和《Ceph数据盘怎样实现自动挂载》，来讲述这个自动挂载的这里讲下流程：开机后 udev 匹配 95-ceph-osd.rul

2017-09-07

暂未分类

#暂未分类

Ceph OSD服务失效自动启动控制

Ceph OSD服务失效自动启动控制

前言服务器上面的服务会因为各种各样的原因失败，磁盘故障，权限问题，或者是服务过载引起超时，这些都可能引起这个在ceph里面systemctl unit 默认有个on-fail restart,默认的可能并不适合所有的场景，所以自动化的服务应该是尽量去适配你手动处理的过程，手动怎么处理的，就怎么去设置启动分析如果有osd失败了，一般上去会先启动一次，尽快让服务启动，然后去检查是否有故障，如果失败

2017-09-06

暂未分类

#暂未分类