tgt的chap双向认证认证逻辑 背景iscsi的单向认证和双向认证的验证 验证单向认证开启单向认证 1234567<target iqn.2008-09.com.example:server.target1> backing-store /dev/rbd0 incominguser zp 123456</target>[root@lab102 ~]# iscsiadm -m discovery 2024-12-20 系统管理 #iscsi相关
centos7过期源添加 背景centos7的支持已经没有了,源也移动到其它的路径,还是有环境需要用 源内容123456789101112131415161718192021222324252627282930[root@lab101 yum.repos.d]# cat CentOS-Base.repo[base]name=CentOS-$releasever - Basebaseurl=https://mirrors.a 2024-12-18 系统管理 #操作系统
nvme电源控制引起的nvme磁盘离线 故障信息12345678910Nov 26 07:20:12 node03 kernel: nvme nvme0: I/O 24 QID 0 timeout, reset controllerNov 26 07:20:22 node03 kernel: nvme nvme0: I/O 146 QID 4 timeout, abortingNov 26 07:20:25 node03 kernel: 2024-12-17 系统管理 #磁盘相关
esxi克隆虚拟机方法 背景内网搭建了一套esxi做测试的机器,没有用vcenter,管理平台没有克隆的操作的地方 方法最开始使用的是平台的存储浏览的复制功能这个里面有个问题是,复制的很慢,并且精简配置的属性没有保留,占用了过多的空间这个地方可以后台通过命令行操作,也比较简单 后台操作123456789101112131415161718192021[root@nucesxi:/vmfs/volumes/6730898e 2024-12-16 虚拟化 #exsi
rgw追加写功能测试验证 背景aws的s3以前是不支持追加写这个功能的 这个存储类型大概是2023年发布的,这个文章是2024年11月21日发布的 找到功能的发布大概时间我们看下boto3的工具是什么时候集成进去的就知道这个功能发布的大概的时间 1WriteOffsetBytes aws里面使用这个参数去控制追加写的偏移量的,我们根据这个关键字去找 找到botcore的代码,使用git下载下来 1cd botocore 2024-12-13 存储系统 #ceph
纠删码中间对象属性丢失引起osd的崩溃 背景迁移的时候出现osd的崩溃,然后进行pg的备份的时候出现了无法获取属性的情况,本篇记录问题和解决的方法 问题1234567891011Error getting attr on : 2.7s2_head,2#2:f7d032a7:::rbd_data.1.101a6b8b4567.00000000000000a1:head#f6, (61) No data availableError get 2024-12-11 存储系统 #ceph
快照原始对象缺失引起的osd崩溃 问题 修复pg的时候出现了 unexpected clone 可以看到这个对象后面有编号,这个编号有两种情况 快照的对象(snapid) 纠删对象的中间版本(对应是generation) 1{"oid":"rbd_data.1.101a6b8b4567.00000000000000b3","key":"" 2024-12-11 存储系统 #ceph
为什么只坏了一个盘集群无法读写 背景我们拿到故障环境,看到环境就坏一个osd,但是环境还是处于卡着的状态,这个时候客户肯定会问,怎么就坏一个盘,还无法用了,不是都配置了冗余么 这个地方我们来分析下这个问题的原因,坏一个osd只是结果,不是过程,我们看下过程发生了哪些状况 中间过程这个中间过程我们用图来说过程比较清晰一些 上面是时间线上的三个阶段的情况 阶段一:数据完整,没有任何问题,数据写三份,分布到三台机器 阶段二:主机 2024-12-04 存储相关 #ceph
device_health_metrics正确的删除方法 问题描述1234567891011121314151617181920[root@lab103 ceph]# ceph -s cluster: id: 4f5ce868-8389-489a-bd96-f2754ed6fa2f health: HEALTH_ERR mon is allowing insecure global_id reclaim 2024-11-21 存储相关 #ceph
earlyoom预防机器卡死 背景机器还没来得及oom,机器就出现挂死的状态,swap无法交换出,或者直接挂死 这个问题比较好复现在机器上面一直进行内存的申请即可 1python3 memory.py 100 40000 这个在x86上面做测试的时候,系统能够比较快的oom,但是这个板卡的系统盘本身慢,这个就可能出现卡顿的情况了 系统的oom,需要进行一些计算和系统处理,并且有个问题是,很多进程都不杀,因为都是系统进程,很多 2024-11-14 系统管理 #内存管理