成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

一體機(jī)系統(tǒng)盤(pán)offline的處理過(guò)程

IT那活兒 / 1391人閱讀
一體機(jī)系統(tǒng)盤(pán)offline的處理過(guò)程
點(diǎn)擊上方“IT那活兒”公眾號(hào),關(guān)注后了解更多內(nèi)容,不管IT什么活兒,干就完了?。?!

  

概述:

一體機(jī)有數(shù)據(jù)盤(pán)和系統(tǒng)盤(pán),數(shù)據(jù)盤(pán)要是missing可以由其它柜數(shù)據(jù)盤(pán)重平衡后修復(fù),但是系統(tǒng)盤(pán)在硬件上只有一組冗余,壞了之后需要即時(shí)修復(fù)。




事情發(fā)生及分析

1. 發(fā)現(xiàn)問(wèn)題
收到一體機(jī)數(shù)據(jù)庫(kù)ASM存在離線(xiàn)磁盤(pán)組的告警告警。
2. ASM檢查
數(shù)據(jù)庫(kù)檢查ASM磁盤(pán)情況,發(fā)現(xiàn)存在offline disk磁盤(pán)。
3. 臨時(shí)方案
嘗試手動(dòng)online asm disk,執(zhí)行后失敗報(bào)not visible cluster-wide。
說(shuō)明存在損壞,有可能是物理壞盤(pán)了。
4. 分析日志
1)查看ASM日志,確認(rèn)為底層磁盤(pán)有問(wèn)題。
2)登錄一體機(jī)進(jìn)行狀態(tài)檢查,發(fā)現(xiàn)所有磁盤(pán)組為正常,對(duì)應(yīng)ASM的的磁盤(pán)組提示狀態(tài)未更新。
找到對(duì)應(yīng)的節(jié)點(diǎn)進(jìn)行日志檢查,發(fā)現(xiàn)存在ERROR日志,確認(rèn)為00號(hào)盤(pán)損壞,需要及時(shí)更換 。注:一個(gè)cell節(jié)點(diǎn)有12塊盤(pán)其中00和01為系統(tǒng)盤(pán)所以存在異常需要立馬進(jìn)行更換,避免出現(xiàn)因系統(tǒng)盤(pán)異常導(dǎo)致的二次故障)


解決過(guò)程

經(jīng)過(guò)和同事分析后,必須盡快對(duì)物理盤(pán)進(jìn)行修復(fù),先對(duì)壞盤(pán)drop,再修復(fù)物理盤(pán)。

1. 舊盤(pán)清理drop

在db節(jié)點(diǎn)上grid用戶(hù)登錄,這是要確認(rèn)一下asm disk是不是被drop掉。drop掉就可以直接更換,如果沒(méi)有,就需要手動(dòng)去drop。
[root@dw01db01 ~]# su - oracle
[oracle@dw01db01 ~]$ ssh oracle@dw01db02
[oracle@dw01db01 ~]$ env
[oracle@dw01db01 ~]$ export ORACLE_SID=+ASM1
[oracle@dw01db01 ~]$ export ORACLE_HOME=/u01/app/11.2.0.3/grid
[oracle@dw01db01 ~]$ sqlplus / as sysasm
SQL> set linesize 132
SQL> col path format a50
SQL> select group_number,name,state from v$asm_diskgroup;
GROUP_NUMBER NAME STATE
------------ ------------------------------ -----------
1 DATAC1 MOUNTED
2 DATAC2 MOUNTED
3 DATAC3 MOUNTED
4 DBFS_DG MOUNTED
5 RECOC1 MOUNTED
SQL>select group_number,path,header_status,mount_status,mode_status,name from V$ASM_DISK where path like %CD_00_ndw1celadm02;SQL> SQL>

GROUP_NUMBER PATH HEADER_STATU MOUNT_S MODE_ST NAME
------------ -------------------------------------------------- ------------ ------- ------- ------------------------------
0      o/192.168.XX.7;192.168.XX.8/RECOC1_CD_00_ndw1celad UNKNOWN CLOSED ONLINE
m02

0      o/192.168.XX.7;192.168.XX.8/DATAC1_CD_00_ndw1celad UNKNOWN CLOSED ONLINE
m02
本次磁盤(pán)損壞ASM相關(guān)的磁盤(pán)沒(méi)有drop,需手動(dòng)drop,在手動(dòng)drop之前還需要確認(rèn)當(dāng)前的ASM實(shí)例是否仍在reblance。
SQL> select * from gv$asm_operation where state=RUN;
no rows selected------沒(méi)有正在運(yùn)行的reblance
沒(méi)有運(yùn)行的reblance,進(jìn)行磁盤(pán)drop:
SQL> alter diskgroup RECOC1 drop disk RECOC1_CD_00_ndw1celadm02 
rebalance power 4;----并發(fā)可根據(jù)實(shí)際情況進(jìn)行調(diào)整
2. 機(jī)房現(xiàn)場(chǎng)檢查
完成drop后即可進(jìn)行磁盤(pán)更換,在機(jī)房找到指定一體機(jī),上方為db節(jié)點(diǎn),下方為cell節(jié)點(diǎn)(drop掉后到對(duì)應(yīng)cell節(jié)點(diǎn)檢查狀態(tài)會(huì)發(fā)現(xiàn)該塊異常盤(pán)未提出節(jié)點(diǎn),cell節(jié)點(diǎn)的順序是由下至上),查看故障指示燈,橙燈亮表示為有異常!

3. 機(jī)房硬盤(pán)更換

找到指定位置后進(jìn)行拔插,注意拔掉磁盤(pán)后等待5-10分鐘再將磁盤(pán)插入。

在此過(guò)程中遇到問(wèn)題:

  • 本次X5-X6為一套集群,并且X5-X6的硬件可以共用的,但是X5的硬盤(pán)為4T,X6為8T。剛好攜帶的硬件為8T進(jìn)行插盤(pán)后無(wú)法兼容。導(dǎo)致插入新盤(pán)狀態(tài)持續(xù)未恢復(fù)!

    此過(guò)程中重新插入拔出不會(huì)有任何影響,重新跟換適配盤(pán)進(jìn)行插入。所以更換前一定確認(rèn)清楚設(shè)備型號(hào)已經(jīng)其他節(jié)點(diǎn)已經(jīng)運(yùn)行的設(shè)備容量。

  • 更換為指定符合要求的硬件后,插入硬盤(pán)指示燈閃爍后仍為橙燈,檢查發(fā)現(xiàn)為新盤(pán)一直未加入到節(jié)點(diǎn)組中。通過(guò)cellcli -e list alerthistory命令可查看新盤(pán)插入后的分配情況,提示未分配到指定的組中,檢查發(fā)現(xiàn)為節(jié)點(diǎn)的/目錄滿(mǎn)了導(dǎo)致,清理后再次拔插磁盤(pán)恢復(fù)正常。
    由于00和01為系統(tǒng)盤(pán)所以當(dāng)/目錄空間不足時(shí)無(wú)法進(jìn)行重新平衡)插入后觀察指示燈,綠燈快速閃爍后恢復(fù)正常閃爍。登錄對(duì)應(yīng)cell節(jié)點(diǎn)檢查日志。
[root@ndw1celadm02 ~]# cellcli -e list alerthistory---查看日志
[root@ndw1celadm02 ~]#cellcli -e list griddisk---檢查狀態(tài)
都恢復(fù)正常后進(jìn)行rebalance操作:
alter diskgroup DATAC1 rebalance power 32;

至此一體機(jī)換盤(pán)全部完成!


事情總結(jié)

  1. 每天做好一體機(jī)硬件巡檢。
  2. 每天做好數(shù)據(jù)庫(kù)存儲(chǔ)ASM巡檢。
  3. 壞盤(pán)后即時(shí)做好應(yīng)急方案,根據(jù)實(shí)際情況制定處理方案并解決。
  4. 事情出現(xiàn)后,若無(wú)法自己判斷嚴(yán)重性,應(yīng)該立即上報(bào),尋求專(zhuān)家協(xié)同分析后,再制定相應(yīng)措施,避免二次故障及人為問(wèn)題。
  5. 做好備件核查及備件入庫(kù),避免出現(xiàn)硬件問(wèn)題,無(wú)法即時(shí)得到更換。

本文作者:曹安勻(上海新炬王翦團(tuán)隊(duì))

本文來(lái)源:“IT那活兒”公眾號(hào)

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/129236.html

相關(guān)文章

  • 【云極高性能計(jì)算 EPC】操作指南:安裝步驟及大文件下載指南

    摘要:主機(jī)內(nèi)置免費(fèi)的網(wǎng)盤(pán)加速功能,百度網(wǎng)盤(pán)超級(jí)會(huì)員。百度網(wǎng)盤(pán)對(duì)非超級(jí)會(huì)員限制下載速度操作指南,登錄主機(jī)。,選擇需要下載的大文件資源,下載速度可達(dá)。下載速度文件大小小時(shí)小時(shí)下載成本下載文件,若使用主機(jī)的帶寬,單次下載所需的流量費(fèi)用為元。VASP軟件官網(wǎng):[www.vasp.at]安裝步驟安裝依賴(lài)包yum -y install cmake pkgconfig yum groupinstall Deve...

    Tecode 評(píng)論0 收藏0
  • 私有云怎么搭建之智能調(diào)度

    摘要:智能調(diào)度系統(tǒng)實(shí)時(shí)監(jiān)測(cè)集群所有計(jì)算節(jié)點(diǎn)計(jì)算存儲(chǔ)網(wǎng)絡(luò)等負(fù)載信息,作為虛擬機(jī)調(diào)度和管理的數(shù)據(jù)依據(jù)。當(dāng)有新的虛擬資源需要部署時(shí),調(diào)度系統(tǒng)會(huì)優(yōu)先選擇低負(fù)荷節(jié)點(diǎn)進(jìn)行部署,確保整個(gè)集群節(jié)點(diǎn)的負(fù)載。智能調(diào)度是 UCloudStack 平臺(tái)虛擬機(jī)資源調(diào)度管理的核心,由調(diào)度模塊負(fù)責(zé)調(diào)度任務(wù)的控制和管理,用于決策虛擬機(jī)運(yùn)行在哪一臺(tái)物理服務(wù)器上,同時(shí)管理虛擬機(jī)狀態(tài)及遷移計(jì)劃,保證虛擬機(jī)可用性和可靠性。智能調(diào)度系統(tǒng)實(shí)...

    ernest.wang 評(píng)論0 收藏0
  • DBASK問(wèn)答集萃第四期

    摘要:?jiǎn)栴}九庫(kù)控制文件擴(kuò)展報(bào)錯(cuò)庫(kù)的擴(kuò)展報(bào)錯(cuò),用的是裸設(shè)備,和還是原來(lái)大小,主庫(kù)的沒(méi)有報(bào)錯(cuò),并且大小沒(méi)有變,求解釋。專(zhuān)家解答從報(bào)錯(cuò)可以看出,控制文件從個(gè)塊擴(kuò)展到個(gè)塊時(shí)報(bào)錯(cuò),而裸設(shè)備最大只支持個(gè)塊,無(wú)法擴(kuò)展,可以嘗試將參數(shù)改小,避免控制文件報(bào)錯(cuò)。 鏈接描述引言 近期我們?cè)贒BASK小程序新關(guān)聯(lián)了運(yùn)維之美、高端存儲(chǔ)知識(shí)、一森咖記、運(yùn)維咖啡吧等數(shù)據(jù)領(lǐng)域的公眾號(hào),歡迎大家閱讀分享。 問(wèn)答集萃 接下來(lái),...

    SKYZACK 評(píng)論0 收藏0
  • 私有云搭建-私有云搭建之存儲(chǔ)虛擬化

    摘要:平臺(tái)采用分布式存儲(chǔ)系統(tǒng)作為虛擬化存儲(chǔ),用于對(duì)接虛擬化計(jì)算及通用數(shù)據(jù)存儲(chǔ)服務(wù),消除集中式網(wǎng)關(guān),使客戶(hù)端直接與存儲(chǔ)系統(tǒng)進(jìn)行交互,并以多副本糾刪碼多級(jí)故障域數(shù)據(jù)重均衡故障數(shù)據(jù)重建等數(shù)據(jù)保護(hù)機(jī)制,確保數(shù)據(jù)安全性和可用性。云計(jì)算平臺(tái)通過(guò)硬件輔助的虛擬化計(jì)算技術(shù)最大程度上提高資源利用率和業(yè)務(wù)運(yùn)維管理的效率,整體降低 IT 基礎(chǔ)設(shè)施的總擁有成本,并有效提高業(yè)務(wù)服務(wù)的可用性、可靠性及穩(wěn)定性。在解決計(jì)算資源的...

    ernest.wang 評(píng)論0 收藏0
  • 斷網(wǎng)支付開(kāi)閘,知位停車(chē)發(fā)布多項(xiàng)物聯(lián)網(wǎng)停車(chē)新技術(shù)

    摘要:月日下午,阿里云聯(lián)合智芯原動(dòng)主辦以無(wú)人值守,一望而知為主題的知位停車(chē)新品發(fā)布會(huì)暨合作伙伴大會(huì),在深圳成功舉行。未來(lái),憑借阿里云強(qiáng)大的生態(tài)賦能以及智芯原動(dòng)領(lǐng)先的行業(yè)技術(shù)不斷的深度融合,知位停車(chē)創(chuàng)新科技將引領(lǐng)智慧物聯(lián)網(wǎng)停車(chē)新時(shí)代。 10月28日下午,阿里云IoT聯(lián)合智芯原動(dòng)主辦以無(wú)人值守,一望而...

    xumenger 評(píng)論0 收藏0
  • 浪潮存儲(chǔ):聯(lián)接新數(shù)據(jù)時(shí)代

    摘要:見(jiàn)證高光時(shí)刻在月日的大會(huì)上,浪潮存儲(chǔ)產(chǎn)品線(xiàn)總經(jīng)理李輝隆重發(fā)布了新一代全閃存儲(chǔ),以及自研的固態(tài)盤(pán)。殷東升表示,年贊華將加大力度,聯(lián)手浪潮存儲(chǔ)提供一攬子解決方案,滿(mǎn)足智慧金融的新需求。毫無(wú)疑問(wèn),計(jì)算產(chǎn)業(yè)正處于一個(gè)前所未有的變革期。和此前不同,新的計(jì)算形態(tài)不斷涌現(xiàn),從本地到云上,從數(shù)據(jù)中心到邊緣節(jié)點(diǎn),計(jì)算變得無(wú)處不在。與之對(duì)應(yīng)的,則是數(shù)據(jù)鋪天蓋地而來(lái),藉由實(shí)時(shí)在線(xiàn)的新型應(yīng)用,人們希望傾向于收集全生...

    Harriet666 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<