通過(guò)分析故障時(shí)間點(diǎn)數(shù)據(jù)庫(kù)ASH、AWR報(bào)告、OSW日志信息:
1、 故障期間主機(jī)CPU資源高消耗、RUN隊(duì)列持續(xù)增高
2、 故障時(shí)間段數(shù)據(jù)庫(kù)狀態(tài)分析
故障時(shí)間段數(shù)據(jù)庫(kù)語(yǔ)句執(zhí)行情況:
故障時(shí)間段數(shù)據(jù)庫(kù)TopSQL信息:
TopSQL語(yǔ)句信息:
略
異常時(shí)間段fyh80hwbv7gna、5vsxm0s8ps2j6語(yǔ)句高并發(fā)情況:
同比8月29日TopSQL語(yǔ)句執(zhí)行次數(shù)突增近10倍:
總結(jié):本次故障原因?yàn)椤癴yh80hwbv7gna”、“5vsxm0s8ps2j6”語(yǔ)句異常高并發(fā)調(diào)用、導(dǎo)致數(shù)據(jù)庫(kù)主機(jī)CPU資源高消耗,數(shù)據(jù)庫(kù)服務(wù)響應(yīng)時(shí)間延長(zhǎng)。
解決方案:
本次解決方案分為兩個(gè)方面:
1. 針對(duì)異常SQL語(yǔ)句進(jìn)行執(zhí)行性能優(yōu)化;
優(yōu)化分析:
異常期間fyh80hwbv7gna語(yǔ)句執(zhí)行2300次,平時(shí)10次 "分析和優(yōu)化:分頁(yè)查詢(xún)總條數(shù),1.SE_XX系列表統(tǒng)計(jì)信息不對(duì) se_pretask_info查詢(xún)條件like全通配導(dǎo)致執(zhí)行計(jì)劃基數(shù)估算不準(zhǔn)(實(shí)際小于10條,實(shí)際返回5000次,應(yīng)該走NESTED LOOPS的走了HASH JOIN)。
優(yōu)化建議:
收集SE_XX系列表統(tǒng)計(jì)信息并使用SQL PROFILE綁定,邏輯讀436w 執(zhí)行時(shí)間16s,高頻運(yùn)行會(huì)導(dǎo)致CPU使用滿(mǎn) ,同時(shí)存在大量分頁(yè)語(yǔ)句匯總,未使用綁定變量。
優(yōu)化效果:
fyh80hwbv7gna語(yǔ)句邏輯讀:436w--->5800 執(zhí)行時(shí)間:16s-->0.3s 效率提升50倍以上。
gyk0u596xt7c7語(yǔ)句邏輯讀:363w——>25000,執(zhí)行時(shí)間:11s—》1.6s,效率提升6倍以上。
2. 核查應(yīng)用運(yùn)行情況,確認(rèn)異常調(diào)用根本原因。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/130242.html
摘要:當(dāng)奧巴馬贏得美國(guó)總統(tǒng)大選時(shí),頁(yè)面活躍度刷新了記錄。對(duì)于每一個(gè)成因,都應(yīng)制定相應(yīng)的預(yù)防措施,以減輕大規(guī)模事故。這種故障會(huì)通過(guò)許多層面進(jìn)入系統(tǒng)服務(wù)中,導(dǎo)致系統(tǒng)故障的發(fā)生。 作者介紹:Ben Maurer是Facebook的網(wǎng)絡(luò)基礎(chǔ)團(tuán)隊(duì)的技術(shù)領(lǐng)先者,主要負(fù)責(zé)整個(gè)Facebook面向用戶(hù)產(chǎn)品的性能和可靠性。Ben于2010年正式加入Facebook,基礎(chǔ)設(shè)施團(tuán)隊(duì)的成員。在加入Facebook之...
摘要:儀表板是一個(gè)附加組件,它能提供集群上運(yùn)行的資源的概述信息??梢院苋菀椎貏?chuàng)建圖形,并且把它們合并稱(chēng)儀表板,而這些儀表板由一個(gè)強(qiáng)大的身份驗(yàn)證和授權(quán)層保護(hù),它們還可以和其他儀表板進(jìn)行共享而不需要訪(fǎng)問(wèn)服務(wù)器本身。 介 紹 Kubernetes在Github上擁有超過(guò)4萬(wàn)顆星,7萬(wàn)以上的commits,以及像Google這樣的主要貢獻(xiàn)者。Kubernetes可以說(shuō)已經(jīng)快速地接管了容器生態(tài)系統(tǒng),成...
摘要:谷歌在萬(wàn)臺(tái)機(jī)器的區(qū)間內(nèi),他們中位數(shù)集群尺寸大約在萬(wàn)臺(tái)機(jī)器,也有一些更大的。谷歌稱(chēng),一個(gè)單獨(dú)的其專(zhuān)有的分配集群的首腦在一個(gè)谷歌對(duì)于集群的術(shù)語(yǔ)內(nèi)能管理成千上萬(wàn)臺(tái)機(jī)器。 【文章簡(jiǎn)介】本文討論了單個(gè)容器所無(wú)法解決的問(wèn)題和局限性,并介紹了容器編排的必要性和復(fù)雜性及常用工具的比較,提到了諸如Kubernetes、Mesos等容器管理工具。 就像之前已被證實(shí)的那樣,要在一個(gè)機(jī)器上創(chuàng)建成千上萬(wàn)個(gè)容器還...
摘要:資源包括什么內(nèi)存磁盤(pán)網(wǎng)絡(luò)文件描述符外部緩存數(shù)據(jù)庫(kù)等,編程語(yǔ)言是如何管理資源的合理的算法架構(gòu)保證了資源的合理使用,分配內(nèi)存使用網(wǎng)絡(luò)等等。 在云計(jì)算時(shí)代,開(kāi)發(fā)和運(yùn)維的結(jié)合變得越來(lái)越重要。在DIFF論壇第一期,前新浪SAE運(yùn)維主管,鄭志勇,分享了《一個(gè)開(kāi)發(fā)眼中的運(yùn)維》根據(jù)自己從開(kāi)發(fā)人員轉(zhuǎn)型運(yùn)維之后的心得,談如何把在開(kāi)發(fā)上的運(yùn)用抽象思維方式運(yùn)用到運(yùn)維領(lǐng)域。 showImg(http://se...
摘要:且過(guò)多的從服務(wù)器,當(dāng)業(yè)務(wù)量大時(shí)對(duì)主服務(wù)器的網(wǎng)卡也是一定的挑戰(zhàn)。我們可以通過(guò)對(duì)集群的監(jiān)控信息來(lái)了解是什么影響了數(shù)據(jù)庫(kù)性能。 關(guān)于數(shù)據(jù)庫(kù)性能的故事 面試時(shí)多多少少會(huì)講到數(shù)據(jù)庫(kù)上的事情,你對(duì)數(shù)據(jù)庫(kù)的掌握如何?,什么時(shí)候最考驗(yàn)數(shù)據(jù)庫(kù)的性能,答應(yīng)主要方面上講就是大數(shù)據(jù)量的讀寫(xiě)時(shí),而電商類(lèi)的大促活動(dòng)就是考驗(yàn)各自的數(shù)據(jù)庫(kù)性能的時(shí)候啦。 對(duì)于web服務(wù)器而言,數(shù)據(jù)量大時(shí),我們可以簡(jiǎn)單的通過(guò)橫向擴(kuò)展來(lái)減...
閱讀 1356·2023-01-11 13:20
閱讀 1707·2023-01-11 13:20
閱讀 1215·2023-01-11 13:20
閱讀 1906·2023-01-11 13:20
閱讀 4165·2023-01-11 13:20
閱讀 2757·2023-01-11 13:20
閱讀 1402·2023-01-11 13:20
閱讀 3671·2023-01-11 13:20