摘要:作者浪潮信息技術(shù)研發(fā)部吳海波背景月日,字節(jié)跳動宣布全球首批基于云固件的服務(wù)器實現(xiàn)批量化上線運行。指是提出的對目前固件的開源優(yōu)化解決方案。已被基金會接受。
作者: 浪潮信息技術(shù)研發(fā)部 吳海波
背景
9 月 15 日,字節(jié)跳動宣布全球首批基于LinuxBoot云固件的x86服務(wù)器實現(xiàn)批量化上線運行【1】。該產(chǎn)品固件由字節(jié)跳動系統(tǒng)技術(shù)與工程團隊(STE團隊)、浪潮信息技術(shù)研發(fā)團隊以及Intel聯(lián)合開發(fā)實現(xiàn)。
產(chǎn)品采用UEFI Minplatform(Minimum?Platform的縮寫)進行芯片初始化和最小化的平臺初始化功能,將其它大部分傳統(tǒng)UEFI固件初始化的流程代碼移植到LinuxBoot模塊中進行實現(xiàn)。通過精簡UEFI 功能模塊,在底層固件模塊中引入Linux軟件生態(tài),面向云平臺原生需求開發(fā)云固件解決方案,使得服務(wù)器系統(tǒng)固件更易于開發(fā)和維護。
將Linux生態(tài)引入到系統(tǒng)固件中是目前開源固件技術(shù)發(fā)展的一種趨勢,本文簡單介紹了浪潮服務(wù)器在開源系統(tǒng)固件方面的創(chuàng)新實踐。
目前系統(tǒng)固件問題
在服務(wù)器領(lǐng)域,經(jīng)常會聽到“固件”這個名詞,什么是固件呢?
“固件”就是存儲在EEPROM或者FLASH中的程序。它是在電子硬件系統(tǒng)最基礎(chǔ)最底層的軟件,在系統(tǒng)上電后,首先要執(zhí)行的程序就是固件。固件負責完成硬件的初始化,讓電子設(shè)備系統(tǒng)處于一個正常的狀態(tài),然后才能讓上層的操作系統(tǒng)或者應(yīng)用軟件正常使用。
對于服務(wù)器領(lǐng)域,BIOS是服務(wù)器最重要的固件,BIOS負責完成CPU、內(nèi)存和外設(shè)的初始化,將硬件系統(tǒng)的抽象信息報告給操作系統(tǒng),操作系統(tǒng)才能正常使用硬件。
目前服務(wù)器的BIOS均采用UEFI/Tiano的方案[2],但是隨著目前云服務(wù)和數(shù)據(jù)中心的快速發(fā)展,UEFI BIOS也逐漸顯露了一些問題:
(1)隨著技術(shù)的發(fā)展,UEFI越來越復雜,門檻高,在UEFI專業(yè)領(lǐng)域的開發(fā)人員相比其他軟件開發(fā)而言非常稀少。
(2)目前大多都是服務(wù)器廠商在購買BIOS軟件廠商的UEFI BIOS代碼基礎(chǔ)上進行增強開發(fā)。 不同BIOS軟件廠商提供代碼風格和架構(gòu)差別很大,一個服務(wù)器廠商的UEFI BIOS開發(fā)人員需要熟悉多套代碼;另外,UEFI BIOS代碼結(jié)構(gòu)和內(nèi)容有時還會隨著服務(wù)器CPU的更新升級發(fā)生較大變動;這些都增加了BIOS固件的開發(fā)難度。
(3)由于UEFI BIOS固件中包含了服務(wù)器廠商和IBV(獨立BIOS)廠商的知識產(chǎn)權(quán),所以大部分BIOS代碼都是閉源的,通過二進制的形式分發(fā)給服務(wù)器廠商使用。閉源會帶來三方面的問題:i) 如果BIOS固件出現(xiàn)問題,只能讓廠商來解決,這可能延長故障處理時間。ii) 由于代碼是閉源的,對客戶而言也隱藏著一些安全風險。Iii) 代碼閉源,也將導致用戶難以增添定制化功能,無法滿足當前云環(huán)境下的快速迭代更新的需求。
綜上所述,目前UEFI生態(tài)環(huán)境面臨著開發(fā)人員短缺,代碼不夠開放,開發(fā)難度大,隱藏著安全風險等問題。
開源固件解決方案
為解決當前UEFI BIOS固件的問題,尤其是針對當前云環(huán)境下的應(yīng)用,目前開源社區(qū)提出了多種優(yōu)化解決方案,包括Minplatform[3,4],CoreBoot[5]和LinuxBoot[6]等;主要是希望通過引入開源的方式來解決和優(yōu)化目前UEFI BIOS固件遇到的問題。下面分別簡單介紹下這些方案的內(nèi)容。
Minplatform
Minplatform指Mininum Platform, 是Intel 提出的對目前UEFI固件的開源優(yōu)化解決方案。如下圖1所示,Minplatform定義了平臺啟動的多個BootStage,通過BootStage的配置實現(xiàn)了UEFI BIOS開發(fā)過程中依據(jù)不同需求選擇配置相應(yīng)的功能模塊實現(xiàn)完整UEFI BIOS的最終解決方案。
圖1 Minplaform定義的多個BootStage
在具體的實現(xiàn)上,如圖2所示,Minplatform是依賴于UEFI Tiano EDK2[7]的開源代碼,以搭積木的方式逐漸添加系統(tǒng)固件的功能,最終實現(xiàn)完整的BIOS固件。Minplatfom相比當前全功能的UEFI BIOS而言,先是一個做減法的操作,能快速啟動。它定義了UEFI BIOS的最小平臺代碼;然后才做加法,根據(jù)不同需求來增加功能,繼而實現(xiàn)較完整的UEFI BIOS。通過這種方式有效的減少了UEFI固件開發(fā)難度,增加功能代碼的復用,是對當前UEFI BIOS固件開發(fā)的一種優(yōu)化方案。
圖2 MinPlatform實現(xiàn)
由于Minplatform是基于UEFI Tiano EDK2的開源實現(xiàn),從BIOS代碼廠商那購買UEFI BIOS,服務(wù)器廠商可以直接將功能代碼做簡單移植就可以作為Minplatform。這種方案對目前服務(wù)器廠商而言影響最小,因為已經(jīng)積累了豐富的UEFI開發(fā)經(jīng)驗。
CoreBoot
CoreBoot的前身是LinuxBios,是Ron Minnich于上世紀發(fā)起的項目,一種Linux代碼風格的開源固件解決方案,跟UEFI固件架構(gòu)完全不同。CoreBoot的目標是做最小的操作來完成硬件功能初始化,盡快的啟動到操作系統(tǒng)中。
圖3 CoreBoot的發(fā)展
UEFI的平臺啟動初始化流程為SEC->PEI->DXE->BDS->TLS->RT這幾個階段,其中SEC是指安全驗證階段,PEI是指EFI前期初始化階段,DXE是驅(qū)動執(zhí)行環(huán)境階段,BDS是指啟動設(shè)備選擇階段,TSL是指操作系統(tǒng)加載前期階段,RT是指運行時階段。
而CoreBoot將啟動流程分為bootblock->romstage->ramstage->payload這幾個主要階段, 如下圖4所示。其中booblock是匯編編寫的,主要為C運行環(huán)境做準備;romstage階段主要是來初始化內(nèi)存和一些早期初始化操作;ramstage階段主要執(zhí)行系統(tǒng)設(shè)備的初始化,比如pcie初始化,創(chuàng)建ACPI表等;到了payload階段CoreBoot的初始化操作實際上已經(jīng)完成,payload可以作為最終的Bootloader來加載操作系統(tǒng)。
圖4 CoreBoot平臺初始化流程
相比UEFI架構(gòu)的代碼,CoreBoot代碼跟Linux風格類似,完全開源, 它結(jié)合CPU廠商的芯片初始化二進制包(FSP/ATF/AGASA等)一起使用,來完成封閉的芯片初始化功能,同時可以集成Tianocore、LinuxBoot等各種payload,來滿足各種需求。
目前CoreBoot主要在Chromebook等PC機器上應(yīng)用,由于CoreBoot的開源以及Linux風格的代碼架構(gòu)的原因, 以及在Linux領(lǐng)域的人才優(yōu)勢,也在推進支持使用CoreBoot作為服務(wù)器的UEFI BIOS的替代選擇。
LinuxBoot
LinuxBoot來源于NERF(Non-Extensible Reduced Firmware)項目,是用Linux作為固件的一部分的解決方案,它不是一個完整的固件方案,無法獨立完成所有的硬件初始化功能,必須依賴于UEFI 、CoreBoot等完成CPU和內(nèi)存初始化,然后使用Linux Kernel來完成外設(shè)初始化和啟動操作系統(tǒng)的功能。
圖5 LinuxBoot架構(gòu)圖
對于當前服務(wù)器固件解決方案UEFI BIOS而言,LinuxBoot主要是通過開源的Linux Kernel來取代UEFI DXE和BDS階段的功能,比如通過Linux下的開源driver來取代UEFI下的設(shè)備驅(qū)動,用Linux完備的網(wǎng)絡(luò)功能取代UEFI的。UEFI結(jié)合LinuxBoot可以減少UEFI代碼和開發(fā)難度。
LinuxBoot已被 Linux 基金會接受。目前在服務(wù)器領(lǐng)域,它作為固件部分的方案得到了許多廠商的支持,但是這種方案要求有較強的Linux開發(fā)能力,否則難以享受LinuxBoot帶來的優(yōu)勢。
固件發(fā)展趨勢
雖然目前基于UEFI的BIOS系統(tǒng)固件還是絕對的主流,但是UEFI BIOS面臨的閉源、安全和開發(fā)難問題也是無法回避的問題。尤其是對于具有大型數(shù)據(jù)中心的大型互聯(lián)網(wǎng)服務(wù)提供商來說,如何將符合自己業(yè)務(wù)場景需求的功能添加到固件中,如何實現(xiàn)系統(tǒng)固件的快速開發(fā)和維護,從而減少因為固件維護導致的停機時間,如何保證固件代碼的安全可靠, 如何具備系統(tǒng)固件開發(fā)能力和掌控能力,都需要考慮。
相比服務(wù)器廠商,大型互聯(lián)網(wǎng)服務(wù)提供商,擁有大量的Linux方面的開發(fā)人才,所以希望引入LinuxBoot和CoreBoot這些基于Linux或類似的固件方案來增加在服務(wù)器固件上的技術(shù)掌控能力。另外通過開源的固件解決方案,也能夠減少UEFI代碼中隱藏的代碼安全風險,加快服務(wù)器固件開發(fā),減少服務(wù)器系統(tǒng)固件的維護時間。
圖6 服務(wù)器固件 Bootloader各方案對比(引自字節(jié)跳動STE團隊)
這也要求服務(wù)器廠商需要提前了解這些客戶的需求,并與之深入合作來保持在未來固件發(fā)展中重要地位。在構(gòu)建智慧時代的“新基建”-智算中心的過程中,浪潮秉承著開放標準、集約高效和普適普惠的理念,以穩(wěn)健、實干的態(tài)度,積極主動地與用戶、以及上下游合作伙伴一道,共同推動開放計算生態(tài)健康有序的發(fā)展。
感謝黃家明、吳安、葉毓睿等對本篇文章的貢獻。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/122478.html
摘要:華為云華為云在云原生這場游戲中,最具競爭力的玩家之一。年,金山云在云原生領(lǐng)域推出了三款重磅產(chǎn)品星曜裸金屬服務(wù)器云服務(wù)器和云盤。在線上智博會上,浪潮云發(fā)布了經(jīng)過全新迭代升級的浪潮云,進一步提升平臺云原生服務(wù)能力。面對數(shù)字時代復雜系統(tǒng)的不確定性,傳統(tǒng)的 IT 應(yīng)用架構(gòu)研發(fā)交付周期長、維護成本高、創(chuàng)新升級難,煙囪式架構(gòu),開放性差、組件復用度低,這些都成為了企業(yè)業(yè)務(wù)快速增長的瓶頸。而云原生以其敏捷、...
摘要:月日,在風云際會百度云計算戰(zhàn)略發(fā)布會上,百度云計算事業(yè)部總經(jīng)理劉煬正式發(fā)布智能物聯(lián)網(wǎng)平臺天工。為解決上述問題,百度云計算推出了天工智能物聯(lián)網(wǎng)平臺,助力行業(yè)跨越鴻溝,實現(xiàn)產(chǎn)業(yè)升級。? 《天工開物》是世界上第一部關(guān)于農(nóng)業(yè)和手工業(yè)生產(chǎn)的綜合性著作,強調(diào)人類與自然的協(xié)調(diào)。7月13日,在2016風云際會百度云計算戰(zhàn)略發(fā)布會上,百度云計算事業(yè)部總經(jīng)理劉煬正式發(fā)布智能物聯(lián)網(wǎng)平臺——天工。秉承天工之理念,...
摘要:德邦快遞創(chuàng)始于年,從專于傳統(tǒng)零擔業(yè)務(wù)到現(xiàn)在全面發(fā)力大件快遞,業(yè)務(wù)量正處于高速增長中。網(wǎng)易云輕舟微服務(wù)是圍繞應(yīng)用和微服務(wù)打造的一站式平臺,幫助用戶快速實現(xiàn)易接入易運維的微服務(wù)解決方案。 歡迎訪問網(wǎng)易云社區(qū),了解更多網(wǎng)易技術(shù)產(chǎn)品運營經(jīng)驗。 2018年7月31日,由杭州市政府、賽迪以及網(wǎng)易主辦的2018中國杭州云創(chuàng)大會于杭州國際博覽中心如期舉辦,大會以開放·生態(tài)·賦能為主題,匯聚行業(yè)領(lǐng)袖、技...
摘要:在德國漢諾威舉行的國際消費電子信息及通信博覽會期間,華為展示了基于分布式云存儲的技術(shù)創(chuàng)新,旨在讓更多企業(yè)享受到云帶來的高效便捷,加速數(shù)字化轉(zhuǎn)型。自年發(fā)布第一款分布式存儲以來,華為分布式存儲已經(jīng)規(guī)模應(yīng)用于全球超過家行業(yè)客戶。在德國漢諾威舉行的2018國際消費電子信息及通信博覽會(CEBIT 2018)期間,華為展示了基于分布式云存儲的技術(shù)創(chuàng)新,旨在讓更多企業(yè)享受到云帶來的高效便捷,加速數(shù)字化轉(zhuǎn)...
閱讀 2781·2021-10-14 09:42
閱讀 838·2021-10-11 10:57
閱讀 784·2019-08-30 15:54
閱讀 1927·2019-08-30 13:50
閱讀 1693·2019-08-30 11:19
閱讀 943·2019-08-29 12:38
閱讀 1435·2019-08-26 11:51
閱讀 1401·2019-08-26 10:48