最近,有些經(jīng)常在數(shù)據(jù)中心現(xiàn)場(chǎng)工作的工程師們,對(duì)于數(shù)據(jù)中心(DC)所采用的技術(shù)是否會(huì)繼續(xù)獲得提高產(chǎn)生了很大的懷疑。本文所指的對(duì)數(shù)據(jù)中心的“改變”,實(shí)際上就是指能夠保證更恰當(dāng)?shù)哪J綉?yīng)用到數(shù)據(jù)中心。盡管工程師們都有自己的工作方式,但這種“改變”無(wú)論是對(duì)于不定期到數(shù)據(jù)中心現(xiàn)場(chǎng)工作,還是對(duì)于有固定日程安排的現(xiàn)場(chǎng)工作情形都是具有現(xiàn)實(shí)意義的。
當(dāng)然,我們現(xiàn)在會(huì)利用遠(yuǎn)程模式來(lái)處理很多方面的工作。不過(guò),實(shí)際項(xiàng)目中還是會(huì)有不少通過(guò)遠(yuǎn)程桌面操作無(wú)法完成的工作。比如,經(jīng)常會(huì)涉及到更換硬件、對(duì)線路情況進(jìn)行目視檢查、重新安裝刀片服務(wù)器、插拔調(diào)整設(shè)備組件以及偶爾會(huì)碰到讓人琢磨不透的操作系統(tǒng)安裝過(guò)程等方面的情況。盡管大多數(shù)工程人員并不介意前往數(shù)據(jù)中心親自進(jìn)行現(xiàn)場(chǎng)處理,但有時(shí)依然還是會(huì)產(chǎn)生出:這些所謂的“標(biāo)準(zhǔn)”組件究竟是什么人設(shè)計(jì)的,他們?cè)谠O(shè)計(jì)時(shí)有沒(méi)有考慮到人類的手、手指以及眼睛是存在局限性之類的想法。
經(jīng)過(guò)對(duì)這些問(wèn)題的認(rèn)真思考,本文給出了相應(yīng)的解決方案供讀者參考。這里所謂的“標(biāo)準(zhǔn)”組件,指的是19英寸機(jī)架、熱通道與冷通道、服務(wù)器進(jìn)出口、線纜以及線纜管理器、電源接口、KVM系統(tǒng)、照明以及幾乎所有其它方面的物理架構(gòu)。按照以上的觀察,如果需要從人性化角度來(lái)對(duì)設(shè)計(jì)進(jìn)行評(píng)估的話,所有這一切幾乎都需要推倒重來(lái)。唯一不需要改進(jìn)的部分可能就是非常不起眼的底板。該架構(gòu)的工作看起來(lái)顯得非常出色,但并不能認(rèn)為底板的合格就代表整個(gè)系統(tǒng)在功能方面也同樣合格。
為方便起見(jiàn),本文將所有組件的具體情況都一一羅列出來(lái),并告訴讀者可能存在問(wèn)題的地方以及相應(yīng)的解決方案。
機(jī)架結(jié)構(gòu)
盡管19英寸這一固有標(biāo)準(zhǔn)屬于無(wú)法進(jìn)行調(diào)整的基礎(chǔ)部分,但真的就沒(méi)有人想過(guò)到應(yīng)該對(duì)機(jī)架內(nèi)部結(jié)構(gòu)進(jìn)行一下調(diào)整,讓標(biāo)準(zhǔn)架構(gòu)(1U、2U、4U等)系統(tǒng)的實(shí)際安裝工作不再困難無(wú)比嗎?舉例來(lái)說(shuō),為了實(shí)現(xiàn)電源、網(wǎng)絡(luò)、SAN等線路直接連進(jìn)機(jī)架的目標(biāo),我們可以將連接器順著邊角兩側(cè)安裝。這樣的話,我們?cè)诖蜷_(kāi)機(jī)柜門時(shí),就再也不用經(jīng)受無(wú)數(shù)線路瞬時(shí)直接映入眼簾的嚴(yán)峻考驗(yàn)了。由于電線“架子”的限制讓連接系統(tǒng)的具體操作變得極為困難,因此,更恰當(dāng)?shù)母倪M(jìn)措施應(yīng)該是選擇插片式連接。
此外,為了讓工作人員在工作的時(shí)可以看清楚手里正在進(jìn)行的操作,設(shè)計(jì)者需要在機(jī)柜中安裝幾盞照明用的LED燈。燈具可以采用冰箱照明模式,即在門打開(kāi)時(shí)直接亮起,關(guān)閉時(shí)馬上熄滅。由于頂燈會(huì)導(dǎo)致頂部系統(tǒng)投下陰影,所以并不是合適的選擇。為了確保機(jī)柜從上到下由內(nèi)及外的所有部分都可以看清,就應(yīng)當(dāng)將照明燈垂直安裝在機(jī)架前部與后部?jī)?nèi)側(cè)的邊緣位置上。
散熱系統(tǒng)
盡管這樣的設(shè)計(jì)理論上確實(shí)可以有效發(fā)揮作用,但對(duì)于現(xiàn)場(chǎng)人員來(lái)說(shuō),卻意味著只能選擇呆在熱通道或者冷通道中工作。很明顯,不論所選擇的是哪一邊,工作人員的實(shí)際感受都不會(huì)太好。從某種程度上,空氣交換模式的真實(shí)效果將遠(yuǎn)好于空氣冷卻模式。換句話說(shuō),利用流動(dòng)的空氣帶走機(jī)架所產(chǎn)生的熱量才屬于更有效的冷卻方式。在最初設(shè)計(jì)的時(shí)候,機(jī)架就不應(yīng)該使用效率低下的散熱器。它只會(huì)導(dǎo)致產(chǎn)生的熱量繼續(xù)存在系統(tǒng)內(nèi)部以及周圍環(huán)境中。此外,相比之下,水平方向的風(fēng)扇要比垂直方向的風(fēng)扇能夠帶走更多的熱量。
為了讓風(fēng)扇的散熱效果更好,還應(yīng)當(dāng)縮短風(fēng)道的長(zhǎng)度,以避免風(fēng)扇只能在一端發(fā)揮作用,而另一端不能有效覆蓋的情況發(fā)生。更通俗的比喻就是,我們應(yīng)該建立起一條空氣“河流”來(lái);這樣的話,冷卻空氣就可以通過(guò)風(fēng)扇源源不斷地涌入,而熱空氣則能夠利用風(fēng)道前往排氣扇。
機(jī)柜改造
至于機(jī)架系統(tǒng)方面,比較實(shí)用的設(shè)計(jì)是一些能夠?yàn)樯喜恳苿?dòng)提供方便的措施。畢竟,在一臺(tái)服務(wù)器的上方安裝另一臺(tái)系統(tǒng)是一項(xiàng)非常麻煩的工作。由于整個(gè)移動(dòng)過(guò)程會(huì)非常困難,因此需要耗費(fèi)大量時(shí)間來(lái)慢慢地逐步進(jìn)行調(diào)整。這里,首先要做的工作就是快速打開(kāi)手?jǐn)Q螺絲或插銷,將它從機(jī)架內(nèi)部拉出來(lái)。接下來(lái),為了可以便于卸下頂蓋并進(jìn)行必要的維護(hù),還不得不將系統(tǒng)拉出到幾乎脫離機(jī)架的程度。并且,在從機(jī)柜前端拉出服務(wù)器后,還要繞到后面才能斷開(kāi)電源。如果機(jī)架在背面或者旁邊設(shè)置有快速通/斷模塊,系統(tǒng)在機(jī)架中的移動(dòng)就可以變得更方便,從而實(shí)現(xiàn)移動(dòng)一次就能夠完成所有相關(guān)工作的目標(biāo)。
另外,將所有需要進(jìn)行更換的部件都調(diào)整到硬件設(shè)備內(nèi)部更方便處理的位置,應(yīng)該是一個(gè)可行性的設(shè)計(jì)?想象一下,如果我們可以從系統(tǒng)前端輕松地移除硬盤的話,將會(huì)是一件多么美妙的體驗(yàn)啊。而現(xiàn)在,為了完成這項(xiàng)工作,就需要拔除內(nèi)存、固態(tài)磁盤以及中央處理器這些重重阻礙。
降噪措施
靜音風(fēng)扇已經(jīng)出現(xiàn)。但遺憾的是,它們并沒(méi)有得到廣泛的普及;但數(shù)據(jù)中心發(fā)出的噪音卻是那么的嘈雜,以至于當(dāng)工作人員之間需要進(jìn)行交流時(shí)必須要大聲喊話。就這點(diǎn)而言,我們有理由認(rèn)為機(jī)架與服務(wù)器都應(yīng)該選擇使用靜音風(fēng)扇。
安全性
還有哪些地方會(huì)比數(shù)據(jù)中心更安全呢?答案估計(jì)就剩下銀行或者存在大量現(xiàn)金交易的地方。盡管數(shù)據(jù)中心內(nèi)部不會(huì)存在現(xiàn)金交易(通常情況下),也還是需要采取一些專業(yè)級(jí)別的安全措施。
在進(jìn)入數(shù)據(jù)中心或者內(nèi)部工作區(qū)域時(shí),工作人員就應(yīng)當(dāng)佩戴上一枚工作徽章。它的內(nèi)部將包含有需要訪問(wèn)設(shè)備的實(shí)際編號(hào)以及相關(guān)工作任務(wù)的具體描述。這樣設(shè)置就表示,我們只能打開(kāi)需要訪問(wèn)的機(jī)架。在系統(tǒng)感應(yīng)到徽章進(jìn)入工作區(qū)域的時(shí)候,安置相關(guān)系統(tǒng)的對(duì)應(yīng)機(jī)架就可以解除鎖定。這種做法可以讓安全性變得更高,防止系統(tǒng)因?yàn)橐馔馐录淮鄹摹⒊霈F(xiàn)中斷甚至遭到破壞的情況。
現(xiàn)實(shí)世界中,系統(tǒng)名稱過(guò)于相似、機(jī)架位置安放錯(cuò)誤以及粗心大意都是導(dǎo)致物理服務(wù)器出現(xiàn)意外中斷的重要原因。因此,只有部署了恰當(dāng)?shù)轿坏陌踩胧瑪?shù)據(jù)中心才能實(shí)現(xiàn)讓訪問(wèn)者只針對(duì)需要處理的指定系統(tǒng)這一目標(biāo)。如果徽章中的信息出現(xiàn)錯(cuò)誤導(dǎo)致對(duì)應(yīng)位置產(chǎn)生誤差,就需要讓技術(shù)人員對(duì)服務(wù)器名稱以及機(jī)架位置進(jìn)行重新驗(yàn)證。
對(duì)于數(shù)據(jù)中心管理者來(lái)說(shuō),該模式還可以實(shí)時(shí)顯示出內(nèi)部活動(dòng)人員的數(shù)量、所處位置、在做的操作以及操作原因等方面的具體信息。而現(xiàn)在,管理者并不能知道哪臺(tái)系統(tǒng)正在被訪問(wèn),為什么或者是否有相關(guān)工作的授權(quán)。通過(guò)這種方式,一旦技術(shù)人員進(jìn)入相關(guān)維修區(qū),對(duì)應(yīng)的指示燈就會(huì)點(diǎn)亮并通知保安與管理者工作正在進(jìn)行中。所以,相信這將是數(shù)據(jù)中心向零意外停機(jī)目標(biāo)邁進(jìn)的重要一步。
硬件審核機(jī)制
按照個(gè)人看法,為防止需要使用標(biāo)準(zhǔn)計(jì)算機(jī)硬件的緊急情況出現(xiàn),所有數(shù)據(jù)中心都應(yīng)該為技術(shù)人員準(zhǔn)備必要的應(yīng)急用品。技術(shù)人員還應(yīng)當(dāng)對(duì)手機(jī)、筆記本電腦、救援車、工具箱以及物理維護(hù)所必須的其它設(shè)備進(jìn)行全面登記。所有外部計(jì)算設(shè)備都不應(yīng)該容許使用數(shù)據(jù)中心的內(nèi)部網(wǎng)絡(luò)。如果有人違規(guī)操作,就將給數(shù)據(jù)中心的安全性帶來(lái)巨大風(fēng)險(xiǎn)。眾所周知,外部硬件通常是病毒入侵的重要方式,而視頻與照片帶來(lái)的安全風(fēng)險(xiǎn),以及工具導(dǎo)致設(shè)備出現(xiàn)問(wèn)題都是非常危險(xiǎn)并且很難有效控制的因素。
實(shí)際上,我們的目標(biāo)并不是希望數(shù)據(jù)中心的實(shí)際工作變得更困難,而是希望整個(gè)操作過(guò)程可以變得更加輕松。這也正是上面給出這些解決方案來(lái)達(dá)到效率最大化的根本所在。舉例來(lái)說(shuō),如果你剛走到數(shù)據(jù)中心修復(fù)系統(tǒng),而機(jī)架旁邊正在運(yùn)行的系統(tǒng)恰巧剛出現(xiàn)了停機(jī)故障,后果很可能是其它人會(huì)直接把你當(dāng)做造成這個(gè)問(wèn)題的主因。而通過(guò)以上的方案對(duì)數(shù)據(jù)中心進(jìn)行合理規(guī)劃,就不會(huì)再發(fā)生這種令人尷尬的事情了。

