1. Overview CPU在C0状态下有两种手段降低功耗的方法,其一是之前介绍过的P-state,另一个就是T-state。T-sate全称就是Processor Throttling States,它为OSPM提供了一种通过降低Processor Performance进而降低系统负载和温度的能力,听上去可能和P-state很像,其实是有区别的,P-state通过调整CPU VID电压进而影响CPU的工作频率的方式调整系统系能,而T-state则是通过调整单位时间内CPU Clock On /(Clock On + Clock Off)的时间(也即Clock On工作占整个CPU工作时间的占空比)的方式 ,影响系统的功耗和温度。
二、應用程式服務 (Application SLA) :
尖峰負載服務品質保證服務 (Peak Load Service Quality Guaranteed Service)。使用者可透過MCloud環境提供服務 (例如網站服務),並設定服務支品質要求(QoS),MCloud會提供動態配置資源以保證該服務品質要求。
( http://www.syscom.com.tw/ePaper_Content_EPArticledetail.aspx?id=176&EPID=172&j=4&HeaderName=%E7%A0%94%E7%99%BC%E6%96%B0%E8%A6%96%E7%95%8C )
這個問題是類似於電網供需不匹配的問題,和“需求響應”機制,在這方面是類似上述的解決方案。然而,一個解決方案 - 儲能 - 這是正常的電網用於擴增的需求響應的有效性已經在數據中心環境中很少探討。儲能可用於:(一)交易,甚至沒有要求其他反應機制(時間/空間),其中有性能方面的後果,(二)補充現有機制,以提高其療效,在滿足應用程序SLA短/小功率尖峰,(三)提供補救解決方案,即使他們是暫時的,當其他機制可能無法找到可行的方案,以滿足應用程序SLA。
此外,在電網儲能可能是一個昂貴的主張不同,數據中心已經有內置在UPS單元來處理電力中斷的形式存儲 - 我們可以挖掘到這些緊急處理沒有撞擊的可用性任務嗎?
UPS是不间断电源(uninterruptible power system)的英文简称,是能够提供持续、稳定、不间断的电源供应的重要外部设备。
在线式UPS结构较复杂,但性能完善,能解决所有电源问题。如四通PS系列,其显著特点是能够持续零中断地输出纯净正弦波交流电,能够解决尖峰、浪涌、频率漂移等全部的电源问题;由于需要较大的投资,通常应用在关键设备与网络中心等对电力要求苛刻的环境中。
服務器級別的UPS,納入與電源時,可以幫助消除雙轉換的需求和相關的能源損失。我們假設服務器級別的UPS單元,雖然我們的很多想法,也將適用於其他配置。
在一般情況下,UPS電池有助於減少/帽功耗及以上水平,它們被放置在電源層次。
當使用電池超出了他們原來的角色,我們必須確保數據中心的電源可用性(功利中斷),以及電池的正常壽命為鉛酸(3-5歲)不受到損害。由於UPS設備主要是過渡性的設備,暫時處理負載,直到柴油發電機組開始(大約需要15-30秒),我們能夠利用我們的目的,他們為一兩分鐘,而仍然留足夠的充電可用性的目的。
我們開發的實驗樣機,8個人與單位的UPS的服務器和落實七個控制啟發式。
我們研究中的幾種有代表性的有特色的數據中心工作負載的情況下的緊急情況:
(一)TPC-W和在SPECjbb基於服務器的負載峰值(例如,閃存人群),
(二)一個MapReduce的應用程序,其中的地圖相產生的緊急情況下從工作量介紹了功率峰值大大高於降低相位,
(三)流媒體服務器處理功率尖峰造成一股新的連接,導致現有流的緊張,
(四)1多道的GPU+病毒掃描應用程序對捆綁到特定的一組服務器(遷移是不是一種選擇)一起運行時介紹了高功耗要求他們時間間隔。
我們認為,根據配置的不同程度,表明本身的電池可以維持短期的突發事件(約10-20分鐘,我們的原型)。較長的突發事件(30分鐘或以上),需要遷移當地節流以來持續傷害性能。
另一方面,移民的性能開銷使得它不太縮短緊急情況下的吸引力。我們的電池解決方案,與移民一起,提供一個無縫的橋樑,橫跨這些時間的頻譜,並能減少這些中間期限的性能影響。
在大多數情況下,電池為主的啟發式,這些旋鈕,幫助我們在理論界的10-20%。
基本的想法是利用所有組件/服務器同時出現高峰電力需求的可能性很低。
-------------------------------------------------------------------
我們現有工作量感知反應機制分為兩大類:時間和空間。時空的機制,調整內部服務器資源使用的利率。由於資源使用(尤其是CPU)的速度會影響功耗,它可以用來作為需求響應旋鈕。
兩種常見的顳機制包括:
(一)調度推遲一些非緊急時期的高峰負荷,
(二)用人電源狀態 - 動態電壓和頻率縮放(DVFS),時鐘節流,甚至睡眠/關機狀態。
空間機構直接/超負荷遷移服務器和/或地區的數據中心,其功率預算餘量。
在這裡,我們再考慮兩大戰略:
(一)負載重定向/遷移/整合到一個或多個服務器在C級的層次,讓一些在C服務器被關閉/放緩。
(二)負荷運動/遷移到一個或多個服務器在數據中心(外)增加的負載餘量,其他地方。
許多現有的技術,負載平衡/不平衡能量/功率減少這一類下降。
可以實現這種負荷運動
(一)在許多基於網絡的服務請求重定向
(二)“容錯”應用程序檢測到服務器不可用,可用的服務器之間的自動平衡,
(三)動態過程/ VM遷移。
另一方面,空間技術可以長時間高負荷工作,因為他們可以有足夠的餘量要求移動到數據中心的地區。
然而,這些技術也有其局限性:
(一)他們不到時間的機制,這意味著他們對自己在處理緊急情況的不足,敏捷。緊急情況的反應,可以很長一段時間,其間時間的機制,必須依靠封頂功耗,使它們只適合長時間的緊急情況;
(二)遷移可以是昂貴的,這取決於應用程序的狀態,需要遷移。這不僅可以在遷移過程中(這可能需要幾分鐘)和遷移後的抗衝擊性能(由於所在地損失),但也可以暫時提高功率有關服務器的抽獎;
(三)他們需要淨空,其他地方的數據中心,這可能並不總是可用(有時是不可取的,由於行政區域界線);
(iv)不適合所有的應用程序遷移,因為他們可能需要的資源(圖形應用程序需要的GPU卡,需要在本地磁盤的病毒掃描)對特定的服務器。
然而,這些技術也有其局限性:
(一)他們不到時間的機制,這意味著他們對自己在處理緊急情況的不足,敏捷。緊急情況的反應,可以很長一段時間,其間時間的機制,必須依靠封頂功耗,使它們只適合長時間的緊急情況;
(二)遷移可以是昂貴的,這取決於應用程序的狀態,需要遷移。這不僅可以在遷移過程中(這可能需要幾分鐘)和遷移後的抗衝擊性能(由於所在地損失),但也可以暫時提高功率有關服務器的抽獎;
(三)他們需要淨空,其他地方的數據中心,這可能並不總是可用(有時是不可取的,由於行政區域界線);
(iv)不適合所有的應用程序遷移,因為他們可能需要的資源(圖形應用程序需要的GPU卡,需要在本地磁盤的病毒掃描)對特定的服務器。
沒有留言:
張貼留言