當前位置:首頁 > 專訪 > 付斌
[導讀]11月11日,intel召開“XPU和軟件發佈會”,發佈了獨立服務器GPU,並宣佈將於今年12月正式交付oneAPI Gold版本,21ic中國電子網記者受邀參加此次發佈會。

多次自我突破的摩爾定律,幾番“壓榨”下,雖説有望迴歸兩年一更新的頻率,但還是有很多人感嘆“廉頗老矣”。不過事實上,摩爾定律在提出之時,就在論文的第二頁指明瞭摩爾定律失效的前路,這就是電子行業所追捧的“異構計算”,intel現稱之為XPU(CPU+GPU+FPGA+加速器)。

材料受到了限制,所以才有了電化學鍍銅和機械平面化的雙鑲嵌結構;物理受到了限制,所以才有了金屬柵極和高K電介質;製程受到了限制,神説“要有光”,所以才有了光刻技術……回溯1965年,intel的創始人戈登·摩爾提出了改變世界的摩爾定律至今已經自我突破了三次瓶頸。

雖然幾經放緩,intel已讓其重新迴歸兩年一更新。但實際上,我們仍然不知道1nm節點後的名字,這一迷之領域仍是紙上談兵的階段。反觀登納德縮放比例定律和阿姆達爾定律也基本進入瓶頸期,現在正是異構計算,即加速計算的時代。

今年4月,intel提出XPU+oneAPI的超異構計算的概念,即通過CPU、GPU、FPGA和其他加速器的混合式架構,配合統一開發平台oneAPI進行軟硬的有機結合方式進行超級加速計算。同期,全新的計算架構Xe被一併提出,並在今年8月正式宣佈Xe圖形架構下的幾款獨立顯卡。

時至今日,大勢已至,intel正式“亮刃”,拔劍反覆打磨的“干將和莫邪”,盡數展示了intel一直遵循戈登·摩爾論文的成果。11月11日,intel召開“XPU和軟件發佈會”,發佈了獨立服務器GPU,並宣佈將於今年12月正式交付oneAPI Gold版本,21ic中國電子網記者受邀參加此次發佈會。

硬件:支持Linux的獨立服務器GPU

手遊作為可以隨手暢玩的一種極佳消遣方式,逐漸成為現代人放鬆的好方法。任何技術參數都是口説無憑,直接看intel發佈的這款服務器GPU到底有什麼神奇之處。

根據intel的介紹,新華三(H3C)XG310是一款雲服務GPU,在相比傳統卡3/4的長度(全高x16 PCle 3.0)下,封裝了4顆intel服務器GPU。典型雙卡系統之中,可支持120個Android遊戲併發用户,而這一數字最高甚至可以擴展到160個併發用户,實際數量取決於具體遊戲和服務器配置。

值得一提的是,在使用至強(Xeon)可擴展處理器下,即使不擴展服務器數量,可直接擴展顯卡容量,在每個系統上支持更多流和訂閲用户,並且同時實現較低的總體擁有成本(TCO)。換言之,只需要兩張GPU,無需再單獨購置服務器,就多能滿足120個玩家實時連線遊戲的任務。

數據顯示,2017至2022年視頻直播將增加15倍、遊戲流量將增加9倍,到2022年視頻將佔全球IP流量的82%,而Android佔據了全球移動設備的74%,intel正是看重了這一重大轉變因此首次發佈了其數據中心獨立圖形顯卡intel Server GPU。

這是一款基於Xe-LP微架構的高密度、低延時獨立GPU,而本款產品的特殊之處在於除了瞄準了視頻和遊戲渲染應用場景下的數據中心,更加優化了對Linux操作系統的支持,使得不同操作系統之間代碼複用成為了可能,也使得這款獨立GPU註定能夠成為Android遊戲雲服務的新寵。

參數上,intel Server GPU配備128-bit渲染管線(128-bit wide pipeline)和8GB LPDDR4 專用板載低功耗顯存。

開發上,開發人員可利用目前Media SDK中的通用API,這一API也將於明年遷移到oneAPI視頻處理庫(oneVPL)當中。

架構上,不僅是本次推出的新品,整個Xe產線都將全線優化Linux上的開發。通過intel給出的intelServer GPU的Android雲遊戲架構上,這款面向數據中心的獨立GPU在Linux OS(CentOS/Ubuntu)的容器和虛擬化上提供了更好的優化,擴展代碼庫在Linux上的支持。從架構上來看,遊戲流服務將輸入到intel Cloud Rendering(ICR)中;利用FFMPEG編譯、3DMesa渲染輸出聲音;利用intel GPU UMD渲染視頻;而Android 遊戲的雲端主機和Android容器將利用intel橋接技術連接。

據悉,目前intel正與諸多軟件和服務合作伙伴合作,共同將intel服務器GPU推向市場,其中包括Gamestream、騰訊和Ubitus。

騰訊雲遊戲副總經理方亮表示:“intel是我們安卓雲遊戲解決方案上非常重要的合作伙伴。intel至強可擴展處理器和intel服務器GPU,打造了一個高密度、低時延、低功耗、低TCO(總擁有成本)的解決方案,讓我們能夠在每台雙卡服務器上生成超過100個遊戲實例,諸如《王者榮耀》、《傳説對決》。”

筆者認為,此款雲服務獨立GPU在功耗上優化的非常徹底,不僅使用了獨立顯卡Xe架構中最為低功耗的Xe-LP,還利用LPDDR4作為顯存進一步降低功耗。眾所周知數據中心是耗電和發熱大户,因此只有在提高密度和性能的架構下降低器件的功耗才能全面壓低功耗。

另一方面,操作系統和軟件正逐漸靠攏開源,開源也是造就流量增長的功臣之一。正因為瞄準的主要是Android的遊戲和視頻市場,因此在爆發式增長的流量下,無需擴充服務器,直接插獨立GPU卡對於節約成本具有非凡的意義。

軟件:oneAPI Gold正式登場

軟件和硬件誰更重要?任何時候的答案都是“我都要”,特別是對電子工程師來説,軟件硬件兩手都要硬,產品亦如此,新發布的獨立GPU亦如此。

講起intel,oneAPI就是這家企業的一切的硬件的載體,也是intel不折不扣的“軍師”。事實上,oneAPI早在“SuperComputing 2019”時就已放出測試版。經過無數的測試和功能完善,直到今天oneAPI Gold正式發佈,並將於今年12月正式交付。

名為Gold的oneAPI實際上也是oneAPI的1.0的版本,這款軟件正是intel連接CPU、GPU、FPGA和其他加速器的“鑰匙”,是實現XPU必不可少的一環。就如intel的戰略“水利萬物而不爭”一樣,oneAPI包容着一切的硬件。

軟件千千萬,oneAPI到底有什麼不一樣?如果讓筆者首推,一定是其直接編程的優秀開發體驗,intel稱之為DPC++(Data ParallelC++),用一個等式簡單解釋就是DPC++ =ISO C++ and Khronos SYCL。正因為語法接近CUDA,所以在學習曲線上oneAPI是極簡的,上手難度很低。

另一方面,intel的統一、簡化架構編程模型,開發者可以藉助oneAPI針對要解決的特定問題選擇最佳加速器結構,且無需為此重寫代碼。intel對此的願景是能夠提供毫不妥協的性能,不受限於單一京廣集運專用的代碼構建,就能實現原有代碼的集成。

在深度學習加速(intel DL Boost)方面,不僅支持PyTorch、mxnet、sklearn、NumPy、XGBoost,最近也獲得了微軟Azure和TensorFlow的支持;眾多領先的研究機構、公司和大學也支持oneAPI。

在工具方面,無論是應對數據中心、IoT還是最新發布的獨立顯卡的渲染上,oneAPI都得心應手。

發佈會上,intel表示oneAPI Gold工具包將於12月在本地和intelDevCloud上免費提供,同時還將提供包含intel技術諮詢工程師全球支持的商業版本。intel還會將intel Parallel Studio XE和intel System Studio工具套件遷移到oneAPI產品中。

另外,intel隱式SPMD程序編譯器(ISPC)將在oneAPI級別零之上運行。oneAPI級別零是為XPU提供硬件抽象層的API的集合,由intel創建,提供了底層的直接到硬件的接口,以供客户跨多種硬件平台進行編程。ISPC是oneAPI渲染工具包的已安裝基礎語言,該工具包支持大多數主流的視頻工作室基於至強處理器的渲染場,並將支持基於Xe架構的GPU。

筆者認為,oneAPI Gold相比測試版已可以勝任XPU的艱鉅任務,從工具的遷移和GPU使用的渲染工具箱的加入,使得獨立GPU加入至強可擴展處理器架構中無需使用其他軟件。另一方面,oneAPI也是與硬件是相輔相成的,軟硬件的閉環系統成為intel堅不可摧的生態。

左手一個硬件,右手一個軟件

intel的XPU宏圖

intel早前就已強調,現在intel是忠於數據,圍繞數據業務和客户痛點而前行的一家公司。如果説intel的“護城河”是 “六大技術支柱”(封裝&製程,架構、內存&存儲、互連、安全、軟件),那麼“城池”便是XPU+oneAPI的超異構計算。

晶體管耦合設計轉向晶體管彈性設計、圍繞CPU到圍繞XPU、半導體硬件到半導體軟硬件,我們既是歷史的見證者也是創造者。筆者曾多次強調,一整套的產品都放在同一軟硬件架構下,無論從性能上來講,還是從穩定性、適配性、更替性上來説,均具天生優勢。

在數據中心的XPU選擇上,intel的不同級別定位產品,使得搭配更加豐富。從CPU上來説,intel的至強(XEON)可擴展處理器,命名上也採用了更加符合主流、直觀易懂的“銅牌”、“銀牌”、“金牌”、“鉑金”的分級。

從FPGA上來講,擁有最高密度、高性能的Stratix,高性能、低功耗的Agilex,中端主流的Arria,低功耗、成本敏感的Cyclone,低成本、單芯片的MAX。

從獨立GPU上來講,intel仍然擁有這樣的定位,更加貼合不同應用的需求。

● Xe-LP(低功耗):定位為PC和移動平台最高效架構,主要使用LPDDR再次進行功耗的壓縮。目前已在8月發佈Xe DG1,近期發佈了第11代intel酷睿移動處理器集成的鋭炬®Xe顯卡和intel鋭炬®Xe MAX獨立顯卡。

● Xe-HP:定位為數據中心級、機架級媒體性能架構,能夠提供GPU可擴展性和AI優化,Xe HP將於明年推出。涵蓋了從一個區塊(tile)到兩個和四個區塊的動態範圍的計算,其功能類似於多核GPU。

● Xe-HPG:定位為專用於遊戲優化的微架構,技術參數上,添加了GDDR6的新內存子系統提高性價比,支持光線追蹤。是利用Xe-HP的擴展性,結合了Xe-LP的微架構變體。Xe-HPG預計將於2021年開始發貨。

● Xe-HPC:定位為數據中心,正在開發之中。

從路線上來看,intel的獨立GPU遠不止Xe-LP這種低功耗產品,將會從入門級顯卡擴展到高性能計算,而實施這種策略的核心是所有系列產品能夠實施同一套代碼庫。

包容這一切的毋庸置疑就是oneAPI,通過CPU+GPU+加速器+FPGA,便是標量+矢量+矩陣+空間的全方位計算。

在摩爾定律日漸放緩的如今,其實摩爾所書寫的未來還沒有結束,XPU+oneAPI就將是最好的見證。

換一批

延伸閲讀

[付斌] 再添最強eASIC!Intel付得起xPU的鉅額尾款嗎?

再添最強eASIC!Intel付得起xPU的鉅額尾款嗎?

一波還未平息,一波再起,時隔一週,Intel繼續擴張其xPU陣營! 上回,筆者説道Intel正在利用xPU+oneAPI的超異構計算的形式延續摩爾定律。所謂xPU即為CPU+GPU+FPGA+其他加速器的異構計算,體現在數據中心的...

關鍵字: Intel xpu easic

[科技生活八卦] Intel出售旗下電源芯片業務,聯發科火速拿下

Intel出售旗下電源芯片業務,聯發科火速拿下

日前,聯發科發佈公告稱,將透過子公司立錡併購Intel旗下Enpirion電源管理芯片產品線相關資產,預計總交易金額約8500 萬美元(約合人民幣5.6億元左右),交易完成日期暫定第四季,實際日期代相關法律程序完備後交割。 21ic家注意...

關鍵字: 聯發科 電源 Intel

[付斌] 為H3C、騰訊插翅騰飛!intel這次真的讓人直呼Yes

為H3C、騰訊插翅騰飛!intel這次真的讓人直呼Yes

多次自我突破的摩爾定律,幾番“壓榨”下,雖説有望迴歸兩年一更新的頻率,但還是有很多人感嘆“廉頗老矣”。不過事實上,摩爾定律在提出之時,就在論文的第二頁指明瞭摩爾定律失效的前路,這就是電子行業所追捧的“異構計算”,intel現稱之為XPU...

關鍵字: oneapi Intel xpu

[intel] 英特爾加速實現XPU願景: 發佈oneAPI Gold版本和英特爾服務器GPU

英特爾加速實現XPU願景: 發佈oneAPI Gold版本和英特爾服務器GPU

英特爾公司今日宣佈多項重要的技術進展,這也是英特爾多年來一直致力於通過統一的軟件體驗打造跨架構解決方案的又一里程碑。其中,英特爾® oneAPI Gold工具包將於今年12月正式交付;英特爾軟件棧推出新功能,作為公司軟硬件聯合設...

關鍵字: oneapi Intel xpu

[智能硬件] 首款首款首款!AX210:Intel首款Wi-Fi 6E無線網卡

首款首款首款!AX210:Intel首款Wi-Fi 6E無線網卡

在這篇文章中,小編將對Intel發佈的首款Wi-Fi 6E無線網卡AX210的相關內容和情況加以介紹以幫助大家增進對它的瞭解程度,和小編一起來閲讀以下內容吧。 本週,Intel悄然推出旗下首款Wi-Fi 6E無線網卡,型號AX2...

關鍵字: 網卡 ax210 Intel

技術子站

關閉