封小韻:算力網絡,驅動AI發展的核心動力
專題:2024中國高新技術論壇
“2024 中國高新技術論壇”于11月14日在深圳舉行。思科大中華區副總裁封小韻出席并演講。
以下為演講實錄:
封小韻:剛才兩位院士的介紹非常精彩,給我特別特別大的壓力。既然大家壓力這么大,我希望這部分跟大家的匯報這個有點輕松也有點新的話題上給大家有一些新的感受。
我的題目是“算力網絡,驅動AI發展的核心動力”。我知道在座各位都是各自行業的專家,所以你們可能不太認可憑什么說算力網絡是驅動AI發展的核心動力。這就對了,我就是要把這個題目拋出來,想跟大家交流一下,希望接下來這十幾分鐘大家在我的介紹里有一些新的認知,跟原來不一樣的看法,這是我這次希望帶給大家的一些新知。
大家如果對我剛才的觀點有自己的看法,我是從大家都有共識的點開始講。
AI三要素,可能大家都沒有什么異議,模型和應用,剛才劉院士講了非常多實際場景的應用,數據和基礎架構。這三點共識大家應該都同意。
思科是做基礎架構的,在基礎架構里三個重要組成部分:能源、服務器、芯片(GPU及網絡)。
網絡有什么了不起的?我引用了全球最頂級的做大模型數據訓練負責人對GPU和基礎架構的看法。GPU像金子一樣又貴又少,肯定不能讓它閑著,用什么來讓它滿負荷運轉?那就是數據。怎么樣才能做到不斷喂養數據給它讓它滿負荷運轉?只有網絡。AI的網絡跟傳統所謂數據中心網絡有什么區別?上圖講到的是AI對網絡的三種不同應用。大規模GPU并行計算要求這個網絡是無損的,現在的GPU都是用O2O的集合通訊方式,現在訓練時要求每一個GPU訓練出來的結果大家同步等待,就有了延遲穩定需求。
這個圖就可以看到,傳統數據的流量模式在個體流量上是大量異步小帶寬,疊加之后變成均衡的流量結果,前面三個要求帶來的完全不一樣的模型顯示。
小結:AI對網絡的要求就三個符號:00、++、--。00,對網絡的要求無損耗,不丟包;++,網絡帶寬要越來越大;--,時延要越來越少,越來越減。什么樣的網絡技術才能滿足AI的算力網絡要求?普通傳統數據中心網絡流量跟AI網絡流量完全不一樣,技術層面上,這一兩年可能大家在AI網絡上花的錢最多的是IB,用INFINIBAND來做。我這張圖是把傳統以太網技術跟IB關鍵技術上的參數維度列出來。
紅色代表的是以太網的優勢,灰色代表的是IB的優勢(見PPT)。一般關鍵因素上都是以太網全面領先,碾壓性的領先。但為什么大家還是花這么多錢用IB更多?因為幾個關鍵因素:帶寬、時延、無損以及跟GPU尤其是英偉達自己的GPU的適配性,都是IB做得更好,所以現在IB的價格貴很多,IB的人才非常少。IB的普及性以及彈性、可收縮性非常有限,大家都是花大價錢做這件事情。
某一個程度上講,阻礙了AI算力發展的,一方面是GPU像金子一樣貴,另外是算力網絡使得這個算力的發展雪上加霜。
好消息是剛才我說到的幾個關鍵因素里,以太網這一兩年有了非常大的發展,在一些關鍵因素的表現上已經非常接近,甚至可以說很快就要追上了。這個追趕的動作是怎么發生的?以太網憑什么能夠在短時間內有這些變化?
我希望通過這三張圖能夠解釋剛才紅圈部分的變化是怎么發生的。
左邊的圖可以看到,現在無論是前端還是后端,算力網絡上以太網的使用量已經超過了IB。馬斯克最近10萬卡的集群,大量是用的以太網算力網絡來做。為什么大家敢用以太網來做?第二幅圖紅色部分可以看到,帶寬和時延這幾年的變化。以太網已經從某種程度上超越了IB。
剛才說到一個很重要的原因,GPU的適配性,尤其是跟英偉達,業界俗稱全家桶,它的GPU、IB一路這樣下來。今年超級以太網聯盟會發布怎么樣讓GPU和內部系統的Scale統一起來,通過以太網來實現,思科也是里面的創始成員。因為我們以太網的發展有現在這三個不同的動作,使得剛才我說的那幾個因素追得越來越近了。
我匯報一下思科現在的算力網絡大概做到了什么程度。
以前跟思科打過交道的都知道我們傳統做系統包括軟件,以及到光模塊,全部產品都已經非常完善了。用思科的AI算力網絡,價格已經可以做到非常低,跟IB比起來可以說是1:N之間的關系。
下面說說軟件,基于AI網絡特點,有了一些軟件和技術上全調度的算法。我放了一張調度算法圖,具體內容在白皮書里詳細技術介紹,可以會后再交流。
AI算力網絡,除了剛才講到的網絡流量本身,它還有好幾個層面需要考慮。不同層面有一些不同的應對方式,包括數據和安全。
我希望剛才非常精簡和快速的介紹能跟大家匯報一下最近我們在以太網上的進展,怎么樣跟IB做追趕和匹配,使得大家做AI算力網絡時易用性、適配性、價格和普適程度,都能大力降下來,從而推動AI算力的發展。
最后,在這么多技術專家跟前,我要講一個小小的話題,也是作為我今天這個內容的結束。
技術的盡頭都是哲學,前段時間諾貝爾獎得主Hintin講他最自豪的事情是他的學生把西蒙干掉。(56:31)目前我們看到在硅谷AI進進出出的人員變更,很多時候都是這兩派之爭的結果,這里面的戰略、理念包括他們的哲學思想,深深影響現在的政策。這兩派的競爭很激烈,但有幾個點是共識的,包括AI對風險、倫理道德以及全球合作上都要有投入、控制和共識。
為什么思科要加入《人工智能羅馬倡議》以及以中國作為基地的世界互聯網大會剛剛提出的《發展負責任的生成式人工智能研究報告及共識文件》,思科都在里面積極參與。AI發展到最后還是要為人類服務,如果AI發展得太快,對人類造成傷害或者一些不可逆轉的結果,應該引起我們的反思,并且用我們能力范圍內好好思考這些問題。
最后,希望高交會辦得越來越好,促進AI行業的發展,讓AI發展的同時對人類越來越好,謝謝各位!
新浪聲明:所有會議實錄均為現場速記整理,未經演講者審閱,新浪網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。
標簽: 核心
相關文章
發表評論