現在的AI市場有多熱呢?受到美國可能進一步加強技術封鎖的消息影響,面向數據中心的英偉達H800在中國炒到了50萬元人民幣的高價,A800也升值20%;美國多家巨頭的相關業務負責人都在社交平臺抱怨近期的算力資源悉數被預訂;甚至已經有一些AI項目(典型如Comma AI)為了確保算力供給,開始把目標轉向游戲顯卡……有媒體甚至在擔憂,游戲顯卡會不會像之前礦潮時期那般,受到AI需求的影響而再度大幅漲價。
2022年,DALL-E 2深度學習模型一度成為頭條,輸入幾個關鍵詞就能生成精美圖像,一度震驚了藝術創作者;今年,ChatGPT毫無爭議地長期占據頭版,人們發現機器可以如此“智能”地與人直接對話。于是AI現如今的大熱門顯然就著眼在幾個關鍵詞上:LzaiLM(大語言模型)、Transformer/GPT、生成式AI(Generative AI,或AIGC)……
所謂的生成式AI,就是指基于用戶的輸入(prompt),由AI來生成對應的信息、內容。比如可以生成文字構成問答或對話形式;生成圖像、圖形、視頻等多媒體內容。在今年的WAIC(世界人工智能大會)上,幾乎所有的AI芯片與相關技術廠商,都在自家展位的C位展示生成式AI的Demo,比如在令筆者印象還挺深刻的燧原展位上,輸入幾個關鍵詞就可自動生成完整的PPT——前后耗時不過50秒,生成的PPT結構清晰、圖文排版純熟,頗有很快取代文案工作者的既視感。
據統計,在今年英偉達春季GTC開發者大會上,英偉達CEO黃仁勛的主題演講中提到了48次“Generative AI”這個詞,他在面向亞太區的媒體采訪活動上又提了23次。主題演講共計1小時20分鐘,前1小時都在談AI,徹底蓋過了去年還是香餑餑的元宇宙的風頭——這是往屆GTC從未有過的情況。
從英偉達的股價可以看出行業的一絲有趣風向。去年筆者撰文聊AI時提到,昔日英偉達的股價為30至40美元一股,隨加速計算和AI的興起,從2021年底一路飆升至將近330美元。但2022年Q3受到電子產業下行、消費電子市場整體疲軟,以及消息面上美國針對中國技術封鎖等多重因素的影響,英偉達的股價“狂瀉”50%。2022年Q4隨著ChatGPT的問世,其股價又快速攀升,到今年7月底已經在沖擊470美元——其股價5年漲幅超過600%。
這應該是行業熱點的最佳寫照。即便熱錢“再度”涌向AI技術,這也只是生成式AI發展的開端。時隔一年之后,《國際電子商情》封面故事再聊AI,我們來看看生成式AI與AI芯片市場的現狀與未來。
可能尚有不少讀者未能直接體驗到生成式AI對生活的影響。以下從個人和行業企業兩個角度來簡單談談生成式AI現階段的應用情況。
從內容創作者、撰稿人的角度來看,筆者為提升日常的工作效率,訂閱了ChatGPT和Midjourney會員。前者用于粗粒度的資料收集,或活動文案創作點子參考,以及將ChatGPT作為某些技術問題的活體字典,極大程度減少了搜索引擎的使用和資料收集的時間;后者則著眼在文章的配圖生成,部分取代了攝影和平面設計工作。
另外,Adobe在Photoshop這類工具的beta版中加入了生成式AI特性:針對一張圖選出其中一部分,用文字的形式輸入修改期望,比如在圖片中增加一個物件,AI能快速完成這類操作,雖說它尚無法做到完全可用,但卻大大減輕了用戶的工作負擔。
與此同時,本人正在進修計算機科學碩士學位,在學習過程中會頻繁使用ChatGPT與New Bing來輔助寫代碼與算法——只需用自然語言提出對應的需求,ChatGPT就能寫出媲美專業程序員的復雜算法。筆者也留意到身邊的技術人員也普遍開始在工作中使用ChatGPT,一位CCIE(思科專家級網絡工程師)好友在針對不同行業企業、機構做網絡結構設計與配置時,都會征詢ChatGPT的意見。
這些都是生成式AI的威力——暫且不談ChatGPT、Midjourney這類直接面向個人的工具會產生多少價值。行業普遍認為,生成式AI產生價值的主力應該在不同的垂直細分市場上。瀚博半導體聯合創始人兼CEO錢軍先生在采訪中就提到,AI落地的“更多是行業應用”。這應該也是現階段主要的AI芯片公司正在努力的方向。
今年的WAIC展會上,Graphcore的工程師告訴我們,文生圖(text-to-image)類型的生成式AI在行業里已經有比較多的落地,包括修圖、繪畫輔助、建筑渲染,他還介紹說:“我們在CV(計算機視覺)領域已經在開展合作;NLP這塊還在測試”。恰好,燧原科技就在WAIC上發布了曜圖(LumiCanvas)——這是個初看與Midjourney挺類似的服務——只要輸入提示詞就可生成圖片。
不過,曜圖本身是一個企業級解決方案,內含“MaaS(Model-as-a-Service)”模式。如燧原工程師提到的,曜圖就像是一個基礎畫板,面向客戶的是包含底層硬件,到軟件及上層生態的整套交付,滿足企業客戶文生圖服務部署;構建從算力到云服務、基礎模型與微調,再到終端客戶使用的一體化流程。這應該算是生成式AI比較典型的行業應用。
現如今,黃仁勛在在英偉達GTC大會上的主題演講,會把大量篇幅放在AI合作和業務落地上,這使得GTC大會成為見證生成式AI商業落地的最佳場合。
在今年的GTC大會上,英偉達宣布與多家企業進行合作。比如,與Getty Images在生成式AI方面進行合作,基于Getty Images的素材庫構建圖像、視頻生成式模型,企業客戶輸入簡單的文字或圖片prompt,就能獲得定制化的圖片和視頻;與Shutterstock合作,基于圖像、3D和視頻素材庫打造3D生成模型,簡化3D內容構建,包括數字孿生、虛擬協作的流程和工作量;當然還有和Adobe的合作,在圖像、視頻、3D與動畫制作工具中融入生成式AI模型。
多媒體和內容創作似乎是生成式AI現階段最直接的受益者。但也不止于此,以醫療領域為例,生成式AI正在徹底變革藥物發現的每一步流程。如英偉達BioNeMo服務中包含了諸多3D蛋白質結構預測模型,其中不同的步驟都需要對應的模型,生成式AI模型能夠在讀取蛋白質氨基酸序列后,精準預測靶蛋白結構。此外,還有像是生成所需ADME屬性的分子,以及預測蛋白質與分子的3D交互……雖然這段文字可能晦澀難懂,但總體是指加速藥物發現流程。
以上是生成式AI行業應用的一個典型例子。實際上,生成式AI的潛在應用市場遠不止這些,在WAIC展會上還有電力、金融等行業大模型的應用實例,其中的很多實例可能尚未真正進入商用,或者離商用還有距離。但就前文提及的個人領域的應用而言,就已經展現了生成式AI在計算機科學、網絡工程等市場的應用潛力。
此外,還包括零售、廣告、建筑、能源等各行各業都會受到深遠的影響,甚至在生成式AI中僅借助自然語言提需求來設計芯片,都不需要HDL(硬件描述語言)工程師參與,這是最近幾個月熱議的焦點,只不過這其中的絕大部分,離行業應用的成熟還有距離。錢軍說:“我覺得很多問題在現在開始談還太早,包括最終有多少Foundation Models (基礎模型)能夠存活,中國大模型發展會是怎樣的商業模式,行業應用如何做模型訓等等。最近我覺得Llama 2不錯,基于此做再開發可能會是趨勢,但從我們芯片廠商的角度來看,很多東西都還沒有看得很清楚。”
沐曦聯合創始人、CTO兼首席軟件架構師楊建,將生成式AI的落地概括為“以Foundation模型為底座,加上針對行業應用領域做微調的中間層,去服務大量下游客戶的商業生態結構”。楊建表示,沐曦正“廣泛、深入地和各個Foundation大模型機構通力合作,快速推進AIGC大模型的應用落地”。
今年的GTC上,針對生成式AI在內容與多媒體創作方向上的應用,英偉達在Omniverse(元宇宙)部分有句話說得很好,元宇宙虛擬世界應當是基于物理規律的,而生成式AI則加速了虛擬世界的創建過程——“生成式”一詞在此體現得相當到位,元宇宙里的內容填充不就都等著“生成”嗎?
所以無論最終生成式AI會在哪些領域全面落地,可以肯定的是,當前的熱度絕非簡單的市場、媒體或投資行業吹捧所致。
前不久,筆者受邀參加了英偉達GeForce游戲顯卡的媒體活動。從活動當天所討論的內容來看,英偉達Gaming業務現在也在尋求對游戲應用中的AI技術做宣傳,當然這遠不只是很多人熟知的AI超分(DLSS)。
去年,英偉達發布了一個叫ACE(Avatar Cloud Engine,虛擬化身云引擎)的工具,這兩年網上挺火的Toy Jensen(黃仁勛的3D卡通形象),它有一部分就是基于ACE。ACE這一市場概念下包含了好些技術點,比如Audio2Face,這是一個生成式AI,基于單純的音頻信息就能構建臉部動畫;再比如Riva,能夠將文字信息轉成語音;還有NeMo,它可以理解為針對特定領域的定制版ChatGPT。
在今年5月的Computex大會上,英偉達又發布了ACE游戲開發版。英偉達透露稱,ACE在游戲里的主要功能是創建游戲NPC(非玩家角色),在生成式AI的幫助下,未來的NPC與玩家的交互會變得非常智能。屆時,游戲里的NPC有著ChatGPT般的對話能力,而且它的表情、口型、動作都會很自然。
ACE自然是生成式AI在游戲領域的一個應用。不過這個邏輯中比較有趣的一點是,如果ACE技術或者其他AI技術本身能夠推進游戲行業的發展,以及英偉達的GeForce游戲顯卡賣得更好,是否也能泛活在經濟低迷期如一潭死水的Gaming業務?而英偉達營收的另一大支柱Data Center(數據中心),也是Nvidia AI所處的業務部門,它的發展形勢一片大好,客觀上它能夠幫助Gaming業務的發展。
當然這只是筆者的猜測,但AI對電子產業的價值已經相當確切。英偉達Gaming業務營收的下滑,反映的是整個電子產業、半導體行業的大趨勢。IBS(International Business Strategies)數據顯示,預計今年全球半導體市場價值下滑9%,可能收報于5,110億美元。
Morgan Stanley的分析師認為,今年AI計算半導體市場的年度銷售額可能會達到430億美元(不同分析機構的數據不能直接對比,因為統計范圍,比如統計的芯片類型、對“AI芯片”的定義,都可能存在較大差異),占到芯片行業整體營收的大約8%。未來4年內,AI芯片的產值達到1,250億美元,在整個芯片行業的市場價值占比會翻一番。
楊建受訪時援引了IDC的數據,“生成式AI計算市場規模將從2022年的8.2億美元增長到2026年的109.9億美元”。其中,量級上的差異應當是統計范圍不同所致,這組數字表達的是“生成式AI計算占整體AI計算市場的比例從4.2%增長到31.7%”。
顯然生成式AI會成為整個半導體產業發展的發動機,也就是極大利好GPU、AI芯片制造商。但不要忘記《國際電子商情》去年的AI主題封面故事提到的:英偉達對所有市場參與者造成的白色恐怖。
OpenAI發布ChatGPT及GPT-4之后,在隨后的英偉達GTC開發者大會上,黃仁勛放出了將全球首臺DGX-1(英偉達的AI計算機)贈予OpenAI的視頻,隨即英偉達的股票就迎來了新一波漲勢。該視頻仿佛是在向市場宣告,英偉達才是生成式AI領域內算力工廠的老大。
GPU的算力基礎或許還在其次,英偉達的AI生態或者說Nvidia AI全棧,才是令其他市場參與者都只能暫避鋒芒的關鍵。前文談到的BioNemo、ACE等是英偉達AI生態的冰山一角,下文中筆者從軟硬兩方面來舉例談談所謂的“AI生態”。
LLM大模型訓練與推理的基礎是高算力、大容量存儲,當需求大到單一芯片、單一封裝、單一節點無法承載時,就需要跨節點做通訊。說白了就是要一堆GPU、一堆板卡、一堆服務器去算。在英偉達的這套系統里,不同層級的NVLink可互聯。很多AI芯片企業就這一層面的基礎設施支持都做不到完備。
去年秋季的GTC上,英偉達發布Spectrum-4 400Gbps交換機時說,這臺交換機主要是為大規模數字孿生、模擬仿真類應用的“elephant flow(大象流)”大流量所準備的。Spectrum-4在今年GTC正式亮相時,生成式AI已經爆火,英偉達對該產品的宣傳口徑已經轉向了生成式AI,為生成式AI云提供規模化所需的性能......這種基礎設施作為其AI生態里的一環,顯然就不是一般競爭對手可輕易拿捏的。
英偉達AI的軟件生態層面觸及了各行各業的預訓練模型、開發工具、框架與庫,這絕不是任何AI芯片企業旦夕可及的。今年6月底,AspenCore發布的處理器報告中也提到,英偉達在軟件生態層面的積累,在很多領域是達到了可無視并抹平DSA AI芯片性能和能效優勢的程度。這里再舉一個生成式AI的例子。
去年,在“生成式AI”一詞還未被病毒式傳播之前,英偉達就發布了NeMo LLM服務,這是個針對大模型的云服務,可讓大模型適用于特定領域。因為針對某一個問題,在不同領域的回答理應是不一樣的,如ChatGPT作為一個“普適”的AI機器人,必須要經過調整,給予其對話的上下文,才能將其直接應用于零售行業。
“定制LLM”的NeMo在只需要提供一些額外token(令牌)、prompt、“例子”的情況下,就能對模型做出微調,而不需要重新訓練整個模型。其實今年英偉達又發布了一遍NeMo,只不過套上了生成式AI的宣傳詞,并強調企業需要基于自己的業務,以及安全、因素方面的考量,對自己的模型做“guardrail(限定范圍)”和“redefine(重新界定)”。起碼這是生成式AI快捷實現行業應用的關鍵。今年和NeMo共同發布的,還有面向視覺模型(包含圖像、視頻與3D圖形)的Picasso,和前文已經提到的BioNeMo。
在8月上旬的SIGGRAPH上,英偉達又發布了AI Workbench,其宣傳語是“讓每個能用上GPU的人都成為生成式AI創作者”,在PC、工作站、數據中心和公有云等不同平臺上,都能做AI相關的工作。這一階段的英偉達顯然是期望越來越多的人能夠用上生成式AI,以此占領更大范圍的市場。
總體來說,這是個特別質樸和簡單的道理。Graphcore聯合創始人兼CEO Nigel Toon在談AI從一項技術轉向應用時的兩大關鍵點,其一是硬件和軟件部署的基礎設施,其二是用于AI計算系統的效率。一套完整的AI解決方案理應包含云計算、開發工具、軟件棧、AI-as-a-Service(人工智能即服務)產品。
這是個聽起來理所應當,但實踐起來十分困難的巨型工程。換句常被人提及的話來說,就是AI芯片公司從來不是把一顆AI芯片做出來就完事。楊建就在采訪中多次強調沐曦“致力于軟硬件一體的全面生態解決方案”,其自主研發的MXMACA?軟件棧支持“多種開源技術和主流框架的網絡模型”,能夠“持續完善ModelZoo讓客戶開箱即用”,“為各行各業的數字化轉型升級提供高能效和高通用性的全棧GPU產品”——“全棧”似乎是AI芯片企業必須強調的方向。
英偉達是真正借助“全棧”的長期投入,才掌握著超過80%的市場份額。但AMD數據中心硬件負責人Forrest Norrod說,行業需要競爭,“很多人都非常期望能夠有新的選項”。尤其隨著模型本身走向成熟,更多競品(包括固定成本更低的芯片)與設備購入會體現出優勢。
J.P. Morgan美國企業軟件研究負責人Mark Murphy說,微軟的AI產品(應當是指new Bing和Office的copilot)顯然還在發展早期階段,“我們相信范式轉變已經在發生。ChatGPT把這陣風吹了起來,成百上千的初創公司都奔著開發基礎模型而去,搭載AI原生應用、構建基礎設施。”
很顯然,這是個發展尚處在早期,機會仍十分充沛的市場,蛋糕都還沒有完全做大。且不論那些看到競爭對手引入AI技術,認為自己也不能在戰局中落后的企業,SemiAnalysis在今年初的報告中說,基于其統計范圍,他們了解到的至少有21家初創公司、11家大型企業,在訓練理論上達到GPT-3質量甚至更好的大模型。這個數量級可能還相對保守,但總體說明AI芯片企業市場機會的充盈。
即便單就大模型訓練,英偉達GPU還是一家獨大,但不難發現,有實力的AI芯片公司都期望,能在盡可能避開與英偉達正面鋒芒的情況下,尋求市場機會。比如在今年的WAIC大會上,瀚博發布了LLM大模型AI加速卡VA1L,在高算力基礎上特別做出了對于ChatGPT、LLaMA、Stable Diffusion等主流生成式AI模型的支持。
而更值得關注的是,瀚博推出AIGC大模型一體機,它用了8張VA1L,支持512GB顯存,1,750億參數大模型。瀚博在宣傳中提到,這是目前價格最低的針對LLM的大模型一體機方案,其對標友商產品的價格為150萬元。錢軍說:“我們意識到大模型還是需要私有化的部署。借助一體機來做fine tuning(微調),又能支撐推理,真正把私有化部署的大模型應用做起來。”
J.P. Morgan在評論文章中說,生成式AI的商業化并不簡單,除非有著極強的需求驅動力,且能夠變現。或許將AI技術真正融入到業務中,要核算AI所占成本是件還挺復雜的事:比如黃仁勛就始終在說英偉達的產品是“買得越多、省得越多”,這大概是從模型訓練到部署與推理使用,雜糅了開發全周期,以及固定成本、可變成本的系統性考量。但對中小型企業而言,高昂的固定成本是現階段能否用上生成式AI的巨大門檻。這大概也是諸多AI芯片廠商的切入點之一,楊建在評價生成式AI時,就提到“AIGC產業發展不僅需要高算力,更需要性價比更高的普惠算力”。
不僅是瀚博,大部分AI芯片與GPU企業都有自己在技術與市場上于生成式AI時代生存和發展的邏輯,比如Cerebras就強調堆料在應對大模型時的高效性;Graphcore似乎漸有從單純賣硬件,走向把更多注意力放在運營AI云的業務模式上;亞馬遜Trainium則顯然是借助AWS的強勢,在字節跳動、Airbnb之類的客戶中推廣AI。
另外,當前英偉達還面臨一定程度的半導體產業區域化和地緣政治的不良影響。中國市場顯得更為特殊,即美國潛在的技術封鎖行為持續收緊,讓英偉達的數據中心產品很難在中國開展業務。這就給了其他AI芯片企業以機會,也才有了文首提及現如今H800/A800一卡難求,以及二級市場價格高漲的局面。
Nigel Toon就在不同場合提過,Graphcore的亞洲業務發展不錯,尤其中國企業在尋找美國供應商之外的選擇。而中國GPU與AI芯片企業則或許能夠借此機會,催生更完整的自有生態。可能在生成式AI接下來深入到更多行業中以后,我們會找到答案,畢竟ChatGPT正式發布還不到1年。