DeepSeek現(xiàn)象背后:算法博弈與巨頭焦慮
21世紀(jì)經(jīng)濟(jì)報(bào)道記者孔海麗 北京報(bào)道
從2024年12月發(fā)布V3大模型,到最近推出R1模型和多模態(tài)模型Janus-Pro,DeepSeek持續(xù)出圈,形成了全球AI界甚至整個(gè)科技圈的“DeepSeek現(xiàn)象”。
多次采訪馬斯克等AI企業(yè)家的知名播客主持人萊克斯·弗里德曼(Lex Fridman),用了一個(gè)詞叫做“DeepSeek 時(shí)刻”,“我認(rèn)為 5年后它仍將作為科技史上的關(guān)鍵事件被人們銘記?!?/p>
DeepSeek出圈的原因之一是,它采用“更聰明”的算法,把AI訓(xùn)練成本砍掉近60%,卻實(shí)現(xiàn)甚至超越了同類模型的性能。簡單來說,同樣的產(chǎn)品,別人花100塊訓(xùn)練一個(gè)AI模型,它只要40元。這種“省錢打法”直接戳中了行業(yè)的痛點(diǎn)——過去拼的是誰能買更多高價(jià)芯片,現(xiàn)在比的是誰能把芯片用得更好。
DeepSeek不僅提供了新的AI技術(shù)路線,更重要的是,它在硅谷和華爾街聯(lián)合主導(dǎo)的AI敘事鐵墻上撕開了一道口子。
但自豪和興奮之余,還是要保持清醒的頭腦。且不說,在資金、技術(shù)、人才等方面,以DeepSeek為代表的新創(chuàng)AI企業(yè),尚無法向OpenAI、Anthropic 這些巨頭發(fā)起全面挑戰(zhàn),單單就V3、R1而言,其算法優(yōu)化也有代價(jià):處理復(fù)雜場景時(shí),它的表現(xiàn)明顯不如燒錢堆出來的大模型。就像用精簡版PS軟件修圖——日常夠用,專業(yè)場景會(huì)露怯。何況,短時(shí)間內(nèi)我們還不足以撼動(dòng)英偉達(dá)巨頭們的硬件江湖。
擺脫硬件依賴尚不現(xiàn)實(shí)
在“DeepSeek現(xiàn)象”推動(dòng)下,未來的算力圖景,并非單一曲線繪就。
一方面,像DeepSeek這樣的產(chǎn)品,更高流量、更低開發(fā)和消費(fèi)成本,可能帶來AI應(yīng)用的突然爆發(fā),這是所有從業(yè)人員夢寐以求的場景。
另一方面,當(dāng)訓(xùn)練成本下降刺激更多公司入場,消費(fèi)者應(yīng)用呈指數(shù)級(jí)增加,催生AI生態(tài)鏈全面繁榮,芯片需求將迎來超乎預(yù)期的增長。
硬幣兩面,恰好構(gòu)成了算力命題的悖論。
但是,業(yè)內(nèi)人士援引騰訊之前發(fā)布的白皮書,AI Agent應(yīng)用要實(shí)現(xiàn)跳躍式增長乃至爆發(fā),必須闖過三關(guān):場景滲透率大于15%、任務(wù)完成度大于80%、用戶信任度大于60%。
僅以信任度為例,此前Gartner的一項(xiàng)抽樣調(diào)查顯示,64%的人表示,不希望在客戶服務(wù)中使用人工智能。
目前AI Agent應(yīng)用的技術(shù)能力僅滿足簡單場景,如客服、日程管理等。而復(fù)雜決策如醫(yī)療咨詢、法律建議等,仍存在難以填補(bǔ)的缺陷。AI最大的應(yīng)用場景是教育、醫(yī)療、金融等,但是,誤診率5%的AI醫(yī)生看病,依然很難被接受。就好比,無人駕駛比人類更安全,但無人駕駛每出現(xiàn)一次事故都會(huì)被凝視。人類對(duì)AI的信任,只是處于初始水平,此外還面臨著各國隱私保護(hù)法規(guī)、用戶習(xí)慣、能源約束、技術(shù)路線分歧、多智能體協(xié)作、倫理困境等方面的挑戰(zhàn)。
業(yè)內(nèi)此前預(yù)計(jì),要到2026年前后,才將出現(xiàn)AI信任度的分水嶺(大于60%)。“DeepSeek現(xiàn)象”會(huì)不會(huì)加快這個(gè)時(shí)間表的到來?現(xiàn)在沒有人能夠斷定。
有人說,2025年將是AI Agent應(yīng)用元年。而DeepSeek通過異構(gòu)計(jì)算架構(gòu)、CPU+FPGA+ASIC混合部署和動(dòng)態(tài)負(fù)載均衡算法等創(chuàng)新,將單位算力產(chǎn)出提升2倍多,這是否意味著它探索的技術(shù)方向?qū)⒋蚱扑懔艛?,?dǎo)致算力過剩?
這關(guān)系到算力現(xiàn)狀。其特點(diǎn)是嚴(yán)重不均衡。一是地區(qū)不均衡。北美尤其是美國占據(jù)了全球算力最大份額,其次是中國,但高端算力基本集中在北美。
二是供應(yīng)不均衡。通用算力芯片廠商主要是英偉達(dá),占據(jù)70%以上份額,2025年其GPU銷量預(yù)計(jì)可達(dá)700萬塊;BSIC芯片的主要廠商是博通和Marvell,合計(jì)占有超60%的份額;云計(jì)算方面,谷歌、微軟、亞馬遜占據(jù)全球65%的市場份額。這就是大家所說的算力壟斷。
三是企業(yè)不均衡。微軟、Meta、谷歌、亞馬遜、xAI幾大巨頭目前囤積的算力總共約合355萬塊等效H100,這還不包括AI新貴OpenAI在內(nèi)。其他經(jīng)濟(jì)體企業(yè)能拿到的芯片量,無法與之相比。
算力供需還存在結(jié)構(gòu)性錯(cuò)配的問題。從縱向看,隨著多模態(tài)應(yīng)用的普及,推理側(cè)的算力需求增速已經(jīng)超過訓(xùn)練側(cè),但算力還主要布局于訓(xùn)練側(cè),調(diào)整需要一點(diǎn)時(shí)間;從橫向看,大量算力被消耗在數(shù)據(jù)清洗和模型調(diào)試等非核心環(huán)節(jié)。
以大模型算力為例。2024年下半年以來,大模型算力已經(jīng)從訓(xùn)練向推理轉(zhuǎn)移,其中占據(jù)推理算力市場最大份額的,仍然是英偉達(dá)。
《中國算力發(fā)展報(bào)告(2024)》援引援引IDC報(bào)告,截至2023年四季度,英偉達(dá)全球市場份額達(dá)95.9%。英偉達(dá)通過在CUDA和GPU兩端同時(shí)發(fā)力,構(gòu)筑了軟硬協(xié)同的護(hù)城河。有人說DeepSeek通過架構(gòu)革新,繞開了CUDA,沖破了它的護(hù)城河,這其實(shí)是誤讀。多位專家研讀DeepSeek公開(開源))論文后表示,V3、R1的底層架構(gòu)仍然是基于CUDA生態(tài)建構(gòu)。
在這種市場格局下,其他區(qū)域及其廠商要發(fā)起挑戰(zhàn),試圖打破巨頭壟斷,擺脫以英偉達(dá)為代表的算力依賴,更多是樂觀主義的展望式預(yù)期。除非量子芯片實(shí)現(xiàn)規(guī)?;逃茫鞘?年甚至10年以后的事。
至于算力過剩,短期內(nèi)不存在,整體上仍然是供大于求。《中國算力發(fā)展報(bào)告(2024)》援引中國信通院數(shù)據(jù),截至2023年底,全球算力規(guī)模同比增長40%,但以CPU為代表但芯片年性能提升不足15%,無法滿足視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)的處理需求。賽迪智庫2024年初測算,2023年中國智能算力需求達(dá)到123.6EFLOPS,但智能算力供給規(guī)模僅為57.9EFLOPS,嚴(yán)重供不應(yīng)求?!癉eepSeek現(xiàn)象”目前看來是增加了而不是減少了硬件需求。比如,32G的英偉達(dá)RTX50系顯卡,近半個(gè)月漲勢兇猛,最高已經(jīng)炒到了6萬元以上。其中部分原因在于,消費(fèi)者購入RTX50顯卡去做DeepSeek V3、R1本地化部署。
AI巨頭為何焦慮
既然DeepSeek尚未突破硬件限制,所做的也是巨人肩上的創(chuàng)新,但為什么還是引起美國AI巨頭的焦慮甚至恐慌?
從表層看,美國AI巨頭嗅到了危機(jī),不是因?yàn)榧夹g(shù)被超越,而是實(shí)現(xiàn)目標(biāo)的技術(shù)路徑變了,新創(chuàng)企業(yè)有了更多選擇。就像燃油車時(shí)代比拼的是發(fā)動(dòng)機(jī),電動(dòng)車時(shí)代比拼的是電池管理技術(shù)。DeepSeek證明了硅谷堆硬件堆數(shù)據(jù)的路線不是唯一選擇,高效用好現(xiàn)有資源同樣能打。
DeepSeek省錢省力的R1模型發(fā)布時(shí),剛好是OpenAI、軟銀、英偉達(dá)等科技巨頭宣布5000億美元算力基建——星際之門計(jì)劃的時(shí)間段,放在這個(gè)背景下對(duì)比來看,美國AI巨頭的刺痛感就更強(qiáng)烈了。
一位資深A(yù)I觀察人士告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,DeepSeek發(fā)起的這場“效率革命”,是AI發(fā)展從技術(shù)理想主義轉(zhuǎn)向工程實(shí)用主義的標(biāo)志性事件。它證明了,在現(xiàn)有硬件和物理約束條件下,通過計(jì)算拓?fù)浣Y(jié)構(gòu)優(yōu)化獲得的邊際收益,遠(yuǎn)高于單純?cè)黾有酒瑪?shù)量的線性增長。
這解釋了為何美國AI巨頭會(huì)產(chǎn)生戰(zhàn)略焦慮的深層因素——當(dāng)工程創(chuàng)新能力開始在AI競爭中脫穎而出,硅谷長期主導(dǎo)的技術(shù)先發(fā)優(yōu)勢就面臨重估,而且它也將帶來AI敘事的重估,背后是資本和資本市場的重估。
宏觀趨勢研究學(xué)者、經(jīng)濟(jì)學(xué)家David Woo近日接受訪談時(shí)表示,過去兩年,人們一直在談?wù)撁绹?jīng)濟(jì)的“例外主義”,而AI是推動(dòng)這一論斷形成的重要因素。美股市值占全球資本市場的份額達(dá)63%,其中ChatGPT出現(xiàn)后的兩年,就增加了10個(gè)百分點(diǎn),而七大科技巨頭又占美股市值的25%。這些巨頭正是依靠AI技術(shù)的強(qiáng)大優(yōu)勢鞏固了它們的地位,從而間接鞏固了美國資本市場的優(yōu)勢地位。
因此,AI與美國科技巨頭、資本市場其實(shí)是捆綁在一起的,也正是硅谷和華爾街聯(lián)合主導(dǎo)了全球AI敘事。
如今,來自東方的神秘力量DeepSeek向這套AI敘事發(fā)起了沖鋒。全球科技和資本領(lǐng)域持續(xù)10多天的熱烈反應(yīng),可以從側(cè)面解釋科技巨頭的焦慮和資本市場為何如此緊張。
前述資深A(yù)I分析人士認(rèn)為,DeepSeek創(chuàng)造的歷史性價(jià)值有兩點(diǎn):一是力行開源,本質(zhì)上是人類資源的共享表達(dá);二是提供了碓砌算力和數(shù)據(jù)之外的新的技術(shù)路徑。記者這幾天的采訪發(fā)現(xiàn),DeepSeek以上兩點(diǎn)價(jià)值,基本已成為業(yè)內(nèi)的共識(shí)。
在現(xiàn)實(shí)層面,DeepSeek耶揭示了一個(gè)殘酷的真相:當(dāng)創(chuàng)新進(jìn)入深水區(qū),工程能力比學(xué)術(shù)突破更重要,成本控制比參數(shù)競賽更致命,社會(huì)接受度比算法精度更關(guān)鍵。
如果跳開地緣政治誰贏誰輸?shù)膯栴},僅僅著眼于行業(yè)本身,商業(yè)本質(zhì)在于,賺錢的公司才能活下去。當(dāng)資本泡沫退去,或許我們會(huì)發(fā)現(xiàn),技術(shù)強(qiáng)大固然重要,但應(yīng)用和生存才是企業(yè)當(dāng)下的現(xiàn)實(shí),也是所有AI企業(yè)的必答題。
從 “誰能燒錢造最大模型”,過渡到“誰能用最少錢辦最多事” ;美國依然掌握著最先進(jìn)的芯片,但中國找到了更省錢的玩法——這才是DeepSeek重新書寫的AI敘事。
畢竟,不是所有新創(chuàng)企業(yè)都像OpenAI、xAI動(dòng)不動(dòng)就能融資到60億美元。正是在這個(gè)意義上,DeepSeek的技術(shù)路線,受到全球大批AI企業(yè)的效仿,其開源策略受到全球研究機(jī)構(gòu)的稱贊,其價(jià)格策略引發(fā)全球消費(fèi)者的熱捧。
高效率低成本的技術(shù)創(chuàng)新,加上全球關(guān)注的巨大流量,讓DeepSeek贏得了寶貴的時(shí)間窗口。這是堆積美元也難以買到的,也是OpenAI、Anthropic等AI新創(chuàng)企業(yè)羨慕甚至嫉妒的。
上海咨詢網(wǎng)站搭建優(yōu)化,打造高效、專業(yè)的網(wǎng)絡(luò)平臺(tái),上海專業(yè)咨詢網(wǎng)站建設(shè)與優(yōu)化,構(gòu)筑高效網(wǎng)絡(luò)新平臺(tái)
下一篇歡迎使用Z-BlogPHP!
相關(guān)文章
- 詳細(xì)閱讀
- 詳細(xì)閱讀
-
揭秘網(wǎng)站SEO算法,優(yōu)化策略與實(shí)戰(zhàn)技巧,網(wǎng)站SEO秘籍,揭秘算法、策略與實(shí)戰(zhàn)技巧詳細(xì)閱讀
本文深入解析網(wǎng)站SEO算法,探討優(yōu)化策略與實(shí)戰(zhàn)技巧。從關(guān)鍵詞研究、內(nèi)容優(yōu)化、技術(shù)調(diào)整等方面,詳細(xì)闡述如何提升網(wǎng)站在搜索引擎中的排名,實(shí)現(xiàn)網(wǎng)站流量與轉(zhuǎn)化...
2025-01-03 2 算法 揭秘 實(shí)戰(zhàn)
- 詳細(xì)閱讀
- 詳細(xì)閱讀
- 詳細(xì)閱讀
最新評(píng)論