不曾想到,,這個(gè)春節(jié),,最火爆的話(huà)題,,不是旅游與消費(fèi),而是DeepSeek與人工智能,。
上至美國(guó)總統(tǒng)特朗普,,中至全球所有AI公司,下至全球數(shù)十億關(guān)注AI進(jìn)展的用戶(hù),,在最近十余天之內(nèi)都在討論、研究和熱議DeepSeek,。
從1月20日DeepSeek公司(全稱(chēng)杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司)發(fā)布DeepSeek-R1算起,,十余天內(nèi),在全球范圍內(nèi)快速掀起關(guān)注熱潮,,成為AI發(fā)展歷史上的現(xiàn)象級(jí)事件之一,。
至1月27日,在蘋(píng)果App Store中國(guó),、美國(guó)區(qū)免費(fèi)榜上,,DeepSeek均成為第一, 超過(guò)了來(lái)自O(shè)penAI的ChatGPT,。
除了鋪天蓋地的溢美之詞之外,,最值得關(guān)注的兩則評(píng)論,分別來(lái)自美國(guó)總統(tǒng)特朗普和OpenAI首席執(zhí)行官薩姆·奧爾特曼。
特朗普認(rèn)為,,中國(guó)的DeepSeek公司“提出了一種更快,、更便宜的人工智能方法,我認(rèn)為這是積極的”,,“(這)給我們(美國(guó))的行業(yè)敲響警鐘,,我們需要專(zhuān)注于競(jìng)爭(zhēng)以贏得勝利?!?/p>
薩姆·奧爾特曼于1月27日晚在社交媒體上發(fā)文,,稱(chēng)“DeepSeek-R1是一款令人印象深刻的模型,尤其是考慮到它能夠以這個(gè)價(jià)格提供”,,“有這樣的新競(jìng)爭(zhēng)對(duì)手確實(shí)令人振奮,。”
網(wǎng)紅效應(yīng)總會(huì)過(guò)去,,一番喧鬧之后,,DeepSeek至少給AI領(lǐng)域留下四個(gè)需要深度思考和直面的真問(wèn)題:
DeepSeek能夠從“網(wǎng)紅”到“長(zhǎng)紅”嗎?
當(dāng)DeepSeek已經(jīng)用低價(jià)策略走出一條獨(dú)特的路后,,AI大模型還會(huì)繼續(xù)走昂貴之路嗎,?
AI大模型到底要走開(kāi)源還是閉源之路?
以及,,如何看待DeepSeek之后的中美AI技術(shù)水平差距,?換言之,中國(guó)真的借DeepSeek之機(jī)實(shí)現(xiàn)“彎道超車(chē)”了嗎,?
一鯨落,,萬(wàn)物生,新的局面,,也孕育著新的挑戰(zhàn),。
DeepSeek能否從“網(wǎng)紅”到“長(zhǎng)紅”?
近幾天的表現(xiàn)反映出,,DeepSeek并不是一個(gè)網(wǎng)紅AI產(chǎn)品這么簡(jiǎn)單,,全球各界已經(jīng)歸納出其爆火的幾個(gè)原因。
在開(kāi)發(fā)背景方面,,DeepSeek出自中國(guó),,而不是AI技術(shù)能力更為領(lǐng)先的美國(guó);而且,,其開(kāi)發(fā)者也不是中國(guó)的互聯(lián)網(wǎng)大廠,,或者是AI“六小虎”等知名企業(yè),而是一家中國(guó)初創(chuàng)公司,,有西方網(wǎng)友甚至稱(chēng)其為“來(lái)自東方的神秘力量”,。
性?xún)r(jià)比方面,,DeepSeek能力強(qiáng)、體驗(yàn)感佳,,水平堪比OpenAI相關(guān)產(chǎn)品,,但價(jià)格僅僅是后者的百分之幾。
在發(fā)展路徑方面,,DeepSeek與OpenAI“反著來(lái)”,,成本低,所需算力少,,一定程度上打破了AI大模型研發(fā)的“高價(jià)”神話(huà),。同時(shí),與全球AI大模型龍頭企業(yè)主要走閉源路線(xiàn)完全不同,,DeepSeek技術(shù)路線(xiàn)完全開(kāi)源,,再次挑動(dòng)了“開(kāi)閉源之爭(zhēng)”話(huà)題。
1 月 27 日,,現(xiàn)象級(jí)國(guó)產(chǎn)游戲《黑神話(huà):悟空》的制作人馮驥評(píng)價(jià)稱(chēng),,DeepSeek“可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果”。
他點(diǎn)評(píng)DeepSeek說(shuō),,“如果有一個(gè) AI 大模型做到了以下(六條)的任何一條,,都是超級(jí)了不起的突破。但DeepSeek 全部,、同時(shí)做到了,。”他提到的DeepSeek六大亮點(diǎn),,分別為強(qiáng)大,、便宜、開(kāi)源,、免費(fèi),、聯(lián)網(wǎng)和本土。
任何一款“網(wǎng)紅”產(chǎn)品的產(chǎn)生都有其獨(dú)特的內(nèi)外部原因,,同時(shí),,“網(wǎng)紅”的宿命有兩種,即成為“長(zhǎng)紅”或止于網(wǎng)紅,。
在中國(guó)AI業(yè)內(nèi)人士看來(lái),自2023年7月成立起,,DeepSeek已有過(guò)兩次“高光時(shí)刻”,。這次在全球火出圈,可以稱(chēng)得上是DeepSeek的第三次高光時(shí)刻,。
第一次在DeepSeek籌備成立期間,。在2023年5月,,正在組建DeepSeek公司的量化基金公司幻方就被媒體曝出可能擁有超過(guò)1萬(wàn)枚英偉達(dá)GPU,是幾家頭部大廠之外持有算力資源最多的公司,。在當(dāng)時(shí),,中國(guó)的AI“六小虎”也還在初創(chuàng)或籌建階段。
業(yè)內(nèi)一般認(rèn)為,,1萬(wàn)枚英偉達(dá)A100芯片是做自訓(xùn)大模型的算力門(mén)檻,。從之后美國(guó)限制中國(guó)進(jìn)口英偉達(dá)芯片的舉措來(lái)看,DeepSeek的創(chuàng)始者極有遠(yuǎn)見(jiàn)和魄力,。
第二次是2024年5月,,中美市場(chǎng)上“百模大戰(zhàn)”最激烈的時(shí)刻,DeepSeek突然宣布對(duì)大模型大幅降價(jià),,掀起“價(jià)格戰(zhàn)”,,其降幅甚至達(dá)行業(yè)水平9成以上。之后中國(guó)AI全行業(yè)在兩周內(nèi)迅速跟進(jìn),,外界直呼“讓大模型降成白菜價(jià)”,。
此次DeepSeek走紅之時(shí),其在正式發(fā)布的資料中自豪地介紹,,DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),,在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力,。在數(shù)學(xué),、代碼、自然語(yǔ)言推理等任務(wù)上,,性能比肩 OpenAI o1 正式版,。
DeepSeek公布的性能測(cè)試比對(duì)成果,。 圖|DeepSeek官方微信
可以預(yù)見(jiàn),,不用很久,DeepSeek將成為中國(guó)AI領(lǐng)域正式的“新貴”,,估值有望超過(guò)“六小虎”水平,。但與此同時(shí),DeepSeek面臨的國(guó)內(nèi)外競(jìng)爭(zhēng)也將更加激烈,。
從技術(shù)上看,,細(xì)觀全球業(yè)內(nèi)人士評(píng)價(jià)可發(fā)現(xiàn),DeepSeek-R1的水平與OpenAI o1“水平相當(dāng)”,,而不是領(lǐng)先,。考慮到OpenAI o1發(fā)布已有4個(gè)月左右,,之后OpenAI仍然在繼續(xù)研究和精進(jìn),,所以DeepSeek的水平能否與即將發(fā)布的新模型“水平相當(dāng)”,,或長(zhǎng)期保持在較高技術(shù)水平上,還未可知,。
從國(guó)外競(jìng)爭(zhēng)形勢(shì)看,,DeepSeek對(duì)美國(guó)AI行業(yè)的刺激很大,未來(lái)技術(shù)起點(diǎn)高于中國(guó)企業(yè)的美國(guó)AI行業(yè)必然會(huì)更加進(jìn)取,。
1月21日,,特朗普在上任美國(guó)總統(tǒng)后第二天,就在白宮宣布了一項(xiàng)名為“星際之門(mén)”(Stargate)的人工智能項(xiàng)目,,將由美國(guó)甲骨文公司,、OpenAI和日本軟銀集團(tuán)聯(lián)合出資5000億美元打造。
除了特朗普的“星際之門(mén)”計(jì)劃會(huì)更快速推進(jìn)之外,,近期包括OpenAI在內(nèi)的AI巨頭已經(jīng)進(jìn)行了戰(zhàn)略微調(diào),。扎克伯格的Meta已宣布,2025年投資高達(dá)650億美元用于與人工智能密切相關(guān)的項(xiàng)目,,包括新建設(shè)一個(gè)規(guī)模巨大的AI數(shù)據(jù)中心以及大幅擴(kuò)充AI領(lǐng)域人才,,增加Meta人工智能團(tuán)隊(duì)實(shí)際規(guī)模。
在國(guó)內(nèi),,各互聯(lián)網(wǎng)大廠與AI“六小虎”,、“四小龍”,甚至其他較小型的大模型公司,,也必然會(huì)如美國(guó)企業(yè)般調(diào)整戰(zhàn)略和技術(shù)路線(xiàn),,進(jìn)行新競(jìng)爭(zhēng)。未來(lái)有下一個(gè)DeepSeek的出現(xiàn),,也不是沒(méi)有可能,。
同時(shí),國(guó)內(nèi)外對(duì)AI感興趣的資本,,以及各家互聯(lián)網(wǎng)大廠,,普遍有興趣對(duì)DeepSeek或投資或合作。如此關(guān)鍵和微妙時(shí)刻,,考驗(yàn)著DeepSeek掌舵人的智慧,。
全球AI發(fā)展形勢(shì)“一月千里”,未來(lái)對(duì)于DeepSeek來(lái)說(shuō),,不再是“不進(jìn)則退”的局面,,而是“不快則退”。想要從“網(wǎng)紅”到“長(zhǎng)紅”,,并不容易,。
AI大模型還會(huì)繼續(xù)走“燒錢(qián)”之路嗎?
貴、燒錢(qián),,是AI大模型效用足夠激動(dòng)人心的另一面。
AI大模型最燒錢(qián)的部分是算力,,需要海量性能最先進(jìn)的GPU芯片,,其運(yùn)行還需要巨量的電力能源支持;其技術(shù)核心是算法,,需要大量頂級(jí)的人工智能專(zhuān)家和技術(shù)人員參與研發(fā),。
因此可以看到,美國(guó)的AI大模型項(xiàng)目動(dòng)輒投資數(shù)十億美元,,大模型計(jì)劃動(dòng)輒投資數(shù)百億美元,、上千億美元。
但DeepSeek此次對(duì)上述模式進(jìn)行了一次讓人震撼的改變——一家小型初創(chuàng)公司,,僅100多名研發(fā)人員,,在算力受限情形下,使用相對(duì)“極低”的訓(xùn)練費(fèi)用,,訓(xùn)練出技術(shù)水平堪比全球頂極的AI大模型,,且實(shí)現(xiàn)了“極低”的用戶(hù)收費(fèi)。
據(jù)央視網(wǎng)報(bào)道,,DeepSeek公司R1模型訓(xùn)練成本僅為560萬(wàn)美元,,遠(yuǎn)遠(yuǎn)低于OpenAI 、谷歌等美國(guó)科技巨頭在人工智能技術(shù)上投入的“數(shù)億美元乃至數(shù)十億美元”,。
伴隨著技術(shù)的精進(jìn),,AI大模型研發(fā)的成本已經(jīng)走上快速下行通道,DeepSeek顯然大大加速了降本進(jìn)程,,而且從行業(yè)反映看,,確實(shí)存在進(jìn)一步加速降本的可能性。
DeepSeek頁(yè)面截圖
但是,,如果據(jù)此認(rèn)為DeepSeek終結(jié)了AI大模型研發(fā)的昂貴路線(xiàn),,恐怕為時(shí)尚早。
首先,,現(xiàn)階段的DeepSeek R1其實(shí)只是AI大模型的一個(gè)具有“深度思考”功能的分支,,一個(gè)分支的低成本還不能代表全部大模型能走上低成本之路。事實(shí)上,,低成本之路能否走通,,還需要全行業(yè)進(jìn)行較長(zhǎng)時(shí)間的驗(yàn)證。
其次,,包括DeepSeek在內(nèi)的中外AI大模型行業(yè),,真正要實(shí)現(xiàn)的目標(biāo)并不是AI大模型本身,而是AGI——通用人工智能,。目前業(yè)內(nèi)尚不能確認(rèn)AI大模型是否是實(shí)現(xiàn)AGI的正確解,,更不能確認(rèn)未來(lái)的AGI研發(fā)之路是否昂貴,。
再次,從市場(chǎng)近期反應(yīng)看,,“終止昂貴之路”一說(shuō)還沒(méi)得到更進(jìn)一步支持,。
芯片巨頭英偉達(dá)股價(jià)雖然多日下跌,但跌幅尚有限,,美國(guó)科技股同樣跌幅有限,。此外,市場(chǎng)上暫時(shí)還沒(méi)有傳出AI大模型項(xiàng)目或計(jì)劃大幅向下調(diào)整預(yù)算的消息,,而Meta在2025年高達(dá)數(shù)百億的AI預(yù)算甚至是在DeepSeek爆火之后才傳出,。
開(kāi)源,還是閉源,?
無(wú)論美國(guó)還是中國(guó),,AI大模型領(lǐng)域的開(kāi)源、閉源之爭(zhēng),,均持續(xù)已久,。
DeepSeek是堅(jiān)定的開(kāi)源路線(xiàn)支持者。任何人均可自行下載與部署,,且提供論文詳細(xì)說(shuō)明了訓(xùn)練步驟與竅門(mén),,甚至DeepSeek APP上提供了用戶(hù)可見(jiàn)的AI思考、推理過(guò)程,。
DeepSeek爆火后,,UC伯克利、港科大,、HuggingFace等機(jī)構(gòu)根據(jù)開(kāi)源信息,,紛紛實(shí)現(xiàn)低成本復(fù)現(xiàn),對(duì)外稱(chēng)僅花30美元就能見(jiàn)證“啊哈時(shí)刻”(指可以令用戶(hù)眼前一亮的時(shí)刻),。
原本,,閉源路線(xiàn)在中美均有隱隱占優(yōu)之勢(shì),但DeepSeek橫空出世并爆火,,增加了太多變數(shù),,勢(shì)必會(huì)在業(yè)內(nèi)再次引發(fā)開(kāi)源、閉源之爭(zhēng),。
DeepSeek在官方公眾號(hào)上稱(chēng):“以開(kāi)源精神和長(zhǎng)期主義追求普惠AGI,,是 DeepSeek 一直以來(lái)的堅(jiān)定信念。我們非常興奮能與社區(qū)分享在模型預(yù)訓(xùn)練方面的階段性進(jìn)展,,也十分欣喜地看到開(kāi)源模型和閉源模型的能力差距正在進(jìn)一步縮小,。”
同樣堅(jiān)持開(kāi)源路線(xiàn)的Meta 的首席人工智能科學(xué)家Yann LeCun近期發(fā)文表示,DeepSeek 的成功“并不是中國(guó)的人工智能超越了美國(guó),,而是開(kāi)源模型正在超越專(zhuān)有模型”,。
其在文中還表示,“DeepSeek受益于開(kāi)放研究和開(kāi)源,,Meta的Llama也是如此,。OpenAI 最初是一家開(kāi)源人工智能公司,其使命是創(chuàng)造造福全人類(lèi)的技術(shù),,但最近已轉(zhuǎn)向閉源?!痹撛u(píng)論對(duì)于閉源路線(xiàn),,隱有火藥味兒。
閉源自有其道理,。AI基礎(chǔ)性研發(fā)投入巨大,,閉源可以讓企業(yè)更有動(dòng)力投入,并利用技術(shù)領(lǐng)先獲得市場(chǎng)地位,,然后進(jìn)行市場(chǎng)變現(xiàn),。而開(kāi)源意味著技術(shù)共享,市場(chǎng)收益一般較閉源要小,。
其中的典型代表便是蘋(píng)果,。蘋(píng)果智能手機(jī)的操作系統(tǒng)和系列軟件是閉源生態(tài),當(dāng)蘋(píng)果市占率實(shí)現(xiàn)全球第一時(shí),,其“贏家通吃”效應(yīng)顯著,。蘋(píng)果之所以能長(zhǎng)期拿走全球智能手機(jī)大部分利潤(rùn),與其閉源生態(tài)密切相關(guān),。而安卓系統(tǒng)為開(kāi)源生態(tài),,谷歌利用技術(shù)共享的方式開(kāi)放給大量手機(jī)廠商,其賺錢(qián)方式為技術(shù)授權(quán)和知識(shí)產(chǎn)權(quán)收費(fèi)模式,。其利潤(rùn)遠(yuǎn)小于蘋(píng)果,。
2024年7月5日,百度CEO李彥宏在一場(chǎng)圓桌訪(fǎng)談中對(duì)開(kāi)源與閉源模型進(jìn)行了討論,,并談了堅(jiān)持閉源路線(xiàn)的理由,。他解釋說(shuō),同樣參數(shù)規(guī)模下,,開(kāi)源模型的能力不如閉源,,閉源模型可以根據(jù)用戶(hù)需求提供多種變體,以平衡效果,、推理速度和成本,;無(wú)論是ChatGPT還是百度的文心一言,這些閉源模型的平均水平都比開(kāi)源模型更強(qiáng)大,推理成本也更低,。
對(duì)于開(kāi)源模型,,李彥宏也承認(rèn)其價(jià)值。他表示,,開(kāi)源模型在一些學(xué)術(shù)研究,、教學(xué)等領(lǐng)域有存在價(jià)值,可以用于研究大模型的工作機(jī)制,,形成理論,。
其實(shí)開(kāi)源、閉源模式之爭(zhēng)的背后,,是關(guān)于如何平衡技術(shù)創(chuàng)新,、商業(yè)利益和市場(chǎng)競(jìng)爭(zhēng)力的討論,是難以給出標(biāo)準(zhǔn)答案的選擇題,,并沒(méi)有優(yōu)劣與對(duì)錯(cuò),。
DeepSeek拉近了中美AI的技術(shù)差距嗎?
DeepSeek爆火之后,,大量的樂(lè)觀評(píng)論也隨之而來(lái),,認(rèn)為意味著中美在AI領(lǐng)域的差距到了“微乎其微”的地步,甚至,,還有人說(shuō)中國(guó)已實(shí)現(xiàn)“彎道超車(chē)”,。
DeepSeek還引發(fā)了資本市場(chǎng)的劇烈反應(yīng),有西方媒體稱(chēng)其為中國(guó)大模型“爆擊華爾街”,。
1月27日,,美國(guó)股市開(kāi)盤(pán)后,科技板塊整體下跌,,其中美國(guó)芯片巨頭英偉達(dá)(NVIDIA)暴跌約17%,。隨后,美國(guó),、歐洲電力供應(yīng)商的股價(jià)也遭受重創(chuàng)(AI大模型預(yù)訓(xùn)練,、運(yùn)行等對(duì)能源需求巨大)。
英偉達(dá)近期股價(jià)走勢(shì)
甚至,,有經(jīng)濟(jì)分析認(rèn)為,,DeepSeek可能影響全球經(jīng)濟(jì)。例如德銀策略師George Saravelos在最新報(bào)告中認(rèn)為,,DeepSeek的出現(xiàn)可能對(duì)全球經(jīng)濟(jì)產(chǎn)生“積極的供應(yīng)沖擊”,,甚至可能使美元“面臨邊際下行壓力”。
客觀,、冷靜地看,,DeepSeek當(dāng)然是重要的局部突破,,但整體上中國(guó)AI領(lǐng)域尤其AI大模型領(lǐng)域與美國(guó)還是有著一定差距的。
首先,,DeepSeek-R1代表大模型的“深度思考”能力,,是通用大模型的一部分能力,因此其水平接近美國(guó)市場(chǎng)的頭部同類(lèi)模型,,且是更早(4個(gè)月前)發(fā)布的模型,,是一種局部突破,而非整體突破,。
其次,,盡管DeepSeek通用大模型V3也廣受好評(píng),但其受好評(píng)的前提是其具有極致的性?xún)r(jià)比,,“性能接近”美國(guó)頭部產(chǎn)品,,且價(jià)格更低(是對(duì)方的百分之幾)。顯然,,這不代表V3真的與ChatGPT在技術(shù)上沒(méi)有差距。
再次,,中國(guó)AI行業(yè)與美國(guó)行業(yè)在算法,、算力和數(shù)據(jù)上的差距依然沒(méi)有實(shí)質(zhì)性改變。
算法方面,,美國(guó)是AI大模型的原創(chuàng)研發(fā)國(guó),,技術(shù)路線(xiàn)和發(fā)展方向目前均主要由美國(guó)引領(lǐng)。算力方面,,美國(guó)目前具有絕對(duì)優(yōu)勢(shì),,且隨著美國(guó)對(duì)英偉達(dá)GPU芯片的出口限制日益嚴(yán)格,中國(guó)受限會(huì)愈加嚴(yán)重,,而國(guó)內(nèi)自主研發(fā)雖有重大進(jìn)展,,但尚需追趕和突破時(shí)間。數(shù)據(jù)方面,,中文數(shù)據(jù)存在數(shù)量少且“互聯(lián)網(wǎng)孤島”加劇之勢(shì),。
最后,從市場(chǎng)表現(xiàn)看中美差距依然較大,。與美國(guó)相比,,我國(guó)AI企業(yè)數(shù)量較多,但核心產(chǎn)業(yè)規(guī)模明顯偏小,。并且,,我國(guó)AI企業(yè)估值與美國(guó)AI企業(yè)估值有拉大之勢(shì),OpenAI市場(chǎng)估值超過(guò)1萬(wàn)億元人民幣,,馬斯克主導(dǎo)的xAI估值已達(dá)400億美元,,而我國(guó)“六小虎”估值普遍為100億至數(shù)百億人民幣,,互聯(lián)網(wǎng)大廠則普遍沒(méi)有因?yàn)榘l(fā)展AI大模型得到較多的AI賦分。
盡管DeepSeek爆火不能完全代表中美AI技術(shù)水平接近,,但確實(shí)進(jìn)一步縮短了中美AI的技術(shù)差距,。至于縮短了多少,或許還需要市場(chǎng)后續(xù)發(fā)展來(lái)給出答案,。
“特別聲明:以上作品內(nèi)容(包括在內(nèi)的視頻,、圖片或音頻)為鳳凰網(wǎng)旗下自媒體平臺(tái)“大風(fēng)號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)空間服務(wù),。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”