亚洲一区二区三区日本久久九-男女猛烈激情xx00免费视频-人妻少妇不满足中文字幕-天天鲁在视频在线观看-吃奶呻吟打开双腿做受视频

中國(guó)的“ChatGPT時(shí)刻”來臨?

放大字體  縮小字體 發(fā)布日期:2025-02-05     來源:解放日?qǐng)?bào)     瀏覽次數(shù):61
核心提示:2024年12月,DeepSeek發(fā)布新一代大語(yǔ)言模型V3,已引起行業(yè)不少討論。1月20日發(fā)布的R1,將DeepSeek的熱度推向了高潮。一年多時(shí)間內(nèi),DeepSeek成為大模型行業(yè)的“黑馬”,是否意味著國(guó)內(nèi)大模型迎來彎道超車的機(jī)會(huì)?

本報(bào)記者 查睿 裘雯涵

 

126日—27日,短短兩天內(nèi),國(guó)內(nèi)AI創(chuàng)業(yè)公司DeepSeek(深度求索)遭遇兩次短暫宕機(jī),DeepSeek將其歸因?yàn)樾履P桶l(fā)布后導(dǎo)致訪問量激增。

 

新模型指的是剛發(fā)布的推理大模型DeepSeek-R1,由此帶來的訪問量有多大?27日,DeepSeek在蘋果美區(qū)應(yīng)用商店下載量力壓ChatGPT,登頂免費(fèi)App下載排行榜。

 

202412月,DeepSeek發(fā)布新一代大語(yǔ)言模型V3,已引起行業(yè)不少討論。120日發(fā)布的R1,將DeepSeek的熱度推向了高潮。

 

一年多時(shí)間內(nèi),DeepSeek成為大模型行業(yè)的“黑馬”,是否意味著國(guó)內(nèi)大模型迎來彎道超車的機(jī)會(huì)?

 

硅谷都在談?wù)?/span>DeepSeek

 

在硅谷,幾乎每個(gè)人都在談?wù)?/span>DeepSeek。有報(bào)道稱,硅谷“被嚇壞了”,工程師正在瘋狂分析DeepSeek。還有說法稱,這是中國(guó)的“ChatGPT時(shí)刻”。

 

DeepSeek究竟厲害在哪?高性能、低成本、開源是外界提到的高頻詞。

 

輿論注意到,DeepSeek的推理計(jì)算效率極高,可以與業(yè)內(nèi)一些頂尖的AI模型相媲美,與美國(guó)硅谷前沿發(fā)展保持同步。國(guó)外大模型排名榜單Arena最新測(cè)評(píng)顯示,R1基準(zhǔn)測(cè)試在全類別大模型中排名第三,其中在風(fēng)格控制分類中與OpenAI o1并列第一,得分達(dá)到1357分,甚至略超OpenAI o1。這也幾乎意味著,DeepSeek-R1躋身全球最強(qiáng)大模型之列。

 

DeepSeek的官方測(cè)試也顯示,R1在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI o1正式版。在各自小參數(shù)版本的模型比拼中,R1-32B的數(shù)學(xué)推理明顯優(yōu)于o1-mini。

 

加利福尼亞大學(xué)伯克利分校教授亞歷克斯·迪馬基評(píng)價(jià),DeepSeek的技術(shù)路線揭示了達(dá)到頂尖性能未必需要天文數(shù)字投入,“這對(duì)硅谷的燒錢競(jìng)賽無(wú)異于釜底抽薪”。

 

DeepSeek有多便宜?有數(shù)據(jù)顯示,Deepseek V3的訓(xùn)練成本僅為558萬(wàn)美元,不足GPT-4o的二十分之一。推理模型R1API(應(yīng)用程序編程接口)服務(wù)定價(jià)為每百萬(wàn)tokens(詞元)僅需1元(緩存命中)/4元(緩存未命中),每百萬(wàn)輸出tokens16元。大語(yǔ)言模型V3就更便宜了,每百萬(wàn)tokens僅需0.1元(緩存命中)/1元(緩存未命中),每百萬(wàn)輸出tokens2元。DeepSeek的定價(jià)約等于Llama 3-70B的七分之一,GPT-4 Turbo的七十分之一。

 

開源是DeepSeek備受關(guān)注的另一個(gè)重要原因。這意味著它已經(jīng)與其他企業(yè)和研究人員共享基礎(chǔ)代碼,其他人能用相同的技術(shù)構(gòu)建和發(fā)布自己的產(chǎn)品。

 

英偉達(dá)資深科學(xué)家吉姆·范稱贊DeepSeek是“非美國(guó)公司踐行OpenAI初心”的典范,通過開放技術(shù)細(xì)節(jié)和訓(xùn)練方法,為全球研究者賦能。

 

出身國(guó)內(nèi)算力最充足企業(yè)

 

天眼查信息顯示,DeepSeek背后的實(shí)控人是梁文鋒,他所創(chuàng)立的幻方量化是國(guó)內(nèi)知名的量化私募基金,這也給DeepSeek打下了良好的算力基礎(chǔ)。

 

不同于常規(guī)基金依賴基金經(jīng)理,量化基金通過數(shù)量模型的計(jì)算尋找投資機(jī)會(huì),因此對(duì)數(shù)據(jù)尤為敏感,高頻交易更是離不開機(jī)器學(xué)習(xí)。為了從海量數(shù)據(jù)中挖掘投資機(jī)會(huì),幻方量化早早開始囤積算力,先后斥資10億元,在美國(guó)對(duì)芯片出口管制前購(gòu)買了1萬(wàn)張英偉達(dá)A100型號(hào)GPU。機(jī)緣巧合下,幻方量化成為國(guó)內(nèi)GPU算力最充足的企業(yè)之一。

 

AI行業(yè)有條規(guī)模化法則,簡(jiǎn)單來說,就是算力越大、參數(shù)越多,訓(xùn)練出的大模型性能就越好。如果遵照這條規(guī)則,幻方量化的算力基礎(chǔ),成了DeepSeek最大的王牌之一。

 

當(dāng)然,光靠算力優(yōu)勢(shì),DeepSeek顯然無(wú)法與全球AI巨頭抗衡。“DeepSeek爆火主要是創(chuàng)新的技術(shù)路線。”上海人工智能行業(yè)協(xié)會(huì)秘書長(zhǎng)鐘俊浩認(rèn)為,架構(gòu)機(jī)制、訓(xùn)練方法和管道并行算法等創(chuàng)新,展現(xiàn)了中國(guó)本土AI技術(shù)的潛力,顛覆了中國(guó)只是AI技術(shù)跟隨者、應(yīng)用方的傳統(tǒng)認(rèn)知。

 

英國(guó)科技網(wǎng)站“生命科學(xué)”撰稿人本·特納指出,美國(guó)限制向中企出口先進(jìn)AI計(jì)算芯片,迫使DeepSeek-R1研發(fā)者采用更智能、更有效的算法,彌補(bǔ)計(jì)算能力的不足。ChatGPT據(jù)報(bào)道需要1萬(wàn)臺(tái)英偉達(dá)的圖像處理器處理訓(xùn)練數(shù)據(jù),DeepSeek稱僅用2000臺(tái)圖像處理器就取得了類似結(jié)果。

 

DeepSeek公布的技術(shù)論文顯示,R1在訓(xùn)練過程中實(shí)驗(yàn)了三種技術(shù)路徑:直接強(qiáng)化學(xué)習(xí)、多階段漸進(jìn)訓(xùn)練和模型蒸餾,其中R1首次證明了直接強(qiáng)化學(xué)習(xí)的有效性?萍济襟w在技術(shù)解讀中打了個(gè)比方,面對(duì)同一道題目,大模型同時(shí)多次進(jìn)行回答,系統(tǒng)將給每個(gè)答案打分,依照“高分獎(jiǎng)勵(lì)低分懲罰”的邏輯進(jìn)行循環(huán),最終得出更具優(yōu)勢(shì)的推理路徑。

 

中國(guó)“正在全力沖刺”

 

“元”公司首席執(zhí)行官扎克伯格日前在一檔播客節(jié)目中坦言,DeepSeek技術(shù)非常先進(jìn)。他表示,中國(guó)“正在全力沖刺”,擔(dān)心這個(gè)開源模型會(huì)被全世界廣泛使用,影響到美國(guó)科技行業(yè)的領(lǐng)先地位。

 

一些美國(guó)專家也評(píng)論稱,如果最好的開源技術(shù)來自中國(guó),美國(guó)開發(fā)人員將在這些技術(shù)之上構(gòu)建他們的系統(tǒng),“從長(zhǎng)遠(yuǎn)來看,這可能會(huì)讓中國(guó)成為研發(fā)AI的中心”。

 

在華盛頓州工作的技術(shù)專家阿爾文·王·格雷林認(rèn)為,DeepSeek的進(jìn)展顯示,美國(guó)的領(lǐng)先優(yōu)勢(shì)正在縮小,各國(guó)應(yīng)該采取合作方式建設(shè)先進(jìn)AI,而不是在AI領(lǐng)域進(jìn)行“軍備競(jìng)賽”。

 

在長(zhǎng)文本交互和多模態(tài)的全球競(jìng)爭(zhēng)中,國(guó)內(nèi)大模型已經(jīng)嶄露頭角,隨著大模型推理能力的迭代,中國(guó)還有機(jī)會(huì)彎道超車。鐘俊浩認(rèn)為,高效利用計(jì)算資源、相對(duì)較低的成本,以及更高的市場(chǎng)活躍度,是國(guó)內(nèi)訓(xùn)練推理大模型的優(yōu)勢(shì)所在。他表示,國(guó)內(nèi)面臨高端算力芯片緊缺的難題,但推理大模型能更集約利用有限的算力資源,同時(shí)國(guó)內(nèi)算力基礎(chǔ)設(shè)施較為完備,訓(xùn)練硬件成本較低。

 

更重要的是,中國(guó)的人工智能市場(chǎng)處于開放競(jìng)爭(zhēng)的狀態(tài),不僅有阿里、字節(jié)、商湯等大型AI廠商,還有階躍星辰、MiniMax等高水平的AI創(chuàng)業(yè)企業(yè)。更多市場(chǎng)參與者,就有更多創(chuàng)新想法,意味著市場(chǎng)更活躍。

 

此外,中國(guó)具有極強(qiáng)的政策引導(dǎo)能力。例如上海發(fā)布“模塑申城”實(shí)施方案,就進(jìn)一步明確“5+6”應(yīng)用場(chǎng)景,為人工智能企業(yè)在推理方面的應(yīng)用拓寬了發(fā)展空間,加速其商業(yè)化進(jìn)程。


關(guān)鍵詞:DeepSeek
工博士工業(yè)品商城聲明:凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問或質(zhì)疑,請(qǐng)立即與商城(haoruiqc.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
聯(lián)系電話:021-31666777
新聞、技術(shù)文章投稿QQ:3267146135  投稿郵箱:syy@gongboshi.com