競速大模型:一手創(chuàng)新策源,一手落地應(yīng)用
新華社上海6月9日電 題:競速大模型:一手創(chuàng)新策源,一手落地應(yīng)用
新華社記者周琳、楊有宗、潘德鑫
百花齊放、競相涌現(xiàn),2023年至今,大模型帶火的通用人工智能賽道,出現(xiàn)了眾多玩家。科技部新一代人工智能發(fā)展研究中心等機(jī)構(gòu)發(fā)布的數(shù)據(jù)顯示,中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。這一席卷科技界的AI革命,將如何改變世界?大模型又將如何一手促進(jìn)創(chuàng)新策源,一手服務(wù)實體經(jīng)濟(jì)?在從業(yè)者看來,這場競速賽才剛剛開始。
大模型探索大應(yīng)用
在位于上海臨港新片區(qū)的商湯科技智算中心一樓展示大廳,可以和大模型“商量”,用中文“商量”一下。
記者在現(xiàn)場感受發(fā)現(xiàn),作為千億級參數(shù)的自然語言處理模型“商量”,它不僅可以進(jìn)行多輪對話、人機(jī)共創(chuàng)童話故事,還可以自動生成簡單代碼、進(jìn)行“文生圖”等。例如,在輸入了20張“港風(fēng)”照片后,生成式AI就可以自動生成一張類似風(fēng)格的“氛圍感”圖片。
“無論是讓大模型寫出一首質(zhì)量過關(guān)的古詩,還是根據(jù)描述生成圖像,都要求其對中文語言的理解足夠深刻。這需要經(jīng)過多輪對話的訓(xùn)練,包括輔助語料的投喂,才能逐漸讓模型理解漢語的規(guī)律。”商湯科技首席科學(xué)家王曉剛說。
語言類大模型不是唯一形態(tài),多種通用大模型正在持續(xù)拓展應(yīng)用場景?萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心等機(jī)構(gòu)發(fā)布的《中國人工智能大模型地圖研究報告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,僅次于美國。
一方面大模型從辦公、生活、娛樂向醫(yī)療、教育、設(shè)計等行業(yè)加速滲透;另一方面,一些垂直專業(yè)類大模型不斷深化落地,生物制藥、遙感、氣象等大模型正在發(fā)揮縱深優(yōu)勢。
4月初,上海人工智能實驗室聯(lián)合中國科學(xué)技術(shù)大學(xué)、上海交通大學(xué)、南京信息工程大學(xué)、中國科學(xué)院大氣物理研究所及上海中心氣象臺發(fā)布全球中期天氣預(yù)報大模型“風(fēng)烏”,30秒生成未來10天全球氣象高精度預(yù)報結(jié)果。
在氣象氣候預(yù)報任務(wù)中,全球中期天氣預(yù)報是重要預(yù)測任務(wù)之一,它以預(yù)測未來14天內(nèi)的大氣系統(tǒng)狀態(tài)為目標(biāo)。“風(fēng)烏”在預(yù)報精度上降低了誤差,在時效上突破了10天,而且僅需單GPU(圖形處理器)便可運行。
上海人工智能實驗室領(lǐng)軍科學(xué)家歐陽萬里說:“‘風(fēng)烏’取名自秦漢時期的‘相風(fēng)銅烏’,是世界上最早的測風(fēng)設(shè)備。天氣預(yù)報大模型‘風(fēng)烏’承載中國古人的智慧,也寓意實驗室致力于在以氣象為代表的人工智能服務(wù)科學(xué)領(lǐng)域不懈探索。”
大算力搭建新“底座”
出臺支持舉措、整合創(chuàng)新資源、布局新興賽道……近段時間以來,各地都在為人工智能的創(chuàng)新策源“鋪路”。
5月30日,北京發(fā)布《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023—2025年)》《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》等方案;深圳發(fā)布關(guān)于加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案;上海市經(jīng)信委表示,超大規(guī)模預(yù)訓(xùn)練模型是人工智能從專業(yè)智能走向通用智能的關(guān)鍵技術(shù),未來將加快研究打造大模型生態(tài)集聚和創(chuàng)新應(yīng)用高地,推進(jìn)算力資源統(tǒng)一調(diào)度。
算力是研發(fā)大模型必不可少的基礎(chǔ)設(shè)施,已成為不少城市爭相布局的焦點。“近期生成式人工智能等應(yīng)用大爆發(fā),推動了算力需求激增。很多企業(yè)在落戶前都會問,算力需求能否被滿足,這已是一種稀缺資源。”上海臨港新片區(qū)管委會高科處處長陸瑜說,這也是臨港發(fā)力構(gòu)建更為完善的算力產(chǎn)業(yè)生態(tài)、搭建公共平臺的初衷。
瞄準(zhǔn)產(chǎn)業(yè)痛點,智能算力更需要一體化調(diào)度、經(jīng)濟(jì)化使用。專家認(rèn)為,“東數(shù)西算”工程的全面實施,將一手促進(jìn)東部數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)鏈向西部延伸拓展,一手讓算力資源精準(zhǔn)配置和按需獲取,有效降低能源消耗。
“我們將在貴安新區(qū)共同合作建設(shè)新的產(chǎn)業(yè)園區(qū),來打造滬黔科技創(chuàng)新成果的轉(zhuǎn)化中心。”貴陽市市長馬寧宇說,貴安正在規(guī)劃建設(shè)全國規(guī)模最大,存算能力一流的高安全、高可靠、高可用的數(shù)據(jù)中心集群,為大數(shù)據(jù)、大算力、大模型的技術(shù)發(fā)展和應(yīng)用提供廣闊空間。
“東西合作有更多想象空間。”優(yōu)刻得科技股份有限公司副總裁劉杰認(rèn)為,“東數(shù)西算”工程可以解決算力問題,在GPU運算中,西部成本比東部便宜一半。業(yè)內(nèi)其實也在探索“東數(shù)西訓(xùn)”,把非實時計算的AI訓(xùn)練過程放在西部進(jìn)行,涉及需要實時運算的推理過程則在東部直接完成,更好地調(diào)度算力、節(jié)約成本。
設(shè)規(guī)則促進(jìn)“好模型”
既為創(chuàng)新“加油”,也為發(fā)展“立規(guī)”。專家認(rèn)為,目前大模型總體人才不足,不少應(yīng)用領(lǐng)域還未有成熟開發(fā),數(shù)據(jù)治理也有待提升,這既需要政府部門為創(chuàng)新的落地搭平臺、找場景,也需要為其安全探索設(shè)置好邊界。
今年4月,國家網(wǎng)信辦發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見稿)》,對用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)提出明確要求。從治理原則到倫理規(guī)范,近年來我國一直加強(qiáng)對人工智能行業(yè)“立規(guī)”。
“大模型推動人工智能實現(xiàn)一次歷史性跨越,中國經(jīng)濟(jì)社會高質(zhì)量發(fā)展為大模型創(chuàng)新提供豐富場景和數(shù)據(jù)基礎(chǔ)。”中國科學(xué)技術(shù)信息研究所所長、科技部新一代人工智能發(fā)展研究中心主任趙志耘認(rèn)為,未來需要在四個方面著力:加強(qiáng)資源和研發(fā)力量統(tǒng)籌,促進(jìn)產(chǎn)學(xué)研合作與開源開放;加強(qiáng)大模型技術(shù)研發(fā),提升學(xué)術(shù)和開源影響力;強(qiáng)化大模型發(fā)展中的場景牽引作用,打造大模型標(biāo)桿項目;強(qiáng)化政策支持和配套服務(wù),加快推動大模型應(yīng)用落地。
從更深層次看,助力大模型走深走透,還需要更高質(zhì)量的數(shù)據(jù)庫。“未來對數(shù)據(jù)的高質(zhì)量和多維度要求都會更高。”中國人工智能開源軟件發(fā)展聯(lián)盟副理事長王健宗說,比如以前標(biāo)注一張圖,只需要說這是“一個公園”;但現(xiàn)在標(biāo)注就需要詳細(xì)描述為“母親和小孩在公園里散步”,標(biāo)注難度和工作數(shù)量級呈指數(shù)上升。
“數(shù)據(jù)變成必要的生產(chǎn)要素后,怎么安全合理地使用,是政府必須考慮的問題。以后對數(shù)據(jù)的質(zhì)量要求、使用門檻都會越來越高,需要規(guī)則的提前制定。”趙志耘說。
新華社上海6月9日電 題:競速大模型:一手創(chuàng)新策源,一手落地應(yīng)用
新華社記者周琳、楊有宗、潘德鑫
百花齊放、競相涌現(xiàn),2023年至今,大模型帶火的通用人工智能賽道,出現(xiàn)了眾多玩家。科技部新一代人工智能發(fā)展研究中心等機(jī)構(gòu)發(fā)布的數(shù)據(jù)顯示,中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。這一席卷科技界的AI革命,將如何改變世界?大模型又將如何一手促進(jìn)創(chuàng)新策源,一手服務(wù)實體經(jīng)濟(jì)?在從業(yè)者看來,這場競速賽才剛剛開始。
大模型探索大應(yīng)用
在位于上海臨港新片區(qū)的商湯科技智算中心一樓展示大廳,可以和大模型“商量”,用中文“商量”一下。
記者在現(xiàn)場感受發(fā)現(xiàn),作為千億級參數(shù)的自然語言處理模型“商量”,它不僅可以進(jìn)行多輪對話、人機(jī)共創(chuàng)童話故事,還可以自動生成簡單代碼、進(jìn)行“文生圖”等。例如,在輸入了20張“港風(fēng)”照片后,生成式AI就可以自動生成一張類似風(fēng)格的“氛圍感”圖片。
“無論是讓大模型寫出一首質(zhì)量過關(guān)的古詩,還是根據(jù)描述生成圖像,都要求其對中文語言的理解足夠深刻。這需要經(jīng)過多輪對話的訓(xùn)練,包括輔助語料的投喂,才能逐漸讓模型理解漢語的規(guī)律。”商湯科技首席科學(xué)家王曉剛說。
語言類大模型不是唯一形態(tài),多種通用大模型正在持續(xù)拓展應(yīng)用場景?萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心等機(jī)構(gòu)發(fā)布的《中國人工智能大模型地圖研究報告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,僅次于美國。
一方面大模型從辦公、生活、娛樂向醫(yī)療、教育、設(shè)計等行業(yè)加速滲透;另一方面,一些垂直專業(yè)類大模型不斷深化落地,生物制藥、遙感、氣象等大模型正在發(fā)揮縱深優(yōu)勢。
4月初,上海人工智能實驗室聯(lián)合中國科學(xué)技術(shù)大學(xué)、上海交通大學(xué)、南京信息工程大學(xué)、中國科學(xué)院大氣物理研究所及上海中心氣象臺發(fā)布全球中期天氣預(yù)報大模型“風(fēng)烏”,30秒生成未來10天全球氣象高精度預(yù)報結(jié)果。
在氣象氣候預(yù)報任務(wù)中,全球中期天氣預(yù)報是重要預(yù)測任務(wù)之一,它以預(yù)測未來14天內(nèi)的大氣系統(tǒng)狀態(tài)為目標(biāo)。“風(fēng)烏”在預(yù)報精度上降低了誤差,在時效上突破了10天,而且僅需單GPU(圖形處理器)便可運行。
上海人工智能實驗室領(lǐng)軍科學(xué)家歐陽萬里說:“‘風(fēng)烏’取名自秦漢時期的‘相風(fēng)銅烏’,是世界上最早的測風(fēng)設(shè)備。天氣預(yù)報大模型‘風(fēng)烏’承載中國古人的智慧,也寓意實驗室致力于在以氣象為代表的人工智能服務(wù)科學(xué)領(lǐng)域不懈探索。”
大算力搭建新“底座”
出臺支持舉措、整合創(chuàng)新資源、布局新興賽道……近段時間以來,各地都在為人工智能的創(chuàng)新策源“鋪路”。
5月30日,北京發(fā)布《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023—2025年)》《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》等方案;深圳發(fā)布關(guān)于加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案;上海市經(jīng)信委表示,超大規(guī)模預(yù)訓(xùn)練模型是人工智能從專業(yè)智能走向通用智能的關(guān)鍵技術(shù),未來將加快研究打造大模型生態(tài)集聚和創(chuàng)新應(yīng)用高地,推進(jìn)算力資源統(tǒng)一調(diào)度。
算力是研發(fā)大模型必不可少的基礎(chǔ)設(shè)施,已成為不少城市爭相布局的焦點。“近期生成式人工智能等應(yīng)用大爆發(fā),推動了算力需求激增。很多企業(yè)在落戶前都會問,算力需求能否被滿足,這已是一種稀缺資源。”上海臨港新片區(qū)管委會高科處處長陸瑜說,這也是臨港發(fā)力構(gòu)建更為完善的算力產(chǎn)業(yè)生態(tài)、搭建公共平臺的初衷。
瞄準(zhǔn)產(chǎn)業(yè)痛點,智能算力更需要一體化調(diào)度、經(jīng)濟(jì)化使用。專家認(rèn)為,“東數(shù)西算”工程的全面實施,將一手促進(jìn)東部數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)鏈向西部延伸拓展,一手讓算力資源精準(zhǔn)配置和按需獲取,有效降低能源消耗。
“我們將在貴安新區(qū)共同合作建設(shè)新的產(chǎn)業(yè)園區(qū),來打造滬黔科技創(chuàng)新成果的轉(zhuǎn)化中心。”貴陽市市長馬寧宇說,貴安正在規(guī)劃建設(shè)全國規(guī)模最大,存算能力一流的高安全、高可靠、高可用的數(shù)據(jù)中心集群,為大數(shù)據(jù)、大算力、大模型的技術(shù)發(fā)展和應(yīng)用提供廣闊空間。
“東西合作有更多想象空間。”優(yōu)刻得科技股份有限公司副總裁劉杰認(rèn)為,“東數(shù)西算”工程可以解決算力問題,在GPU運算中,西部成本比東部便宜一半。業(yè)內(nèi)其實也在探索“東數(shù)西訓(xùn)”,把非實時計算的AI訓(xùn)練過程放在西部進(jìn)行,涉及需要實時運算的推理過程則在東部直接完成,更好地調(diào)度算力、節(jié)約成本。
設(shè)規(guī)則促進(jìn)“好模型”
既為創(chuàng)新“加油”,也為發(fā)展“立規(guī)”。專家認(rèn)為,目前大模型總體人才不足,不少應(yīng)用領(lǐng)域還未有成熟開發(fā),數(shù)據(jù)治理也有待提升,這既需要政府部門為創(chuàng)新的落地搭平臺、找場景,也需要為其安全探索設(shè)置好邊界。
今年4月,國家網(wǎng)信辦發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見稿)》,對用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)提出明確要求。從治理原則到倫理規(guī)范,近年來我國一直加強(qiáng)對人工智能行業(yè)“立規(guī)”。
“大模型推動人工智能實現(xiàn)一次歷史性跨越,中國經(jīng)濟(jì)社會高質(zhì)量發(fā)展為大模型創(chuàng)新提供豐富場景和數(shù)據(jù)基礎(chǔ)。”中國科學(xué)技術(shù)信息研究所所長、科技部新一代人工智能發(fā)展研究中心主任趙志耘認(rèn)為,未來需要在四個方面著力:加強(qiáng)資源和研發(fā)力量統(tǒng)籌,促進(jìn)產(chǎn)學(xué)研合作與開源開放;加強(qiáng)大模型技術(shù)研發(fā),提升學(xué)術(shù)和開源影響力;強(qiáng)化大模型發(fā)展中的場景牽引作用,打造大模型標(biāo)桿項目;強(qiáng)化政策支持和配套服務(wù),加快推動大模型應(yīng)用落地。
從更深層次看,助力大模型走深走透,還需要更高質(zhì)量的數(shù)據(jù)庫。“未來對數(shù)據(jù)的高質(zhì)量和多維度要求都會更高。”中國人工智能開源軟件發(fā)展聯(lián)盟副理事長王健宗說,比如以前標(biāo)注一張圖,只需要說這是“一個公園”;但現(xiàn)在標(biāo)注就需要詳細(xì)描述為“母親和小孩在公園里散步”,標(biāo)注難度和工作數(shù)量級呈指數(shù)上升。
“數(shù)據(jù)變成必要的生產(chǎn)要素后,怎么安全合理地使用,是政府必須考慮的問題。以后對數(shù)據(jù)的質(zhì)量要求、使用門檻都會越來越高,需要規(guī)則的提前制定。”趙志耘說。