在這條新賽道上,中國完全不必妄自菲薄
近日,美國斯坦福大學AI團隊主導的Llama3-V開源模型被證實套殼抄襲國內(nèi)清華大學與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5。斯坦福團隊的兩位作者就這一學術不端行為正式道歉,并撤下了模型。
短短幾天內(nèi),這場風波塵埃落定,與中國團隊給出的證據(jù)之確鑿不無關系。上個月底,斯坦福團隊在網(wǎng)絡上宣傳只需500美元就可訓練出一個超越GPT-4V的SOTA多模態(tài)大模型。但很快就有人發(fā)現(xiàn),該團隊的Llama3-V模型使用的模型結構和代碼與國內(nèi)團隊發(fā)布的MiniCPM-Llama3-V2.5極為相似。
緊接著,國內(nèi)團隊發(fā)現(xiàn),Llama3-V可以識別出“清華簡”戰(zhàn)國古文字,“不僅對得一模一樣、連錯得都一模一樣”。而這一古文字數(shù)據(jù)為研究團隊花費數(shù)月從“清華簡”上逐字掃描并人工標注得來,并未對外公開?!皩嶅N”之下,斯坦福團隊的抄襲也就無從分辯了。
誠如專家所言,盡管這次以一種令人遺憾的方式揭示了中國AI研發(fā)的較高水平,但也說明,現(xiàn)如今中國創(chuàng)業(yè)公司的大模型產(chǎn)品開始受到國際的廣泛關注與認可。人工智能為千行萬業(yè)的跨越式發(fā)展帶來機遇,中國同樣在追趕這一風口。截至去年底,中國有至少130家公司研究大模型產(chǎn)品,其中100億級參數(shù)規(guī)模以上的大模型超過10個,10億級參數(shù)規(guī)模以上的大模型已近80個,大模型數(shù)量位居世界第一梯隊。
對于中美在大模型領域的差距,有業(yè)內(nèi)人士表示,一年前,中國大模型與OpenAI、Google啟動大模型研發(fā)的時間點比起來,有7到10年的差距;但如今,中美之間的差距約為6個月。曾幾何時,一提及美國科技創(chuàng)新,很多人都是仰望心態(tài)。而新賽道上的表現(xiàn)證明,我們正在將差距不斷縮小,完全不必妄自菲薄。
從長遠來看,如今的大模型已從原來的純語言模態(tài)逐步走向多模態(tài)的探索。相關研究正處于起步階段,技術成熟度還不高,這為中國的發(fā)展提供了新的契機。就短板來說,我國在人工智能算力、算法上尚存一定差距。從加快全國一體化算力網(wǎng)建設,到構建算力產(chǎn)業(yè)鏈,再到加強行業(yè)算力建設布局,需要相關部門加速推進。
另一方面,我們占據(jù)了應用場景、人口規(guī)模和產(chǎn)業(yè)集群等優(yōu)勢,為人工智能技術的應用提供了廣闊的場景和超大規(guī)模內(nèi)需市場。在應用實踐中錘煉、迭代和改進的技術,反過來又會促進應用更加深化,從而形成技術進步與應用推廣相互推進的良性循環(huán)。我們要充分發(fā)揮自身制度優(yōu)勢,保持獨立自主的精氣神,更加自信地勇闖“無人區(qū)”,更加主動地擁抱世界,在部分技術不占先發(fā)優(yōu)勢的情況下,加快腳步、站穩(wěn)腳跟。
“人工智能是引領這一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術,具有溢出帶動性很強的‘頭雁’效應?!蔽覀兗纫熬o張”起來,以時不我待的緊迫感去搶抓機遇,保持第一梯隊的位置;也要“放松”下來,以更加自信的姿態(tài),有條不紊、踏踏實實地走好自己的路。時間,永遠不會辜負智慧與汗水。
來源:北京日報客戶端