近日,IDC發(fā)布AI大模型技術(shù)能力評(píng)估報(bào)告顯示,百度文心大模型3.5拿下12項(xiàng)指標(biāo)的7個(gè)滿分,綜合評(píng)分第一。在面向新浪科技等媒體溝通中,百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜指出,新版本文心一言3.5已超越ChatGPT 3.5,未來國內(nèi)將只會(huì)有少量大模型。
“在OpenAI發(fā)布ChatGPT之前,真正在做大模型的企業(yè)或機(jī)構(gòu)寥寥可數(shù),過去短短幾個(gè)月內(nèi),大量新的模型出現(xiàn),這是一個(gè)階段性的現(xiàn)象,在演變的過程當(dāng)中,其實(shí)各個(gè)企業(yè)、機(jī)構(gòu)會(huì)逐漸找到自己的定位,下一步逐漸會(huì)走向自己細(xì)分的方向。”吳甜表示。
在吳甜看來,大模型的終局將會(huì)集中在少量幾個(gè)大模型上。因?yàn)?,真正從底層做起來的大模型成本非常高,并不是想做就能做起來的,它需要有多年的積累,需要非常綜合的能力,也需要有絕對(duì)的堅(jiān)定信心,一直投入下去才能夠做好。所以,從這一點(diǎn)上可以看到,將來只能有少數(shù)的大模型。
吳甜指出,大模型產(chǎn)業(yè)化面臨著挺大的挑戰(zhàn),總結(jié)起來有三方面:第一,大模型的體積確實(shí)很大,模型大帶來的訓(xùn)練難度高,成本高。第二,對(duì)于算力規(guī)模要求非常大,性能要求非常高。第三,數(shù)據(jù)規(guī)模也很大。我們今天為什么有這么多千億參數(shù)規(guī)模,甚至也有萬億參數(shù)規(guī)模,它跟海量的數(shù)據(jù)上自定義強(qiáng)相關(guān)。數(shù)據(jù)的規(guī)模也非常大,收集、挖掘、建設(shè)、篩選這些數(shù)據(jù),清洗這些數(shù)據(jù)本身也是非常大的大工程。
“其實(shí)完全不要存在大量的大模型,而對(duì)于應(yīng)用者來說,也不需要每一個(gè)應(yīng)用都來進(jìn)行大模型的開發(fā)。”吳甜表示。在他看來,大模型的產(chǎn)業(yè)模式,可以類比芯片代工廠,現(xiàn)在芯片的型號(hào)、廠商非常多,但是代工廠只有幾家而已,芯片代工廠價(jià)值非常大,但整個(gè)社會(huì)不需要有非常多的企業(yè)都來實(shí)現(xiàn)這個(gè)能力,只要少數(shù)幾家芯片代工廠,對(duì)于有芯片生產(chǎn)需求公司來說,只要出生產(chǎn)方案,交給芯片代工廠生產(chǎn),就可以得到想要的芯片。