近日,IDC發(fā)布AI大模型技術(shù)能力評估報告顯示,百度文心大模型3.5拿下12項指標的7個滿分,綜合評分第一。在面向新浪科技等媒體溝通中,百度集團副總裁、深度學習技術(shù)及應用國家工程研究中心副主任吳甜指出,新版本文心一言3.5已超越ChatGPT 3.5,未來國內(nèi)將只會有少量大模型。
“在OpenAI發(fā)布ChatGPT之前,真正在做大模型的企業(yè)或機構(gòu)寥寥可數(shù),過去短短幾個月內(nèi),大量新的模型出現(xiàn),這是一個階段性的現(xiàn)象,在演變的過程當中,其實各個企業(yè)、機構(gòu)會逐漸找到自己的定位,下一步逐漸會走向自己細分的方向。”吳甜表示。
在吳甜看來,大模型的終局將會集中在少量幾個大模型上。因為,真正從底層做起來的大模型成本非常高,并不是想做就能做起來的,它需要有多年的積累,需要非常綜合的能力,也需要有絕對的堅定信心,一直投入下去才能夠做好。所以,從這一點上可以看到,將來只能有少數(shù)的大模型。
吳甜指出,大模型產(chǎn)業(yè)化面臨著挺大的挑戰(zhàn),總結(jié)起來有三方面:第一,大模型的體積確實很大,模型大帶來的訓練難度高,成本高。第二,對于算力規(guī)模要求非常大,性能要求非常高。第三,數(shù)據(jù)規(guī)模也很大。我們今天為什么有這么多千億參數(shù)規(guī)模,甚至也有萬億參數(shù)規(guī)模,它跟海量的數(shù)據(jù)上自定義強相關(guān)。數(shù)據(jù)的規(guī)模也非常大,收集、挖掘、建設、篩選這些數(shù)據(jù),清洗這些數(shù)據(jù)本身也是非常大的大工程。
“其實完全不要存在大量的大模型,而對于應用者來說,也不需要每一個應用都來進行大模型的開發(fā)。”吳甜表示。在他看來,大模型的產(chǎn)業(yè)模式,可以類比芯片代工廠,現(xiàn)在芯片的型號、廠商非常多,但是代工廠只有幾家而已,芯片代工廠價值非常大,但整個社會不需要有非常多的企業(yè)都來實現(xiàn)這個能力,只要少數(shù)幾家芯片代工廠,對于有芯片生產(chǎn)需求公司來說,只要出生產(chǎn)方案,交給芯片代工廠生產(chǎn),就可以得到想要的芯片。