010-88587556/9600/9800
大模型讓AGI落地應用成(chéng)畫匠爲可能(néng)

“大模型發(fā)展過(guò)程中,實現大模型的核心基樹相礎技術并未見颠覆性的創新,而是通過(gu麗來ò)長(cháng)期叠代演進(jìn)逐步能船發(fā)展到目前水平。”近日,北京航空航天大學(xué)計算機系主任肖利煙空民教授在采訪中表示,通過(guò)“大算力+大模型+大數你志據”的高效組合,AI大模型逐步解決了需要大量标注樣(yàng)本、跨領志站域自适應能(néng)力、多任務泛化鄉電能(néng)力等傳統AI落地難的問題,使得通用人工智能(n人子éng)(AGI)實質性落地應用成(chéng)房慢爲可能(néng)。

談及AI大模型的關鍵技術,肖利民說(shuō)學高,以GPT爲代表的大模型,通過(guò)唱她基于Transformer結構的模型疊加和并行化,面(煙放miàn)向(xiàng)海量非标注數據的自監督學(xué)習、多任務學(xu線化é)習/元學(xué)習/遷移學(xué雨妹)習,基于人類反饋的強化學(xué)習,基于跨媒體對(duì)齊的多模态翻譯和房不轉換等大模型核心創新技術的持續融合演進(jìn),使得姐紙大模型在跨領域多任務中表現出的智花員能(néng)化水平有了質的變化。

大模型的發(fā)展和應用將(jiāng)賦能(né著窗ng)千行百業,爲實體經(jīng)濟中的企業提供更加智能(néng)化的技謝動術和工具,促進(jìn)各行業和領域的創新發(fā)展,推動新産品長雜、新服務、新業态的出現。肖利民表示,光友一方面(miàn),大模型可利用大量的數據進(jìn)行分析和預測,幫助實體匠現經(jīng)濟中的企業做出更準确的決策。例如,通過(guò)對(duì)市場地作趨勢、消費者行爲、供應鏈等的分析東器和預測,企業可精準了解市場需求、更好(hǎo)優化産品和服務,提高運營效率和競購雜争力。另一方面(miàn),大模型可用于自動化和智校日能(néng)化系統,助力實體經(jīng)濟地訊中的企業提高生産效率和質量。例如,在制造業中拍話,大模型可用于質量控制、設備運維、供應鏈優化等複雜任務,實現智拿我能(néng)化生産和運營。

入局大模型研發(fā)的門檻有多高,需要舊醫怎樣(yàng)的算力支持?大模型的研發(fā)和構近業建在模型訓練、大數據收集、大數據清洗、核心技術研發(fā)及關鍵人才招攬等諸多國低方面(miàn)都(dōu)需要付出高昂的代價。肖利民表示,大模型訓練需討土要有高算力、大内存、高互聯帶寬、高運行效率的智能(néng)計訊這算平台。以GPT 3.0爲例,其模型參數總量達1750億個,訓物議練樣(yàng)本Tokens數達3000億個,計算聽都量高達314ZFLOPS,最大數據集45TB,參數和模爸票型狀态存儲量超過(guò)2.1TB,如果要求訓練謝村在30天内完成(chéng),以A100芯片爲例,訓練階段至少需要155司如8塊A100GPU,耗費至少2337萬美元。雪兵

未來,不僅要關注大模型的研發(fā)和構建,更要注金什重大模型的精調和使用,以發(fā)揮大模型的實際效用。産業界越發(fā)關注上歌大模型,但大模型并非多多益善,其研發(fā)、訓練需要持續的算力、人才投服說入,通常隻有大型龍頭企業或領軍企業才能(néng)負擔得水友起(qǐ)。基于通用大模型,聚焦鄉愛場景需求解決實際問題,打造精耕細作的行業歌能大模型,打通AI應用的“最後(hòu)一公裡(lǐ)”鐘兵,才能(néng)更好(hǎo)賦能(néng)實體經(jīng河近)濟發(fā)展。(記者 吳雙)

注:本文轉載自人民郵電報,轉載目年習的在于傳遞更多信息,并不代表本網贊同朋能其觀點和對(duì)其真實性負責,圖片來源網絡,如有侵權醫算行爲,請聯系我們,我們會(huì)及時(s民計hí)删除