近幾年,隨著人工智能技術(shù)的不斷發(fā)展,大模型的應(yīng)用場(chǎng)景和效果也將不斷得到拓展和提升。而大模型的出現(xiàn)也為工業(yè)上的數(shù)字化轉(zhuǎn)型和高質(zhì)量發(fā)展帶來(lái)很好的技術(shù)支撐。日前,中國(guó)工程院院士鄔賀銓發(fā)表《大模型上手,數(shù)智化進(jìn)階》演講,為我們揭示了大模型的無(wú)限可能。
院士演講實(shí)錄
各位專家、各位領(lǐng)導(dǎo),大家下午好,我的發(fā)言題目是《大模型上手,數(shù)智化進(jìn)階》。明年4月份中國(guó)要迎來(lái)成功進(jìn)入互聯(lián)網(wǎng)30周年,我們可以回顧一下30年來(lái)發(fā)生了非常大的變化,中國(guó)互聯(lián)網(wǎng)進(jìn)入而立之年。
一個(gè)發(fā)現(xiàn),我們整個(gè)互聯(lián)網(wǎng)移動(dòng)化發(fā)展很快,特別是4G帶動(dòng)了移動(dòng)互聯(lián)網(wǎng)的迅速普及,現(xiàn)在5G 帶動(dòng)工業(yè)互聯(lián)網(wǎng)的發(fā)展。
互聯(lián)網(wǎng)從最初的面向一般消費(fèi)客戶的點(diǎn)到點(diǎn)的連接,現(xiàn)在變成了一個(gè)平臺(tái),從點(diǎn)上平臺(tái),云平臺(tái),社交平臺(tái),直播平臺(tái),產(chǎn)業(yè)平臺(tái),尤其是近幾年,我們人工智能的發(fā)展使得互聯(lián)網(wǎng)迅速地進(jìn)入了智能化的時(shí)代。
剛才談到了大模型,實(shí)際上60多年前就有人工智能的研究,1956年的時(shí)候,那時(shí)候是學(xué)界里面的,沒(méi)有多少人知道。為大家所知道的是 1997年IBM深藍(lán)計(jì)算機(jī)戰(zhàn)勝了國(guó)際象棋大師,過(guò)了一段大家也沒(méi)有什么感覺了,2016年阿爾法戰(zhàn)勝圍棋高手,發(fā)現(xiàn)人類下棋下不過(guò)計(jì)算機(jī)了。
下棋這些還不是剛需,對(duì)社會(huì)生活也沒(méi)有太多影響。去年年底,一年前ChatGPT給大家眼睛一亮,當(dāng)然ChatGPT還是一個(gè)基礎(chǔ)大模型,仍然還是第二代人工智能,我們希望將來(lái)是通用的,希望至少在三個(gè)方面:
第一,一個(gè)模型不能僅僅對(duì)一個(gè)任務(wù),能夠適應(yīng)多任務(wù)。
第二,不能只限于一種模態(tài)輸入,希望多模態(tài)輸入。
第三,在將來(lái)推理能夠非常精準(zhǔn)。
大模型也有很多層,也有很多節(jié)點(diǎn),我們開始在對(duì)應(yīng)某一個(gè)任務(wù),并不知道應(yīng)該走哪個(gè)路徑是最準(zhǔn)確的,但是可以通過(guò)大規(guī)模的訓(xùn)練,反復(fù)迭代,試錯(cuò)來(lái)可以知道哪一個(gè)節(jié)點(diǎn),應(yīng)該經(jīng)過(guò)的全值概率是多少,這些就是參數(shù)。顯然參數(shù)越多,分解得越精細(xì)。我現(xiàn)在來(lái)看,從2018年 ChatGPT1到今年年初的ChatGPT4,參數(shù)已經(jīng)增加了一萬(wàn)倍,當(dāng)然對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)和調(diào)用 GPU卡數(shù)也相應(yīng)地增加。
現(xiàn)在講大模型,剛才對(duì)話嘉賓也講到了,我們中國(guó)有188個(gè)大模型,這些大模型基本上都是互聯(lián)網(wǎng)公司,還有IT企業(yè)來(lái)研發(fā)的,這種基礎(chǔ)大模型門檻還是比較高的,現(xiàn)在垂直行業(yè)的企業(yè)還很少,大企業(yè)自己做大模型,做基礎(chǔ)大模型,剛才林院長(zhǎng)說(shuō)的,它沒(méi)有辦法用到工業(yè)上,基本的語(yǔ)料不是工業(yè)語(yǔ)料,工業(yè)上數(shù)據(jù)也沒(méi)有那么多,想找這么大量數(shù)據(jù)訓(xùn)練也不容易。在節(jié)點(diǎn)上基礎(chǔ)大模型還落不了地,要落地怎么辦呢?必須跟行業(yè)合作,行業(yè)合作有兩種辦法,一種是把企業(yè)的數(shù)據(jù)送到基礎(chǔ)大模型提供方,然后讓他們幫助把行業(yè)數(shù)據(jù)加進(jìn)去進(jìn)行微調(diào),這種企業(yè)會(huì)擔(dān)心,我的數(shù)據(jù)送出去會(huì)不會(huì)泄密。技術(shù)上要完全依賴于基礎(chǔ)大模型。
還有一種辦法把基礎(chǔ)大模型訓(xùn)練好的模型給企業(yè),企業(yè)自己加上自己的數(shù)據(jù)微調(diào),這里面對(duì)企業(yè)技術(shù)水平要求比較高,另外基礎(chǔ)訓(xùn)練的時(shí)候是一個(gè)老師教的,到企業(yè)訓(xùn)練的時(shí)候是另外一個(gè)老師,這兩個(gè)老師會(huì)不會(huì)教起來(lái)有不一致的地方,那可能最后沒(méi)有辦法收了。
要跟行業(yè)合作還是有難題的,對(duì)于大多數(shù)中小企業(yè)更是了,本身就很難接入大模型,我們希望能不能把大模型變成一個(gè)簡(jiǎn)約的模塊,放在云平臺(tái) PAAS和SAAS之間,這樣一來(lái)我們就可以通過(guò)一個(gè)簡(jiǎn)單的接口,企業(yè)可以接入到這個(gè)模型模塊里面。我們還要相應(yīng)的配置一些低代碼的開發(fā)軟件,可以通過(guò)鼠標(biāo)拖拉,為企業(yè)基礎(chǔ)場(chǎng)景接入和微調(diào)提供機(jī)會(huì)。真做到了這一點(diǎn),我們將來(lái)就可以做到企業(yè)會(huì)上云,就會(huì)用這個(gè)模型了。我把中小企業(yè),通過(guò)這種方法來(lái)做模型,我稱之為場(chǎng)景的大模型,他還是針對(duì)特定應(yīng)用的。
大模型的出現(xiàn)會(huì)給我們工業(yè)上的數(shù)字化轉(zhuǎn)型和高質(zhì)量發(fā)展帶來(lái)很好的技術(shù)支撐,現(xiàn)在難題還是我們做基礎(chǔ)大模型方怎么能夠跟我們行業(yè)更緊密地結(jié)合,我已經(jīng)注意到,國(guó)內(nèi)做大模型的幾個(gè)有名的單位,他們雖然有一些提供語(yǔ)料的對(duì)話,聊天,實(shí)際上純粹對(duì)話聊天絕對(duì)不是剛需,也很難形成一個(gè)商業(yè)模式。國(guó)內(nèi)做一些大模型的單位,都瞄準(zhǔn)了做工業(yè),比如說(shuō)百度要跟吉利合作做智能客服,跟國(guó)家電網(wǎng)合作,做分布式電網(wǎng)調(diào)度。百度還做MLA疫苗序列有效分析,在新冠疫情期間,中國(guó)大量使用的是滅活疫苗,美國(guó)是使用 MLA,這有很多序列,其中也不是所有序列都對(duì)新冠有效,要找出最好的序列,這還是有難度的。據(jù)說(shuō)超算一秒鐘算一條要算一百億年,現(xiàn)在利用大模型可以優(yōu)選出比較好的疫苗,當(dāng)然不見得是最佳了,這個(gè)百度曾經(jīng)發(fā)表在雜志上,也得到了認(rèn)可。我認(rèn)為從這些方面介入,這些方面都還沒(méi)有直接進(jìn)入到制造業(yè)生產(chǎn)線上。
華為盤古大模型主要針對(duì)制造業(yè),他瞄準(zhǔn)制造業(yè)里面需求的理解,文檔的生成,工業(yè)軟件的編程,讀圖,以及我們供應(yīng)鏈管理,也可以看到這些也是在生產(chǎn)線的外圍,真正在產(chǎn)業(yè)的核心部分還是沒(méi)有進(jìn)去。
騰訊有一個(gè)微搭低代碼平臺(tái),著重面向中小網(wǎng)站,做網(wǎng)站的開發(fā)等等。
阿里有一個(gè)通義千問(wèn),訓(xùn)練參數(shù)也不少,可以支持8K向上文窗口,他可以做聊天對(duì)話,你輸入的長(zhǎng)度也反映了大模型能力。阿里可以輸入8K左右。
針對(duì)制造業(yè)領(lǐng)域做大模型的是海爾,他本身是制造業(yè),通過(guò)海爾本身家用電器的生產(chǎn),他基本上掌握了家用電器里面的生產(chǎn)流程。海爾大模型在家用電器行業(yè)里面沒(méi)有推廣,為什么呢?其他都是他競(jìng)爭(zhēng)對(duì)手,海爾大模型反而推廣到服裝行業(yè),汽車行業(yè),推廣到這些地方去了。
有了大模型,有初級(jí)人工智能發(fā)展,也給社會(huì)上更多的中小企業(yè)機(jī)會(huì)。這時(shí)候出來(lái)了一批面向更多中小企業(yè)的平臺(tái)企業(yè)。比如說(shuō)廣州有一個(gè)企業(yè)做服裝設(shè)計(jì)的建模,服裝工廠的管理。大量的服裝廠只有一大批縫紉女工,沒(méi)有什么技術(shù)的,引入了廣州致景軟件,使生產(chǎn)管理上了一個(gè)很好的臺(tái)階。
山東的橙色云,這本來(lái)是一個(gè)設(shè)計(jì)工具軟件出租公司,很多企業(yè)用工具軟件,自己買太貴了,用時(shí)候也不多,用租,以租的辦法可以省錢。后來(lái)城市運(yùn)營(yíng)發(fā)展成為設(shè)計(jì)承接和轉(zhuǎn)包平臺(tái),很多企業(yè)在那里發(fā)布一些需求,他把設(shè)計(jì)需求分解了,之后招標(biāo),最后把完成的結(jié)果通過(guò)它集成,現(xiàn)在已經(jīng)面向五萬(wàn)多家中小企業(yè)了。
深圳有一個(gè)云工科技,有一些企業(yè)需要訂貨,需要一些產(chǎn)品,不知道在哪訂,在哪里發(fā)布。還有很多企業(yè)就在這上面應(yīng)標(biāo),半年能夠撮合100億的交易。
廣州有一個(gè)公司,主要是做女裝出口,他利用珠三角的服裝加工的能力,國(guó)際快速的物流能力,從品牌,設(shè)計(jì),面料、采購(gòu)、銷售、金融、保險(xiǎn)等等一條龍,現(xiàn)在是世界上54個(gè)國(guó)家手機(jī)購(gòu)物里面最重要一個(gè)環(huán)節(jié),他即將上市,估值要超千億美元。江蘇有一個(gè)智云天工,這是一個(gè)虛擬工廠,三一重工是供應(yīng)鏈管理平臺(tái),三一重工作為龍頭,把供應(yīng)鏈200多家上下游企業(yè)關(guān)聯(lián)起來(lái),最重要做到零庫(kù)存或者說(shuō)少庫(kù)存,大大提升了效率。
現(xiàn)在談大模型大部分在大智算中心,超算上面做。現(xiàn)在一個(gè)新的出來(lái)了,把大模型做到手機(jī)上,現(xiàn)在手機(jī)已經(jīng)可以訓(xùn)練超過(guò)100億參數(shù)的,作為推理運(yùn)用,目前已經(jīng)有人做到130億參數(shù)了。估計(jì)到明年150億也可能做進(jìn)手機(jī)里。
有人說(shuō)只有超過(guò)130億的參數(shù),在手機(jī)上做有什么好處,將來(lái)大模型訓(xùn)練可以離線,這樣成本低,不需要上智算,超算中心,時(shí)延也低?,F(xiàn)在美國(guó)有一個(gè)公司,Aizip,要把大模型做到手機(jī)上需要做一些模型壓縮工作,手機(jī)芯片還要提檔。做模型壓縮工作要量化壓縮,要重新做一下。這個(gè)公司說(shuō)從大模型可以復(fù)制出小模型,可以落到手機(jī)上。
同聲傳譯,我們打電話對(duì)方是老外,他講英文我這邊聽是中文,如果是視頻,還可以幫助你對(duì)口型。我們可以跟聾啞人,手語(yǔ)對(duì)話,盲文翻譯。歌曲創(chuàng)作,你哼幾段話,后來(lái)給你續(xù)譜。
搜索,過(guò)去要很精準(zhǔn),現(xiàn)在用不著精準(zhǔn),一個(gè)模糊的話也能夠把你希望想搜什么搞出來(lái)。當(dāng)然你將來(lái)可以手機(jī)、平板、PC、電視互通。
給出一句話,一個(gè)32歲年輕女性自然保護(hù)者在叢林中探險(xiǎn),面帶親切的微笑,給你生出這個(gè)照片。中間的照片只拍了一點(diǎn)點(diǎn),現(xiàn)在延伸了,可能你只有半身照,現(xiàn)在可能變成全身照。
我們現(xiàn)在手機(jī)有前拍有后拍,現(xiàn)在可以同時(shí)用上,把你前拍的照片嵌入到后面去,當(dāng)然還要光線調(diào)整,這是自拍的合成。
這種大模型落地會(huì)催生新一輪創(chuàng)新,會(huì)降低用戶生成三維視頻門檻。我們很多年前手機(jī)一般一年半就換代了,這幾年換代沒(méi)有這個(gè)需求。將來(lái)起來(lái)了,更多的實(shí)際推廣是靠用戶產(chǎn)生內(nèi)容,大模型落到手機(jī)上,可以為用戶產(chǎn)生內(nèi)容提高一個(gè)檔次。我們不但是消費(fèi),還有健康、養(yǎng)老、監(jiān)護(hù)、教育,最有價(jià)值的還是工業(yè)應(yīng)用,你可以落在手機(jī)上,也可以落在機(jī)器人,工業(yè)模組上面,這些可以帶來(lái)新的飛躍。
IDC預(yù)測(cè)到2026年中國(guó)市場(chǎng)超過(guò)50%終端設(shè)備處理器會(huì)有AI引擎,我們認(rèn)為會(huì)讓中國(guó)互聯(lián)網(wǎng)產(chǎn)業(yè)走出低谷,會(huì)迎來(lái)一次激動(dòng)人心的井噴式發(fā)展。
數(shù)智經(jīng)濟(jì)講了很多,實(shí)際上未來(lái)我們大模型為數(shù)字經(jīng)濟(jì)增添了新的能力,我這里回顧了90年代全球市值最高的前十名,主要是日本的銀行,2000年主要都是紅色的是美國(guó)的IT企業(yè),2010 年是能源,金融,2020年又回到互聯(lián)網(wǎng)主導(dǎo)了,中國(guó)的阿里、騰訊也在上面,到今年12月份,現(xiàn)在可以看到,除了有食藥公司以外,基本上還是IT和IC企業(yè),我們說(shuō)現(xiàn)在位居前列的是以數(shù)智化企業(yè)為主,是數(shù)據(jù)成為主要的生產(chǎn)要素。
謝謝大家。
鄔賀銓
中國(guó)工程院院士
鄔賀銓,中國(guó)工程院院士,光纖傳送網(wǎng)與寬帶信息網(wǎng)專家。1999年當(dāng)選為中國(guó)工程院院士;2002年1月至2010年1月,任中國(guó)工程院副院長(zhǎng)。長(zhǎng)期從事光通信系統(tǒng)和數(shù)字通信網(wǎng)的研究與項(xiàng)目管理工作。鄔賀銓院士是中國(guó)最早從事數(shù)字通信技術(shù)研究的骨干之一,在中國(guó)國(guó)內(nèi)首先主持研制成功了PCM30路復(fù)用設(shè)備、STH-1/STM-4復(fù)用設(shè)備、155/622Mb/sSDH光纖通信系統(tǒng)等;領(lǐng)導(dǎo)管理了8×2.5Gb/s波分復(fù)用光通信系統(tǒng),研制開發(fā)光通信示范工程;多年連續(xù)參加ITU-T網(wǎng)絡(luò)標(biāo)準(zhǔn)研究組會(huì)議,多次參與了中國(guó)通信發(fā)展的決策。
轉(zhuǎn)自創(chuàng)壹智庫(kù)、新浪科技 本文推薦閱讀 ,僅用于交流學(xué)習(xí),版權(quán)歸作者或出版商所有,若涉及版權(quán)問(wèn)題,煩請(qǐng)留言聯(lián)系,我們將第一時(shí)間更正或刪除