編者按:在由啟明創(chuàng)投主辦的2023世界人工智能大會“生成式AI與大模型:變革與創(chuàng)新”論壇上,人工智能等技術前沿領域的著名專家與學者,頂級投資人和領軍創(chuàng)業(yè)者匯聚一堂,共同探索中國科技創(chuàng)新的驅動力量。
本次論壇是大會唯一一場由創(chuàng)投機構主辦的相關論壇,立足創(chuàng)業(yè)與投資視角,分享了最新生成式AI前沿信息和實踐探索,并發(fā)布了行業(yè)首份基于對海內外逾百家企業(yè)深入調研撰寫的生成式AI洞察報告,全方位解讀了生成式AI的產業(yè)變革和未來十大展望。
啟明創(chuàng)投投資企業(yè)云知聲董事長兼CTO梁家恩在演講中分享了生成式AI賦能未來的力量。梁家恩指出大模型帶來了AI的新時代,開啟了“數(shù)據動力學”新范式:預訓練、指令微調和反饋強化。大模型整合大數(shù)據,將成為AI 2.0時代的“發(fā)電廠”,并將會驅動人才、技術、市場等產業(yè)核心要素的升級。云知聲自研的山海大模型有強大的通用能力,并聚焦于插件擴展和領域增強等相關能力構建,圍繞智慧物聯(lián)和智慧醫(yī)療等行業(yè)賦能客戶。未來云知聲將繼續(xù)探索智能極限、引領產業(yè)升級。
以下為精編整理的演講實錄。
今天非常高興在這個論壇上和大家分享、交流。啟明創(chuàng)投一直支持我們的發(fā)展,至今已有十年的時間了,我們走過了AI 1.0時代,現(xiàn)在我們發(fā)布了大模型,AI 2.0時代已經開啟,我們希望圍繞這一話題和大家進行分享。
云知聲董事長兼CTO梁家恩
這次的分享分成兩部分:一個是宏觀的部分,從十年的產業(yè)實踐出發(fā),我們是怎么看待這一次的大機會;第二是微觀的部分,云知聲在這些年發(fā)展的實踐路徑以及大模型給我們帶來的機會。
01/
大模型整合大數(shù)據
將成為AI 2.0時代的“發(fā)電廠”
人工智能確實是很多代人的夢想,從1956年開始提出這個概念,一直到今天,已經60多年過去了,如果算上圖靈時代,已經有80多年了。
這個時代經歷了三個階段。最早我們希望機器能夠像人一樣做事。第二階段是希望機器像人類的專家一樣分析問題和解決問題。第三個階段是完全從神經網絡的角度出發(fā),我們能不能訓練出好的會學習的機器,完全從錯誤當中學習知識,就像曾子所說的“吾日三省吾身”,這種情況下我們能把模型訓練到最大。大模型我們可以歸納為老子在《道德經》里所說的“為學日益,為道日損”。
“為學日益”使得數(shù)據的規(guī)模和計算的尺度比以前大得多,方法上反而比以前看起來要簡潔得多,特別是Transformer模型出來之后,是非常緊湊的學習框架,它的威力非常大。
大模型推出之后我們認為它已經開啟了數(shù)據動力學的時代。像人類想飛到天上是空氣動力學的問題。到今天為止我們認為人工智能最重要的是能不能用機器把數(shù)據學好。
這分為三個階段:在無監(jiān)督學習階段,因為擁有1750億參數(shù),GPT基本實現(xiàn)了博覽全書;我們會發(fā)現(xiàn)它有很強的語義抽象能力,這時可以通過指令的微調,讓它學到知識,并真正解決問題;ChatGPT加上人工反饋的機制,能實現(xiàn)德才兼?zhèn)洹?/strong>我們認為大模型的起點從2018年預訓練大模型開始,后面GPT在規(guī)模上提升起來,到ChatGPT已經呈現(xiàn)出非常強大的通用釋放能力,這是圍繞我們的語言展開的,是一種新的范式。
我們認為大模型能更好地整合大數(shù)據。在互聯(lián)網時期,它已經開始產生紅利了,我們通過數(shù)據等傳統(tǒng)的方法分析學到的知識。我們過去使用煤、石油,有了好的發(fā)電廠、煉油廠之后,才發(fā)現(xiàn)能源可以賦能所有的行業(yè)。大模型建立了非常好的數(shù)據整合的框架,為AI 2.0時代構建了很好的“發(fā)電廠”,智能數(shù)據成為了生產力要素。以前我們說這個要素是存在的,但是如果沒有好的裝置把它對外智能且有效地輸出,就很難實現(xiàn)價值。我們認為現(xiàn)在它開啟了一個像MaaS服務的模式,未來會成為各個行業(yè)里創(chuàng)新的重要機制。
為什么我們認為大模型已經到了AI 2.0時代?它會對產業(yè)的核心要素的升級起到關鍵作用。
由于人才、技術和市場的共同作用才能形成一個大的產業(yè)。過去我們在AI 1.0的時代也做了這個工作,但是只能解決系統(tǒng)里的一些零部件,由智能功能完成某一些環(huán)節(jié)。現(xiàn)在有了大模型之后,我們發(fā)現(xiàn)不論在人才端、市場端,還是核心技術和驅動產品創(chuàng)新端里都有很大的突破。對外來說,未來大家可以看到越來越多的虛擬人的形象出現(xiàn),也會通過分析營銷數(shù)據更真實地理解市場的動態(tài)。對內來說,對我們的生產效率、生產質量的提升,包括組織效率的提升都會有實質性的變革。
02/
未來要務實地解決實際場景中的問題
讓大模型真正產生商業(yè)價值
新的商業(yè)模式分為兩個方面。在通用平臺方面,過去在互聯(lián)網時代誕生的像BAT這些巨頭,以及移動互聯(lián)網里一些視頻巨頭,其實都是由這種平臺型公司構建的。大模型出現(xiàn)后,這些平臺仍然會有新的模式,這些模式并不是說把里面的部件直接變成大模型的部件,邏輯與今天的商業(yè)邏輯相比沒有什么大的變化,而是通過大模型制造規(guī)模效應和邊際成本的降低,形成飛輪效應,可以帶來新的顛覆和創(chuàng)新。如果應用形態(tài)并沒有發(fā)生變化,只是希望改變巨頭業(yè)務中的內核,單純靠這個技術來推動的機會并不大。我們借助新的多模態(tài)的交互和行業(yè)多模態(tài)的應用,把這個平臺構建起來就會有新的機會。
另外就是在行業(yè)大模型層面,大家看到像AI 2.0時代,很多2B的新興業(yè)務開始出現(xiàn)。通用大模型像一個完整的“六邊形戰(zhàn)士”,在各個方面都不錯。最重要的是我們能不能在一個行業(yè)里面真正可靠地解決問題。以最先進的GPT-4的模型來說,它的可靠性、可控性都存在很大的風險,這些問題如果不能得到有效解決的話,作為商業(yè)系統(tǒng)來說,在行業(yè)里面解決一些嚴肅場景的應用問題,就會有比較大的挑戰(zhàn)。我們認為整個行業(yè)的大模型生態(tài),應該要務實解決這方面的問題。另一方面要把成本降到足夠低,對于企業(yè)應用而言,成本是很大的負擔,對于其規(guī)?;瘯砗艽蟮挠绊憽?/strong>
大模型帶來了很多優(yōu)勢,也有很多挑戰(zhàn)。大家比較直觀地感覺到它的認知能力有了很大的提升。在AI 1.0的時代,不管誰做的聊天機器人,聊不到十輪已經暴露其智商與人類有顯著的差距,但是ChatGPT推出之后,全球上億用戶和它對話了大半年,感覺聊天可以一直進行下去。可以說它的認知能力有顯著提升,交互的體驗感也有明顯的提升。
另外就是生成式的能力,人與機器協(xié)同,創(chuàng)造能力也得到了比較大的提高。過去AI 1.0時代是鑒別式人工智能,幫我們實現(xiàn)一個確定性的目標。譬如把聲音轉成文字,這是確定性的任務。人類需要機器輔助做各種創(chuàng)作。雖然GPT會出現(xiàn)事實性問題,但如果將其轉變成可控的能力,可以為我們打開很好的局面。同時它也顯著地提升了我們的知識和信息的整合能力。當然也有負面的因素,雖然現(xiàn)在的大模型并不具備人類的意識能力,但我們怎么調校它才能將其變?yōu)榭煽氐南到y(tǒng)?這是我們需要解決的問題。
未來應該要務實地解決實際場景中的問題,讓大模型真正產生商業(yè)價值。另外它的可靠性、可控性和合規(guī)性都要得到有效的控制,才可能達到好的商業(yè)化。
03/
通過人工智能的手段
創(chuàng)造一個互聯(lián)直覺的世界
在過去十年中,云知聲希望能夠通過人工智能的手段,創(chuàng)造一個互聯(lián)直覺的世界。2012年,剛好趕上深度學習在ImageNet刷榜,這是行業(yè)內非常有標志性的事件。這個團隊當時是在卷積網絡實現(xiàn)了突破,那一年剛好是云知聲創(chuàng)立的第一年。
2016年,AlphaGo作為人工智能的浪潮席卷行業(yè),今天的大模型代表第三波浪潮。在此期間,我們主要構建了底層非常強大的超算平臺,這個超算平臺的構建是我們做這個大模型的基礎。當時的大模型是在2018年做出來之后,開始通過預訓練的方式和底層調優(yōu)的方式,解決語義理解的問題。人工智能皇冠上的明珠就是理解能力是否足夠強大。語言不僅是交流的工具,更多是解決認知問題的關鍵部件。
2018年,人工智能行業(yè)已經具備強大的通用語言理解能力了。GPT之后通用的能力可以得到更大的釋放。我們認為AGI時代由ChatGPT展開了。過去,我們很難設計一個系統(tǒng)應對這么多的復雜任務,OpenAI在ChatGPT推出之后已經打開了新的局面,但它只是我們的起點,并不是我們的終點。
我們的技術體系覆蓋底層的超算平臺至上層的智能組件和大模型。云知聲在今年上半年5月24日開發(fā)了山海大模型,除了底層的通用能力,我們聚焦構建插件能力、領域增強和客戶定制的能力,這是圍繞行業(yè)應用展開的。我們過去積累的是智慧物聯(lián)、智慧醫(yī)療方面的應用。有應用的驅動才能讓我們的模型變得越來越強大。
通用的基礎上我們構建的是插件的擴展。大模型最大的問題之一是信息的時效性非常有限,另外它能不能有效地控制、使用工具,這也是一個很大的問題。此外,還需要通過行業(yè)知識提高它的專業(yè)性和可靠性。
在領域增強維度,我們重點強調的是在醫(yī)療行業(yè)的應用。目前我們已經有幾百家醫(yī)院在商業(yè)應用了。這輪應用通過預訓練,包括指令微調和插件的增量,擴展我們在行業(yè)里面的應用。通過醫(yī)療行業(yè)的應用,我們已經在MedQA評測中超越了GPT-4的水平,6月底從81分提高到了87分。山海大模型在滿分為600分的模擬國內臨床執(zhí)業(yè)醫(yī)師資格考試中,目前為止已經突破500分,360分就可以拿到資格證了。
除此之外,我們還提供了約7個應用場景,主要是在醫(yī)院里面展開。醫(yī)院中有很多定制工作,因為一個通用模型并不能解決它的需求,包括需求定制、數(shù)據安全、風險控制、服務支持等。只有把這些問題有效解決之后,行業(yè)應用才真正能夠打通。
目前,國內我們已在2萬多間酒店房間內應用了大模型,過去,與人工智能的對話不可能實現(xiàn)這樣的流暢度,僅僅可以完成功能性的交互,但現(xiàn)在有了山海大模型之后,靈活度高了很多。
04/
AGI將會繼續(xù)探索智能的極限
同時引領產業(yè)的升級
未來,我們認為AGI將會繼續(xù)探索智能的極限,同時引領產業(yè)的升級。
首先,探索智能極限其實是科學層面的問題,雖然說它開啟了起點,但是未來還有很大的挑戰(zhàn),包括更大的模型、數(shù)據和算法,以及可控性和可靠性方面的研究?,F(xiàn)在我們認為這基本上超過了圖靈測試的水平,它會從模仿達到超越。因為當系統(tǒng)能達到這個狀態(tài)以后,在研究可計算的問題時,很有可能會超越人類的智慧。
對于產業(yè)來說,最核心的還是解決問題,能夠比較可靠、高效地驅動產業(yè)的發(fā)展。智能探索需要大量資金;從賺錢的角度來說,我們需要把產業(yè)推動起來,形成良性的商業(yè)閉環(huán),將行業(yè)真正構建起來。
請關注啟明創(chuàng)投公眾號
在后臺輸入“生成式AI報告”
獲取完整報告下載方式