农村强奸一级网站|久草京热在线视频|色五月桃花综合激情|亚洲人妻精品主播|欧美无限码中文在线|国产午夜伦理三级|亚洲男女在线播放|欧美日韩成人香蕉视频|全球无码AV1区|中文字幕亚洲五月

投資企業(yè)新聞

啟明星 | 星環(huán)科技孫元浩:通用大模型應(yīng)提升模型精準(zhǔn)度和模型效果,才能真正具備競(jìng)爭(zhēng)力

2024/06/14 | 澎湃科技

以下文章來源于澎湃新聞科技頻道 ,作者張靜

編者按:在2024向星力·未來數(shù)據(jù)技術(shù)峰會(huì)上,啟明創(chuàng)投投資企業(yè)星環(huán)科技(688031.SH)創(chuàng)始人、首席執(zhí)行官孫元浩宣布,星環(huán)科技的定位從Data Infra進(jìn)一步延伸到AI Infra,為企業(yè)客戶打造AI基礎(chǔ)設(shè)施,建立從語料處理、模型訓(xùn)練、知識(shí)庫(kù)建設(shè)等一整套工具鏈,幫助企業(yè)快速建立行業(yè)大模型。

峰會(huì)期間,孫元浩接受了澎湃科技的采訪。他分析指出,企業(yè)用戶對(duì)于模型的需求是高精準(zhǔn)度及解決實(shí)際問題的能力,因此,大模型的新趨勢(shì)是用RAG(檢索增強(qiáng)生成)和Agent(智能體)技術(shù)提升模型精準(zhǔn)度。針對(duì)大模型落地的核心難點(diǎn),孫元浩表示高質(zhì)量語料是關(guān)鍵,他提出了例如構(gòu)建用于推理的知識(shí)圖譜的解決方案。

啟明創(chuàng)投微信公眾號(hào)經(jīng)授權(quán)轉(zhuǎn)載。


星環(huán)科技創(chuàng)始人、首席執(zhí)行官孫元浩

“大模型卷價(jià)格對(duì)企業(yè)用戶來說幫助并不大,企業(yè)用戶對(duì)模型的精準(zhǔn)度要求高,通用大模型更應(yīng)通過提升模型精準(zhǔn)度和模型效果,贏得競(jìng)爭(zhēng)力?!逼髽I(yè)級(jí)基礎(chǔ)軟件供應(yīng)商星環(huán)科技創(chuàng)始人、首席執(zhí)行官孫元浩日前在2024向星力·未來數(shù)據(jù)技術(shù)峰會(huì)期間接受澎湃科技采訪時(shí)作出上述表示。

01/
企業(yè)用戶對(duì)于模型的精準(zhǔn)度要求很高
希望能夠解決實(shí)際問題

近期,中國(guó)通用大模型價(jià)格戰(zhàn)打得火熱,科技巨頭紛紛參戰(zhàn)。孫元浩表示,這是由中國(guó)特殊生態(tài)造成的。在他看來,企業(yè)用戶對(duì)于模型的精準(zhǔn)度要求很高,希望能夠解決實(shí)際問題,當(dāng)前即使是市場(chǎng)上最大參數(shù)的模型也未必能達(dá)到企業(yè)要求,所以降價(jià)對(duì)企業(yè)用戶而言幫助有限?!捌髽I(yè)的要求遠(yuǎn)比現(xiàn)在的模型能力高很多”。

在孫元浩看來,僅依靠低價(jià)很難讓用戶形成粘性,“降價(jià)是為了給開發(fā)者提供低廉的Token價(jià)格,基于通用大模型開發(fā)應(yīng)用,從而試圖構(gòu)建生態(tài),收集高質(zhì)量數(shù)據(jù)。但事實(shí)上,模型是很容易被替代的,用戶想換就換,因?yàn)榻涌谌渴亲匀徽Z言,沒有額度限制?!?/span>

去年,孫元浩判斷,要讓大模型變成“理科生”,成為專業(yè)領(lǐng)域的專家模型。今年,他認(rèn)為大模型的新趨勢(shì)是用RAG(檢索增強(qiáng)生成)和Agent(智能體)技術(shù)提升模型精準(zhǔn)度?!艾F(xiàn)在大家又開始開發(fā)Agent,可能馬上會(huì)出現(xiàn)成千上萬個(gè)Agent,這可能是現(xiàn)在大模型能力不夠造成的,模型沒辦法聰明地學(xué)習(xí)現(xiàn)在該用什么工具、怎么用,構(gòu)建Agent的過程就是教大模型怎么使用內(nèi)部工具?!?/strong>

02/
高質(zhì)量語料是解決行業(yè)大模型幻覺
及可信可控等核心落地難點(diǎn)的重要手段

目前,通用大模型數(shù)量快速增加,并不斷升級(jí)迭代,但卻不能完全適應(yīng)企業(yè)AI應(yīng)用需求。企業(yè)對(duì)行業(yè)大模型需求增加,迫切需要降低使用門檻?!艾F(xiàn)在每個(gè)大模型應(yīng)用開發(fā)都要很久,重復(fù)訓(xùn)練量很大。我們想把整套AI基礎(chǔ)設(shè)施建好,用戶再在大模型上開發(fā)應(yīng)用就快了?!睂O元浩表示,過去一年幫助企業(yè)客戶落地大模型時(shí),發(fā)現(xiàn)每個(gè)環(huán)節(jié)都遇到了挑戰(zhàn)。為此,星環(huán)科技開發(fā)了語料處理、模型訓(xùn)練、知識(shí)庫(kù)建設(shè)等工具鏈,就是為了幫助企業(yè)建立行業(yè)大模型,快速使用生成式AI(AIGC)

在AI基礎(chǔ)設(shè)施中,星環(huán)科技無涯大模型Infinity可為各行業(yè)定制自有大模型,提供意圖理解、語義召回、數(shù)據(jù)處理和分析能力?;跓o涯大模型,星環(huán)科技推出無涯·問知、無涯·問數(shù)、無涯·金融、無涯·工程等AI原生應(yīng)用,可應(yīng)用于金融、能源、制造、工程等領(lǐng)域。

孫元浩表示,大模型擅長(zhǎng)生成文本,但回答嚴(yán)肅問題不可控,為此團(tuán)隊(duì)經(jīng)過微調(diào)、增加語料,將模型訓(xùn)練成“理科生”,同時(shí)將企業(yè)內(nèi)部數(shù)據(jù)知識(shí)化,利用RAG提升模型準(zhǔn)確度。

語料質(zhì)量決定了模型質(zhì)量,高質(zhì)量語料也是解決行業(yè)大模型幻覺、可信可控等核心落地難點(diǎn)的重要手段。孫元浩表示,大模型結(jié)構(gòu)已不是秘密,訓(xùn)練方法也不是秘密,但語料散落在各種地方,導(dǎo)致工作量大,“目前最大的挑戰(zhàn)是把現(xiàn)有資料整理起來訓(xùn)練或微調(diào)模型,企業(yè)應(yīng)用要求100%準(zhǔn)確,所以用現(xiàn)在的語料還不夠,我們正在構(gòu)建知識(shí)圖譜用于推理,再結(jié)合大模型提升準(zhǔn)確度。”


來源 | 澎湃科技
作者 | 張 靜