編者按:近日,多模態(tài)人工智能模型基準評測集MMMU更新結果,啟明創(chuàng)投投資企業(yè)云知聲的山海多模態(tài)大模型UniGPT-mMed在通用能力、醫(yī)療專業(yè)能力評測中排名第一,充分彰顯其硬核實力。作為中國AGI技術產業(yè)化的先行者,云知聲建立了Atlas人工智能基礎設施,并以此為基礎,構建云知大腦(UniBrain)技術中臺——以山海通用認知大模型為核心,結合多模態(tài)感知與生成、知識圖譜、物聯平臺等智能組件,提供高效的產品化支撐,持續(xù)推動千行百業(yè)的智慧化升級。
云知聲創(chuàng)始人、CEO黃偉此前接受了第一財經《中國經營者》欄目的邀約,分享了自己對于通用大模型和垂直大模型關系的見解,以及公司對山海大模型的愿景、選擇細分產業(yè)領域時的考量、在物聯網及醫(yī)療健康領域商業(yè)化的進展。談及人工智能產業(yè)是否過熱這一問題時,黃偉指出,只有通過長期、穩(wěn)定的努力,才有可能創(chuàng)造出真正有價值的成果,投資人與創(chuàng)業(yè)者都需要審慎地將資金投入到最需要的方向。
啟明創(chuàng)投微信公眾號經授權轉載。
云知聲創(chuàng)始人、CEO黃偉
隨著ChatGPT的問世,人工智能的發(fā)展迎來了一次革命性的轉變。2024年,諾貝爾物理學獎、化學獎也均與人工智能相關,這充分印證了AI技術在科學界的重要地位。
創(chuàng)立于2012年的云知聲,已歷經多次AI產業(yè)發(fā)展熱潮,也穿越過多次行業(yè)低谷,是中國為數不多的AI領域的資深企業(yè)。
大模型浪潮下,云知聲于2023年正式發(fā)布山海大模型,交出其在AGI領域的第一張答卷。目前,山海大模型已在醫(yī)療、座艙、交通、政務、司法等多場景實現落地應用,并逐步拓展出文生圖、視覺理解、圖片問答等多模態(tài)能力,致力于滿足多種場景的應用需求,助推千行百業(yè)的智慧化升級。
日前,云知聲創(chuàng)始人、CEO黃偉接受第一財經《中國經營者》欄目的邀請,探討在上一個發(fā)展范式當中處在第一梯隊的企業(yè)該如何迎接大模型的2.0時代,就“大模型未來圖景”、“垂直大模型如何選擇行業(yè)”、“垂直大模型如何做好商業(yè)落地”等話題,給出業(yè)界前沿回答。
以下系經精編整理的專訪實錄。
01/
人工智能三問
中國經營者:在我們的節(jié)目開始之前,我們進行一個快問快答。第一個問題,我們并不知道AI里面究竟發(fā)生了什么,是嗎?
黃偉:是的。
中國經營者:AI可以自己修改代碼,逃脫人類的掌控,是嗎?
黃偉:有可能。
中國經營者:現在的技術已經到了這樣的一個狀態(tài)嗎?
黃偉:因為最近兩年的技術演進特別快,遠遠超過過去幾十年,未來兩、三年會發(fā)生什么,我們并不知道。
中國經營者:第三個問題,AI將非常擅長操縱人類,你關不掉它,是嗎?
黃偉:目前還不知道,如果說AI有意識的話,未來一切都有可能,所以說安全性、合規(guī)性也會成為我們新的研究課題。
02/
通用大模型與垂直大模型無需對立
中國經營者:在大模型出來以后,其未來圖景也在投資圈引起很多爭議,包括應用層的百花齊放,那到底未來會是什么樣?
黃偉:我認為“千團大戰(zhàn)”、“百團大戰(zhàn)”這類激烈的市場競爭不會永遠持續(xù),最終會通過競爭淘汰,留下一些優(yōu)勝者。其實不光是業(yè)內,包括像我們團隊內部,我們對大模型都有深入討論,并將其分為通用大模型和垂直大模型。有些人傾向于將這兩種模型對立起來,但我不這么認為。我們用一個強大的通用大模型來解決特定的行業(yè)問題,就好比我的學霸同桌以702分的成績考入了清華物理專業(yè),我以695分的成績緊隨其后考上了北大醫(yī)學院。我相信,經過本碩博10年的系統(tǒng)訓練,如果將來大家的健康出現問題,更可能選擇找我,而不是我的學霸同桌。
中國經營者:所以這是不是也是云知聲模型的定位,是否可以將其定義為垂直類的模型?
黃偉:我們對山海大模型的愿景是將其打造成為世界一流水平的大模型。這里所說的“一流”并不是簡單地追求排名首位,而是意味著我們具備了進入頂尖學府如清華、北大的實力。我們的目標不是一定要選擇這些頂尖學府,而是像選擇一個我們熱愛的專業(yè)一樣,我們希望在所專注的領域內達到世界領先的地位。簡而言之,我們追求的是在特定領域內的專業(yè)卓越,而不僅僅是普遍意義上的第一。
03/
垂直大模型如何選擇行業(yè)
中國經營者:從具體的行業(yè)來看,哪些細分產業(yè)領域的機會會更大一點?
黃偉:我們的目標是尋找那些具有長期潛力和高成長空間的領域,即所謂的“坡長雪厚”的領域,避免那些天花板過低的板塊。基于這樣的考量,我們決定將醫(yī)療行業(yè)作為云知聲的核心領域之一。醫(yī)療行業(yè)與每個人的健康生活緊密相關,具有長遠的發(fā)展前景。
十年前,我們在北京協和醫(yī)院首次通過語音電子病歷系統(tǒng)幫助醫(yī)生提高病歷錄入效率。過去,醫(yī)生可能需要花費三個小時通過鍵盤輸入病歷,而如今,借助我們的語音電子病歷系統(tǒng),這一時間已經縮短至一小時以內。隨著大模型技術的應用,我們預見將有更多醫(yī)院采用我們的技術,進一步提升醫(yī)療服務的效率和質量。
中國經營者:云知聲在短短的時間內做到智慧醫(yī)療領域非常頭部的狀態(tài),是不是也是因為在上一個范式積累了大量的資源,所以可以非常快速地進行技術迭代,然后找到具體的應用場景快速升級?
黃偉:穿越商業(yè)周期確實是一項挑戰(zhàn),尤其是在快速迭代的行業(yè)環(huán)境中。我總是在告訴自己,一定要少去做錯什么。自2012年起,我們便在國內率先涉足深度學習領域。到了2016年,我們開始精準定位我們的核心應用場景,即醫(yī)療和物聯網。從那時起直至今日,我們深耕的領域未曾改變。今天大模型所需的這種算法,我們自2012年起便開始積累了,所以當新的技術范式出現時,我們能夠迅速將過去12年的技術積累轉化為山海大模型的產出。
04/
垂直大模型如何做好商業(yè)落地
中國經營者:我們前面其實聊了很多關于云知聲整個大模型非常重要的跨越,包括現在大模型的外部環(huán)境。我們來聊聊商業(yè)化,因為今天我們聊醫(yī)療場景的應用比較多,比如說今天醫(yī)療場景當中的客戶和云知聲大模型是一種怎樣的合作方式?
黃偉:因為醫(yī)院是一個對數據安全極為重視的場景,所以我們在合作模式上選擇了軟件售賣。 基于AI的基礎能力,我們在醫(yī)院端構建了非常豐富的產品矩陣,未來可能衍生出50個、100個不同的能力,進而轉化為多樣化的產品。醫(yī)院的高門檻和用戶的高黏性,使得我們能夠實現持續(xù)收費,所以從過往歷史數據來看,我們醫(yī)療領域的復購率是非常高的。
中國經營者:其實前面您也談到,物聯網也是云知聲關注的一個很重要的領域,能不能稍微給我們說說物聯網領域目前是什么樣的?
黃偉:現在我們的手機、冰箱、空調、汽車等日常用品幾乎都已聯網,但在2013年左右,物聯網還被認為是一個相當前衛(wèi)的概念。我們在2013年和2014年就已經開始探索如何利用AI技術為物聯網賦能。在這個過程中,我們面臨一個關鍵問題:如何讓AI能力觸及這些設備。因為許多設備端并不具備強大的計算能力,于是我們很早就開始了芯片的研發(fā),并在2018年推出了我們的第一代AI語音芯片——雨燕。
這個過程很漫長,所有顯而易見的困難其實并不算真正的困難,真正的困難在于,我們在沒有手表、月亮和星星的夜晚行走,不知道現在是幾點,也不知道天何時會亮。這就是所謂的穿越周期。選擇正確的方向可以很理性,但沒有感性,你無法真正穿越過去。
中國經營者:最后其實是靠你心中的火和眼里的光去穿越黑暗,支撐你最后成為非常重要的幸存者。今天在云知聲的整體營收架構當中,醫(yī)療和物聯網大概是一個怎樣的比例?對于這兩個重要的板塊,您有什么樣的思考和規(guī)劃?
黃偉:我們集團內部有個很形象的比喻:物聯網就是一橫,醫(yī)療就是一縱。我們希望能夠將通用的AI能力應用于千行百業(yè),只要你不涉及專業(yè)知識,我們都能夠給你提供一些最基本的服務,在更多的行業(yè)里實現落地;而醫(yī)療是一個專業(yè)場景,一個知識密集型場景,它考驗的不是AI的通識能力,而是專業(yè)能力。這一縱就代表了艱深專業(yè)的壁壘。今年上半年,我們實現了快速且穩(wěn)健的增長,我覺得這都是對云知聲過去12年技術戰(zhàn)略、產品戰(zhàn)略堅持到今天的一個回報。
05/
如何理性看待人工智能的泡沫
中國經營者:其實我覺得雖然ChatGPT的浪潮出來的時間沒有那么長,但是它對于整個人工智能產業(yè)的變革是翻天覆地的,所以最近也出現了一些聲音,有人說是不是人工智能的泡沫有點過熱了?其實整個大模型的產業(yè)還是挺燒錢的。兩位怎么來看待這個問題。
黃偉:我認為市場存在泡沫是正常現象,且泡沫在不同發(fā)展階段有著不同的定義。實際上,我認為我們的投資力度尚未達到應有的水平。然而,投資力度不足并不意味著我們的投資得到了合理利用,關鍵在于資金的投向。我不認為單憑一個技術天才就能輕易改變世界,只有通過長期、穩(wěn)定的努力,才有可能創(chuàng)造出真正有價值的成果。無論說像投資人,還是像我們創(chuàng)業(yè)者,我覺得都應該冷靜下來,在彈藥不多的情況下,審慎地將彈藥投入到最需要的方向。
來源 | 中國經營者