由啟明創(chuàng)投主辦的2025世界人工智能大會(WAIC)“啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇——創(chuàng)業(yè)投資開啟AI技術與應用共振周期”于7月28日在上海世博中心藍廳成功舉辦。
在本次論壇上,與愛為舞創(chuàng)始人兼首席執(zhí)行官張懷亭以《關于AI應用創(chuàng)業(yè)的思考與實踐》為題發(fā)表了演講。
與愛為舞創(chuàng)始人兼首席執(zhí)行官張懷亭
張懷亭在演講中表示,AI應用的創(chuàng)業(yè)機會在于利用生成式AI技術,將服務業(yè)做成制造業(yè),打破大規(guī)模(個性化)-高品質-低成本的不可能三角。之所以目前還沒看到AI應用的爆發(fā)式商業(yè)化落地,核心原因是大模型的幻覺、推理的不準確和結果的不確定。這就要求從事AI應用的團隊既要懂業(yè)務還要懂AI技術,平衡模型的不確定性和業(yè)務的容錯度,先跑通業(yè)務閉環(huán),用業(yè)務牽引AI能力逐步落地,同時找到適合自身業(yè)務場景的數據飛輪。在智能時代,跨界的人才密度和務實創(chuàng)新的企業(yè)文化是組織建設的關鍵,人機協同的工作范式是企業(yè)運營的基礎。
以下系張懷亭的演講內容。
感謝啟明創(chuàng)投給我們這樣一家成立才兩年多的初創(chuàng)企業(yè)機會,在這里向大家匯報一下,我們在AI應用領域這兩年來創(chuàng)業(yè)的實踐、總結和認知。
十幾年前,我和當時的團隊在互聯網大廠,第一次用深度機器學習算法,開發(fā)了大概率是全中國第一個大規(guī)模廣告推薦系統。這個系統取得了不錯的效果,幫助我們建立了對AI的初步認知。之后,我和一群志同道合的伙伴在教育領域進行了第一次創(chuàng)業(yè),并有幸在紐交所上市,對教育行業(yè)也有了一定的認知。當生成式AI出現時,我們發(fā)現它可以給“科技向善”和教育普惠更大的空間。于是在2023年,我和我的伙伴們開啟了第二次創(chuàng)業(yè)。
我們認為教育最重要的是有好老師,做到有教無類。也就是說,無論是男生還是女生,在城市還是鄉(xiāng)村,貧窮還是富有,孩子還是成人,每個人都能擁有一位很好的終身陪伴的AI老師,根據個體的興趣、階段、效率、潛力、狀態(tài)、性格等,進行個性化的傳道、授業(yè)和解惑。當然,實際上今天的教育資源依然非常稀缺,教育成本也比較高昂。當生成式AI技術出現時,基于對科技和教育的認知,我們判斷服務個體的教育資源在邊際成本上一定會越來越低,理論上應該接近于實時的推理成本,大概率能在現有成本基礎上削減90%。隨著技術的發(fā)展,成本下降幅度也會越來越大。同時我們認為,這樣的AI老師應該具備隨時隨地的特性,不管你在哪里,只要想用就能用。而且它的知識儲備將隨著智能系統的增強而增強,有可能在所有領域為每個人提供最適配的個性化指導。
今天我并不想過多介紹產品或算法,這幾天在這里有很多相關展示,相信大家都已看到。因此想換一個視角,由于我們是連續(xù)創(chuàng)業(yè)團隊,希望從創(chuàng)業(yè)的角度和大家做一些淺顯的分享。
我們認為在AI應用領域較大的創(chuàng)業(yè)機會是把服務業(yè)做成制造業(yè)。大量現有的服務業(yè)是人力密集型行業(yè),這些行業(yè)經常會遇到“不可能三角”:既希望用低成本提供高質量服務,又需要大規(guī)模覆蓋,這基本上是個悖論。以醫(yī)生為例,生活中我們經常有這樣的經歷:到醫(yī)院可能要排兩小時隊,最后只和醫(yī)生聊十來分鐘;或者醫(yī)生開了檢查單,又要排隊做檢測,有時能排上,有時排不上,可能還得約下一次。這充分說明對大多數人而言,獲得高質量服務很難,同時成本也很高。生成式AI讓我們看到了機會,能夠規(guī)?;靥峁﹤€性化服務,實現質與量的兼顧。在虛擬的數字世界里,我們常聽到“千人千面”這個詞,“千人”代表規(guī)模,“千面”代表個性。類似推薦系統,像內容分發(fā)這類應用,已經解決了規(guī)?;蛡€性化的并存問題,但在服務行業(yè)還未實現,主要受限于推薦系統本身的能力邊界。
用生成式AI改造人力密集型行業(yè),首先用算力成本替代人力成本是更合適的。從趨勢看,算力成本會越來越低,而人力成本會越來越高。其次,人力密集型企業(yè)的人才選拔、使用和培養(yǎng)極其復雜,加上優(yōu)秀人才流失,管理成本非常高,幾乎不可能完全標準化。但如果采用生成式AI技術,標準化服務是可以實現的。一旦用生成式AI技術把服務業(yè)做成制造業(yè),未來我們每個人身邊都可能擁有專屬的AI老師、AI律師和AI家庭醫(yī)生。
對于AI應用,似乎尚未看到大規(guī)模落地與爆發(fā),這是為什么呢?作為對比,我們來回顧十多年前移動應用爆發(fā)的前提。首先,當時的5G網絡基本成形,智能手機也已普及,基礎硬件建設層面已然成熟。手機具備定位、相機和支付功能,為移動應用提供了基礎保障。例如高德地圖、滴滴打車和美團外賣都依賴手機的定位能力;快手、小紅書基于相機功能記錄生活,無論是視頻還是圖文;像高途這樣的在線教育公司則依賴音視頻直播互動,幫助用戶隨時隨地學習。同時,支付功能的普及使應用商業(yè)化成為可能,否則大量商機將被錯過。正是有了這樣的基礎設施,移動互聯網的應用公司只需要考慮應用本身,而不需要考慮更底層的體系構建。
而今天,我們會發(fā)現模型存在很多幻覺,推理能力依然不夠準確,相同上下文場景下的輸出結果也不穩(wěn)定。同時,多模態(tài)能力如數字人的實時交互、大幅遮擋下的面部穩(wěn)定性、實時生成的表情神態(tài)、語音語調以及互動延遲等方面都還比較弱。此外,很多企業(yè)至今尚未遇到這樣的情況:在同一時間面臨數百、數千甚至數萬的推理并發(fā),這需要優(yōu)化大量底層架構能力,對如今的創(chuàng)業(yè)團隊要求較高。一方面需要判斷AI發(fā)展趨勢和迭代速度——實際上從去年到今年,發(fā)展速度已超越當年的摩爾定律;另一方面要明確當前模型的能力邊界,比如文生圖,也許這個圖片可以直接用,但文生視頻用于短劇制作還達不到要求。應用過程中還需平衡模型不確定性與業(yè)務容錯度,這一點很關鍵。比如推薦系統做內容分發(fā),用戶不喜歡的短視頻劃走即可;廣告推薦系統推送了用戶不感興趣的廣告,略過就行。但如果AI醫(yī)生要做手術,能否允許它犯錯?因此模型輸出的不確定性與業(yè)務容錯度直接相關,如何平衡何時使用模型能力、何時依賴系統能力,就是一個“真問題”。
對于AI應用創(chuàng)業(yè)的路徑,我們的理解是:先建立業(yè)務閉環(huán),驗證應用場景的有效性;然后用模型逐步輔助或替換閉環(huán)中的某些環(huán)節(jié),最終實現業(yè)務的AI化變革。這或許是一條比較務實的漸進路徑。在此過程中,核心問題是整個閉環(huán)數據能否上到云端?是否有系統可以采集所有交互數據和靜態(tài)特征,形成高質量的特征集合?之后用這些有效數據訓練模型,完成AI應用的最終變革。這一思路得益于對互聯網創(chuàng)業(yè)史的總結——許多顛覆性技術的應用源于成熟業(yè)務的倒逼。例如阿里云和亞馬遜云,都是因為自身電商產品有集中爆發(fā)式的使用壓力,才推出了云服務,云服務為內部提供支撐,能力溢出后再為更多的外部機構提供服務。
對于AI應用,還有一個底層思考,關鍵在于用AI來賦能,還是用AI來替換?我們判斷這兩種情況都有可能,體現在不同業(yè)務或環(huán)節(jié)中。AI賦能如同將人變成鋼鐵俠,實現路徑是智能輔助、人為決策。由于當前AI尚未達到頂級人類水平,人的頂線更高。通過AI助力實現部分標準化,大概率可以把人做事情的方差變小。因為最終還是由人來決策,我們可以想象,比如一個人一秒鐘做一次決策,一天做決策的上限也就是86400個,受限于此,業(yè)務的增長只能是線性的。當然通過AI輔助,成本必然會有一定的下降。最終整個團隊的組織能力是構建在管理和系統上的。當我們假設有一個工作可以用AI完全替換,也就是無人化,則采用智能系統驅動。鑒于當前AI并非100%準確,仍需人工兜底。長期來看,不受人力限制的算力擴展可能實現指數級增長。就目前AI水平而言,頂線雖不及人類,但均線一定會提升,方差理論上應該為零,成本將呈數量級下降。這種體系下,組織能力僅僅需要構建在全智能系統上,效率更高、成本更低、迭代速度更快。
大家經常會問一個問題,AI應用是否存在數據飛輪?最近谷歌也好,OpenAI也好,都宣布模型在奧林匹克數學競賽的難題解答上已經做得非常好。類似這樣一個有確定性答案的任務,今天的模型能力已經遠超絕大部分人類,這時它和人在交互過程中取得的信息,已經不足以再提升它自身的智能。例如詢問“英偉達股票還能買嗎”,如果信息足夠充分,理論上存在標準答案,此時無需通過交互獲取更優(yōu)解,也就不存在數據飛輪。再比如說有一個完整約束條件的任務:“購買北京至上海7時的高鐵二等座車票”,Agent只需執(zhí)行即可,不存在迭代優(yōu)化的數據飛輪。
什么是數據飛輪?比如你現在要求“中午訂一份好吃的外賣”,Agent需要了解用戶身份、用餐時間、送餐時效、飲食偏好、地點、價格區(qū)間,以及近期點餐記錄是否需要避免重復等。這些都需要通過持續(xù)使用過程中個性化的交互沉淀用戶習慣,形成數據飛輪。更復雜的如“提高英語能力”,這個英語能力指的是聽、說、讀、寫中的哪種?應該怎么提升?當前的水平是怎樣的?個人的學習習慣是怎樣的?學習效率是怎樣的?這些都是與用戶的交互過程中持續(xù)沉淀下來的靜態(tài)特征和動態(tài)行為,結合長短期的上下文,才能實現個性化交互,逐步形成數據飛輪。
今天AI應用的組織到底應該是什么樣的?我們認為最重要的還是人才,且人才密度需高于業(yè)務復雜度。如今既需要行業(yè)領域人才,也需要AI人才,實際上領域人才和AI人才放到一起融合,難度是非常大的。我們公司曾出現這樣的情況:AI人才認為某些工作“不夠AI”,沒有充分運用模型;而領域人才則指出當前模型能力有限,仍需沿用原來的方法。怎么把他們融到一起,形成合力,這非常關鍵。第二,需要建立務實與創(chuàng)新并存的企業(yè)文化。正如前文所述,先構建業(yè)務閉環(huán),再通過AI進行升級或變革。既要有基礎業(yè)務能力,務實地創(chuàng)造商業(yè)價值,還要持續(xù)關注全球技術發(fā)展,懂得如何把AI能力應用到業(yè)務上。第三,硅基生命已成為組織的必要組成部分。例如在代碼研發(fā)中,可能需要Cursor等的協助;在銷售環(huán)節(jié),AI可承擔某些具體工作。因此,人機協同將成為智能時代企業(yè)的基礎運營范式。對于難以適應這種轉變的資深員工,我們一方面要提供機會,給時間點推動這樣的員工做改變;另一方面,我們也會敦促員工:站在未來看現在,不換腦子就換人。
以上就是我的分享,總結我們在AI應用探索中遵循的16個字:“業(yè)務牽引、智能驅動、人機協同、務實創(chuàng)新”。公司提倡延遲滿足,引導大家不高估短期收益,也不低估長期積累。
來源 | IPO早知道