編者按:近日,啟明創(chuàng)投投資企業(yè)銀河通用率先將英偉達(dá)Jetson Thor部署至自研具身智能大模型機(jī)器人Galbot G1 Premium機(jī)器人體內(nèi)。在2025世界機(jī)器人大會(huì)上,Galbot G1 Premium完成了工業(yè)料箱搬運(yùn)場(chǎng)景的全球首秀,展現(xiàn)出絲滑的運(yùn)動(dòng)性能以及實(shí)時(shí)的貨箱視覺處理與運(yùn)動(dòng)規(guī)劃能力。銀河通用致力于推動(dòng)具身智能的技術(shù)突破與規(guī)?;瘧?yīng)用,讓機(jī)器人在城市生活、產(chǎn)業(yè)生產(chǎn)、醫(yī)療康養(yǎng)等各類場(chǎng)景中成為人類的可靠伙伴。
北京大學(xué)助理教授、銀河通用創(chuàng)始人兼首席技術(shù)官、智源學(xué)者王鶴此前在接受《中國(guó)企業(yè)家》雜志的采訪時(shí),分享了自己創(chuàng)業(yè)的契機(jī),銀河通用團(tuán)隊(duì)在規(guī)劃技術(shù)路線時(shí)的思考,及在創(chuàng)業(yè)歷程中的兩點(diǎn)體會(huì)——工程落地的全局把控能力及科學(xué)家級(jí)的前瞻視野。王鶴指出,對(duì)產(chǎn)業(yè)落地關(guān)鍵技術(shù)的高度聚焦是銀河通用得以快速發(fā)展的核心原因。展望未來,他表示,具身智能的終局是走進(jìn)千行百業(yè)、千家萬戶,這需要機(jī)器人本體和背后的AI能力一步步演進(jìn),目前銀河通用正朝著這個(gè)目標(biāo)全力推進(jìn)。
啟明創(chuàng)投微信公眾號(hào)經(jīng)授權(quán)轉(zhuǎn)載,文章有編輯與刪節(jié)。
北京大學(xué)助理教授、銀河通用創(chuàng)始人兼首席技術(shù)官、智源學(xué)者王鶴
當(dāng)深夜急用藥訂單響起,北京一家24小時(shí)零售藥店內(nèi),銀河通用Galbot G1機(jī)器人的機(jī)械臂精準(zhǔn)鎖定抓取藥品,打包并交給即將來取貨的快遞員。
在更復(fù)雜的線下零售場(chǎng)景中,類似場(chǎng)景復(fù)現(xiàn)。北京大學(xué)助理教授、銀河通用創(chuàng)始人兼首席技術(shù)官、智源學(xué)者王鶴在2025年智源大會(huì)現(xiàn)場(chǎng)做了一個(gè)演示——當(dāng)他發(fā)出“Galbot,我又熱又餓,幫我拿點(diǎn)吃的”的指令時(shí),機(jī)器人無需遙操作,可以自主在現(xiàn)場(chǎng)1:1還原的商超場(chǎng)景中規(guī)劃路徑,從貨架中識(shí)別并抓取餅干飲料送達(dá)。
出于對(duì)人工智能的興趣,2016年在斯坦福大學(xué)讀博期間,王鶴的研究方向從半導(dǎo)體元器件轉(zhuǎn)到了計(jì)算機(jī)視覺。他之前在物理學(xué)等方面的背景,讓他找到了一個(gè)全新的研究方向:如何讓AI幫助機(jī)器人看懂世界、跟世界交互,并建模仿真世界解決機(jī)器人背后的數(shù)據(jù)等問題,也就是近年來機(jī)器人領(lǐng)域的熱門概念——“具身智能”。
2021年,王鶴回國(guó)任教于北京大學(xué)前沿計(jì)算研究中心,建立具身感知與交互實(shí)驗(yàn)室。作為國(guó)內(nèi)少有的研究具身智能的年輕科學(xué)家,王鶴由此被眾多投資人發(fā)掘。2023年5月,他聯(lián)合前ABB集團(tuán)機(jī)器人專家姚騰洲創(chuàng)立銀河通用,以“合成數(shù)據(jù)驅(qū)動(dòng)+多模態(tài)大模型”為核心技術(shù)路徑,專注于具身智能多模態(tài)大模型通用機(jī)器人的研發(fā),為商業(yè)、工業(yè)、醫(yī)療等場(chǎng)景提供跨領(lǐng)域泛化能力解決方案。
成立2年多來,銀河通用累計(jì)完成超24億元融資,投資方包括啟明創(chuàng)投等重大投資平臺(tái)及知名機(jī)構(gòu),也得到產(chǎn)業(yè)方的投資,并多次獲得老股東復(fù)投。
作為具身智能領(lǐng)域融資與估值的頭部企業(yè),銀河通用已初步實(shí)現(xiàn)通用機(jī)器人的規(guī)?;涞貞?yīng)用:公司當(dāng)前已簽約100家智慧藥店。據(jù)王鶴透露,團(tuán)隊(duì)正將機(jī)器人解決方案拓展至廣義的智慧零售場(chǎng)景,涵蓋數(shù)碼產(chǎn)品、景區(qū)文創(chuàng)等商品。“今年下半年,大家可能在很多城市的核心景區(qū)、鬧市區(qū),看到銀河通用機(jī)器人經(jīng)營(yíng)的便利店。”王鶴說。
01/
進(jìn)階
2023年,入職北京大學(xué)不久的王鶴還沒有考慮創(chuàng)業(yè)的事情。隨著具身智能概念在大模型的助推下逐漸興起,不少投資人找到王鶴,希望他來主導(dǎo)創(chuàng)業(yè)。2023年3月,Google推出了號(hào)稱既是多模態(tài)又能操縱機(jī)器人的PaLM-E模型,“在今天看來,PaLM-E不是真正端到端的具身智能模型,但它出來以后,讓大家思考具身智能可以跟多模態(tài)大模型搭在一起,做成一個(gè)通用機(jī)器人的系統(tǒng)。如果再不創(chuàng)業(yè),可能就晚了。”王鶴說。
王鶴坦陳,當(dāng)時(shí)自己存在兩個(gè)短板,一是過去沒有硬件量產(chǎn)的經(jīng)歷,“具身智能終究要落地到產(chǎn)品應(yīng)用上的”;二是他并不懂商業(yè)融資相關(guān)事務(wù)。
攝 | 鄧攀
在投資人的引薦下,王鶴很快找到了幾個(gè)有硬件經(jīng)歷和商業(yè)運(yùn)作能力的合伙人,一致的興趣讓他們迅速達(dá)成共識(shí),“要做就立刻開始做”。王鶴表示,從2023年4月誕生創(chuàng)業(yè)的想法,到團(tuán)隊(duì)組建、注冊(cè)公司,并完成第一輪天使融資,全程只花了一個(gè)月。
2023年5月,銀河通用成立。創(chuàng)業(yè)之初,王鶴和團(tuán)隊(duì)的想法是,把動(dòng)作模態(tài)和多模態(tài)大模型結(jié)合在一起,打造一個(gè)看得懂、聽得明白又會(huì)干活的通用機(jī)器人解決方案。這個(gè)想法在當(dāng)時(shí)非常大膽且獨(dú)特,因此在項(xiàng)目初期,王鶴用已有的技術(shù)成果就能吸引到投資人的投資。
但隨著公司逐漸發(fā)展,產(chǎn)品落地成了能否融資成功的關(guān)鍵。王鶴回憶,他當(dāng)時(shí)經(jīng)常會(huì)被投資人挑戰(zhàn),被詢問產(chǎn)品的方向以及落地的可能性。
在第二輪融資結(jié)束后,公司當(dāng)時(shí)的估值為8000萬美元,但依然有很多天使投資人對(duì)他說,如果再早一點(diǎn)認(rèn)識(shí)他,(以更低的估值)他們就愿意投了。“如今具身智能幾乎是最熱門的投資領(lǐng)域,但在2023年上半年,很多人都覺得它風(fēng)險(xiǎn)很大,告訴投資人它是值得投的方向,在當(dāng)時(shí)非常困難?!蓖斛Q透露。
接下來的融資經(jīng)歷中,王鶴和團(tuán)隊(duì)受到投資人的“瘋狂”挑戰(zhàn),尤其在銀河通用第一款(無人零售/藥房機(jī)器人)產(chǎn)品的打磨期間,王鶴每次面對(duì)投資人,都需要解答到底要做成什么樣、能不能快速部署、有沒有ROI(投資回報(bào)率)、做哪些功能才可以算得過來這筆賬等問題。
02/
目標(biāo)
2024年6月,銀河通用首代具身智能大模型機(jī)器人Galbot正式發(fā)布,與普通人眼中的人形機(jī)器人不同的是,G1并沒有選用雙足,而是采用了“可折疊腿部+輪式底盤”的結(jié)構(gòu)。
這一外形面臨過不少爭(zhēng)議。比如,王鶴作為一位科學(xué)家,為什么沒有研究最酷炫的雙足機(jī)器人?也有投資人質(zhì)疑這一研究的前沿度問題。
在王鶴看來,現(xiàn)階段雙足穩(wěn)定性不如輪式底盤?!拔覀冋J(rèn)為在落地的第一階段是上半身手眼腦的協(xié)調(diào),下半身能升降,如低處能摸到地、高處能摸到兩米多高,手能伸進(jìn)貨架取貨,就夠了?!蓖斛Q說。
王鶴認(rèn)為,具身智能是逐步落地的,銀河通用團(tuán)隊(duì)在規(guī)劃技術(shù)路線時(shí),將其分為當(dāng)下能落地的、未來一段時(shí)間能落地的,以及放眼長(zhǎng)遠(yuǎn)要做的事。
“作為公司創(chuàng)始人兼首席技術(shù)官,我必須平衡產(chǎn)品研發(fā)的近、中、遠(yuǎn)期需求,從研究到落地全鏈路布局,這對(duì)我個(gè)人是一個(gè)巨大挑戰(zhàn)?!蓖斛Q坦言,當(dāng)技術(shù)真正走向應(yīng)用時(shí),硬件控制、算法部署等問題會(huì)集中爆發(fā),“你要找到可靠、低成本且能真正交付的方案,這迫使我和團(tuán)隊(duì)不斷學(xué)習(xí)?!?/span>
創(chuàng)業(yè)之后,王鶴總結(jié)出了在企業(yè)里做技術(shù)的兩點(diǎn)體會(huì):
第一,工程落地的全局把控。作為首席技術(shù)官,不能只懂科學(xué),既要對(duì)工程問題有敏銳判斷,又要有全局把控的能力。
第二,科學(xué)家級(jí)的前瞻視野。在王鶴看來,科創(chuàng)企業(yè)若失去頂尖科學(xué)家引領(lǐng),長(zhǎng)期必然衰退。
具身智能亦是如此。王鶴認(rèn)為,它需要“沿途下蛋”,同時(shí)仰望星空。“今天的輪式方案、5年后的人形本體、15年后的C端普及,是三個(gè)完全不同的技術(shù)階段,這期間如果缺乏科學(xué)家級(jí)的前瞻視野預(yù)判下一步,企業(yè)很快會(huì)被巨頭收割階段性成果?!蓖斛Q說。
王鶴預(yù)測(cè),具身智能的終局規(guī)模將是“汽車單價(jià)×手機(jī)銷量”的萬億級(jí)市場(chǎng)?!耙砸慌_(tái)機(jī)器人單價(jià)10萬元計(jì)算,如果公司能達(dá)到1000萬臺(tái)年出貨量,對(duì)應(yīng)至少1萬億產(chǎn)值,公司也將蛻變?yōu)轭崜洳黄频男袠I(yè)巨頭?!蓖斛Q說。
在王鶴看來,如果銀河通用今年能落地1000臺(tái)機(jī)器人,兩三年后要突破萬臺(tái),再過3年要沖擊10萬臺(tái)的規(guī)模,這樣才能保持企業(yè)處于行業(yè)龍頭地位,任何停滯都會(huì)讓企業(yè)陷入紅海競(jìng)爭(zhēng)危機(jī)。
03/
聚焦與終局
在王鶴看來,銀河通用當(dāng)下的發(fā)展路線是,先用穩(wěn)定的架構(gòu)跑通商業(yè)化,把核心的手眼腦協(xié)同能力轉(zhuǎn)化為生產(chǎn)力。公司雖持續(xù)投入足式機(jī)器人的前沿研究,但當(dāng)前雙足機(jī)器人的技術(shù)成熟度仍不夠完善。
另一方面,掃地機(jī)器人、焊接機(jī)器人、擦玻璃機(jī)器人等垂直領(lǐng)域機(jī)器人都很有市場(chǎng),且很容易落地,但在王鶴看來,這些技術(shù)并不能引領(lǐng)未來?!斑@些事也不是我們做通用機(jī)器人的初心,只有用真正有用的技術(shù)引領(lǐng)行業(yè)前進(jìn),做過去誰也做不了的場(chǎng)景,且這個(gè)場(chǎng)景還有產(chǎn)值、有高速增長(zhǎng)空間,才能讓投資人放心?!蓖斛Q說。
王鶴的專注習(xí)慣始于中學(xué)物理競(jìng)賽的訓(xùn)練,并延續(xù)至學(xué)術(shù)與創(chuàng)業(yè)生涯。從斯坦福大學(xué)畢業(yè)前,拿到北京大學(xué)offer的他便遠(yuǎn)程招生,指導(dǎo)學(xué)生實(shí)驗(yàn),回國(guó)后更是全力投入具身智能領(lǐng)域。
創(chuàng)立銀河通用后,他將研究完全聚焦于產(chǎn)業(yè)落地的關(guān)鍵技術(shù)。“要么不做,要做就以成功為唯一目標(biāo),調(diào)動(dòng)全部資源精力,只研究能推動(dòng)具身智能商業(yè)化的技術(shù),絕不浪費(fèi)時(shí)間在不實(shí)際的方向上?!蓖斛Q認(rèn)為,這種高度聚焦策略,是銀河通用快速發(fā)展的核心原因。
2025年1月,銀河通用發(fā)布全球首個(gè)基于十億級(jí)仿真合成動(dòng)作數(shù)據(jù)預(yù)訓(xùn)練的端到端具身智能大模型GraspVLA,實(shí)現(xiàn)零樣本泛化能力。
不過,王鶴并沒有滿足于此,在他看來,具身智能是硬件背后的靈魂,但是硬件決定了通用機(jī)器人的天花板。2021年剛到北京大學(xué)任教時(shí),王鶴用了國(guó)內(nèi)、國(guó)外的幾款機(jī)器人,據(jù)他描述,當(dāng)時(shí)學(xué)生95%的時(shí)間花在了修或者調(diào)試機(jī)器人上,只有5%的時(shí)間真正花在科研上?!叭绻覀儧]有自己的硬件,我們能信賴誰?”王鶴反思。
因此,從創(chuàng)業(yè)第一天起,銀河通用就鎖定了三大閉環(huán):硬件自主研發(fā),保障可靠性;智能化自研;自建數(shù)據(jù)庫。“這三者缺一不可,否則商業(yè)化必然瘸腿?!蓖斛Q說。隨著硬件與商業(yè)化方面的合伙人加入,才促成了銀河通用創(chuàng)立。
2025年,銀河通用在突破具身智能通用模型GraspVLA的同時(shí),也在加速商業(yè)化能力落地,全球首發(fā)面向零售場(chǎng)景的端到端具身智能大模型GroceryVLA與產(chǎn)品級(jí)端到端具身導(dǎo)航大模型TrackVLA,助力其在線下無人零售市場(chǎng)的規(guī)?;涞?。
“目前我們已跟合作伙伴簽約合作了100家智慧零售門店,并正迅速拓展其他商業(yè)領(lǐng)域客戶?!蓖斛Q透露,除了藥店場(chǎng)景外,公司同時(shí)面向更廣闊的無人零售場(chǎng)景推進(jìn)商業(yè)化,包括數(shù)碼產(chǎn)品、景區(qū)文創(chuàng)商品及便利店自動(dòng)售貨等。
銀河通用在工業(yè)領(lǐng)域的布局也在加速落地。截至目前,銀河通用已經(jīng)與多家頭部制造企業(yè)展開戰(zhàn)略合作,交付了工廠端的商業(yè)訂單。王鶴預(yù)判,明年銀河通用在工業(yè)場(chǎng)景的落地?cái)?shù)量,將有望復(fù)制今年在線下零售業(yè)的擴(kuò)張曲線,實(shí)現(xiàn)高速增長(zhǎng)。
今年6月,博世中國(guó)、博原資本(博世集團(tuán)旗下市場(chǎng)化投資平臺(tái))與銀河通用簽署戰(zhàn)略合作備忘錄,博原資本還與銀河通用宣布聯(lián)合成立合資公司“博銀合創(chuàng)”,以此推動(dòng)具身智能技術(shù)在汽車和工業(yè)制造領(lǐng)域的產(chǎn)業(yè)化應(yīng)用。
“具身智能的終局就是走進(jìn)千行百業(yè)、千家萬戶,但這需要機(jī)器人本體和背后的AI能力一步步演進(jìn)?!?/strong>王鶴強(qiáng)調(diào),當(dāng)人形機(jī)器人真正能完成人類各種勞動(dòng)時(shí),行業(yè)才真正成熟?!拔覀冋@個(gè)目標(biāo)全力推進(jìn),相信在不遠(yuǎn)的未來就能實(shí)現(xiàn)。”王鶴說。