农村强奸一级网站|久草京热在线视频|色五月桃花综合激情|亚洲人妻精品主播|欧美无限码中文在线|国产午夜伦理三级|亚洲男女在线播放|欧美日韩成人香蕉视频|全球无码AV1区|中文字幕亚洲五月

投資企業(yè)新聞

啟明星 | Video Rebirth劉威:視頻生成模型是構(gòu)建世界模型的最佳路徑

2025/08/22 | IPO早知道

啟明創(chuàng)投主辦的2025世界人工智能大會(WAIC)“啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇——創(chuàng)業(yè)投資開啟AI技術(shù)與應(yīng)用共振周期”于7月28日在上海世博中心藍(lán)廳成功舉辦。

在本次論壇上,前騰訊杰出科學(xué)家、混元大模型技術(shù)負(fù)責(zé)人,Video Rebirth首席執(zhí)行官劉威以《從視頻生成到世界模型》為題發(fā)表主旨演講。


前騰訊杰出科學(xué)家、混元大模型技術(shù)負(fù)責(zé)人,Video Rebirth首席執(zhí)行官劉威

劉威表示,視頻生成模型是構(gòu)建世界模型的最佳路徑,這一技術(shù)方向有望成為AI從感知向認(rèn)知躍遷的關(guān)鍵突破口。

劉威認(rèn)為,AI技術(shù)發(fā)展正經(jīng)歷從符號主義到連接主義,再到現(xiàn)實主義和生成主義的四個重要階段。特別值得關(guān)注的是,OpenAI在2024年9月發(fā)布的o1模型首次讓AI獲得了真正的推理能力,標(biāo)志著連接主義40年探索的重要突破。當(dāng)前2025年AI正處于關(guān)鍵拐點,軟件正向智能體過渡,智能硬件向物理AI演進(jìn)。

在技術(shù)框架上,劉威提出世界模型應(yīng)具備三大核心能力:模擬能力對應(yīng)仿真功能,預(yù)測能力實現(xiàn)因果推理,探索能力支撐規(guī)劃決策。其中模擬屬于快思考的感知層面,預(yù)測進(jìn)入了慢思考的認(rèn)知層面,而探索則是主動思考,這三大能力正是世界模型的關(guān)鍵所在。

盡管GPT-4o等多模態(tài)模型能夠處理文本、語音、圖片的輸入輸出,但這類模型仍處于被動響應(yīng)模式,缺乏對環(huán)境的整體建模和預(yù)測能力。相比之下,世界模型需要從被動思考轉(zhuǎn)向主動思考,從用戶問才思考變成能夠主動進(jìn)行系列化思考。

SORA的出現(xiàn)為世界模型提供了重要啟發(fā)。劉威指出,SORA首次證明了世界模型的可行性,通過視頻生成實現(xiàn)了高度的時空變化模擬能力。雖然當(dāng)前版本存在一定局限,但已經(jīng)為世界模型的構(gòu)建提供了實際的技術(shù)起點和可行路徑。

Video Rebirth將視頻原生世界模型定義為世界模擬器加世界預(yù)測器的組合。當(dāng)前主流的DiT架構(gòu)雖然具備強(qiáng)大的時空模擬能力,但存在缺乏因果推理、無法交互干預(yù)等關(guān)鍵問題。未來公司致力于技術(shù)升級路徑解決上述問題,構(gòu)建獨有的技術(shù)主張和模型范式,迎來屬于視頻生成領(lǐng)域的“ChatGPT Moment”,推出首個真正的視頻原生世界模型。

劉威強(qiáng)調(diào),AI不僅需要宏大敘事,更要創(chuàng)造逼真的現(xiàn)實。Video Rebirth通過視頻生成切入世界模型這一技術(shù)路徑,有望在AI認(rèn)知能力突破的關(guān)鍵時期實現(xiàn)重要技術(shù)創(chuàng)新,為通用人工智能的發(fā)展提供重要支撐。

 

來源 | IPO早知道