日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給小七
發(fā)送

0

OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀,與面壁智能「撞車」了

本文作者: 小七   2026-05-12 21:06
導語:面壁智能的 MiniCPM-o 4.5 在 2026 年 2 月就已正式開源,比翁荔 TML 團隊領先了 3 個月。

 今天,大模型圈再次被點燃,這一次的火花來自前 OpenAI 應用研究負責人翁荔(Lilian Weng)。她創(chuàng)立的Thinking Machines Lab(TML)首次公布的技術愿景,直指人機交互的終極形態(tài)——一個能與人類進行「全雙工」(Full-Duplex)實時對話的 AI 模型。 

然而,當 TML 那支展示著無縫、主動交互能力的 Demo 視頻在網絡上流傳時,許多 AI 領域的從業(yè)者卻產生了一種強烈的「既視感」——因為 TML 描繪的那個未來,早在三個月前,就已被中國公司「面壁智能」的 MiniCPM-o 4.5 以開源的形式,帶到了現實。

先看「邊看邊聽邊說」的全模態(tài)實時交互效果——

這是 MiniCPM-o 4.5 的效果,模型可以實時觀察周圍并對環(huán)境進行描述輸出,主動反應表現一流:

這是 TML 時隔 3 個月后發(fā)布的模型效果:

這不僅是一次簡單的「撞車」,更像是一場跨越太平洋的技術共識。它不僅驗證了下一代 AI 交互的技術路徑,也讓我們重新審視中國 AI 力量在全球創(chuàng)新版圖中的位置。

 

一場不約而同的交互革命:打破「對講機」模式

要理解這場技術共識的深刻性,首先要明白 TML 和面壁智能共同挑戰(zhàn)的敵人是什么——延續(xù)至今的「回合制」(turn-based)交互范式。

從 Siri 到各類語音助手,再到 GPT-4o 的語音模式,我們與 AI 的交流更像是使用一部「對講機」:你說完,等待「滴」的一聲,然后它回應。

這背后是一套名為「語音活動檢測」(VAD)的機制在主導,它像一個裁判,嚴格劃分著你和 AI 的發(fā)言輪次。這種模式,與人類自然對話中那種你來我往、信息流交織的狀態(tài),相去甚遠。

而面壁智能與 TML 的共同洞察是:真正的自然交互,必須打破這種輪次限制,進入一個「全雙工」的流式處理時代。

面壁智能的先行:這正是面壁智能在 2 月發(fā)布并開源 MiniCPM-o 4.5 時提出的核心理念。在其技術報告中,面壁智能將目標定義為構建一個能夠處理和生成「交錯多模態(tài)信息」的系統(tǒng),其核心動機就是擺脫「對講機」的束縛。

TML 的愿景:在其博客中,翁荔團隊明確指出,要從「回合制」轉變?yōu)樘幚砥叫械妮斎?、輸出信息流。AI 應該能一邊聽你說話,一邊看著周圍的環(huán)境,同時思考并生成回應,甚至在你話音未落時就能捕捉到意圖,進行打斷或補充。


這是面壁智能的 MiniCPM-o 4.5,打破了傳統(tǒng)交互中「對講機」的模式:


這是 TML 的模型效果:

雙方幾乎用不同的語言,描述了同一個未來。這標志著,AI 交互的下一次范式革命,已經有了清晰的靶心。

 

高度重合的技術框架

如果說目標一致是「英雄所見略同」,那么實現路徑的高度重合,則讓這場技術共識變得無可辯駁。TML 與 面壁智能,仿佛拿著同一張地圖,走向了同一個目的地。

這張「地圖」的核心,是一種基于時間對齊的流式處理框架

面壁智能稱之為「Omni-Flow」框架。其原理是將連續(xù)的音視頻流,像切香腸一樣,切成以毫秒(如200ms)為單位的細小片段。然后,將同一時間片段內的視覺、聽覺和已生成的文本令牌(token)「打包」在一起,形成一個按時間排序的統(tǒng)一序列,喂給大模型。

OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀,與面壁智能「撞車」了

面壁智能 Omni-Flow 框架示意圖

 

而 TML 在其博客中提出的,是「基于時間對齊的微輪次」(Time-aligned micro-turn based)概念。其圖示與Omni-Flow 的原理如出一轍:同樣是將多模態(tài)信息流切碎成帶有時間戳的微小單元,然后在一條共享的時間軸上對齊融合。

OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀,與面壁智能「撞車」了

TML 框架示意圖

這種設計的精妙之處在于,它將世界從 AI 視角下離散的、模態(tài)各異的數據,還原成了其本來的面目——一個連續(xù)不斷、多感官信息交織的整體。

正是基于這一共同的底層架構,兩者都實現了兩個顛覆性的能力:

從革命的目標,到核心的實現框架,再到最終呈現的能力,TML 的首秀與面壁智能三個月前的工作,形成了完美的閉環(huán)印證。


愿景與現實:誰先撞線?

既然技術路線高度一致,那么評判的標尺自然就落在了「執(zhí)行力」上——誰先將藍圖變成了現實?

答案是清晰的。

MiniCPM-o 4.5 技術報告地址:https://github.com/OpenBMB/MiniCPM-V/blob/main/docs/MiniCPM_o_45_technical_report.pdf

 

如果說翁荔團隊是向世界宣告「我們發(fā)現了新大陸」,那么面壁智能則是早在三個月前就已經登陸,并繪制好了海圖,甚至向所有后來者開放了港口。

MiniCPM-o 4.5 視覺主動提醒

這種「交付」形態(tài)的差異至關重要。在大模型技術一日千里的今天,三個月的時間差,以及「概念展示」與「開源實物」之間的鴻溝,足以定義誰是先行者,誰是驗證者。

 

一場中國 AI 的「自我證明」

TML 與面壁智能的這次「技術撞車」,與其說是一場競賽,不如說是一次相互成就。

翁荔以其在全球 AI 領域的巨大影響力,為這一技術方向帶來了聚光燈,讓「全雙工」AI 的概念迅速成為行業(yè)焦點。

而面壁智能則以其更早的布局、扎實的工程實現和徹底的開源精神,證明了中國 AI 團隊不僅能跟上世界潮流,更有能力在關鍵領域領先潮流。

直接的數據佐證就是:面壁智能的 MiniCPM-o 4.5 在 2026 年 2 月就已正式開源,比翁荔 TML 團隊領先了 3 個月。

未來已來,只是分布尚不均勻。這一次,中國 AI 團隊,有幸站在了更早的時區(qū)。

雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說