OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀，與面壁智能「撞車」了

本文作者：小七

2026-05-12 21:06

導語：面壁智能的 MiniCPM-o 4.5 在 2026 年 2 月就已正式開源，比翁荔 TML 團隊領先了 3 個月。

今天，大模型圈再次被點燃，這一次的火花來自前 OpenAI 應用研究負責人翁荔（Lilian Weng）。她創(chuàng)立的Thinking Machines Lab（TML）首次公布的技術愿景，直指人機交互的終極形態(tài)——一個能與人類進行「全雙工」（Full-Duplex）實時對話的 AI 模型。

然而，當 TML 那支展示著無縫、主動交互能力的 Demo 視頻在網絡上流傳時，許多 AI 領域的從業(yè)者卻產生了一種強烈的「既視感」——因為 TML 描繪的那個未來，早在三個月前，就已被中國公司「面壁智能」的 MiniCPM-o 4.5 以開源的形式，帶到了現實。

先看「邊看邊聽邊說」的全模態(tài)實時交互效果——

這是 MiniCPM-o 4.5 的效果，模型可以實時觀察周圍并對環(huán)境進行描述輸出，主動反應表現一流：

這是 TML 時隔 3 個月后發(fā)布的模型效果：

這不僅是一次簡單的「撞車」，更像是一場跨越太平洋的技術共識。它不僅驗證了下一代 AI 交互的技術路徑，也讓我們重新審視中國 AI 力量在全球創(chuàng)新版圖中的位置。

一場不約而同的交互革命：打破「對講機」模式

要理解這場技術共識的深刻性，首先要明白 TML 和面壁智能共同挑戰(zhàn)的敵人是什么——延續(xù)至今的「回合制」（turn-based）交互范式。

從 Siri 到各類語音助手，再到 GPT-4o 的語音模式，我們與 AI 的交流更像是使用一部「對講機」：你說完，等待「滴」的一聲，然后它回應。

這背后是一套名為「語音活動檢測」（VAD）的機制在主導，它像一個裁判，嚴格劃分著你和 AI 的發(fā)言輪次。這種模式，與人類自然對話中那種你來我往、信息流交織的狀態(tài)，相去甚遠。

而面壁智能與 TML 的共同洞察是：真正的自然交互，必須打破這種輪次限制，進入一個「全雙工」的流式處理時代。

面壁智能的先行：這正是面壁智能在 2 月發(fā)布并開源 MiniCPM-o 4.5 時提出的核心理念。在其技術報告中，面壁智能將目標定義為構建一個能夠處理和生成「交錯多模態(tài)信息」的系統(tǒng)，其核心動機就是擺脫「對講機」的束縛。

TML 的愿景：在其博客中，翁荔團隊明確指出，要從「回合制」轉變?yōu)樘幚砥叫械妮斎?、輸出信息流。AI 應該能一邊聽你說話，一邊看著周圍的環(huán)境，同時思考并生成回應，甚至在你話音未落時就能捕捉到意圖，進行打斷或補充。

這是面壁智能的 MiniCPM-o 4.5，打破了傳統(tǒng)交互中「對講機」的模式：

這是 TML 的模型效果：

雙方幾乎用不同的語言，描述了同一個未來。這標志著，AI 交互的下一次范式革命，已經有了清晰的靶心。

高度重合的技術框架

如果說目標一致是「英雄所見略同」，那么實現路徑的高度重合，則讓這場技術共識變得無可辯駁。TML 與面壁智能，仿佛拿著同一張地圖，走向了同一個目的地。

這張「地圖」的核心，是一種基于時間對齊的流式處理框架。

面壁智能稱之為「Omni-Flow」框架。其原理是將連續(xù)的音視頻流，像切香腸一樣，切成以毫秒（如200ms）為單位的細小片段。然后，將同一時間片段內的視覺、聽覺和已生成的文本令牌（token）「打包」在一起，形成一個按時間排序的統(tǒng)一序列，喂給大模型。

OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀，與面壁智能「撞車」了

面壁智能 Omni-Flow 框架示意圖

而 TML 在其博客中提出的，是「基于時間對齊的微輪次」（Time-aligned micro-turn based）概念。其圖示與Omni-Flow 的原理如出一轍：同樣是將多模態(tài)信息流切碎成帶有時間戳的微小單元，然后在一條共享的時間軸上對齊融合。

OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀，與面壁智能「撞車」了

TML 框架示意圖

這種設計的精妙之處在于，它將世界從 AI 視角下離散的、模態(tài)各異的數據，還原成了其本來的面目——一個連續(xù)不斷、多感官信息交織的整體。

正是基于這一共同的底層架構，兩者都實現了兩個顛覆性的能力：

從革命的目標，到核心的實現框架，再到最終呈現的能力，TML 的首秀與面壁智能三個月前的工作，形成了完美的閉環(huán)印證。

愿景與現實：誰先撞線？

既然技術路線高度一致，那么評判的標尺自然就落在了「執(zhí)行力」上——誰先將藍圖變成了現實？

答案是清晰的。

MiniCPM-o 4.5 技術報告地址：https://github.com/OpenBMB/MiniCPM-V/blob/main/docs/MiniCPM_o_45_technical_report.pdf

如果說翁荔團隊是向世界宣告「我們發(fā)現了新大陸」，那么面壁智能則是早在三個月前就已經登陸，并繪制好了海圖，甚至向所有后來者開放了港口。

MiniCPM-o 4.5 視覺主動提醒

這種「交付」形態(tài)的差異至關重要。在大模型技術一日千里的今天，三個月的時間差，以及「概念展示」與「開源實物」之間的鴻溝，足以定義誰是先行者，誰是驗證者。

一場中國 AI 的「自我證明」

TML 與面壁智能的這次「技術撞車」，與其說是一場競賽，不如說是一次相互成就。

翁荔以其在全球 AI 領域的巨大影響力，為這一技術方向帶來了聚光燈，讓「全雙工」AI 的概念迅速成為行業(yè)焦點。

而面壁智能則以其更早的布局、扎實的工程實現和徹底的開源精神，證明了中國 AI 團隊不僅能跟上世界潮流，更有能力在關鍵領域領先潮流。

直接的數據佐證就是：面壁智能的 MiniCPM-o 4.5 在 2026 年 2 月就已正式開源，比翁荔 TML 團隊領先了 3 個月。

未來已來，只是分布尚不均勻。這一次，中國 AI 團隊，有幸站在了更早的時區(qū)。

雷峰網版權文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

小七

編輯

發(fā)私信

當月熱門文章

OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀，與面壁智能「撞車」了

OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀，與面壁智能「撞車」了