0
| 本文作者: 馬廣宇 | 2026-03-27 19:15 | 專題:全面突破 vivo NEX |
從2023年開始,三年時(shí)間,中國科技產(chǎn)業(yè)開啟了所謂的"大模型狂飆時(shí)代"。
自ChatGPT引爆全球AI熱潮以來,中國科技行業(yè)迅速陷入了一場前所未有的集體焦慮。從互聯(lián)網(wǎng)巨頭到傳統(tǒng)制造業(yè),從手機(jī)廠商到汽車新勢力,都試圖與"大模型"或"生成式AI"概念建立關(guān)聯(lián),參數(shù)規(guī)模從千億躍升至萬億,戰(zhàn)略合作的簽署儀式頻繁見報(bào)。
DeepSeek的爆火恰好再次印證了這一觀點(diǎn),在行業(yè)落地方向尚未明確時(shí),各行各業(yè)均選擇了“先上車后補(bǔ)票”的方式乘上這趟“快車”。
不可否認(rèn)的是,AI是現(xiàn)今科技產(chǎn)業(yè)最重要的發(fā)展方向之一,但在這場集體性的非理性繁榮中,冷靜思考變成了一件奢侈的事,畢竟沒有人愿意被貼上"錯(cuò)過AI時(shí)代"的標(biāo)簽,哪怕這種焦慮的來源本身就是對技術(shù)變革的過度反應(yīng)。
今年春節(jié)開始,OpenClaw又掀起了一陣AI熱潮,只是在短暫的繁榮后,熱度又開始悄然退下。這是每一個(gè)新技術(shù)的終局,同樣也是對技術(shù)浮躁、焦慮的代價(jià)。如何讓AI理解世界、理解用戶、理解任務(wù),這些基礎(chǔ)問題仍沒有人做出回答。
這是一個(gè)需要長期投入、難以短期變現(xiàn)、無法靠發(fā)布會(huì)解決的問題。正因如此,大多數(shù)企業(yè)選擇回避,轉(zhuǎn)而將資源投入到更具傳播效應(yīng)的"追熱點(diǎn)"策略中。
vivo是少數(shù)選擇正面回答這個(gè)問題的企業(yè)。
2026年3月,博鰲亞洲論壇。vivo總裁、首席運(yùn)營官胡柏山在演講中明確表示:"我們把核心資源聚焦在端側(cè)AI和產(chǎn)業(yè)鏈協(xié)同,思考用戶在AI時(shí)代真正需要什么樣的體驗(yàn)。"
這番表述可以視為一家成熟企業(yè)對技術(shù)趨勢的理性判斷。
如果我們仔細(xì)審視vivo過去五年的技術(shù)布局和戰(zhàn)略選擇,會(huì)發(fā)現(xiàn)這家企業(yè)正在下一盤遠(yuǎn)比"發(fā)布大模型"更為深遠(yuǎn)的大棋:感知能力賽道。
感知能力,是vivo對"AI時(shí)代競爭核心"這個(gè)問題的回答。
"在未來AI時(shí)代,算力、模型能力不具備差異化"。胡柏山的判斷,也是vivo感知戰(zhàn)略的決策基礎(chǔ)。
在vivo看來,隨著芯片工藝持續(xù)進(jìn)步和模型架構(gòu)不斷優(yōu)化,算力和模型能力將會(huì)供應(yīng)鏈化,每個(gè)手機(jī)廠商都有更多選擇權(quán),不再構(gòu)成競爭壁壘,而這一點(diǎn)也正在被行業(yè)驗(yàn)證。
2024年至2026年間,聯(lián)發(fā)科、高通、蘋果、三星等主流芯片廠商的旗艦SoC在AI算力上持續(xù)快速提升。與此同時(shí),高通驍龍系列、蘋果A系列的自研神經(jīng)網(wǎng)絡(luò)引擎也在同步演進(jìn)。這意味著,端側(cè)AI的算力基礎(chǔ)正在快速走向同質(zhì)化。
在模型層面,開源社區(qū)的貢獻(xiàn)同樣不可忽視。Meta的Llama系列、Google的Gemma系列、阿里云的Qwen系列等開源大模型,已經(jīng)能夠提供接近閉源模型的性能表現(xiàn),且授權(quán)費(fèi)用極低。對于手機(jī)廠商而言,基于開源模型進(jìn)行微調(diào),正在成為一條可行的技術(shù)路徑。
一個(gè)邏輯是,當(dāng)算力和模型都不再是稀缺資源,企業(yè)就必須尋找新的差異化方向。vivo給出的答案是:以影像為基礎(chǔ),構(gòu)建AI落地物理世界的視覺感知中樞。
今年開始,vivo內(nèi)部就已經(jīng)對感知賽道進(jìn)行立項(xiàng),核心是把視覺、聽覺、觸覺等感知,通過傳感器加以感知大模型,轉(zhuǎn)化成AI想要得到的物理世界的信息。
所謂"數(shù)字世界連接物理世界",指的便是AI理解、分析、處理物理世界信息的能力。一張圖片中的光影關(guān)系、一段視頻里的空間結(jié)構(gòu)、用戶臉上的情緒變化。這些物理世界的感知信息,需要被AI"翻譯"成可理解、可分析、可決策的數(shù)字信號(hào)。
胡柏山的看法是:真正的差異化,在于誰數(shù)字世界連接物理世界的能力越強(qiáng),誰就越'聰明'。而這恰巧是vivo的強(qiáng)項(xiàng)所在,過去十年,vivo在影像上做了巨大投入,除了讓照片變得更好看,同樣也是在建立一套完整的物理世界感知系統(tǒng)。
這套感知系統(tǒng)的技術(shù)架構(gòu),包含三層架構(gòu):
第一層是光學(xué)系統(tǒng)——鏡頭光學(xué)設(shè)計(jì)、鍍膜工藝、光學(xué)防抖等技術(shù),決定了"看得到"的邊界。vivo與蔡司的深度合作,正是這一層的戰(zhàn)略投資,雙方持續(xù)在光學(xué)設(shè)計(jì)、鍍膜工藝、色彩科學(xué)等領(lǐng)域深化合作。
第二層是成像處理——ISP算法、HDR融合、多幀降噪、色彩科學(xué)等技術(shù),決定了"看得清"的能力。vivo自研的V3影像芯片,專門針對這一層進(jìn)行了算力優(yōu)化。V3采用了先進(jìn)的6nm制程工藝,AI算力相比前代提升40%,能夠支持4K級(jí)別的實(shí)時(shí)畫面增強(qiáng)。
第三層是感知理解——場景識(shí)別、語義分割、空間建模、情緒感知等AI能力,決定了"看得懂"的深度。這是vivo感知戰(zhàn)略的核心差異化所在。在這一層,vivo的藍(lán)心大模型矩陣發(fā)揮著關(guān)鍵作用。藍(lán)心大模型是vivo自主研發(fā)的多模態(tài)AI模型系列,能夠?qū)D像和視頻內(nèi)容進(jìn)行深度理解,識(shí)別物體、場景、關(guān)系、情緒等多維信息。
三層能力的疊加,使vivo的手機(jī)成為一臺(tái)真正意義上的"物理世界感知終端"。當(dāng)用戶舉起手機(jī)拍照時(shí),不僅在記錄一個(gè)瞬間,更是在讓AI"觀察"和"理解"當(dāng)前的物理場景。
這種感知能力的長期價(jià)值,遠(yuǎn)超一款手機(jī)的功能升級(jí)。vivo認(rèn)為,當(dāng)未來AI真正深入到千行百業(yè)時(shí),具備強(qiáng)大感知能力的終端將成為最重要的數(shù)據(jù)入口,這也意味著感知能力賽道的競爭,已經(jīng)悄然開始。(雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)))
在博鰲亞洲論壇,胡柏山指出——Smart Phone 將進(jìn)化成Agent Phone。
什么是Agent Phone?用vivo的理解,這是一種能夠主動(dòng)理解用戶需求、自動(dòng)完成任務(wù)、智能調(diào)度服務(wù)的下一代智能手機(jī)。
這與"智能手機(jī)"有著本質(zhì)區(qū)別。智能手機(jī)的核心是"工具":人使用手機(jī)來處理任務(wù)、獲取信息,手機(jī)始終處于"被動(dòng)響應(yīng)"的狀態(tài)。但Agent Phone的核心是"伙伴":手機(jī)主動(dòng)感知環(huán)境、理解需求、預(yù)判行動(dòng),成為真正懂你的智能代理。
這個(gè)轉(zhuǎn)變的關(guān)鍵驅(qū)動(dòng)力,依然是感知能力。
當(dāng)前智能手機(jī)的交互邏輯,本質(zhì)上是"輸入-反饋"模式:用戶發(fā)出指令,手機(jī)執(zhí)行并返回結(jié)果。整條交互鏈路是離散的、事件驅(qū)動(dòng)的。但Agent Phone的交互邏輯將是"感知-理解-行動(dòng)":手機(jī)持續(xù)感知環(huán)境和用戶狀態(tài),在后臺(tái)構(gòu)建對當(dāng)前場景的深度理解,然后主動(dòng)提供最合適的響應(yīng)和服務(wù)。
vivo對于Agent Phone有著超前的理解,但距離落地仍有許多現(xiàn)實(shí)問題需要解決。
首先是意圖理解,手機(jī)需要從用戶的模糊表述甚至無表述行為中,準(zhǔn)確推斷用戶的真實(shí)意圖。這要求端側(cè)AI具備強(qiáng)大的上下文理解能力和長程記憶能力,能夠綜合用戶的歷史行為、當(dāng)前位置、時(shí)間狀態(tài)、日程安排等多維信息進(jìn)行綜合判斷。
其次是任務(wù)規(guī)劃能力,當(dāng)確認(rèn)用戶意圖后,手機(jī)需要自動(dòng)拆解任務(wù)步驟、調(diào)用相關(guān)App和數(shù)據(jù)、在后臺(tái)完成復(fù)雜操作流程,并在必要時(shí)向用戶確認(rèn)關(guān)鍵決策。這需要手機(jī)具備跨App、跨服務(wù)的任務(wù)編排能力。
最后是隱私邊界問題,在 vivo 看來這是不可逾越的底座。主動(dòng)服務(wù)意味著手機(jī)需要持續(xù)感知和分析用戶狀態(tài),Agent Phone需要在隱私保護(hù)和服務(wù)能力之間找到平衡點(diǎn),做到既能提供足夠智能的服務(wù),又要確保用戶對數(shù)據(jù)的控制權(quán)。
vivo的解法是將感知和推理過程盡可能保留在端側(cè)。胡柏山透露,vivo正在與芯片廠商、算法公司、學(xué)術(shù)機(jī)構(gòu)深度合作,共同定義面向端側(cè)AI的新一代算力架構(gòu)。"單靠手機(jī)廠商自己做不了端側(cè)AI,必須拉著產(chǎn)業(yè)鏈一起做。"
與Arm 建立聯(lián)合實(shí)驗(yàn)室,與聯(lián)發(fā)科從底層硬件到軟件的多層面聯(lián)合研發(fā),包括性能、AI、影像、游戲、通訊還有多媒體等各個(gè)領(lǐng)域;而在學(xué)術(shù)層面,vivo與清華大學(xué)、北京大學(xué)、上海交通大學(xué)等高校建立了深度合作關(guān)系,在端側(cè)AI的基礎(chǔ)研究上持續(xù)投入。
Agent Phone的底層支撐,是端側(cè)AI的意圖理解能力和感知系統(tǒng)對環(huán)境的實(shí)時(shí)建模。兩者的結(jié)合,使手機(jī)能夠在本地完成對用戶需求的理解、規(guī)劃和執(zhí)行,既保證了響應(yīng)速度,又保護(hù)了用戶隱私。
vivo在博鰲論壇上宣布,搭載相機(jī)Agent能力的新一代旗艦機(jī)型X300 Ultra 與X300s即將發(fā)布。除了專業(yè)的影像能力進(jìn)一步提升,從某種程度來說,這也是Agent Phone的階段性成果展示。
但胡柏山明確表示,Agent Phone只是起點(diǎn),不是終點(diǎn)。
"X300 Ultra會(huì)展示Agent Phone的核心能力,但它還不是終極形態(tài)。"他在專訪中透露,"真正的Agent Phone需要感知能力、端側(cè)AI、IoT生態(tài)的完整配合,這需要一個(gè)更長的建設(shè)周期。"
在vivo的戰(zhàn)略藍(lán)圖里,感知能力的價(jià)值遠(yuǎn)不止于手機(jī)。
在vivo的生態(tài)藍(lán)圖里,手機(jī)不是終點(diǎn),而是起點(diǎn)。用胡柏山的話:"以影像+AI構(gòu)建的視覺感知中樞,可以升級(jí)為IoT生態(tài)的視覺感知中樞。"
在vivo看來,IoT行業(yè)有著難以解決的問題,單個(gè)智能化設(shè)備的感知過于片面,最終導(dǎo)致這些設(shè)備都缺乏一個(gè)共同的"感知中樞"來整合多維信息、構(gòu)建統(tǒng)一理解。vivo認(rèn)為,手機(jī)可以承擔(dān)這個(gè)角色。
當(dāng)手機(jī)具備強(qiáng)大的視覺感知能力,它可以成為IoT生態(tài)的"眼睛"——通過與各類IoT設(shè)備的互聯(lián)互通,匯聚來自不同維度、不同位置、不同視角的感知信息,形成對用戶生活場景的完整理解。
"你的手機(jī)看到你在客廳,它就知道你的電視、音箱、空調(diào)應(yīng)該怎么調(diào)整。"胡柏山舉例道,"但這只是第一步。未來,手機(jī)的感知能力會(huì)延伸到更多品類,讓更多設(shè)備'看見'這個(gè)世界。"
這種"感知延伸"的戰(zhàn)略,需要新的產(chǎn)品形態(tài)作為載體。
去年,vivo成立了機(jī)器人Lab,其成員來自無人機(jī)、計(jì)算機(jī)視覺、自動(dòng)控制、機(jī)械工程等多個(gè)領(lǐng)域,研究包括室內(nèi)環(huán)境的三維重建、動(dòng)態(tài)障礙物的識(shí)別與規(guī)避、人體姿態(tài)的精細(xì)感知等核心技術(shù)。
而這個(gè)機(jī)器人實(shí)驗(yàn)室的首要目標(biāo)并非打造一款面向C端的消費(fèi)級(jí)機(jī)器人,而是專注于感知能力的技術(shù)突破,
"vivo做機(jī)器人,核心還是圍繞感知能力。"胡柏山表示,手機(jī)積累的影像技術(shù)、AI算法、人機(jī)交互理解,都會(huì)成為機(jī)器人的基礎(chǔ)。但更重要的是,機(jī)器人會(huì)成為vivo感知生態(tài)的延伸,讓vivo在更多場景、更大范圍內(nèi)建立感知優(yōu)勢。
這種感知能力的生態(tài)外溢,最終將超出消費(fèi)電子的邊界。
"感知能力的價(jià)值,在于它能為多少行業(yè)創(chuàng)造多少價(jià)值。"胡柏山說到,"這是vivo作為一家中國科技企業(yè),應(yīng)該承擔(dān)的產(chǎn)業(yè)責(zé)任。"
這種產(chǎn)業(yè)責(zé)任的承擔(dān),需要長期投入和戰(zhàn)略定力作為支撐,而vivo的感知戰(zhàn)略,本質(zhì)上就是一場關(guān)于"長期主義"的實(shí)踐。
這條路線的代價(jià)是沉重的。感知能力的構(gòu)建需要五年、十年的持續(xù)投入,短期內(nèi)難以看到顯著回報(bào)。當(dāng)競爭對手靠"追熱點(diǎn)"收割流量和資本時(shí),vivo必須承受戰(zhàn)略定力帶來的寂寞。當(dāng)友商不斷發(fā)布"震撼業(yè)界"的新產(chǎn)品時(shí),vivo只能埋頭做技術(shù)攻關(guān)。
但vivo選擇相信:時(shí)間會(huì)犒賞那些愿意下笨功夫的企業(yè)。在博鰲論壇上,胡柏山引用了老子《道德經(jīng)》中的一句話:"企者不立,跨者不行",vivo的每一步,都走得扎實(shí)。
在行業(yè)普遍焦慮的時(shí)代,保持戰(zhàn)略定力本身就是一種稀缺能力。當(dāng)AI時(shí)代真正進(jìn)入深水區(qū),vivo在感知能力上的長期積累,將成為它最堅(jiān)實(shí)的壁壘。
這是vivo的押注,也是它的底牌。(雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章