九章云極推出DART-GUI-7B模型，登頂 OSWorld 7B 榜首

本文作者：虞超

2026-01-28 12:19

導(dǎo)語(yǔ)：2026 年 1 月，在操作智能領(lǐng)域權(quán)威評(píng)測(cè)體系 OSWorld 發(fā)布的最新榜單中，九章云極 DART-GUI-7B 模型，奪得 OSWorld 7B 賽道冠軍

2026 年 1 月，在操作智能領(lǐng)域權(quán)威評(píng)測(cè)體系 OSWorld 發(fā)布的最新榜單中，九章云極 DataCanvas 憑借在 Alaya NeW Cloud 強(qiáng)化學(xué)習(xí)平臺(tái)上訓(xùn)練的 DART-GUI-7B 模型，以卓越的智能操控表現(xiàn)，一舉奪得 OSWorld 7B 賽道冠軍！

九章云極：Alaya NeW Cloud 強(qiáng)化學(xué)習(xí)平臺(tái)

Alaya NeW Cloud 是由九章云極打造的以強(qiáng)化學(xué)習(xí)（Reinforcement Learning, RL）為核心能力的智算云平臺(tái)，該平臺(tái)通過(guò)將強(qiáng)化學(xué)習(xí)能力深度融入底層基礎(chǔ)設(shè)施，重構(gòu)了智能計(jì)算的架構(gòu)與邏輯，旨在為企業(yè)和開(kāi)發(fā)者提供“可用、好用、經(jīng)濟(jì)”的算力資源。

Alaya NeW Cloud打造前沿強(qiáng)化學(xué)習(xí)云平臺(tái)，平臺(tái)原生支持一鍵式Agentic RL 開(kāi)發(fā)環(huán)境啟動(dòng) 、分布式極核Agentic RL訓(xùn)練，性能上實(shí)現(xiàn)訓(xùn)推分離與全流程加速，生態(tài)上預(yù)置多種主流Agent仿真環(huán)境，高效支撐強(qiáng)化學(xué)習(xí)技術(shù)的快速落地與創(chuàng)新突破，精準(zhǔn)解決 AI 技術(shù)應(yīng)用中的效率和成本等核心問(wèn)題。目前，九章云極已在全球布局多個(gè)聚焦于加速計(jì)算優(yōu)化的 AIDC 智算中心，持續(xù)賦能 AI 技術(shù)的高效應(yīng)用與行業(yè)規(guī)?；涞?。九章云極推出DART-GUI-7B模型，登頂 OSWorld 7B 榜首

DataCanvas Alaya NeW Cloud

核心技術(shù)解讀：輕量化模型的GUI智能體突破

什么是OSWorld？

OSWorld 是目前 AI 領(lǐng)域衡量 “智能體（Agent）跨軟件操作電腦” 能力最頂尖的基準(zhǔn)測(cè)試，它模擬真實(shí)的操作系統(tǒng)環(huán)境，要求 AI 像人類一樣通過(guò)視覺(jué)觀察屏幕，并精準(zhǔn)操控瀏覽器、Excel、VS Code 等各類桌面應(yīng)用來(lái)完成跨平臺(tái)的復(fù)雜任務(wù)，被OpenAI、Anthropic、字節(jié)跳動(dòng)Seed、月之暗面、智譜等頂尖AI團(tuán)隊(duì)廣泛采用，更是檢驗(yàn)AI能否從“只會(huì)聊天”進(jìn)化為“高效數(shù)字員工”的硬核試金石。

為什么 OSWorld 對(duì) 7B 模型幾乎是“地獄難度”？

? 真實(shí)生態(tài)：任務(wù)在 VS Code、LibreOffice 等真實(shí)軟件中運(yùn)行，環(huán)境信息密度遠(yuǎn)超結(jié)構(gòu)化數(shù)據(jù)

? 閉環(huán)操控：需要連續(xù)理解截圖、規(guī)劃路徑和進(jìn)行鍵鼠操作，考驗(yàn)長(zhǎng)程推理能力

? 零容錯(cuò)率：限時(shí)30步，操作需步步為營(yíng)，失敗不可逆轉(zhuǎn)

? 數(shù)據(jù)稀疏：基礎(chǔ)成功率不足1/4，即使是大模型也面臨嚴(yán)峻挑戰(zhàn)

復(fù)雜的跨軟件協(xié)作與精細(xì)的坐標(biāo)控制，使得參數(shù)規(guī)模有限的7B模型在“理解”與“執(zhí)行”之間難以調(diào)和，長(zhǎng)期處于“不可用”狀態(tài)。

核心技術(shù)路徑：九章云極三大創(chuàng)新賦能輕量化突破

1. 核心方法：解耦式 GUI 智能體強(qiáng)化學(xué)習(xí)框架

九章云極并未通過(guò)簡(jiǎn)單擴(kuò)大模型規(guī)模取勝，而是選擇了系統(tǒng)級(jí)的算法創(chuàng)新。提出了 DART（Decoupled Agentic Reinforcement Training），首次將 GUI 智能體的強(qiáng)化學(xué)習(xí)訓(xùn)練流程徹底解耦為四個(gè)異步模塊：九章云極推出DART-GUI-7B模型，登頂 OSWorld 7B 榜首

三項(xiàng)關(guān)鍵突破

? 推演級(jí)軌跡調(diào)度（Rollout-Level Scheduling）

? 以“單條軌跡”作為調(diào)度最小單位

? 每個(gè) rollout 完成后立即釋放環(huán)境并啟動(dòng)下一個(gè)任務(wù)

? 環(huán)境利用率提升從 12.2% 達(dá)到 67.7%，提升幅度高達(dá) 5.5 倍

? 動(dòng)態(tài)模型服務(wù)池（Dynamic Model Serving Pool）

? 采用 GPU 推演的集中化管理，支持多模型版本的熱加載

? 避免了傳統(tǒng)“一卡一環(huán)境”的資源浪費(fèi)

? GPU 推演利用率提升 1.6 倍

? GPU 資源的并發(fā)彈性擴(kuò)展能力

? 訓(xùn)練與推理異步執(zhí)行（Asynchronous Execution of Training and Inference）

? 訓(xùn)練與推演實(shí)現(xiàn)異步解耦

? 避免模型更新導(dǎo)致服務(wù)阻塞

2. 數(shù)據(jù)策略：四層自適應(yīng)篩選，放大稀疏成功信號(hào)

針對(duì) GUI 強(qiáng)化學(xué)習(xí)中的“成功少、噪聲多”核心難題，DART 設(shè)計(jì)了覆蓋任務(wù)、軌跡、步驟和 Token 的四層篩選機(jī)制：

九章云極推出DART-GUI-7B模型，登頂 OSWorld 7B 榜首

這一機(jī)制使得 7B 模型，在最大30步內(nèi)，即可穩(wěn)定的實(shí)現(xiàn)OSWorld中的任務(wù)要求。

3. 多維優(yōu)化：以輕量化參數(shù)對(duì)沖復(fù)雜場(chǎng)景，重塑性能邊界

九章云極經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的7B 模型之所以能實(shí)現(xiàn)突破，關(guān)鍵在于采用了“場(chǎng)景適配、精度優(yōu)化、算力協(xié)同”的三維技術(shù)方案，在控制參數(shù)量的同時(shí)，最大化提升操作智能性能。

? 場(chǎng)景化指令對(duì)齊技術(shù)：基于百萬(wàn)級(jí)真實(shí)操作場(chǎng)景數(shù)據(jù)訓(xùn)練，構(gòu)建細(xì)分領(lǐng)域的指令庫(kù)，優(yōu)化模型對(duì)辦公自動(dòng)化、數(shù)據(jù)處理等高頻場(chǎng)景的語(yǔ)義理解能力，精準(zhǔn)捕捉模糊指令背后的核心需求，使指令理解準(zhǔn)確率較通用模型提升23%，并減少無(wú)效操作。

? 混合精度推理優(yōu)化：借鑒智算硬件優(yōu)化經(jīng)驗(yàn)，對(duì)模型不同模塊進(jìn)行精度分層處理。核心推理模塊保留 FP16 精度以確保準(zhǔn)確性，非核心模塊量化至 INT8 精度。這一調(diào)度方式實(shí)現(xiàn)推理效率提升 1.8 倍，資源占用率降低 40%。

? 軟硬件協(xié)同調(diào)度機(jī)制：依托自研的智算技術(shù)棧優(yōu)勢(shì)，深度協(xié)同模型推理與算力資源，動(dòng)態(tài)調(diào)整算力分配策略以應(yīng)對(duì)負(fù)載波動(dòng)，避免資源閑置。同時(shí)使用專用推理加速引擎優(yōu)化 GUI 元素識(shí)別與動(dòng)作規(guī)劃的計(jì)算鏈路，進(jìn)一步降低輕量化模型的推理延遲。

實(shí)驗(yàn)結(jié)果：全類型任務(wù)下性能優(yōu)勢(shì)顯著

在最大步長(zhǎng)僅有 30 步的情況下，DART-GUI-7B 在多種任務(wù)類型上表現(xiàn)出顯著優(yōu)勢(shì)，包括：

? 瀏覽器類（Chrome）

? 圖像/設(shè)計(jì)類（GIMP）

? 郵件客戶端類（Thunderbird）

? 代碼/IDE 類（VS Code）

? 操作系統(tǒng)交互類（OS）

亮點(diǎn)：GIMP 類任務(wù)的正確率高達(dá) 80.77%，且在辦公套件（Impress、Writer、Calc）、媒體播放類（VLC）以及多應(yīng)用協(xié)同等任務(wù)中，其能力也有顯著提升。

九章云極還進(jìn)行了真實(shí)場(chǎng)景的驗(yàn)證。在 DataCanvas Alaya NeW 平臺(tái)上，DART-GUI-7B 成功地通過(guò)鍵鼠操作完成文檔查找、導(dǎo)航到指定頁(yè)面及查找官網(wǎng)聯(lián)系方式等場(chǎng)景任務(wù)，其成功率超過(guò) 90%。

產(chǎn)業(yè)價(jià)值與未來(lái)展望

目前，AI 大模型正加速?gòu)摹凹夹g(shù)驗(yàn)證”向“產(chǎn)業(yè)落地”轉(zhuǎn)變。通用人工智能作為連接數(shù)字世界與物理操作的重要工具，在辦公自動(dòng)化、智能運(yùn)維和工業(yè)控制等領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。然而，模型部署成本高、輕量化模型性能不足及數(shù)據(jù)出域安全等問(wèn)題，仍然是產(chǎn)業(yè)規(guī)?；年P(guān)鍵瓶頸。

九章云極的 7B GUI 模型突破為行業(yè)提供了“低成本、高性能”的通用人工智能解決方案，有望推動(dòng)通用人工智能在中小企業(yè)及長(zhǎng)尾場(chǎng)景的普及。

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。