日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給業(yè)界評(píng)論
發(fā)送

0

Ling-2.6-flash 正式發(fā)布:104B 參數(shù),主打 Token 效率,更快、更省、更落地

本文作者: 業(yè)界評(píng)論   2026-04-22 18:14
導(dǎo)語:4 月 22 日,螞蟻百靈正式推出 Ling-2.6-flash —— 一款總參數(shù)量 104B、激活參數(shù) 7.4B 的 Instruct 模型。該模型主打“To

4 月 22 日,螞蟻百靈正式推出 Ling-2.6-flash —— 一款總參數(shù)量 104B、激活參數(shù) 7.4B 的 Instruct 模型。該模型主打“Token 效率(Token Efficiency)”,在保持競(jìng)爭(zhēng)力智能水平的同時(shí),更快、更省以及更適合大規(guī)模真實(shí)應(yīng)用。

據(jù)權(quán)威三方評(píng)測(cè)Artificial Analysis 數(shù)據(jù),Ling-2.6-flash 展現(xiàn)了突出的 Token Efficiency 優(yōu)勢(shì),以 15M output tokens 實(shí)現(xiàn)了 26 分 的 Intelligence Index,在保持較強(qiáng)智能水平的同時(shí),將輸出消耗控制在相對(duì)更低的位置。相比部分依賴更長(zhǎng)輸出換取更高分?jǐn)?shù)的模型,Ling-2.6-flash 在“智能表現(xiàn)”與“輸出成本”之間取得了更優(yōu)平衡。

對(duì)于開發(fā)者和企業(yè)場(chǎng)景而言,這種效率優(yōu)勢(shì)意味著更低的推理開銷、更快的首字響應(yīng)、更短的整體生成時(shí)延,以及更流暢的交互體驗(yàn),滿足在真實(shí)部署環(huán)境下對(duì)速度、成本與體驗(yàn)的綜合要求。

 

Ling-2.6-flash 正式發(fā)布:104B 參數(shù),主打 Token 效率,更快、更省、更落地 

Ling-2.6-flash 沿用了 Ling 2.5 的混合線性架構(gòu)設(shè)計(jì),這種高度稀疏化的 MoE 架構(gòu)在硬件表現(xiàn)上優(yōu)勢(shì)明顯。在 4 卡 H20 條件下推理速度最快可達(dá)到 340 tokens/s,Prefill 吞吐達(dá)到 Nemotron-3-Super 的 2.2 倍。在 Output Speed 測(cè)評(píng)中,Ling-2.6-flash以 215 tokens/s 的穩(wěn)定輸出速度位列同參數(shù)級(jí)別模型的第一梯隊(duì)。

從 Token 消耗來看,Ling-2.6-flash 的智效比顯著提升。在 Artificial Analysis 完整測(cè)評(píng)中,Ling-2.6-flash 總消耗為 15M tokens,而 Nemotron-3-Super 等模型達(dá)到或超過 110M tokens。這意味著,Ling-2.6-flash 僅用約 1/10 的 token 消耗完成了同類評(píng)測(cè)任務(wù)。

 

Ling-2.6-flash 正式發(fā)布:104B 參數(shù),主打 Token 效率,更快、更省、更落地 

 

Ling-2.6-flash 正式發(fā)布:104B 參數(shù),主打 Token 效率,更快、更省、更落地 

Ling-2.6-flash 面向 Agent 場(chǎng)景進(jìn)行了定向增強(qiáng),在控制 Token 消耗的前提下,依然保持了極強(qiáng)的任務(wù)執(zhí)行力,模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等Agent 相關(guān)基準(zhǔn)上達(dá)到同尺寸 SOTA 水平。與此同時(shí),Ling-2.6-flash 在通用知識(shí)、數(shù)學(xué)推理、指令遵循及長(zhǎng)文本解析等維度保持優(yōu)秀水準(zhǔn)。

Ling-2.6-flash 正式發(fā)布:104B 參數(shù),主打 Token 效率,更快、更省、更落地 

API 定價(jià)方面,Ling-2.6-flash 輸入每百萬tokens定價(jià) 0.1 美元,輸出 0.3 美元。目前,Ling-2.6-flash 的 API 已正式向用戶開放,并提供為期一周的限時(shí)免費(fèi)試用。用戶可以通過OpenRouter 、百靈大模型 tbox 獲取對(duì)應(yīng)服務(wù)。據(jù)了解,該模型后續(xù)將通過螞蟻數(shù)科發(fā)布商業(yè)版本LingDT,服務(wù)全球開發(fā)者及中小企業(yè)。

一周前,Ling-2.6-flash 的匿名測(cè)試版本“Elephant Alpha”上線OpenRouter,上線以來,其調(diào)用量持續(xù)增長(zhǎng),連續(xù)多日位列 Trending 榜首,日均 tokens 調(diào)用量達(dá) 100B 級(jí)別,周增長(zhǎng)超5000%。

雷峰網(wǎng)雷峰網(wǎng)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說