(資料圖)
12月8日,智譜正式上線并開源GLM-4.6V系列多模態(tài)大模型,包括面向云端與高性能集群場景的基礎版GLM-4.6V(106B-A12B)和面向本地部署與低延遲應用的輕量版GLM-4.6V-Flash(9B)。
據(jù)介紹,GLM-4.6V將訓練時上下文窗口提升到128k tokens,在視覺理解精度上達到同參數(shù)規(guī)模SOTA,首次在模型架構中將Function Call(工具調用)能力原生融入視覺模型,打通從“視覺感知”到“可執(zhí)行行動(Action)”的鏈路,為真實業(yè)務場景中的多模態(tài)Agent(智能體)提供統(tǒng)一的技術底座。
該系列模型較GLM-4.5V降價50%,API(應用程序編程接口)調用價格為輸入1元/百萬tokens,輸出3元/百萬tokens,其中GLM-4.6V-Flash免費供用戶使用。GLM-4.6V融入GLM Coding Plan,針對用戶8類場景定向開發(fā)了專用MCP(大模型上下文協(xié)議)工具。
Copyright (C) 1999-20120 關于我們 m.allfitheat.com, All Rights Reserved
版權所有 環(huán)球快報網(wǎng) | 京ICP備2022018928號-24聯(lián)系我們:315 541 185@qq.com