【美團發布原生多模态 LongCat-Next】3月27日消息,美團發布并全面開源原生多模态大模型LongCat-Next及其核心組件——離散原生分辨率視覺分詞器(dNaViT)。該模型打破了當前大模型以“語言為中心”的傳統拼湊式架構,将圖像、語音與文本統一映射為同源的離散Token。通過純粹的“下一個Token預測”(Next Token Prediction,NTP)範式,LongCat-Next讓視覺與語音成為AI的“原生母語”。
來源:Jiajia 時間:2026-03-27 11:48:22
字号
微信掃碼 > 右上角點擊 > 分享