您當前的位置 :創(chuàng)業(yè) >
    解決傳統(tǒng)架構記憶瓶頸 MiniMax發(fā)布新一代模型
    2025-01-16 10:47:16   來源:新京報  分享 分享到搜狐微博 分享到網(wǎng)易微博

    1月15日,“AI六小虎”之一的MiniMax發(fā)布并開源了新一代01系列模型,包含基礎語言大模型MiniMax-Text-01和視覺多模態(tài)大模型MiniMax-VL-01。該系列模型使用多項突破性創(chuàng)新,以大規(guī)模應用線性注意力機制打破了Transformer傳統(tǒng)架構的記憶瓶頸。

    未來,AI智能體有望成為最重要的產(chǎn)品形態(tài),由于智能體處理的任務變得越來越復雜,涉及的數(shù)據(jù)量也越來越大,單個智能體的記憶以及多個智能體協(xié)作間的上下文都會變得越來越長。因此,長上下文能力與多模態(tài)處理能力的提升至關重要。

    技術上,MiniMax-01系列模型首次將線性注意力機制擴展到商用模型的級別,受益于此次架構創(chuàng)新,該系列模型在處理長輸入的時候具有非常高的效率,接近線性復雜度。從規(guī)模效應、結(jié)構設計、訓練優(yōu)化和推理優(yōu)化等層面綜合考慮,MiniMax選擇模型參數(shù)量為4560億,其中每次激活459億,能夠高效處理400萬token的上下文,將有效替代Transformer傳統(tǒng)架構并開啟超長文本輸入時代。相較于Gemini等一眾全球頂級模型,MiniMax-01隨著輸入長度變長,性能衰減最慢。

    值得注意的是,MiniMax還開源了Text-01模型、VL-01模型的完整權重,以便于更多開發(fā)者做有價值、突破性的研究。MiniMax方面表示,“我們認為這有可能啟發(fā)更多長上下文的研究和應用,從而更快促進Agent時代的到來,二是開源也能促使我們努力做更多創(chuàng)新,更高質(zhì)量地開展后續(xù)的模型研發(fā)工作。”

    關鍵詞:


    [責任編輯:ruirui]





    關于我們| 客服中心| 廣告服務| 建站服務| 聯(lián)系我們
     

    中國焦點信息網(wǎng) 版權所有 滬ICP備2022005074號-20,未經(jīng)授權,請勿轉(zhuǎn)載或建立鏡像,違者依法必究。
     

    亚洲午夜在线电影| 亚洲毛片av日韩av无码 | 亚洲精品无码少妇30P| 亚洲美女又黄又爽在线观看| 国产亚洲成在线播放va| www国产亚洲精品久久久| 久久精品国产亚洲AV天海翼| 亚洲a∨无码一区二区| 国产精品亚洲专区无码牛牛 | 亚洲国产精品无码久久一区二区| 奇米影视亚洲春色| 亚洲人成人网站色www| 亚洲人精品午夜射精日韩| 亚洲日韩在线观看免费视频| 国产成人精品日本亚洲专区 | 亚洲人成综合在线播放| 亚洲中文字幕久在线| 亚洲av产在线精品亚洲第一站| 亚洲综合丁香婷婷六月香| 亚洲国产福利精品一区二区| 亚洲乱码在线播放| 亚洲中文字幕无码中文| 亚洲.国产.欧美一区二区三区| 国产成人 亚洲欧洲| 亚洲一级Av无码毛片久久精品| 中文字幕精品无码亚洲字| 亚洲理论电影在线观看| 亚洲Aⅴ无码专区在线观看q| 亚洲邪恶天堂影院在线观看| 亚洲小说区图片区| 亚洲中文无码mv| 国产成人高清亚洲一区91| 国产精品亚洲mnbav网站 | 国产精品亚洲一区二区三区在线观看| 亚洲av无码成人精品区在线播放| AV在线播放日韩亚洲欧| 亚洲av午夜福利精品一区人妖| 亚洲高清中文字幕| 午夜在线a亚洲v天堂网2019| 99亚洲乱人伦aⅴ精品| 中文字幕专区在线亚洲|