您當前的位置 :創業 >
    聯想將單臺服務器運行大模型性能推向新高
    2025-03-18 13:38:38   來源:中國經濟網  分享 分享到搜狐微博 分享到網易微博

    近日,聯想宣布旗下首款AMD AI大模型訓練服務器聯想問天WA7785a G3在單機部署671B(滿血版) DeepSeek大模型時,可實現極限吞吐量6708token/s,將單臺服務器運行大模型的性能推向了新高。

    據悉,依托聯想萬全異構智算平臺,聯想通過訪存優化、顯存優化、PCIe 5.0全互聯架構創新以及精選SGLang框架中性能最優算子等諸多創新方式,對大模型從預訓練、后訓練到推理的全流程進行持續優化,在單臺部署DeepSeek 671B大模型的聯想問天WA7785a G3上實測最高吞吐量達6708 token/s。

    在模擬問題對話場景(上下文序列長度128/1K)時,最高可支持并發數158,TPOT 93毫秒, TTFT 2.01秒;而在模擬代碼生成(上下文序列長度512/4K )時,并發數可達140,TPOT 100毫秒, TTFT 5.53秒。意味著單臺聯想問天WA7785a G3可以支撐1500人規模企業的正常使用,是繼聯想問天WA7780 G3服務器單機部署滿血版DeepSeek大模型總吞吐量突破2500 token/s之后,單機部署該大模型推理性能的又一次突破。

    此次突破是聯想中國基礎設施業務群、聯想研究院ICI實驗室和AMD聯合設計、協同調優、共同實現的。此結果也并非最終結果,聯想與AMD還在持續嘗試深度調優新方法,實現更高調優突破。

    關鍵詞:


    [責任編輯:ruirui]





    關于我們| 客服中心| 廣告服務| 建站服務| 聯系我們
     

    中國焦點信息網 版權所有 滬ICP備2022005074號-20,未經授權,請勿轉載或建立鏡像,違者依法必究。
     

    国产成人毛片亚洲精品| 亚洲国产精品尤物yw在线 | 亚洲欧洲精品一区二区三区| 亚洲AV无码久久精品成人| 国产AV无码专区亚洲AWWW| 日日噜噜噜噜夜夜爽亚洲精品| 亚洲欧洲自拍拍偷精品 美利坚| 亚洲女同成人AⅤ人片在线观看| 亚洲 综合 国产 欧洲 丝袜| 无码欧精品亚洲日韩一区夜夜嗨| 小说区亚洲自拍另类| 国产成人亚洲午夜电影| 亚洲精品tv久久久久| 亚洲一区二区视频在线观看| 一本色道久久综合亚洲精品高清| 亚洲综合熟女久久久30p| 国产av天堂亚洲国产av天堂| 久久久久久亚洲精品中文字幕| 亚洲免费在线播放| 亚洲精品韩国美女在线| 亚洲丝袜中文字幕| 亚洲人成人伊人成综合网无码| 亚洲AV无码片一区二区三区| 伊在人亚洲香蕉精品区麻豆| 亚洲欧洲国产成人综合在线观看| 亚洲日韩精品无码一区二区三区| 亚洲国产精品va在线播放| 久久亚洲精品中文字幕| 亚洲一区精品视频在线| 亚洲精品无码mⅴ在线观看| 免费在线观看亚洲| 国产成人综合亚洲AV第一页 | 亚洲一区二区无码偷拍| 久久精品国产亚洲AV电影网| 亚洲国产精品一区二区第一页免| 亚洲熟妇av一区二区三区漫画| 亚洲a一级免费视频| 亚洲另类视频在线观看| 亚洲成在人线aⅴ免费毛片| 亚洲国产一成久久精品国产成人综合 | 亚洲AV无码乱码在线观看|