您當前的位置 :創業 >
    DeepSeek成功的底層邏輯及產業影響
    2025-02-19 16:32:42   來源:人民郵電報  分享 分享到搜狐微博 分享到網易微博

    仿佛是一夜之間,DeepSeek迎來了“滔天的流量”。它不僅在全球引發了新一輪的AI應用熱潮,而且給全球的算力資本市場帶來了重大沖擊。究其原因,DeepSeek不僅在訓練成本及使用成本、模型訓練及優化方式等領域實現了大量的工程創新,而且打破了AI領域許多的傳統敘事邏輯。簡而言之,DeepSeek正在改變游戲規則。

    DeepSeek最新推理模型R1的橫空出世,帶來了一個非常大的驚喜,僅用6天就發展了1億用戶。“用好奇心來揭開AGI的神秘面紗”這一愿景,更增添了神秘色彩。那么,DeepSeek在技術上究竟有哪些創新,成功的背后有哪些深層次的原因?這一切將對中美下一個十年的科技競爭產生哪些影響?

    本圖片為AI生成并進行了人為后期加工。 遙歌/制作

    工程創新

    成就與眾不同

    DeepSeek不僅引發了全球新一輪的AI應用熱潮,而且對全球的算力資本市場產生重大沖擊。究其原因,DeepSeek在訓練成本及使用成本、模型訓練及優化方式方面均實現了大量工程創新。

    成本是最大的亮點。DeepSeek-R1的整體訓練成本比OpenAI少了一個數量級以上。R1在整個訓練過程中的工程優化和創新亮點非常多,包括“Multi-Head Latent Attention——多頭隱形注意力機制”“Multi-token predication——多token預測”“有選擇性地使用8個浮點數精度FP8來替代FP16甚至FP31”等。這些優化其實都不容易實現。每一個看似不顯著的優化,在層級疊加效應下卻產生了非常驚人的效果。

    DeepSeek其實一共發布了兩個模型,分別是R1和R1-zero。DeepSeek基于V3這個基礎模型聚焦強化學習獲得了R1-zero。但是,R1-zero在回答一些問題的時候容易產生包括“多語言混雜”在內的諸多問題。Deep-Seek又對這個模型進行了SFT(監督微調優化),從而產生了R1。R1的強化學習功能可以實現自動化,是比較容易去scale的。這樣一來,該模型未來的想象空間接近無限。

    顛覆性改變

    打破傳統敘事邏輯

    DeepSeek之所以備受關注,本質在于打破了很多AI領域的傳統敘事邏輯,例如OpenAI對于推理模型的算力堆疊霸權邏輯、AI應用圈的OpenAI寡頭壟斷格局邏輯、美國對中國的高制程芯片封鎖邏輯以及AI大模型的開源閉源邏輯……

    首先,AI圈公認這種推理模型的實現難度是極大的。此前,比較好的推理模型只有OpenAI的GPT o1。Anthropic做不出來,Google“卡”了很久才推出表現一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力還要強于o1。進一步來看,R1不僅免費還開源,訓練成本和使用成本均實現了指數級下降。原先o1憑借領先性可以“收割”相當長一段時間的價值,但DeepSeek-R1的出現以及開源的舉措,讓絕大多數開發者以及聚焦應用的創業公司都能夠以更低的門檻去做開發。更加便宜且更容易私有化部署的R1,擊碎了華爾街對于所有大模型公司的估值邏輯。

    其次,DeepSeek的出現打破了AI應用圈原有的競爭枷鎖。就算是美國的頂尖應用公司選擇DeepSeek和ChatGPT時,答案也很清楚。Cursor、Perplexity這些AI領域的超級明星應用,都第一時間進行了DeepSeek模型的部署,而且設置了推薦第一優先級。此外,Google、Amazon、NV等平臺也都部署了Deep-Seek模型。這些改變,同步影響了云服務的市場格局。國內大量從事應用開發的企業,在DeepSeek-R1出現之前不得不使用微軟云(為了便捷使用GPT-4的API);現在,使用阿里云上部署的Deep-Seek成為可選項。

    再其次,DeepSeek帶來了芯片封鎖邏輯的崩塌。DeepSeek在輝達CUDA生態的更底層(例如PTX層),通過微調底層代碼來優化性能,從而解決“連接通信能力和調度能力被閹割”的問題。專家普遍認為,目前中美AI大模型領域的技術差距約為4個月。從技術能力發展的趨勢來看,這一差距繼續縮小的概率大于擴大的概率。

    最后,開源讓DeepSeek在輿論戰中至少“不落下風”。在AGI的道路上做出最強大的模型并開源,應該是OpenAI最早的初心和使命。市場永遠不會說謊,誰的模型能力強誰就能掌握最終的話語權。2024年12月DeepSeek V3發布的時候,國際主流媒體主要關注其“成本低廉”;當Deep-Seek-R1發布時,情況則截然不同,因為“滔天的流量”來了。作為一個開源模型,DeepSeek讓所有用戶在任何領域都增加了一個“頂尖專家”,免費且24小時隨時在線。(作者:鄭濤)

    關鍵詞:


    [責任編輯:ruirui]





    關于我們| 客服中心| 廣告服務| 建站服務| 聯系我們
     

    中國焦點信息網 版權所有 滬ICP備2022005074號-20,未經授權,請勿轉載或建立鏡像,違者依法必究。
     

    亚洲色偷偷偷鲁综合| 亚洲AV男人的天堂在线观看| 亚洲熟妇AV乱码在线观看| 亚洲电影唐人社一区二区| 亚洲影院在线观看| 亚洲av福利无码无一区二区| 亚洲VA中文字幕无码毛片| 久久99国产亚洲高清观看首页| 在线亚洲午夜理论AV大片| 区久久AAA片69亚洲| 亚洲香蕉网久久综合影视| 亚洲熟妇丰满多毛XXXX| 亚洲午夜久久久久久久久电影网| 怡红院亚洲怡红院首页| 国产亚洲成av片在线观看| 亚洲va中文字幕无码久久不卡| 亚洲成a人片在线观看日本| 久久久亚洲欧洲日产国码农村| 亚洲AV无码一区二区三区系列 | 国产亚洲中文日本不卡二区| 亚洲国产成人99精品激情在线| 亚洲人成网站看在线播放| 国产AV旡码专区亚洲AV苍井空| 亚洲中文字幕无码久久| 亚洲爆乳AAA无码专区| 九月婷婷亚洲综合在线| 4338×亚洲全国最大色成网站| 亚洲午夜久久久影院| 亚洲avav天堂av在线不卡 | 亚洲精品蜜夜内射| 狠狠综合亚洲综合亚洲色| 国产亚洲美女精品久久久久| 亚洲国产专区一区| 亚洲无码在线播放| 亚洲日本在线看片| 亚洲乱码在线播放| 亚洲国产成人久久精品软件| 国产成人精品亚洲一区| 夜夜春亚洲嫩草影院| 亚洲第一视频网站| 亚洲AV无码国产精品色|