DeepSeeK開啟AI算法變革元年2025-甲子光年_第1頁
DeepSeeK開啟AI算法變革元年2025-甲子光年_第2頁
DeepSeeK開啟AI算法變革元年2025-甲子光年_第3頁
DeepSeeK開啟AI算法變革元年2025-甲子光年_第4頁
DeepSeeK開啟AI算法變革元年2025-甲子光年_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

出品機構:甲子光年智庫研究團隊:宋濤、劉瑤、翟惠宇、何偉康、小麥發(fā)布時間:2025.02經(jīng)過近七十年的發(fā)展,人工智能自出現(xiàn)至今其核心能力一直在提升,到如今已經(jīng)成為覆蓋感知、認知、決策、學習、執(zhí)行、社會協(xié)作能力,未來發(fā)展到現(xiàn)在,人工智能的技術能力已經(jīng)到了一個拐點,即從技術能力驅動從舊范式抵達新范式。如今人工智能的發(fā)展已經(jīng)處于從第三階段向第四技術能力圖1:技術革命的周期性示意圖技術能力第五階段第一階段第二階段第三階段第四階段第五階段新產(chǎn)品、新產(chǎn)業(yè)的爆炸性增長和迅速創(chuàng)新全部集群(新產(chǎn)業(yè)、技術體系和基礎設施)新產(chǎn)品、新產(chǎn)業(yè)的爆炸性增長和迅速創(chuàng)新創(chuàng)新和市場潛力的全面擴張產(chǎn)業(yè)范式的顛覆創(chuàng)新和市場潛力的全面擴張產(chǎn)業(yè)范式的顛覆式創(chuàng)新擴張新產(chǎn)品和新產(chǎn)業(yè)接近成熟,已經(jīng)構建獨立的技術體系處位置產(chǎn)業(yè)發(fā)展醞釀期構造范式成熟期成長期產(chǎn)業(yè)化醞釀期構造范式成熟期技術新產(chǎn)品、新產(chǎn)業(yè)、新技術體系接連出現(xiàn)并持續(xù)更新技術大爆炸用得上新技術用得好新技術中國式新技術看得到新技術看得懂新技術用得上新技術用得好新技術中國式新技術 數(shù)據(jù)來源 數(shù)據(jù)來源2DeepSeek通過優(yōu)化算法架構,顯著提升了算力利用效率,打破了算力至上的傳統(tǒng)認知o1GPT-4oGeminiUltraGPT-4o1GPT-4oNLG530BPaLM(540B)Claude2Megatron-TuringLlama2-70BBaichuan2-13BBaichuanNLG530BPaLM(540B)Claude2Megatron-TuringLlama2-70BBaichuan2-13BBaichuan2-7BJliGLM-130BBERT-LargeTransformerDeepSeek-R1-671BBERT-LargeTransformerAlexNetDeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Qwen-1.5BAlexNet年人工智能指數(shù)報告》數(shù)據(jù)來源:3年人工智能指數(shù)報告》數(shù)據(jù)來源:3DeepSeek通過重新設計AIInfra,驗證“性價比”訓練路徑DeepSeek-R1的效果示意:更少的DeepSeek-R1的效果示意:更少的GPU(或其他AI芯片)帶來同樣的效果新設計訓練流程、以少量SFT數(shù)據(jù)+新設計訓練流程、以少量SFT數(shù)據(jù)+多輪強化學習的辦法,在提高了模型準確性的同時,也顯著降低了內(nèi)存占練的方法,而不是說只能通過低成本反而通過優(yōu)化,DeepSeek-R1可能每增加一張GPU,模型推理能力可模型效果高穩(wěn)定提升,無需依賴復雜的外部監(jiān)督機制。這一特性直接驗證了“算力即性能”的ScalingLaw,為AI芯片市低少多模型效果高穩(wěn)定提升,無需依賴復雜的外部監(jiān)督機制。這一特性直接驗證了“算力即性能”的ScalingLaw,為AI芯片市低少多備注:該圖僅為示意,不代表實際情況下具體數(shù)量與效果的對比*該圖為無編碼基礎分析師通過DeepSeekR1協(xié)作利用python編碼生成年4年4 2025年發(fā)布的大模型,都具有低參數(shù)量的特征,為本地化部署到AI終端運行提供了可能高參數(shù)量4萬億4560MiniMax-VL-01,4560新版BERT新版BERT4810億Qwen-32B,320Qwen-32B,3202025年1月2025年1月2025年1月2025年1月2025年1月2025年1月2018年6月2018年10月2019年2月2019年7月2020年6月2021年12月2023年2024年2025年1月2025年1月2025年1月2025年1月2025年1月2025年1月2025年52025年5AI技術創(chuàng)新一直在圍繞核心三要素在動態(tài)循環(huán),2025年再次進入算法創(chuàng)新階段AI技術成熟度AI技術成熟度核心三要素的創(chuàng)新循環(huán)?算力、數(shù)據(jù)、算法的三角創(chuàng)新體系,在動態(tài)循環(huán)之中再次進入算法創(chuàng)新階段。?數(shù)據(jù)據(jù)標注等成為高質(zhì)量數(shù)據(jù)集建設的熱點方數(shù)據(jù)卡時代,算力運營商等產(chǎn)業(yè)新物種誕生2025年2025年 R1-zero完全基于RL(強化學習)進行訓練,以第三階段為主,通過自我學習來提高性能圖1:傳統(tǒng)AI基礎大模型的訓練過程三個階段都注重圖2:DeepSeek聚焦的訓練過程核心在第三階段第三階段強化學習優(yōu)化模型第二階段訓練獎勵模型(RM)第一階段訓練監(jiān)督策略模型?數(shù)據(jù)集中隨機抽取問題?第三階段強化學習優(yōu)化模型第二階段訓練獎勵模型(RM)第一階段訓練監(jiān)督策略模型?數(shù)據(jù)集中隨機抽取問題?使用PPO模型生成回答?基于質(zhì)量分數(shù)優(yōu)化PPO模型參數(shù)?循環(huán)迭代出新模型?數(shù)據(jù)集中隨機抽取問題?生成多個不同的回答?標注答案排名順序?排序結果數(shù)據(jù)來訓練獎勵模型?數(shù)據(jù)集中隨機抽取問題?生成多個不同的回答?用標注好的數(shù)據(jù)來微調(diào)模型采用PPO強化學習算法針對獎勵模型來優(yōu)化策略收集演示數(shù)據(jù)并訓練有監(jiān)督策略收集比較數(shù)據(jù)并訓練獎勵模型核心創(chuàng)新點第三階段強化學習第二階段訓練獎勵模型(第一訓練監(jiān)督策略模型核心創(chuàng)新點第三階段強化學習第二階段訓練獎勵模型(第一訓練監(jiān)督策略模型采用GRPO算法,通過對比分析方式針對獎勵模型來進行優(yōu)化訓練模型收集比較數(shù)據(jù)并訓練獎勵模型RM)階段收集演示數(shù)據(jù)并訓練有監(jiān)督策略階段?GRPO算法對比分析,提升訓練效率?"冷啟動數(shù)據(jù)"建立基礎的推理框架?推理導向的強化學習?利用訓練得到的檢查點來收集新的監(jiān)督訓練數(shù)據(jù)?全場景強化學習?蒸餾賦予小型模型推理能力2025年2025年DeepSeek-R1的訓練流程:通過RL強化LLM的推理能力R1-zero完全基于RL(強化學習)進行訓練,未使用任何監(jiān)督訓練或人類反饋,能夠通過自我學習來提高性能。R1是在R1-zero的基礎上,通過少量冷啟動數(shù)據(jù)進行微調(diào),提高了輸出質(zhì)量和可讀性。 除了基于Transformer架構的算法創(chuàng)新之外,非Transformer架構的新算法也成為近期新出現(xiàn)的重點發(fā)展方向。一種新架構模型LFM(LiquidFoundationModel超越了同等規(guī)模的Transformer模型如Llama3.2。它用的是一種液態(tài)神經(jīng)網(wǎng)絡(LNN其計算單元植根于動態(tài)系統(tǒng)理論、信號處理和數(shù)值線性代數(shù)。其小巧便攜的特性使得它能夠直接部署在手機上進行文檔和書籍等分析。因此,甲子光年智庫判斷,2025年將是算法變革的元年。未來最適合人類使用的大模型,可能會是非Transformer架構的算法模型。圖:LFM架構模型性能超越同等規(guī)模的Tran4040(A12B)2025年;2025年;AI終端推動端側模型和端側算力需求增加,小參數(shù)量模型需求爆發(fā)推動算法變革到來2024年AI終端已經(jīng)開始爆發(fā)AI處理重心正向端側轉移,催生小語言模型的需求爆發(fā)2024年AI終端已經(jīng)開始爆發(fā)AIPCAI手機AIPC占比AI手機占比74.6%80.3%74.6%54.7%XR等便攜戴設備28.0%16.0%471.238.0%XR等便攜戴設備28.0%16.0%471.25.0%338.8190.457.02131388.1%終端側5.0%338.8190.457.02131388.1%終端側邊緣云AI手機智能汽車人形機器人3人形機器人202320242025E2026E202320242025年2025年2024城頭變幻大王旗,2025年AI超級應用開始出現(xiàn),DAU達2161萬為2024年的AI超級應用的頭把交椅處于不斷變動之中。甲子光年智庫統(tǒng)計匯總了近13個月中訪問量最高的產(chǎn)品訪問量數(shù)據(jù),發(fā)現(xiàn)第一名的AI產(chǎn)品是處于不斷變動狀態(tài)的,可以用一句話來形容。那就是城頭變幻大王旗?;旧厦總€解讀的頭把交椅都會發(fā)生變化。2025年的開年,DeepSeek用短短二十天的時間就實現(xiàn)了DAU2161萬的數(shù)據(jù),超過了ChatGPT發(fā)布之處的數(shù)據(jù)表現(xiàn),具有成為AI超級應用的潛力。圖:近一年中各月AI產(chǎn)品訪問量最高的產(chǎn)25002000150010005000-500TOP1訪問量(M)DeepSeek2161萬DAU百度搜索AI360AI搜索豆包文心一言文心一言文心一言豆包豆包豆包百度文庫百度文庫百度文庫1月2月3月4月5月7月8月9月10月1月2月3月4月5月7月8月9月10月11月12月25年1月6月sDeepSeek的模型實現(xiàn)AI時代的“小米模式”,實現(xiàn)技術和價格的雙重普惠如果說Transformer的應用標志著基礎模型時代的開始(基礎模型的龐大規(guī)模和應用范圍突飛猛進),可以稱為AI技術的“iPhone時刻”。那么DeepSeek從建立之初的“價格屠夫”模式就贏得了開發(fā)者市場的關注,可以看做是AI時代的“小米模式”。短期影響短期影響直接挑戰(zhàn)了國際品牌的高價策略國際挑戰(zhàn)高價策略直接挑戰(zhàn)OpenAI的閉源技術模式及OpenAIO1的價格策略(O1正將高性能智能手機推向大眾市場普惠開發(fā)者讓更多中國普通用戶使用推理型同時具有極強的代碼及數(shù)學能力帶動帶動京東方(屏幕)、舜宇光學土供應鏈企業(yè)技術升級,降低全行業(yè)制造成本成本重構,打破資源壟斷訓練效率提升與推理成本壓縮,帶動一系列本土AIinfra建立產(chǎn)業(yè)生態(tài)(如硅基流動與華為云聯(lián)合小米通過紅米系列覆蓋下沉市場,移動互聯(lián)網(wǎng)應用服務更多樣人群推動垂直場景、長尾應用爆發(fā)從“科技巨頭試驗”走向“千行百業(yè)剛需”,構建更多元的開發(fā)DeepSeek的“高性價比”有望解鎖具身智能的理解與推理DS不僅在推理模型上實現(xiàn)了突破,在多模態(tài)方面也保持了進步,并于近日開源發(fā)布了Janus-Pro多模態(tài)模型?;谒惴üこ谭矫娴膬?yōu)化,DS能夠實現(xiàn)性價比更高的模型推理能力(價格低、效率高、性能強、可部署在端側平臺DS有望以強大的推理能力和多模態(tài)感知能力,重塑機器人交互與決策,同時通過低成本、高效率的解決方案,加速具身智能的普及與應用。DeepSeek的性價比&效率優(yōu)勢,有降低推理成本端側平臺部署、提升反應速率、降低計算能耗性能更強的中小模型蒸餾更低的計算成本在真實硬件上運行自主決策鏈式思考通用性低成本訓練??通過強化學習自主探索,發(fā)展出復雜的推理能力實現(xiàn)機器人自主規(guī)劃任務和解決復雜問題的能力進行邏輯推理,從而更可靠地完成目標不針對特定任務,追求通用推理能力適應不同具身場景冷啟動訓練減少了對大量標注數(shù)據(jù)的依賴,降低數(shù)據(jù)成本,并解決了R1-zero的可讀性問題低成本和高效率對于實現(xiàn)規(guī)?;瘧煤蜕虡I(yè)化至關重要降低推理成本端側平臺部署、提升反應速率、降低計算能耗性能更強的中小模型蒸餾更低的計算成本在真實硬件上運行自主決策鏈式思考通用性低成本訓練??通過強化學習自主探索,發(fā)展出復雜的推理能力實現(xiàn)機器人自主規(guī)劃任務和解決復雜問題的能力進行邏輯推理,從而更可靠地完成目標不針對特定任務,追求通用推理能力適應不同具身場景冷啟動訓練減少了對大量標注數(shù)據(jù)的依賴,降低數(shù)據(jù)成本,并解決了R1-zero的可讀性問題降低訓練成本加速研發(fā)速度、加速迭代速度、降低開發(fā)門檻加速研發(fā)速度、加速迭代速度、降低開發(fā)門檻多模態(tài)融合感知?能夠有效融合視覺和語言信息,使得機器人多模態(tài)融合感知圖像生成圖像生成?可生成高質(zhì)量的圖像,對虛擬環(huán)境建模、仿?視覺編碼方法解耦,對不同的任務進行優(yōu)化,時提升感知能力和生成能力編碼器解耦編碼器解耦ss,2025sss,2025s 推理成本的顛覆性降低,將會推動C端產(chǎn)品的大多數(shù)應用場景進入實際落地階段大模型的價格正在快速下降,而開放權重也在加速,并為開發(fā)者提供更多選擇。OpenAI的o1每輸出100萬令牌收費60美元,而DeepSeek-R1只需2.19美元。這將近30倍的價差,讓算力成本不再是模型門檻,正在讓基礎模型層“平民化”。推理成本的顛覆性降低,將會推動C端產(chǎn)品在大多數(shù)應用場景得到落地。尤其是在星云象限和星團象限之中的應用場景,將會得到全面的落地。Y滿意度XNPS值待重塑產(chǎn)品側重產(chǎn)品效率提升Y滿意度XNPS值待重塑產(chǎn)品側重產(chǎn)品效率提升側重產(chǎn)品體驗側重商業(yè)落地光年象限光年象限●●..● ●●.備注說明:1.滿意度:一個用來衡量個人或組織對特定產(chǎn)品、服務、經(jīng)驗或事件的滿意程度的指標。當使用體驗大于預期時會獲得滿意感。2.NPS值:凈推薦值,是評估用戶口碑的一種方式。評估用戶/客戶向朋友、其他人推薦公司的產(chǎn)品或服務的可能性的指標。整理,2025年;整理,2025年;9、全球AI科技競爭進入G2時代DeepSeek將成為特朗普制定人工智能政策的重要參考,預示著AI進入G2競爭時代?調(diào)動企業(yè)力量發(fā)展人工智能:相比拜登政府堅持通過政府干預進行對人工智能監(jiān)管,特朗普政府更傾向于依靠企業(yè)和資本的力量發(fā)?擴大對芯片的出口管制:一方面

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論