DeepSeek驅動高質量模型平價化_第1頁
DeepSeek驅動高質量模型平價化_第2頁
DeepSeek驅動高質量模型平價化_第3頁
DeepSeek驅動高質量模型平價化_第4頁
DeepSeek驅動高質量模型平價化_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

請閱讀最后評級說明和重要聲明報告日期:2025年02月報告日期:2025年02月14日投資評級:看好投資評級:看好分析師:吳起滌執(zhí)業(yè)登記編號:A0190523020001密集,發(fā)布了參數眾多且性能提升的V3、支持思維鏈輸出和模型訓練的Rl,以及深耕圖像領域的視覺和多模態(tài)模型。2024年12月底到2025年1月底,全球用戶數從34.7萬激增至1.19億。與chatGPT相比,Deepseek僅用一年多就達到chatGP執(zhí)業(yè)登記編號:A0190523020001人工智能AIETF與滬深300指數走勢對比類模型大幅下降。Deepseek-Rl在繼承了v3的創(chuàng)新架構的基礎上,在后訓練階段大規(guī)模使用了強化學習技術,自動選擇有價值的數據進行標注和訓練,減少數據標注量和計算資源浪費,并在僅有極少標AIME2024測評中上獲得79.8%的pass@l得分,略微超過openAl-ol;在MATH-500上,獲40%30%20%10% 人工智能AIETF與滬深300指數走勢對比類模型大幅下降。Deepseek-Rl在繼承了v3的創(chuàng)新架構的基礎上,在后訓練階段大規(guī)模使用了強化學習技術,自動選擇有價值的數據進行標注和訓練,減少數據標注量和計算資源浪費,并在僅有極少標AIME2024測評中上獲得79.8%的pass@l得分,略微超過openAl-ol;在MATH-500上,獲40%30%20%10% 限,Al應用開發(fā)提速升級。建議關注:B端:鼎捷數智、用友網絡;C端:金山辦公。3)小模型能力提升促進了端側模型部署,我們看好Al終端作為新一代計算平臺爆發(fā)可能。建議關注:科大訊飛、立訊精密、歌爾股份。Al產業(yè)商業(yè)化落地不及預期的風險市場競爭加劇風險政策不確定性風險。2一、"低成本、高性能、強推理"三位一體 3 32.低成本:DeepSeek位于模型性 43.高性能&強推理:Deepseek算法能力突出 7 9 9 圖表目錄圖1:Deepseek:全球增速最快的Al應用 4圖2:Deepseek:增長1億用戶所用時間最短的AI應用 4圖3:Deepseek-v3模型架構 5圖4:Deepseekv3Dualpipe調度策略 5圖5:Deepseek-v3混合精度框架 6圖6:Deepseek-v3位于模型性能性價比最優(yōu)范圍 7圖7:ol類推理模型輸入輸出價格 7圖8:Deepseek模型性能優(yōu)異 8圖9:蒸餾技術原理 8圖10:Deepseek蒸餾小模型超越openAlol-mini 9圖11:Deepseek顯著提升了算力利用效率 圖12:Deepseek面臨服務器資源不足的問題 圖13:Al智能體"數字化"走向"具身化"示意 圖14:2025年全球AIPC出貨量能占到PC出貨量的35% 圖15:Al智能交互眼鏡構成及功能 表1:Deepseek持續(xù)迭代升級 3表2:不同大模型API服務定價對比 6表3:國內外云廠商接入Deepseek模型 表4:科技廠商Al眼睛布局 表5:相關公司萬得一致盈利預測 3—、低成本,用戶數將持續(xù)高速增長底,更新尤為密集,發(fā)布了參數眾多且性能提升的V3、支持思維鏈輸出和模型訓練的R1,通用語言模型自然語言處理領域的初步探索。數學專用模型專注于數學問題解決能力,提升邏輯推理和復雜數學任務處理性能。多模態(tài)模型引入視覺語言融合技術,支持圖像與文本的聯合理解,拓展多模態(tài)應用場景。語言生成模型優(yōu)化語言生成流暢度與準確性,顯著提升文本輸出的自然度和邏輯性。代碼生成侈模強化代碼生成能力與多模態(tài)交互功能,支持編程態(tài)模型任務和跨模態(tài)內容生成。多語言跨領域模型支持多語言處理與跨領域任務,增強模型的泛化能力。綜合性能優(yōu)化模型提升模型綜合性能,優(yōu)化訓練策略與架構設計,為后續(xù)版本奠定基礎。推理優(yōu)化模型采用混合專家(MOE)架構,動態(tài)路由技術使推理成本僅為GPT-4Turbo的17%,在多個基準pro多模態(tài)專業(yè)模型高級版本多模態(tài)模型,優(yōu)化訓練策略與數據規(guī)模,擊敗DALL和stableDiffusion,支持文本到圖像的穩(wěn)定生成。4全球用戶數從34.7萬激增至1.19億。2月8日,國內APP端日活3494萬,海外3685萬,全球web端4800萬。與chatGPT相比,Deepseek僅用一年多就達到chatGPT兩年的用戶規(guī)模,在國內1月躍居月均活躍用戶數榜首,chatGPT-O1;技術路徑巧妙,推理成本僅為GPT-4Turbo的17%;開源與閉源雙軌戰(zhàn)略,資料來源:Al產品榜,源達信息證券研究所資料來源:Al產品榜,源達信息證券研究所2.低成本:Deepseek位于模型性價比最優(yōu)范圍,較openAl等同類模型大幅下降1)從算法創(chuàng)新層面來看,Deepseek-v3采用了自主研發(fā)的MOE架構,總參數量達671B,并引入冗余專家部署策略,實現推理階段MOE不同專家間的負載均衡,還提出無輔助損失和計算效率展開,通過創(chuàng)新底層軟件架構,引入數學變換減少kvcache內存占用,緩解5transformer推理時的顯存和帶寬瓶頸,優(yōu)化注意力計算方式,進一步提高效率。同時,采用創(chuàng)新訓練目標MTP,讓模型訓練時一次性預測多個未來令牌,擴展預測范圍,增強對上下文的理解能力,優(yōu)化訓練信號密度,將推理速度提升1.8倍。2)在工程優(yōu)化方面,一系列的創(chuàng)新與優(yōu)化,使得Deepseek-v3訓練成本僅為557萬美H800GPU集群上僅需3.7天。加上266.4萬GPU小時預訓練、119萬GPU小時上下文長時。假設H800GPU的租賃價格為GPU6存未命中),每百萬輸出tokens8元。此外,V3模型設置長達45天的優(yōu)惠價格體驗期:2025年2月8日前,V3的API服務價格仍保持每百萬輸入tokens0.1元(緩存命中)/1定價為每百萬輸入tokens1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens16表2:不同大模型API服務定價對比Deepseek-v3:每百萬輸入tokens0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens8元Deepseek-R1:每百萬輸入tokensl元(緩存命中)/4元(緩存未命中),每百萬輸出tokens16元(2月9日前優(yōu)惠期減半)chatGPTGPT4Turbo:輸入每百萬tokens約元o3-mini:價格較前代降低63%通義千問文本模型:qwen2-72b-instruct:輸入價格為0.005元/l,000tokens,輸出價格為0.0l元/1,000tokensqwenl.5-110b-chat:輸入價格為0.007元/1,000tokens,輸出價格為0.014元/qwen-72b-chat:輸入和輸出價格均為0.02元/1,000tokens視覺理解模型:Qwen-VL-plus:輸入價格為0.0015元/千tokensQwen-VL-Max:輸入價格為0.003元/千tokens文心一言7輸出0.002元/千Tokens,模型推理的綜合價格為0.001元/千Tokens豆包格為0.0046元/千Tokens開放平臺多模態(tài)圖片理解模型:kimimoonshot-v1l-32k-vision-preview:每1Mtokens價格24元moonshot-v1l1-128k-vis上下文緩存:kimicache創(chuàng)建費用:24元/Mtokencache存儲費用:5元/Mtoken/分鐘cache調用費用:0.02元/次資料來源:源達信息證券研究所圖6:Deepseek-vv3位于模型性能性價比最優(yōu)范圍圖7:o1類推理模型輸入輸出價格列術,自動選擇有價值的數據進行標注和訓練,減少數據標注量和計算資源浪費,并在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,在MATH-500上,獲得了97.3%的得分,與openAl-O1性能相當,并且顯著優(yōu)于其他模型。8發(fā)布了從15億到700億參數的R1蒸餾版本。這些模型基于Qwen和Llama等架構,表明R1生成的合成推理數據對這些較小的模型進行微調,從而在降低計算成本的同時保持高性能。讓規(guī)模更大的模型先學到高水平推理模式,再把這些成果移植給更小的模包。圖9:蒸餾技術原理資料來源:CSDN,源達信息證券研究所9和端側的投資機會學家威廉·斯坦利·杰文斯于1865年提出。當時,英國面臨煤炭資源可能耗盡的擔憂,人們認為提高煤炭使用效率能緩解資源短缺。但杰文斯卻指出,技術進步帶來的效率提升,反而會導致資源消耗的增加。例如,當煤炭動力技術效率提高,能量,這會促使更多依賴煤炭能源的產業(yè)興起,如工廠、火車、輪船等,進而刺激煤炭需求大幅增長,加速煤炭資源的消耗。求呈現出幾何級增長趨勢。Al技術的進步,就像曾經煤炭動力技術的提升,雖然模型效率提高了,但不斷增長的用戶和應用數量,卻對算力資源提出了更高要求,消耗也隨之劇增。顯示"當前服務器資源緊張,為避免對您造成業(yè)務影響,我們已暫停API服務充值。存量充務器繁忙,請稍后再試"。資料來源:甲子光年智庫,源達信息證券研究所建議關注以國產算力和Al推理需求為核心的算力環(huán)節(jié),尤其是IDC、服務器、國產芯片等算力配套產業(yè),推薦海光信息、浪潮信息。許可協議下支持免費商用、任意修改和衍生開發(fā)的優(yōu)勢,迅速成為了海內外各大云廠商的寵如騰訊云將Rl大模型一鍵部署至高性能應用服務HAI上,開發(fā)者僅需3分鐘就能接入接拉高了模型能力下限。以往一些受限于基礎模型能力不足而難以實現的復雜功能,在集成應用時,從模型搭建到功能實現的周期大幅縮短,開發(fā)效率顯著提升,實現了Al應用開發(fā)理服務騰訊云動和配置阿里云模型百度智能云格方案及限時免費服務火山引擎京東云混私有化實例部署兩種模式天翼云微軟Azure亞馬遜AWS英偉達完整版Deepseek-R1671B的處理速度可達每秒3872Token資料來源:源達信息證券研究所場規(guī)模達到了554億元,預計到2028年,這一數字將攀升至8520億元,年均復合增長內人士預測,垂直領域的Al代理市場規(guī)模有望達到saas的十倍,甚至可能催生出超過知識管理,為企業(yè)的數字化轉型提供了有力支持。2)c端場景:作為生成式Al的重要商場發(fā)展,大模型更廣泛地接入硬件產品,做好軟硬件協同發(fā)展是未來競爭的關鍵。圖13:Al智能體"數字化"走向"具身化"示意lAIPC通過在本地運行大模型,以更具定制性、高效性和安全性的方式,滿升,其應用范圍也在不斷拓展。聯想、華為等知名品牌廠商敏銳捕捉到這一技術優(yōu)勢,紛紛圖14:2025年全球AIPC出貨量能占到PC出貨量的35%lAl眼鏡眼鏡成端側Al落地絕佳載體,貼合現代生活應用場景廣泛。眼鏡是人類穿戴設備中最靠近嘴巴、耳朵和眼睛這三大感官的物體,技術進步使其成為端側Al落地絕佳載體:Al眼鏡集的多模態(tài)輸入輸出,完美契合Al復雜功能使用條件。圖15:Al智能交互眼鏡構成及功能資料來源:艾瑞咨詢,源達信息證券研究所款創(chuàng)新產品的可行性,科技企業(yè)們紛紛布局,刺激整個產業(yè)蓬勃發(fā)展,據VR陀螺,目前已有超40家國內外廠商入局Al眼鏡,其中包括互聯網大廠、手機巨頭、AR明星企業(yè),涉及產品數量預計超過50款。表4:科技廠商Al眼睛布局華為visionGlass2024年1349元起輕巧舒適,等效4米前120英寸巨幕,3D模式下可呈現超200英寸巨幕,支持多種3D片源華為華為智能眼鏡22024年1399元起搭載鴻蒙系統(tǒng),支持多種智能交互功能華為華為XGENTLEMONSTER2024年889元起時尚設計與智能功能結合小米小米Al眼鏡預計2025年4月暫未公布搭載Al功能、音頻耳機模塊、攝像頭模塊,全面對標Ray-BanMetaRokidGlasses2024年112499元搭載高通驍龍AR1平臺,1200萬像素攝像頭,支持高清攝影攝像2025年11799元驍龍AR1旗艦級芯片預計2025暫未公布MetaRay-BanMeta2023年9月299美元起內置定向揚聲器、麥克風、攝像頭等組件,可用于FPV拍攝/視頻錄制、通話、聽音樂等三星Al智能眼鏡預計2025年9月暫未公布搭載AR1、支持Gemini模型蘋果蘋果Al眼鏡預計2025年暫未公布據報道正在研發(fā),可能具備AR功能李未可科技李未可MetaLenschat預計2024年Q4或2025年Ql暫未公布與博士眼鏡達成戰(zhàn)略合作,進駐博士眼鏡全國線下門店蜂巢科技界環(huán)Al音頻眼鏡2024年9月600-800元提供8框14色,快拆結構設計,重量約30克,續(xù)航1l小時閃極科技閃極Al"拍拍2024年12999元起球首款Al記憶系統(tǒng)LoomoosXREALXREALone2024年3299元起智能AR眼鏡,具備高清顯示和智能交互功能INMOINMOGO22024年113999元起一體式Al+AR智能眼鏡,具備實時同聲翻譯、便攜提詞等功能看見科技LooktechAlGlasses2024年暫未公布具備Al拍照、識別等功能星辰科技Al眼鏡2024年暫未公布搭載星辰科技的Al技術,具備智能交互功能資料來源:源達信息證券研究所三、投資建議等算力配套產業(yè),推薦海光信息、浪潮信息。3)小模型能力提升促進了端側模型部署,我們看好Al終端作為新一代計算平臺爆發(fā)可能。建議關注:科大訊飛、立訊精密、歌爾股份。表5:相關公司萬得一致盈利預測688041.SH15.919.528.739.0162.3110.281SZ4.923.028.734.340.532.527.2931鼎捷數智300378.SZ5.61.82.22.766.153.543.1118用友網絡600588.SH7.23.26.2-1553.2194.3100.4625金山辦公68811l.SH16.615.219.124.2116.593.073.51776科大訊飛002230.SZ7.76.09.613.3211.0130.91262立訊精密002475.SZ4.9135.9171.8209.123.218.33151歌爾股份002241.SZ3.027.336.445.335.626.7972資料來源:wind,源達信息證券研究所四、風險提示Al產業(yè)商業(yè)化落地不及預期的風險。目前如果各環(huán)節(jié)產品的推進節(jié)奏不及預期,或對相關企業(yè)業(yè)績造成不利影響。市場

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論