Databricks公司開源1320億參數DBRX模型目前性能最領先的MoE架構大模型_第1頁
Databricks公司開源1320億參數DBRX模型目前性能最領先的MoE架構大模型_第2頁
Databricks公司開源1320億參數DBRX模型目前性能最領先的MoE架構大模型_第3頁
Databricks公司開源1320億參數DBRX模型目前性能最領先的MoE架構大模型_第4頁
Databricks公司開源1320億參數DBRX模型目前性能最領先的MoE架構大模型_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

目錄一、行業(yè)變化 1大數據人工智能公司Databricks開源通用大模型DBRX 1Databricks發(fā)布的DBRX模型與其他公司大模的功能性對比 1Databricks發(fā)布的DBRX模型的訓練與推理效率 5二、持續(xù)關注標的 6三、行情回顧 7四、產業(yè)要聞 10五、重要公告 12六、風險提示 13圖表目錄圖表1:Databricks官的源DBRX模用冊界面 1圖表2:DBRX型他源AI大型語言解、程數三方的能對比 2圖表3:DBRX不準下其開大型能力比 3圖表4:DBRX其源大型性基對比 4圖表5:DBRX其型的上文準試較 4圖表6:DBRX兩個RAG基(NaturalQuestions和HotPotQA)上質對比 5圖表7:Gemini1.5下文口面其模對比 5圖表8:DBRX理對比 6圖表10:人智(證)股漲前名(%) 7圖表11:人智(證)股漲后名(%) 7圖表12:重公股漲跌情盈預為Wind一預) 8請務必閱讀正文之后的免責條款和聲明。一、行業(yè)變化大數據人工智能公司Databricks開源通用大模型DBRX327日,DatabricksDBRX(1),在綜合所有的大模型評價標準后,DBRX無疑是目前表現質量最高的開源大模型之一,Databricks公司樹立了一個新的開源大模型行業(yè)標桿。同時,DBRXAPIDBRXDatabricks公司自身公布的測評結果,DBRXOpenAIGPT-3.5Gemini1.0Pro相競爭。除此之外,DBRXCodeLLaMA-70B此類的一些專注于編程領域的大模型。圖表1:Databricks官網的開源DBRX模型用戶注冊界面資料來源:Databricks官網,Databricks官網,DBRXtransformerDecoder-Only大語言模型。DBRX1320億參360980億參數則為專家混合層。DBRX模型采用了專家混合模型(MoE)12T文本和代碼數據預訓練而成。MoE:MoEMixtralGrok-1,DBRXDBRX164MixtralGrok-18個65倍可能的專家模型組合,Databricks公司表示這種變化提升了模型的質量。此外,DBRX還使用了tiktoken存儲庫中提供的分詞器。Databricks發(fā)布的DBRX模型與其他公司大模型的功能性對比在本周三DBRX模型正式開源后,Databricks公司官網也可查詢到公司發(fā)布的DBRX模型與其他公司行業(yè)動態(tài)報告(Meta、MixtralAI、xAI等)的大模型性能對比。2中直觀的呈現了在語言理解,編程,數學三個方面DBRXDBRX與其他開源大模型的性能對比,DBRX與一些閉源大模型的能力對比。圖表2:DBRX模型與其他開源AI大模型在語言理解、編程、數學三個方面的能力對比資料來源:Databricks官網,圖表3詳細顯示了DBRX和其他公司的開源大模型在不同應用領域的比較結果3可以看出,DBRX的指導分數在綜合基準、編程與數學能力、MMLU三個方面表現優(yōu)越。綜合基準方面,DBRX在theHuggingFaceOpenLLMLeaderboard(ARC-ChallengeHellaSwagMMLUTruthfulQAWinoGrandeGSM8k的平均值)DatabricksModelGauntlet(630個任務維度)。DBRXHuggingFace74.5%,排名第二的模型MixtralInstruct72.7%;DatabricksGauntlet66.8%MixtralInstruct60.7%HumanEvalGSM8k基準上的得分結果也高于其他的開源模型。行業(yè)動態(tài)報告圖表3:DBRX在不同基準下與其他開源大模型的能力對比資料來源:Databricks官網,圖表4顯示了DBRXInstruct和領先的閉源模型比較結果。DBRXInstruct超越了GPT-3.5(如比較GPT-4參考圖表4中所述),并且與Gemini1.0Pro和MistralMedium相比相當具有競爭力。具體而言:從每個abricsBX即使是表現最差的指標也與P3.5eii1.0ProMistralMedium比較,DBRXInflectionCorrectedMTBench、MMLU、HellaSwagHumanEval上的得分高于Gemini1.0Pro,在HumanEval、GSM8k和InflectionCorrectedMTBench上的得分高于MistralMediumGemini1.0ProGSM8kDBRXInstructDBRXMistralMedium在WinograndeMMLUGemini1.0ProMistralMedium模型,DBRX有自己獨特的優(yōu)勢。行業(yè)動態(tài)報告圖表4:DBRX與其他閉源大模型的性能基準對比資料來源:Databricks官網,對于在長文本任務和RAG基準的測試。DBRXInstruct32Ktoken5將其性MixtralInstructTurboTurboAPI在一系列長上下文基準測試上進行了TurboDBRXInstructTurboDBRXInstruct和MixtralInstruct的整體性能相似。RAG基準方面的測試,Databricks32KtokenDBRX的訓5MixtralInstructTurboTurboAPI進行TurboDBRXInstructTurbo好;和MixtralInstruct的整體性能類似。圖表5:DBRX與其他模型的長上下文基準測試比較資料來源:Databricks官網,RAG基準是一個十分流行的模型長文本任務性能測試方法。圖表6顯示了DBRX在兩個RAG基準上的行業(yè)動態(tài)報告模型質量。DBRXInstruct與MixtralInstruct、LLaMA2-70BChat等開源模型、當前版本的GPT-3.5Turbo相比也具有競爭力。圖表6:DBRX在兩個RAG基準(NaturalQuestions和HotPotQA)上的質量對比資料來源:Databricks官網,Databricks發(fā)布的DBRX模型的訓練與推理效率DatabricksDBRXDatabricks公司研究發(fā)現訓練混合專家模型可以顯著提高訓練的計算效率(7)。圖表7:Gemini1.5Pro上下文窗口方面與其他模型對比資料來源:Databricks官網,DatabricksDBRX預訓練數據在DBRXDense-A7BDatabricksGauntlet39.0%模型雖tokenGauntletScore30.9%Databrickstokentoken數abrics通過在500Boen上訓練BXne-Aene-A在abricsantletore32.1%的分詞器可能也對模型的分數作出了重要貢獻,因為它具有龐大的詞匯量同時被認為尤其有效率。8DBRXNVIDIADatabricks優(yōu)化后的基礎設施的模型的推理效率對比。一般來說,MoE架構的模型的推理速度相比其他模型要快。DBRX在這方面也不例外,DBRX推理吞吐量比132B非MoE模型高2-3倍。MoEDBRX的性能LLaMA2-70BLLaMA2-70B2(圖8)。此外,DBRX比Mixtral小,質量相應較低,但推理量更高。圖表8:DBRX推理效率對比資料來源:Databricks官網,二、持續(xù)關注標的GPUFPGA:安路科技-U等;SoC:高通、瑞芯微、晶晨股份、全志科技等;自然語言處理:科大訊飛等;計算機視覺:格靈深瞳-U等;自動駕駛:德賽西威、中科創(chuàng)達、均勝電子、光庭信息;智慧交通:千方科技、萬集科技;AI+工業(yè):中控技術、華大九天、廣立微、概倫電子等。三、行情回顧上期,人工智能指數(中證)指數下跌5.85%,本月份以來累計跌幅0.35%。上期上證指數下跌0.23,,滬深300指數下跌0.21%。圖表9:中證人工智能指數、上證指數、滬深300指數漲跌幅比較15%

人工智能 上證指數 滬深30010%10%5%0%-15%資料來源:,中證人工智能指數板塊個股方面,漲幅前五個股分別為:德賽西威(+11.60%)、四維圖新(+9.51%)、北斗星通(+6.86%)、浪潮信息(+5.38%)、石頭科技(+4.99%);漲幅后五個股分別為:深信服(-21.32%)、國投智能(-14.88%)、安恒信息(-14.76%)、太極股份(-13.52%)、廣聯達(-12.91%)。圖表10:人工智能(中證)個股周漲幅前十名(%) 圖表11:人工智能(中證)個股周漲幅后十名(%)(3)0份威視

0.410.39

6.865.384.99

11.609.51

(11.57)(11.72)(11.75)(11.97)(12.75)(12.91)(13.52)(14.76)(14.88)(21.32)

芯原股份中科曙光金山辦公晶晨股份易華錄廣聯達太極股份安恒信息國投智能深信服資料來源:, 資料來源:,圖表12:重點公司股票漲跌詳情(盈利預測均為一致預測)重點公司股票漲跌詳情2021歸母凈利潤20222023E2021)PE20222023E!))#DIV/0!#DIV/0!本周區(qū)間行情月初至今年初至今股票代單公司名稱行業(yè)碼位億英偉達NVDA.OGPU美9.8(NVIDIA)元億-超威半導體AMD.OGPU美10.9(AMD)元-億688041海光信息GPU元11.78.8-億688107安路科技FPGA元22.8-21.8-32.2億688256寒武紀-UASIC元2.02.8億高通QCOM.OSoC美3.87.3(QUALCOMM)元億-300458全志科技SoC元2.50.6-14.5億-603893瑞芯微SoC元8.5-20.6-億688099晶晨股份SoC元14.4-15.0-24.0汽車攝億002036聯創(chuàng)電子像頭元1.73.8-22.8-2382.HK舜宇光學科技汽車攝像頭億元21.5-21.4-43.6億603501韋爾股份CIS元4.62.5毫米波億-300691聯合光電雷達元6.1-28.1毫米波億-603197保隆科技雷達元6.0-19.2激光雷億29.1!139.217.0!-688048長光華芯達元8.8-33.4激光雷億300620光庫科技達元6.48.9激光雷億603297永新光學達元4.03.8-19.3激光雷億31.0002273水晶光電達元激光雷億002222福晶科技達元0.62.7激光雷億688127藍特光學達元1.25.0數據服億688787海天瑞聲務元9.10.7語音處億-002230科大訊飛理元7.35.0計算機億-002415??低曇曈X元9.9計算機億-688207格靈深瞳視覺元8.3-2.0-30.6計算機億688003天準科技視覺元5.76.3億21.0002920德賽西威Tier1元億--1.53.7002906華陽集團Tier1元-27.4億688326經緯恒潤-WTier1元-33.1億600699均勝電子Tier1元0285.H億-K比亞迪電子Tier1元6.6-21.2-汽車軟億300496中科創(chuàng)達件元18.3-15.5-36.0汽車軟億11.2301221光庭信息件元-19.0汽車軟億688088虹軟科技件元0.16.1-20.6汽車軟億14.4002405四維圖新件元汽車軟億-300353東土科技0.10.20.51188.8305.7116.93.6件元3.3智慧交億-002373千方科技7.2(4.8)6.023.0(34.5)27.71.2通元1.1智慧交億(220.850.1300552萬集科技0.4(0.3)(0.7)150.3(94.6)55.21.5通元)智慧工億-688777中控技術5.88.013.563.246.127.21.22.6業(yè)元3.8智慧工億000682東方電子3.54.45.535.227.922.26.28.3業(yè)元智慧工億-301269華大九天1.41.92.4326.2245.0191.4-20.9業(yè)元8.6-智慧工億301095廣立微0.61.21.8172.289.761.115.8-15.5-26.5業(yè)元-智慧工億688206概倫電子0.30.40.4236.6150.8172.512.6-11.6-28.4業(yè)元資料來源:,四、產業(yè)要聞大模型API】3月28AITaskMatrix.AI。TaskMatrix.AI(Microsoft)AI《科學》合作期刊IntelligentComputing上發(fā)表的論文TaskMatrix.AI:CompletingTasksbyConnectingFoundationModelswithMillionsofAPIs中正式亮相,作者為微軟亞洲研究院的段楠博士團隊。(IT之家)【小藝大模型版本下放,華為Mate40系列手機迎來首次眾測更新】3月27日,華為Mate40系列手機現已開啟小藝大模型版本眾測,版本號為12.1.2.400,大小為65.1MB,日期為2024/3/22-2024/4/30。華為Mate60/50P60/P50”之家)【阿里云x聯發(fā)科,天璣93003月289300AI1870億、140720102.0(IT之家)芯片3月2618室檢測具有革命性推動作用。該成果不僅有利于提高中國的體外診斷技術水平,還打破了國際壟斷。(IT之家)【英偉達AI芯片H200開始供貨,性能相比H100提升60%-90%】3月28(GPU)H200H200為面向AIH100Meta型Llama2H200H100AI453月18AI“B200”,B200和CPU()上?!白顝夾I”GB200B200BlackwellGPUArm的GraceCPUH100提升3025(IT之家)【分析稱蘋果M3Ultra3月28MaxTech的VadimYuryev稱,蘋果的M3UltraM1Ultra和M2UltraM3MaxM3UltraN3EiPhone16A18N3EM3Ultra將于2024MacStudio(IT)智能駕駛【小米汽車SU7/Pro/Max正式發(fā)布并上市】3月28SU7正式SU75.28sCLTC續(xù)航700公里、1973.6kWh15350kmPro生免費、小米澎湃智能座艙,售價21.59萬元。新車定位于“C級高性能生態(tài)科技轎車”,售價21.59萬元-29.99萬元。(IT之家)傳感器【蘋果VisionPro頭顯新專利獲批:LightSeal內嵌觸控傳感器,帶來更豐富交互方式】3月26日消息,根據美國商標和專利局(USPTO)近日公示的清單,蘋果公司獲得了一項關于VisionPro頭顯的技術專利,暗示蘋果計劃未來在LightSeal中嵌入觸控傳感器,從而為佩戴者提供更豐富的交互體驗。IT之家報導,蘋果公司此前的專利中,就考慮在LightSeal中嵌入各種傳感器,測量佩戴者體溫、行業(yè)動態(tài)報告汗液、心率、心臟電信號(如心電圖、心電圖等)、額葉活動等指標,從而進一步分析佩戴者的反應或者參與度。(IT之家)五、重要公告本期重點公告包括銷售合同、股權激勵、對外投資、股權質押等。天準科技發(fā)布銷售合同相關公告,中控技術發(fā)布股權激勵相關公告,經緯潤恒發(fā)布對外投資相關公告,廣立微發(fā)布股權質押相關公告。人工智能行業(yè)一周重要公告公司簡稱發(fā)布日期公告內容四維圖新2024/2/5近日,北京四維圖新科技股份有限公司(以下簡稱“公司”)子公司北京圖迅豐達信息技術有限公司(以下簡稱“圖迅豐達”)收到北京市科學技術委員會、北京市財政局、國家稅務總局北京市稅務局聯合頒發(fā)的《高新技術企業(yè)證書》(證書編號:GR202311004043),發(fā)證日期為2023年11月30日,有效期三年。聯創(chuàng)電子2024/2/7聯創(chuàng)電子科技股份有限公司關于控股股東股份補充質押的公告:聯創(chuàng)電子科技股份有限公司(以下簡稱“公司”)近日收到控股股東江西鑫盛投資有限公司(以下簡稱“江西鑫盛”)的告知函,獲悉江西鑫盛將所持有公司的部分股份進行股份補充質押。德賽西威2024/2/720231024屆董事會第二十次會議,審議通過了《關于公司全資子公司擬與專業(yè)投資機構共同投資設立產業(yè)基金暨關聯交易的議案》,同意公司的全資子公司深圳市德賽西威產業(yè)投資有限公司與廣東粵財

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論