




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
DeepSeek與AIGC應用AI (孫萍、周嶸、李娜、張惠軍、劉譽)2月20日院元宇宙技術研究所學實驗室2.本次講座首先分析當前備受矚目的DeepSeek-R1的概念、優(yōu)勢和歷史地位。然后進一AIGC具應用的局限,理解DeepSeekAIGCAI具,為大家I目錄AIGC力揭秘AIGC的概念和應用3PART01能的發(fā)展歷程,以及大模型相關術語,并對比DeepSeek-R1與其他模型的性能DeepSeek及DeepSeek-R1的技術原理和應用場景,揭示了其型任務、教育、科研、知識應用和文檔分析等領域的獨特優(yōu)勢,并列舉接入該模型的第對人工智能發(fā)展歷史以及DeepSeek-R1的介紹和分析,本部分旨在為聽眾提供一個對2023年GPT-4AIGCAIGC的發(fā)展歷程19501950s-1990S1990s-2010S2010s-2022年文本、圖片、音頻、視頻通義千問、秘塔搜索、微信搜索...?大語言模型(LLM,LargeLanguageModel)模型?行業(yè)模型(垂直模型、垂類模型)教育、醫(yī)療、金融等生成模型推理模型ref告(2025.01.08)比較項GPT-4o(生成模型)DeepSeek-R1(推理模型)模型定位專注于通用自然語言處理和多模態(tài)能力,適合日常對話、內容生成、翻譯以及圖文、音頻、視頻等信息處理、生成、對話等。側重于復雜推理與邏輯能力,擅長數(shù)學、編程和自然語言推理任務,適合高難度問題求解和專業(yè)領域應用,在中文表達上容易出理能力在日常語言任務中表現(xiàn)均衡,但在復雜邏輯推理(如數(shù)學題求解)上準確率較低。在復雜推理任務表現(xiàn)卓越,尤其擅長數(shù)學、代碼推理任務,在部分基準測試(如GPQA)中準確率高于GPT-4o。持支持文本、圖像、音頻乃至視頻輸入,可處理多種模應用場景適合廣泛通用任務,如對話、內容生成、多模態(tài)信息處理以及多種語言相互翻譯和交流;面向大眾市場和適合需要高精度推理和邏輯分析的專業(yè)任務,如數(shù)學競賽、編程問題和科學研究;在思路清晰度要求高的場景具有明顯優(yōu)勢,比如采訪大綱、方案梳理;在對中文語言表達和情感表達方面有明用戶交互體驗提供流暢的實時對話體驗,支持多種輸入模態(tài);用戶界面友好,適合大眾使用??烧故敬蟛糠宙準剿伎歼^程,便于專業(yè)用戶理解推理過程;界面和使用體驗具有較高的定制性,但整體交互節(jié)奏較慢。勢-演繹或歸納等推理能力強(如謎題、數(shù)學證明)-響應速度慢且計算成本高(需要更多推理時間)-鏈式思維推理出色(善于分解多步驟問題)-基于知識的任務更容易出錯(容易產(chǎn)生幻覺)-擅長復雜決策任務-處理簡單任務的時候效率低(容易"過度思考")-可以呈現(xiàn)思考過程mini火爆全網(wǎng)的DeepSeek-火爆全網(wǎng)的DeepSeek-R1?DeepSeek-R1的推理能力進入了第一梯隊(媲美OpenAIo1),但訓練和推理成本低、速度快、全部開源?DeepSeek打破了硅谷傳統(tǒng)的“堆算力、拼資本”的大模型發(fā)展路徑01對01對AI行業(yè)的重大影響打破壟斷DeepSeek-R1以低成本和開源特性打破以往頭部企業(yè)巨頭割據(jù)局面價格下調DeepSeek-R1的API定價僅為行業(yè)均價的1/10,推動了中小型企業(yè)低成本接入AI,對行業(yè)產(chǎn)生了積極影響推動創(chuàng)新DeepSeek-R1促使行業(yè)開始從“唯規(guī)模論”轉向更加注重“性價比”和“高效能”方向DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技企業(yè),專注于人工智能基礎技術的研究與開發(fā)公司成立背景與發(fā)展歷程DeepSeek公司DeepSeekDeepSeek專注于開發(fā)先進的大語言模型(LLM)和相關技術,旨在通過這些技術推動人工智能在多個領域的應用和創(chuàng)新管理資金規(guī)模均超過600億元。這為DeepSeek提供了清晰的市場定位和投資者背景大語言模型(LLM)的創(chuàng)新應用投資者背景與市場定位2025年1月20日推出DeepSeek2025年1月20日推出DeepSeek-R1推理模型DeepSeek產(chǎn)品信息官方渠DeepSeek產(chǎn)品信息官方渠道新聞:/zh-cn/news/news250120Github:/deepseek-ai/DeepSeek模DeepSeek模型系列DeepSeekDeepSeek最新的生成模型和推理模型版本對比生成模型(V3)推理模型(R1)想要在各種自然語言處理的任務中都更通用復雜的推理情況,比如分析和解決問題在數(shù)學題、多語言任務還有編碼任務里表現(xiàn)不錯,像Cmath能得90.7分,HumanEval編碼任務通過率是65.2%思考的測試里很棒,比如.8%的范圍適合大規(guī)模的自然語言處理工作,像對話式AI、多語言翻譯還有內容生成等等,能給企業(yè)提供高效的AI方案,滿足好多領域的需求適合學術研究、解決問題的應用和決策支持系統(tǒng)等需要深度推理的任務,也能拿來當教育工具,幫學生鍛煉邏輯思維讓模型自我探索和訓練蒸餾 (讓模型自我探索和訓練蒸餾 (Distillation)在不損失能力的情況下縮小模型DeepSeek-R1強化學習強化學習 (ReinforcementLearning) (ChainofThought)讓讓模型進行慢思考DeepSeek-DeepSeek-R1模型名稱滿血版,能力最強蒸餾版,能力稍弱QwenLlamaDeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BB能能部署DeepSeek-R1DeepSeek-RDeepSeek-R1的優(yōu)勢理科能力強,且準確率高DeepSeek-DeepSeek-R1的局限?R1的通用能力(尤其是生成能力)低于DeepSeek-V3?R1的幻覺仍舊比較明顯(可能源于R1的中文語言表達能力更強)RZero明顯DeepSeekDeepSeek-R1t如何使用DeepSeek如何使用DeepSeek寶I騰訊ima個人知識庫I接入接入DeepSeekR1第三方服務的廠家?百度:百度搜索、文小言?字節(jié)跳動:豆包、扣子、飛書?阿里:釘釘?AI應用公司(教育類):學而思、北大青鳥、網(wǎng)易有道、猿輔導、作業(yè)幫、…...?其它云服務平臺:三大運營商、云服務商(硅基流動等)PART02AIGC的概念和應用本部分著重介紹人工智能生成內容(AIGC)的定義、應用范圍及其在各行業(yè)的實際影響:AIGC,包括AI、AGI、生成式AI和決策式AI等,明確了其在人工智能領域的傳媒、影視、游戲、教育和金融等行業(yè)的具體實踐,展示AIGC在提升效率、降低成本和增強創(chuàng)通過深入探討AIGC的應用現(xiàn)狀和未來趨勢,本部分旨在幫助讀者全面理解AIGC的潛力和影響,為應本部分的內容參考了《人工智能通識課(微課版)》和相關的視頻(B站的思睿觀通)初識AIGC (人工智能生成內容)AIGCAIGCChatGPTAI(人工智能)AGI(通用人工智能) (artificialgeneralintelligence)AIGC能AIGC能干什么頻生成內容AI文本AI文本?Cursor?Windsurf?MarsCode?GitHubCopilot?阿里云通義靈碼?微軟“小冰”出版詩集?AI撰寫劇本電影《陽春》?百萬字小說《天命使徒》?清華大學的《機憶之地》AIAI搜索聞?Perplexity?知乎直答?秘塔AI搜索引擎?納米AI搜索?微信搜索(DeepSeekR1、元寶)?小紅書的筆記助手?短視頻平臺的內容創(chuàng)意?自動回復機器人?企業(yè)微信的智能回復?英國廣播公司(BBC)的Juicer?彭博社的Cyborg?新華社的快筆小新?人民日報的創(chuàng)作大腦?第一財經(jīng)的DT稿王AI繪畫AI繪畫2022年8月,獲得比賽2022年8月,獲得比賽“數(shù)字藝術/數(shù)字修飾照片”空歌劇院AI繪畫AI繪畫AI繪畫AI繪畫新西湖繁勝全景圖全景圖是一副百米畫卷,再現(xiàn)了當下西湖邊的景觀特色、生活場景,還有一些已經(jīng)消失的景觀,比如曾經(jīng)聞名寺。如果這些建筑都要自己親手畫,一天I技術,在一年內完成了作品AI音頻AI音頻話創(chuàng)作音樂隆AI視頻AI視頻頌效添加圖片AIGC的行業(yè)應用內容廣告電商行業(yè)其它行業(yè)內容廣告電商行業(yè)其它行業(yè) (教育、金融...)新聞傳媒影視行業(yè)游戲行業(yè)AIGC的行業(yè)應用產(chǎn)品拍攝降本增效主播提升直播帶貨效率參與傳效果播環(huán)節(jié)采編環(huán)節(jié)傳媒錄音語音轉寫應用場景拓展能新聞寫作應用功能升級能視頻剪輯應用形態(tài)完善播環(huán)節(jié)采編環(huán)節(jié)傳媒錄音語音轉寫應用場景拓展能新聞寫作應用功能升級能視頻剪輯應用形態(tài)完善對媒體從業(yè)者將部分采編、播放工作自動化,讓其更專注于思考創(chuàng)造如將精力集中于深度報道專題報道等更需發(fā)揮人類精準分析事物、妥善處理情感的領域;對傳媒用戶短時間獲得更多新聞,提高獲取及時性及便捷性;降低傳媒門檻,使得受眾可以參與內容生產(chǎn),增強參與感對傳媒機構大幅提高生產(chǎn)效率,并帶來新的視覺化、互動化體驗;豐富了新聞報道的形式,推動傳媒向智媒轉變傳媒AIGCAIGC對傳媒行業(yè)參與主體的影響影視劇本文稿創(chuàng)作拓展角色范疇影視劇本文稿創(chuàng)作拓展角色范疇賦賦能影視剪輯拓拓展場景空間戲玩法,提高游戲可玩性。游戲驗02功能AI造不同的面孔、服飾、聲音甚至性格特征,甚至可同步驅動嘴型、表情等面部變化,達到,完成行走、跑步等一系列動作反應。?AI智能NPC能夠分析玩家的實時輸入,與玩家動態(tài)交互,構建幾乎無限且不重復的劇情;AI?讓AI感知環(huán)境、自身狀態(tài)并基于特定目標決定當下需要執(zhí)行的動作,基于特定問題和場景,自主提出解決方案。游戲策業(yè)AIGCAIGC游戲研發(fā)環(huán)節(jié)作用001體驗套數(shù)值體系下的游戲體驗,提出優(yōu)化策略;找出游戲交互的可能性,發(fā)現(xiàn)潛在漏洞輔助游戲策劃。游戲性能0303角色0404劇情0505策略??AI自動化廣告投放:目前抖音等平臺的廣告分發(fā)、內容推薦已通過算法實現(xiàn),且效果較高;游戲運營環(huán)節(jié)試?虛擬實驗室?生成學習資料?翻譯文獻資料其其它?風險管理文檔?合規(guī)管理金融行業(yè)AIGC的未來AIGC的核心價值AIGC的核心價值AIGC的挑戰(zhàn)AIGC的挑戰(zhàn)結果幻象、可控性、理解能力生成精準度、還原度、仿真度0104倫理挑戰(zhàn)社會偏見、性別歧視等002003私及安全露隱私數(shù)字身份冒用制作虛假信息詐騙產(chǎn)權挑戰(zhàn)侵權與被侵權AIGC的未來AIGC的未來步AIGC的生成質量和準確性將得到提升泛的應用在更多領域得到應用,如保險、醫(yī)療和法律服務等協(xié)作更多地與人類專家協(xié)作,以提供更高質量的內容和服務管框架的發(fā)展預計將出現(xiàn)更多關于內容生成和使用的監(jiān)管框架生成式人工智能(AI)目前處于到2026年,Gartner預測超過80%的企業(yè)將使用生成式AI的API或模型,或在生產(chǎn)環(huán)境中部署支持生成式AI的應用,而在2023年初這一比例不到5%。錫報告:《工作的新未來:在歐洲及其他地區(qū)部署人工智能和提升技能的競賽》顯著上升?STEM(科學、技術、工程和數(shù)學)相關職業(yè)?醫(yī)療保健和其他高技能職業(yè)下降顯著?辦公室職員?生產(chǎn)工人?客戶服務代表等傳統(tǒng)職業(yè)到2030年,歐洲和美國多達30%的工作時間化錫報告:《工作的新未來:在歐洲及其他地區(qū)部署人工智能和提升技能的競賽》?技能類型需求變化?技術技能大幅增長?炙手可熱的“新寵”技能是社會和情感技能?體力和手動技能的需求預計將保持大致穩(wěn)定?認知技能(文字和信息處理、編程、科研、工程等)的需求預計將減少14%與AI共舞與AI共舞?學習AIGC基礎知識?積極使用AIGC工具?關注AIGC在各行業(yè)的應用案例PART03本部分深入剖析AIGC背后的技術原理,涵蓋文本生成和圖像生成兩大核心領域。通過對比文本生成和圖像生成的不同路徑,大家能夠全面理解AIGC在不同模態(tài)下的工作原理,以及如何利用這些技術實現(xiàn)高效的內容創(chuàng)作在文本生成方面,以OpenAI的GPT-4o為例,詳細介紹了通用大語言模型(LLM)的工作原理,包括其基于Transformer架構的生成機制、上下文編碼、自注意力機制以及預訓練和微調過程。探討了GPT-4o在多輪對話、語言轉換、意圖理解、文本生成和推理能力等方面的優(yōu)勢,同時也指出其在知識局限、上下文窗口限制和生成幻覺的不足。在圖像生成方面,以StableDiffusion模型為例,解釋了其核心組件(文本編碼器、圖像信息生成器和圖像解碼器)的工作流程,揭示了文生圖和圖生圖技術的優(yōu)勢與局限。本部分的內容參考了《人工智能通識課(微課版)》和相關的視頻(B站的思睿觀通)。文本生成的奧秘AIGC與GPTAIGC與GPT(通用大模型的代表)1950s-1990S11990s-2010S22010s-2022年OpenAIGPT4-多模態(tài)大模型GPT的學霸養(yǎng)成GPT的學霸養(yǎng)成記OpenAI能力工作原理-1工作原理-1GGenerative (生成式)GPTTransformer (變換器)Pre-trained (預訓練)LLM:LargeLanguageModel11.收到提示詞2.將輸入拆分為token3.采用Transformer架構處理token?理解token之間的關系?識別提示詞的整體含義4.基于上下文預測下一個token?為可能的單詞分配概率分數(shù)5.根據(jù)概率分數(shù)選擇標記概率概率預測+文字接龍自回歸:重復步驟4和步驟5直到形成完整的句子示例:今天天氣不錯,我定去公園訓練 (自監(jiān)督)督微調收輸入處訓練 (自監(jiān)督)督微調收輸入處理輸入進行推理工作原理-2模型工作過程+知識類反饋生成輸出生成輸出工作原理-3工作原理-3源維基百科在線百科,嚴謹圖書經(jīng)典為主的古登堡計劃和自助出版平臺Smashwords等雜志期刊鏈接WebText,RedditCommonCrawl開源項目,爬取互聯(lián)網(wǎng)所有數(shù)據(jù)GitHub程序員聚集地合計?700多GB,約有19萬套四大名著的閱讀量?5000億左右的token數(shù)量。(13萬億token:gpt4)?100個標記大約等于75個英語單詞訓練語料(gpt-3)GPT-4o上下文窗口大小:8192個token(標記)劣勢劣勢vs?幻覺(生成錯誤答案)基本對話方法基本對話方法具:?ChatGPT?POE多輪對話引導如何與GPT對話智慧對智慧對話ChatGPTChatGPT:聊天機器人應用GPT:大語言模型力-多輪對話?上下文編碼?自注意力機制上下文窗口限制?包括字符、標點、空格?GPT-3.5:4096,大約3000個英文單詞或4000個漢字?GPT-4:8192,大約6000個英文單詞或8000個漢字 tformopenaicomtokenizer?分段對話?定期總結?使用關鍵詞提醒?精簡輸入-語言轉換能力?人類語言之間轉換?機器語言之間轉換?人類語言與機器語言之間轉換??人類語言生成能力不同法語、德語、中文機器語言生成能力不同t?GPT:使用英文?中文優(yōu)先選擇國內產(chǎn)品?編程盡量選用前4種語言力--意圖和情感分析能力力--意圖和情感分析能力?真實意圖?情緒識別?判斷行為特點?重要他人?缺乏真正的情感?上下文理解有限?缺乏深層次推理?提供清晰具體的信息?簡短和連貫的對話?使用明確的情感表達力力強力強文本生成能力文本統(tǒng)計?統(tǒng)計字符數(shù)、單詞數(shù)、句子數(shù)等基本統(tǒng)計信息文本摘文本統(tǒng)計?統(tǒng)計字符數(shù)、單詞數(shù)、句子數(shù)等基本統(tǒng)計信息文本摘要?從長文檔中提取主要信息,并生成一個簡短的概述創(chuàng)作能力-文本分析能力更新、長文本理解、數(shù)據(jù)偏見、數(shù)據(jù)、語境歧義、領域專業(yè)知識、新穎和類別、不確定性文本分類?新聞分類、情感分析(正面、負面、中性)文本總結?文本的整體內容進行簡要概述,通常比文本摘要更為簡短文本校對?錯別字識別與修改、語法錯誤檢查與修正、文本校對?錯別字識別與修改、語法錯誤檢查與修正、標點符號調整、詞匯選擇優(yōu)化、語句重組與調整、保持一致的寫作風格文本改寫文本簡化、文本優(yōu)化、保持一致性創(chuàng)作能力-文本潤色能力更新限制、長文本處理能力、用戶意別文本擴寫?增加細節(jié)、舉例說明、提供背景信息、解釋專業(yè)術語或概念、描述過程或步驟、增加文學修辭、提供多種觀點等創(chuàng)作能力-使用建議創(chuàng)作能力-使用建議使用優(yōu)先級析>文本潤色>文本生成分段處理長文本明確和具體的指示補充背景信息注意多義詞和模糊表達對比能力?對比分析:對比能力?對比分析:事物、概念、人物、事件、文學作品、藝術作品等列舉能力?簡單列舉任務:組合/排列/序列,簡單數(shù)學問題等假設推理能力?多個領域能力不同:歷史事件、文學作品解讀等數(shù)據(jù)局限、缺乏常識和領域專長、模型理解能力、過度生成偏見、難以驗證答案的準確性學會提學會提問?明確、具體、避免歧義邏輯清晰?上下文信息示范數(shù)據(jù)驗證輸出?從回復中找到有價值的部分識別可靠信息?評估信息準確性:與其他來源進行對比話圖像生成的奧秘Stable三大核心組件 (畫家)(工匠)圖像信息生成器編碼器Diffusion模型的構成Stable三大核心組件 (畫家)(工匠)圖像信息生成器編碼器Diffusion模型的構成Stable (翻譯官)?解析用戶輸入的提示詞?將提示詞轉化為高維向量表示?將輸入信息逐步處理和轉換為圖像數(shù)據(jù)?接收來自圖像信息生成器的處理后的信息矩陣?將信息矩陣轉換為可視化的圖像PART04AIGC的工具類型,包括聊天對話機器人、圖像生成工具、音頻與視頻生成工還
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030中國非臨床信息系統(tǒng)行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略研究報告
- 星際介質中的熱輻射機制研究-全面剖析
- 時間常數(shù)在納米材料表征中的應用-全面剖析
- 營業(yè)員工作總結(29篇)
- 2024-2025學年下學期高一地理湘教版期中必刷??碱}之城鎮(zhèn)化進程及其影響
- 碳交易市場機制優(yōu)化路徑-全面剖析
- 抵押皮卡銷售合同范本
- 上海工程技術大學輔導員考試題庫
- 經(jīng)紀人合規(guī)培訓
- 籃球租場合同范本
- 2025山東電工電氣集團社會招聘177人筆試參考題庫附帶答案詳解
- 2025年山東省青島市高考地理一模試卷
- 2020年個人信用報告新版含水印
- 雷雨第四幕劇本由中門上不做聲地走進來雨衣上雨還在往下滴發(fā)鬢有些
- 廣東省五年一貫制考試英語真題
- 更換鍋爐水冷壁管施工方案 勿刪
- 石化公司成品油銷售中心考核方案
- 機動車檢測站車輛起火及應急疏散演練記錄
- DB13(J)∕T 105-2017 預應力混凝土管樁基礎技術規(guī)程
- 加壓氣化操作規(guī)程(共115頁)
- 標準魯班尺尺寸對比表
評論
0/150
提交評論