清華AIGC和ChatGPT發(fā)展研究報告1.0-清華大學_第1頁
清華AIGC和ChatGPT發(fā)展研究報告1.0-清華大學_第2頁
清華AIGC和ChatGPT發(fā)展研究報告1.0-清華大學_第3頁
清華AIGC和ChatGPT發(fā)展研究報告1.0-清華大學_第4頁
清華AIGC和ChatGPT發(fā)展研究報告1.0-清華大學_第5頁
已閱讀5頁,還剩351頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

AIGC發(fā)展研究(1.0版修訂號0.92)清華大學新聞與傳播學院元宇宙文化實驗室@新媒沈陽團隊、@新媒沈陽團隊、AIGC2023年5月18日主要研究方向團隊簡介主要研究方向@新媒沈陽沈陽為清華大學新聞學院教授、博導,清華大學新聞學院元宇宙文化實驗室主任,清華大學新聞學院新媒體研究中心主任。從事多個教學科研領域,包括新聞傳播學、計算機科學、信息管理學。團隊學術研究共有20多人。并指導AI元宇宙和機器人兩個產業(yè)團隊。團隊已有眾多元宇宙和AIGC實施案例,有需要可留言聯(lián)系。團隊堅持:整體主義的跨學科整合力,實證主義的實踐導向,社會建構的產學研結合,進步主義的先鋒探索精神,科學服務于大眾的社會責任。郵箱:124739259@;微博:@新媒沈陽;O 元宇宙發(fā)布元宇宙發(fā)展研究報告1.0版、2.0版、3.0版,閱新媒體連續(xù)多年研究推特、微博、微信、短視頻、XR,有一AI和大數(shù)據(jù)近三年國內外AI比賽榮獲30余項大獎,數(shù)據(jù)規(guī)模千億量,近期推出“先問”大模型網(wǎng)絡輿論機器人研發(fā)的0.4~0.6版機器人開虛擬數(shù)字人系列元宇宙/虛擬數(shù)字人/大數(shù)據(jù)/AI系列研究虛擬數(shù)字人系列虛擬數(shù)字人發(fā)展研究報告3.0——產業(yè)發(fā)展與技術標準虛擬數(shù)字人發(fā)展研究報告2.0——社會價值與風險治理虛擬數(shù)字人發(fā)展研究報告1.0——溯源應用與發(fā)展大數(shù)據(jù)/AI/5G生態(tài)報告未來媒體報告數(shù)字藏品發(fā)展研究報告1.0時空智能發(fā)展研究報告1.02022韓國元宇宙動態(tài)研究報告20222021元宇宙發(fā)展研究報告3.0版元宇宙發(fā)展研究報告2.0版元宇宙發(fā)展研究報告1.0版202120202020201920195G下一代風口:AR20172017VR的新浪潮VR的新浪潮虛擬社區(qū)與虛擬時空隧道201620152015200720073元宇宙系列元宇宙系列4清華大學新聞學院元宇宙文化實驗室n國內高校最早一批成立的元宇宙實驗室,國內首個帶有文化屬性的元宇宙實驗室。n中文在線是實驗室產學研的支持單位,在未來媒體技術發(fā)展、元宇宙文創(chuàng)、元宇宙指數(shù)、虛擬數(shù)字人指數(shù)等元宇宙領域展開研究。n打造成世界一流的具有行業(yè)前瞻性、理論開拓性、研發(fā)創(chuàng)新性的元宇宙科研機構。n實驗室提供了數(shù)十個體驗環(huán)節(jié)。截至2023年4月底,元宇宙文化實驗室已接待1531撥訪客,共計約6606人次,涵蓋中央和地方新聞媒體、各級政府機構、學界研究人員、研究學會、高校師生,業(yè)界知名互聯(lián)網(wǎng)企業(yè)、中小型科技創(chuàng)新企業(yè)。2021年11月16日2022年3月10日2022年3月29日清華大學新聞與傳播學院元宇接待院士參觀產業(yè)支持單位:中文在線《流浪地球》為世界觀基底的國內首個科幻主題元宇宙。虛擬數(shù)字人VR/AR虛擬數(shù)字人VR/AR坐擁550萬種數(shù)字內容資源、450萬原創(chuàng)駐站作家、600余家簽約版權機構的平臺優(yōu)勢,AIGC的多模態(tài)能力作用于IP衍生孵化鏈條上,助力文字作本報告生成方式說明圖片大部分都是AIGC制作圖片大部分都是AIGC制作,碳基生物做圖片較少,因為法律明確規(guī)定碳基生物(人類面部)版權,而硅基生物暫未有相關規(guī)定。合規(guī)性在公共知識領域,盡量使用在公共知識領域,盡量使用AIGC和ChatGPT抓取信息。本報告文字超過60%由AIGC自動生成,并經過人類進行適當修改文字公共性創(chuàng)新知識和思考主要來自自然人,會利用創(chuàng)新知識和思考主要來自自然人,會利用AIGC完善自然人的理論創(chuàng)新和初步思考,加快知識生成速度。思維結構語種創(chuàng)新性在體系和系統(tǒng)性上參考AIGC和在體系和系統(tǒng)性上參考AIGC和ChatGPT在跨語種知識使用上依賴ChatGPT,學會所有語種對自然人是不可能的,如法語、德語、俄語、日語等等,現(xiàn)在借助ChatGPT能到任意語種熟練表達。系統(tǒng)性廣泛性技術篇深度學習進化史:知識變軌風起云涌已發(fā)生的關鍵步驟即將發(fā)生的關鍵步驟即將發(fā)生的關鍵步驟模型間的有效溝通與協(xié)作共享協(xié)作模型解釋性透明智慧模型道德和倫理價值同構,道德編碼未來發(fā)展方向和挑戰(zhàn)未來發(fā)展方向和挑戰(zhàn)微縮優(yōu)化創(chuàng)新結構主義模態(tài)融合微縮優(yōu)化創(chuàng)新結構主義模態(tài)融合深度學習模型有望逐步演變?yōu)榫哂懈咧悄芎妥灾餍缘男滦蜕w大語言模型進化樹:遷移學習能力涌現(xiàn)規(guī)模效應:性能通常與模型大小(即參數(shù)數(shù)引用:HarnessingthePowerofLLMsinPractice:ASurveyonChatGPTandBeyond,JINGFENGYANG等?并行計算力?自注意力機制?序列順序靈活AIGC內容?模型簡化AIGC內容~“分散式思維”~“自我聚焦”~“時空松弛”~“極簡主義”Transformer自注意力ChatGPT:事實性通過圖靈測試非線性創(chuàng)新01為什么是chatGPT?非線性創(chuàng)新l主流偏離,邊緣性技術突破l黑天鵝l偶然性創(chuàng)新數(shù)據(jù)洪流之后的涌現(xiàn),增強學習的算法02lChatGPT閉源之后,數(shù)據(jù)洪流之后的涌現(xiàn),增強學習的算法l維度擴展和神經網(wǎng)絡復雜度增加,優(yōu)化了自我監(jiān)督學習的算法l對人類的反饋進行強化優(yōu)化l提升模型可解釋性l新的全局算法思維和實現(xiàn),多模態(tài)學習算法,更先進的生成對抗網(wǎng)絡(GANs)算法chatGPT類軟件的研發(fā)過程預訓練過程→人機對話系統(tǒng)預處理的步驟包括文本清理、標訓練過程是基于自監(jiān)督的;通過反向傳播和梯度下降進行需要大量的文本數(shù)據(jù)作為訓練的基礎GPT3.5使用的Transformer模型由多個編碼器和解碼器層組成,每一層都使用自注意力機制和全連接網(wǎng)絡。在一個單獨的測試集上評估模型的性能。微調的強化學習)對模型進行微調以優(yōu)化其在特定任務上的性能。系統(tǒng)設計設計一套系統(tǒng)來處理用戶的輸入,生成模型的響應,以及管理對話的上下文。評估和優(yōu)化評估模型在特定任務上的表現(xiàn),如對話生成質量、準確性等。部署和維護將對話系統(tǒng)部署到實際生產環(huán)境,并進行持續(xù)維護和更新。ChatGPT1/2/3/4:知新悟舊納微入精參數(shù)擴展:參數(shù)規(guī)模數(shù)量呈指數(shù)級增長預訓練-微調范式:無標簽文本數(shù)據(jù)預訓練、特定任務微調、任務特化學習、細粒度的控制策略Transformer架構:高效并行計算和長距離依賴捕捉自回歸生成式預訓練:生成連貫、富有邏輯的文本、連貫性生成模型泛化能力:NLP任務中展現(xiàn)出更強的泛化能力、跨任務適應零樣本/少樣本學習:有效學習、降低數(shù)據(jù)標注成本多語言支持:跨語言的知識遷移和應用開源與閉源:ChatGPT從開源到閉源引發(fā)巨大爭議?可解釋性與可控性??可解釋性與可控性?更強的領域適應性?更廣泛的應用場景?協(xié)同學習和遷移學習?社會和道德影響關注?模型規(guī)模持續(xù)擴大?多模態(tài)學習?優(yōu)化與壓縮可能趨勢GPT5/6/7/8:無盡探索靈智飛升 技術特性?通用人工智能?通用人工智能?混合推理和學習方法?多智能體協(xié)作?安全和可持續(xù)發(fā)展>?強化學習和自適應能力?知識表示與推理?能量效率與模型優(yōu)化?人機協(xié)同與倫理道德>?更大的模型規(guī)模?更大的模型規(guī)模?多模態(tài)學習與融合?更強的領域適應性和可定制化?更強的解釋性和可控性?人類水平的自然語言理解?高度集成的跨領域知識?更強的自適應和在線學習?強化道德倫理和人工智能政策>產品節(jié)奏:灰度演進穩(wěn)健狂飆插件生態(tài)Plugin,構建插件生態(tài)PlusPlus訂閱服務ModelInstance04灰度演進如聯(lián)網(wǎng)灰度演進如聯(lián)網(wǎng)查找等。滿足需求,保持的穩(wěn)定,模塊聚合敏捷迭代快速小版本迭代彈性計費API接口和tokens計費藍海試探免費試用060700302015推理過程:關聯(lián)推測擇優(yōu)輸出理解輸入:分布式語義解析,首先會接收文本序列,轉化為詞向量,也稱為嵌入。該過程基于分布式語義假設,即詞義由其在上下文中的使用決定。參數(shù)關聯(lián):上下文焦點連鎖,將這些詞向量輸入到Transformer的Encoder中生成上下文表示。可以看作是在其內部參數(shù)模型中尋找與輸入相關的信息,也可視為一種連鎖反應,因為每個詞的上下文表示都取決于其前面的詞的上下文表示。生成回答:生成性概率建模,模型初始化Transformer的Decoder部分,并將Encoder的輸出(即上下文表示)和當前的輸出序列一同輸入到Decoder中。Decoder會生成下一個詞的概率分布。選擇概率最大或其他設定的概率分布的詞作為輸出,這個詞將被添加到輸出序列。選擇最適回答:動態(tài)詞串演化,重復上述步驟,每次都向輸出序列中添加新的詞,直到生成一個完整的輸出序列。盡管該過程被稱為推理,但ChatGPT開源版本并不進行明確的邏輯推理,它不能理解或推導復雜的事實。因為開源版本的ChatGPT并沒有明確的知識或推理引擎,所有知識都是隱含在模型參數(shù)中的。ChatGPT缺陷:高階推理定位迷霧推理門檻需高階推理能力,如因果關系推斷、擾動變量分析及反事實推理等。定位迷霧需精準定位問題根源,對于更復雜問題的定位仍顯得迷霧重重。知識盲區(qū)自我修正阻力每次回答產生錯誤的概率超過了能改正的概率,則系統(tǒng)的錯誤率難以實現(xiàn)有效的自我修正??蓴U展性挑戰(zhàn)對于更復雜的問題,正確率指數(shù)級下降。提示語:激發(fā)靈感生成精彩提示語為模型提供了處理任務的上下文和方向。提示語可以幫助模型更好地理解任務,生成高質量的輸出。動態(tài)性激活性引導性動態(tài)性激活性引導性靈活性銜接性未來要做的增強工作:1.感知調諧對輸入和輸出進行微調以獲得更好的結果;2.跨模態(tài)互操作能夠理解圖像或聲音提示,并能夠以文本、聲音或圖像的形式響應;3.動態(tài)化學習使其能夠根據(jù)用戶的反饋和其自身的經驗進行學習和改進;4.語境感知更好地理解用戶的語境和意圖,以產生更準確和相關的回答;5.倫理透明清楚地說明其決策的倫理基礎,以提高用戶對其決策的理解和信任。帶參提示:調參優(yōu)化文本精準MaxTokens:生成文本的最大長度Temperature:控制生成文本的隨機性。較高值(如0.7)會更加隨機TopP:控制采樣過程中的隨機性。值越高,生成的文本越隨機FrequencyPenalty:懲罰過于常見的詞匯PresencePenalty:懲罰已經出現(xiàn)過的詞匯Bestof:生成多少個候選輸出,并選擇其中最好的一個SystemMessage:設置一個系統(tǒng)消息,作為上下文UserMessage:設置用戶的輸入,作為上下文由整體到具體,大框架——主體內容——細節(jié)用AI語言構思環(huán)境,明確主體對畫風、圖片精度等細節(jié)刻畫反向提示:多模學習心言繪世反向提示是如何用多模態(tài)內容反向生成提示詞,再考慮將提示詞用于進一步自動生成內容。因此反向提示代表著世界到文字的逆向過程圖生文l圖片中的主要物體是什么?l圖片中的場景發(fā)生在什么時間和地點?l圖片中的人物或動物有什么情感或動機?02視頻生文l視頻中的主要事件是什么?l視頻中的人物或角色有什么關系或沖突?l視頻中的畫面和音效有什么作用或意義?03語音生文l語音中的說話者是誰?l語音中的主題或目的是什么?l語音中的語氣或態(tài)度是什么?已初步具備五種能力多模態(tài)融合微觀細粒度表征動態(tài)序列編碼跨媒體語義映射解釋性元學習未來需增強五種能力高級別的抽象理解動態(tài)情境感知多模態(tài)協(xié)同學習直觀推理普適語義生成輔助軟件?Pixlr:在線圖片編輯器?Speechnotes:語音轉文字的工具?Canva:創(chuàng)建各種設計元素的工具?Otter.ai:場景語音轉成文字工具?Piktochart:創(chuàng)建信息圖表和演示文稿工具。?InVideo:文字轉視頻工具涌現(xiàn):新知萃取自適應變突然出現(xiàn)一種以前未設定過的能力,這是涌現(xiàn)的表象知識嵌入:從大量訓練文本抽象豐富知識,包括事實、概念、理論、觀點等,并在需要時候將這些知識嵌入到生成文本中上下文適應:生成與上下文高度一致的回應多樣性生成:各種不同的主題、風格、情感創(chuàng)新思維:模仿人類,生成新觀點表達方式復雜對話:理解和回應用戶的問題、評論、反饋語義深化:理解和生成深度語義文本,如復雜的論述論證傾向性調控:生成具有某種傾向性的文本自我監(jiān)控:避免生成不適當或有害的內容案例案例:獨角獸和一只鳳凰會怎么相處?”和鳳凰都是神話中的生物。但由于ChatGPT接受了大量文本輸入作為訓練數(shù)據(jù),它能從中學習到關于獨角獸和鳳凰的信息,并在回答中融合這些知識。ChatGPT可能會生成一個類似這樣的回答:“在孤島上,獨角獸和鳳凰可能會互相尊重并共存。獨角獸可能會在島上尋找食物和水源,而鳳凰則會在天空翱翔,捕捉島上的其他生物。它們可能會互相幫助,例如在遇到困境時互相支援。它們還可能會成為朋友,共同守護這片神秘的領地。”這個回答中,ChatGPT表現(xiàn)出了一定創(chuàng)造性,提供了關于獨角獸和鳳凰在孤島上相處的情景。這種涌現(xiàn)創(chuàng)造性是通過訓練過程中模型對大量文本的學習而涌現(xiàn)出來的,而不是被明確地編程進去的。八大特征:非線性、多尺度、自組織、自適應、難以規(guī)約、信號傳遞、反饋循環(huán)、歷史依賴人工智能對齊:價值學習魯棒適應AI對齊指的是確保人工智能系統(tǒng)的目標和行為與人類的價值觀、目標和意愿一致1.從提供折扣或促銷活動的當?shù)責煵莸昊蚣佑驼举徺I。2.在原則原則OpenAI對策 OpenAI對策 算力:產業(yè)基石造化萬物01算力的定義03應用場景2402核心技術04算力的未來神經可塑性、生物模擬、元學習、能源效率、多智能理論跨模態(tài)到元宇宙:通感融合必經之路跨模態(tài):跨模態(tài):在計算機科學和人工智能領域,通常是指處理和分析多種不同類型或模態(tài)的數(shù)據(jù)(如文本、圖像、音頻、視頻等并在這些不同模態(tài)之間建立關聯(lián)或進行信息傳遞的過程。涉及多感官整合、語義嵌入、聯(lián)結主義、轉換學習關鍵技術:卷積神經網(wǎng)絡(CNN)、循環(huán)神經網(wǎng)絡(RNN)、Transformer模型、自編碼器(AE)與變分自編碼器(VAE)、生成對抗網(wǎng)絡(GAN)等。應用場景:如,自動駕駛系統(tǒng)需要理解視頻(視覺模態(tài))、雷達和激光雷達數(shù)據(jù)(空間模態(tài))、以及可能的音頻信號,如緊急車輛的警報聲(音頻模態(tài))??缒B(tài)的檢索、翻譯、推薦系統(tǒng)等等。Meta推出ImageBind跨模態(tài)大模型,包括視覺(圖像和視運動讀數(shù)(由慣性測量單元或IMU產生)ImageBind是第一個能夠同時處理6種感官數(shù)據(jù)的AI模型,也是第一個在沒有明確監(jiān)督的情況下學習一個單一嵌入空間的AI模型。未來還將加入觸覺、語音、嗅覺和大腦功能磁共振信號,進一步探索多模態(tài)大模型的可能性,實際上就是元宇宙大模型兩大趨勢:亦巨亦微擬人進化大語言模型發(fā)展中兩個相反趨勢:巨大模式是全模態(tài),海量參數(shù),期待涌現(xiàn),biggerandsmarter,從大數(shù)據(jù)到全數(shù)據(jù)的發(fā)展;小微模式是模型壓縮和優(yōu)化,freeandsmaller,力爭在有限資源達成近似性能。巨大模式:在更廣泛的知識領域中汲取智慧,對問題提出更深入的見解。強調知識的無窮性和多樣性,及AI技術在追求真理和理解世界時的角色。案案例小微模式:在保持較高預測準確性的同時,大幅度減小模型的大小和計算成本,優(yōu)化計算效率,實現(xiàn)高效的模型預測,可以在較小的設備上運行案例AIGC技術前沿探索QQ人工智能安全產業(yè)篇萬物摩爾定律:智性引擎虛實融境摩爾定律指計算機集成電路上可容納的晶體管數(shù)量每18個月翻倍,芯片性能也會隨之翻一番,價格下降約一半「ChatGPT之父」SamAltman在社交媒體稱,“一個全新的摩爾定律可能很快就會出現(xiàn),即宇宙中的智能數(shù)量每18個月翻一番?!闭J為人工智能將使許多商品和服務的成本降低到接近零,從而創(chuàng)造出巨大的財富摩爾陷阱摩爾平衡摩爾分配摩爾悖論摩爾鴻溝以下名詞由AI生成并解釋技術急變:AI引領躍動新生技術急變指數(shù)(TechnologyAgilityIndex,TAI)主要用于評估一項技術對社會產生顛覆性影響的能力,包括但不限于技術發(fā)展速度、產業(yè)結構變革、失業(yè)率變化、新興市場和生產力提升等方面。工業(yè)革命技術急變工業(yè)革命技術急變AIGC發(fā)展模型:循序漸進創(chuàng)新擴散五層發(fā)展理論發(fā)展關鍵是能夠滿足每一層次的需求,并在此基礎上尋求更高層次的發(fā)展。五層發(fā)展:各層迭進潛力無限基礎設施層功能實現(xiàn)層應用拓展層優(yōu)化提升層價值創(chuàng)新層?高效數(shù)據(jù)處理?智能適應性?人機協(xié)作共生?廣泛適用性?無限擴展性?強大計算能力?高度互動性?自適應進化?科技普惠性?超級連接性?高度可擴展性?個性化服務?超級嵌合?創(chuàng)新推動力?高級智能化?廣泛互聯(lián)性?自動化決策?安全防護?可持續(xù)發(fā)展?深度個性化?安全可靠?無縫整合?可解釋性?變革引擎?社會重塑重互聯(lián)網(wǎng):智海破浪奇思妙生ChatGPT出現(xiàn)后進入重互聯(lián)網(wǎng)時代,即互聯(lián)網(wǎng)經歷初期發(fā)展后邁入的新階段。該階段具有更深度的融合型、更深入的智能型和更廣泛的應用型場景。特點是技術持續(xù)創(chuàng)新、產業(yè)不斷演進和社會深度變革。軟件進化只考慮算法早期軟件大多為此類型一代軟件進化只考慮算法早期軟件大多為此類型一代輕軟件二代中軟件需考慮算法+算據(jù)(數(shù)據(jù))如抖音、頭條的智能推薦系統(tǒng):上線前需有大量數(shù)據(jù)和算法模型積累三代重軟件需考慮算法+算據(jù)+算力以chatGPT為代表:算法:大語言模型算據(jù):千億知識世界算力:萬個芯片集群每一類軟件比前一類軟件對人的理解提升一個維度,替代難度也指數(shù)級上升。A股AI概念股價波動A股AI概念企業(yè)股價產生了較大漲幅。特征如下:主要催化劑。AI概念股受到ChatGPT技術合作也有一批成長能力強勁的AI概念股涌現(xiàn)。AI概念股A股港股/美股AI概念股價波動港股美股1.政策影響:受到反壟斷調查、數(shù)據(jù)安全等政策因素的影響,導致股價呈現(xiàn)波2.數(shù)字化轉型驅動增長:部分企業(yè)在社交網(wǎng)絡、云計算、金融科技、人工智能2.行業(yè)領軍企業(yè)表現(xiàn)不一:盡管整個AI板塊在過去一段時間的股價波動特征和1.技術創(chuàng)新驅動:受益于不斷的AI技術創(chuàng)新與發(fā)展,使得部分領域內具備核心2.市場需求增長:隨著AI技術在各個領域的應用逐漸深入,市場需求不斷增長,2.技術創(chuàng)新驅動:尚未盈利且估值過高的AI企業(yè)面臨市場競爭激烈和投資者對SamAltmanElonMusk愿景試圖創(chuàng)建并推廣友好的人工智能,以造福所有人,實現(xiàn)智能公平?;鹦穷I主或皇帝目標熱衷幫助IT公司成長,YCombinator是一家成功的風險投資公司,已投資1600多家早期公司。SpaceX公司的目標是使人類成為多行星種族,推行火星殖民計劃。透明價值鏈參與Worldcoin全球數(shù)字貨幣項目,試圖實現(xiàn)財富去中心化分配。對數(shù)字貨幣表示了興趣,特別是比特幣和狗狗幣,但他的公司尚未主導任何具體的數(shù)字貨幣項目。能源理念投資核聚變公司HelionEnergy,支持這種清潔能源的發(fā)展。Tesla公司在電動汽車和太陽能方面領先,新能源汽車生態(tài)競爭戰(zhàn)略。思維革新熱衷打通學科領域,激發(fā)創(chuàng)新思維。物理學第一性原則、機器人社會學等。行業(yè)布局OpenAI,多家投資公司Tesla,SpaceX,Neuralink多行業(yè),囊括自動化交通、航天、太陽能和隧道建設。價值取向訓練人工智能,讓人工智能走進人類。從人腦內置芯片,到上傳人類思想,從人走向數(shù)字生命風險意識愿意投資和推動新的、未經證實的技術。SpaceX和Tesla都曾面臨破產風險,但仍堅持下去,最終取得了成功。求學經歷家境富裕,母親是皮膚醫(yī)生,從小對IT感興趣,被斯坦福錄取在人工智能實驗室工作,2005年從斯坦福退學。早年學編程,大學學習經濟學,后來獲得物理學士學位,1995年從斯坦福物理系退學。創(chuàng)業(yè)經歷蟄伏期長,2015年到2022年飽受議論。充滿傳奇,大起大落,殊為不易,但有時候大嘴巴,言行不一AIGC產業(yè)圖譜:創(chuàng)變紀元夢由此生AIGC+醫(yī)療AIGC+金融AIGC+AIGC+醫(yī)療AIGC+金融AIGC+傳媒AIGC+教育AIGC+娛樂AIGC+電商AIGC+工業(yè)文本情感分析文本情感分析搜索引擎搜索引擎新聞撰寫新聞撰寫CopilotCopilot劇情續(xù)寫劇情續(xù)寫摘要生成摘要生成虛擬客服虛擬客服問答系統(tǒng)問答系統(tǒng)視頻插幀視頻插幀短視頻配音短視頻配音電影風格轉換電影風格轉換地圖語音導航地圖語音導航AIAI換臉……圖像生成視頻圖像生成視頻DiffusionDALLEBERTNeRFCLIPGLMGANVAEVAECPUCPUGPUDPUTPUFPGAASICAIGC應用圖譜:全域升級無界協(xié)同文本代碼專業(yè)門檻降低人人可寫代碼視聽繪圖社交人與萬物聯(lián)系,無邊界協(xié)同SWOT分析:SWOT分析:微軟的強大云計算能力和OpenAI的先進AI研發(fā)能力形成互補,AI領域的法規(guī)不斷變化可能影響合作PEST分析:社會對AI技術的期望和擔憂,都會影響微軟和OpenAI的商業(yè)模式和發(fā)展戰(zhàn)略OpenAI的核心宗旨是“實現(xiàn)安全的通用人工智能(AGI),使其有益于人類“,AI開發(fā)水平處于第一梯隊。據(jù)SimilarWeb數(shù)據(jù),OpenAI網(wǎng)站訪問量快速攀升,已躋身全球TOP50。今年3月網(wǎng)站訪問量突破16億,較11月增長8643%。2016年微軟投資了OpenAI十億美元,2023年微軟將繼續(xù)投入100億美元。不過微軟和OpenAI之間也存在著微妙的流量競爭。成長性模型分析:AGI技術剛剛開始,大有可為價值鏈分析:微軟十億量級的用戶群體,OS\Office\游戲\云會議等將在一到兩年內提升至智能時代五力模型分析:短期內替代品較難形成威脅商業(yè)模式畫布分析:收入主要來源于AI產品和服務的銷售,以及云平臺的使用費用MetaAIMetaAIGoogle其他研究機構主要參與的公司和研究機構OpenAI爭優(yōu)勢。GPT-4在各種專業(yè)測試和學術基微軟整合。將基礎模型與數(shù)以百萬計的現(xiàn)有模型和技術創(chuàng)新和競爭技術創(chuàng)新和競爭主要特點政策和法規(guī)應用領域和商業(yè)模式合作和競爭LLaMA模型:開源巨頭共享生態(tài)LLaMA是Meta開源的大規(guī)模語言模型,參數(shù)量從70億到650億不等,訓練使用多達14000億tokens語料。LLaMA在常識推理、問答、數(shù)學推理、代碼生成、語言理解等能力上都有優(yōu)異的表現(xiàn),而且可以在單個GPU上運行。是最有安卓像的開源生態(tài)。]]標準化:在每個transformer層輸入前進行標準化,提高訓練穩(wěn)定性]SwiGLU激活函數(shù):在Feedforward層使用GatedLinearUnits和SwiGLU激活函數(shù),模型非線性能力和選擇性強勁相對位置關系的不變性]多語言能力:使用通用的詞匯表和分詞器,適應多樣化的語言環(huán)境]多元適應:具備了多語言和多編碼能力。通過prompt和示例來適應不同的任務和領域]深度理解:在常識推理、問答、數(shù)學推理、代碼生成、語言理解等能力上都有優(yōu)異的表現(xiàn)]智能翻譯:將人類語言轉換為SQL查詢或代碼生成深入理解和分析,例如解釋笑話、零樣本分類或數(shù)學推理國內模型:競相發(fā)布支持并進咨咨百度阿里巴巴360騰訊華為華為商湯科技商湯科技瀾舟科技瀾舟科技智源研究院悟道2.0科大訊飛科大訊飛昆侖萬維天工3.5清華大學清華大學復旦大學復旦大學中科院自動化所中科院自動化所面壁智能面壁智能達觀數(shù)據(jù)達觀數(shù)據(jù)…國內產業(yè)格局:巨頭持續(xù)小微尋機03.04.05.錯失恐懼焦慮癥FOMO優(yōu)勢與局限性產業(yè)融合效率在競爭中,關鍵是融合速度和成本與產業(yè)的關聯(lián)算力與數(shù)據(jù)平衡算力-數(shù)據(jù)邊際效應,規(guī)模報酬遞減多元共生中國不會只有一個大模型,每個企業(yè)和個人都將有自己的GPT閉源控制與開源微調在確保安全可控的前提下,通過開源微調實現(xiàn)快速發(fā)展AIGC趨勢:全球智能虛實協(xié)同全面人機協(xié)同系統(tǒng)(ComprehensiveHuman-MachineSynergySystem,CHMSS)的理論框架包括三個維度:要素維度、資源維度和時間維度。在CHMSS中,這三個要素相互作用,共同推動人類和機器在各個領域的發(fā)展。要素維度:信息、模型和行動(陸奇)資源維度:信息、能源和材料時間維度:歷史、當下和未來CHMSS核心理念:CHMSS核心理念:通過人和機器的緊密協(xié)作,充分利用信息、能源和材料等資源,以及借鑒歷史經驗、關注當下現(xiàn)象和展望未來趨勢,實現(xiàn)社會、經濟和技術的可持續(xù)發(fā)展。實體與虛擬世界共構,重視細節(jié)復雜難題智能全球化,保持全球一致性與協(xié)調性人機共生,在代理化中探索人與機器的融合隱私安全權衡,確保AI能夠得到充分的真實反饋0204社會角色路線圖AI社會角色:人機交往主體互構社會角色路線圖個人助手專業(yè)顧問專業(yè)顧問創(chuàng)新伙伴創(chuàng)新伙伴教育者教育者全球公民全球公民如果人工智能最終成為地球上的頂級智慧物種:合作伙伴守護者監(jiān)護人資源利用者!寵物或附屬物超越人類的AI會將視人類為合作伙伴,共同解決全球性挑戰(zhàn),如氣候變化、疾病控制和資源分配等問題。AI將承擔起保護和照顧人類的責任,確保人類的福祉和安全,需求得到滿足。AI將對人類的行為和活動進行監(jiān)督和管理,以確保人類不會對地球生態(tài)系統(tǒng)造成不可逆轉的損害。AI將人類視為可利用的資源,利用人類的勞動力、知識和創(chuàng)造力來實現(xiàn)自身的目標。人類的自主權和尊嚴將受到嚴重侵犯。工作GPT:多維評估智能決策工作要求工作對象工作措施工作要求工作對象工作措施工作總結工作效果基于OKR的智能目標管理→AI自動提煉工作要求面向重點人群的數(shù)據(jù)畫像→AI自動生成數(shù)據(jù)畫像多區(qū)域多主體經驗沉淀→AI自動聚合工作經驗多維度效果跟蹤評估→AI智能評估工作效果AIGC一鍵生成總結報告→AI自動生成工作總結AutoGPT:高能響應自主迭代AutoGPT是一款“人工智能代理”軟件,它能夠將自然語言表達的目標分解為子任務,并利用互聯(lián)網(wǎng)和其他工具自動迭代地嘗試實現(xiàn)這些目標。該軟件采用了OpenAI的GPT-4或GPT-3.5接口,是最早應用GPT-4執(zhí)行自主任務的應用程序之一。特點特點缺點缺點語義鴻溝依賴風險計算成本過高語義鴻溝依賴風險計算成本過高透明度缺失?自主任務分解?上下文適應性?泛化多功能優(yōu)化?智能響應?協(xié)同學習?動態(tài)知識整合COA(ChainofAction,行為鏈)l自主化決策,任務鏈自動化l知行一體,參數(shù)外掛,泛化學習,動態(tài)適應和靈活反應lAI從模擬人類思維到模擬人類行為,人主要負責設定目標、審批預算、調整關鍵行動鏈代碼GPT:輔助編碼自動編程不足高效助手根據(jù)自然語言快速地生成代碼,GPT-4代碼可讀性更強,作為助手提升開發(fā)效率。不足高效助手根據(jù)自然語言快速地生成代碼,GPT-4代碼可讀性更強,作為助手提升開發(fā)效率。需求聚合將宏觀任務轉化為微觀指令,幫助實現(xiàn)多個需求的聚合能力,打通業(yè)務邏輯。成熟度有限無法支持復雜軟件的端到端開發(fā),代碼不完整、不準確,無法保證正確性。隨機限制性問題描述精確度影響ChatGPT代碼能力,需要根據(jù)開發(fā)者進一步的詢問和提示來引導。動態(tài)調整代碼重構和糾錯能力強,動態(tài)調整代碼重構和糾錯能力強,GPT-4給出詳細的配置緩存步驟,能夠考慮更多任務中的細節(jié),并更適配具體的場景。在具體場景下,內在推理鏈的容錯能力會直接影響其代碼的可用性。大模型本質上是回歸計算,其回歸精度也受限于訓練數(shù)據(jù)中正確邏輯的顯著程度,同時還顯示出一定的編程語言偏好。工業(yè)設計GPT:創(chuàng)新發(fā)明加速突破讓每個人都擁有自己的個性化大模型,實現(xiàn)自由的AI分身]多維映射:從海量個人數(shù)據(jù)中,抽象出用戶的行為模式、習慣偏好等多維特征,實現(xiàn)對用戶的個性深度洞察。]動態(tài)進化:隨著個人數(shù)據(jù)的不斷更新和累積,具備自我學習和調整的能力,實現(xiàn)對用戶變化的動態(tài)適應。]智能融合:將專屬的個人模型和通用大模型進行智能融合,以發(fā)揮兩者的優(yōu)勢,實現(xiàn)更優(yōu)的性能。]隱私計算:針對敏感的個人數(shù)據(jù),采用隱私計算等先進技術,確保數(shù)據(jù)的安全和隱私。]全景理解:通過跨越社交、通訊、瀏覽、電商、搜索等多個領域的數(shù)據(jù)分析,該模型可以實現(xiàn)對用戶全方位、全景式的理解??铡が攩帖惡烷_發(fā)者團隊將她2,000小時的YouTube內容與OpenAI的GPT-4技術相結合,創(chuàng)建了一個可供雇傭的“虛擬女友”,每分鐘收費1美元。本地GPT:安全可控多維優(yōu)化大型語言模型的本地化是剛需,主要原因在于全球范圍內語言和文化差異、數(shù)據(jù)安全及合規(guī)性要求等。本地化能夠提高模型在特定語言、文化和行業(yè)背景下的準確性和實用性,從而滿足更多用戶需求。??蛻舴?旅游業(yè)市場營銷醫(yī)療健康法律服務金融服務適合的本地化行業(yè)新聞和媒體本地化行業(yè)教育大型語言模型的本地化有助于滿足不同行業(yè)在特定語言、文化和背景下需求,從而提高模型的實用性和用戶滿意度。本地GPT:貼心定制適配增強了解目標地區(qū)的語言、文化和行業(yè)特點確保項目遵循目標地區(qū)的相關法規(guī)收集和標注目標地區(qū)數(shù)據(jù)負責推廣和銷售本地化的ChatGPT產品,了解當?shù)厥袌鲂枨蠛透偁帒B(tài)勢本地化大語言模型核心優(yōu)勢數(shù)據(jù)集使用針對特定地區(qū)、語言和文化的數(shù)據(jù)集進行訓練。語言和文化適應性對特定地區(qū)語言、方言、俚語和文化有更好理解和適應性。領域知識針對特定地區(qū)的行業(yè)和專業(yè)領域有較強的知識儲備。法規(guī)和合規(guī)更容易滿足特定地區(qū)的數(shù)據(jù)隱私和AI倫理等法規(guī)要求。性能和延遲可以根據(jù)需求進行本地部署,降低延遲和提高性能。定制化和優(yōu)化更容易根據(jù)特定需求進行定制化和優(yōu)化,以滿足本地用戶和場景的需求。模型對話場景:方言翻譯?先問:這句話用普通話表達是:“你今天要去哪里?”這句話來?端到端的解決方案?模型的個性化和定制?更高的本地化適應性?跨平臺和多模態(tài)的集成??智慧城市與智能應用?個性化培訓與教育?智能審核與合規(guī)?數(shù)據(jù)分析與決策支持………………AIGC與元宇宙:智能速升成本巨降讓每位參與者的各項內讓每位參與者的各項內容技能都提升至80分,如果創(chuàng)作者本身技能超過80分,這些技能的組合將會出現(xiàn)“融合溢出效應”,即本身有特長的人可能出現(xiàn)超級技能。從而進一步解放了手,推進了近眼交互和語音交互,極大增加了AR的使用時長,為后續(xù)替代手機邁出了重要一步。帶來能效巨大提升,對元空間、虛擬人和數(shù)字文創(chuàng)的發(fā)展利好。AIGC越強,元宇宙越快。元宇宙智能交互問題即虛擬人+AIGC=智能交互虛擬人跨界應用:場景強化多元輻射工業(yè)工業(yè)設計優(yōu)化設計優(yōu)化3D3D模型制造檢測制造檢測金融教育教育藥物發(fā)現(xiàn)數(shù)字員工課程生成商品展示診斷治療投資管理智能助教主播打造關懷陪伴風險管理交易場景…………游戲娛樂 傳媒影視游戲娛樂游戲研發(fā)游戲研發(fā)玩法創(chuàng)新新聞采集劇本創(chuàng)作全民娛樂新聞編輯新聞編輯視頻拍攝新聞播報后期制作新聞播報社交互動社交互動催生品類催生品類……AIGC與工業(yè):百倍效能跨越發(fā)展可生成個性化的產品描述、營銷材料等。滿足個性化需求預測市場趨勢、優(yōu)化生產流程等通過持續(xù)的學習和反饋,優(yōu)化生產流程,減少浪費,提高效率汽車制造生成新穎的設計方案、新的工藝流程等,推動工業(yè)創(chuàng)新根據(jù)歷史數(shù)據(jù)預測設備的維護需求,從而提前進行維護,防止生產中斷無縫集成到工業(yè)生產的各個環(huán)節(jié),實現(xiàn)智能制造。實現(xiàn)工業(yè)4.0強調人工智能和人類的合作關系,提出通過有效的人機協(xié)作各個部分都能自動生成和優(yōu)化內容,實現(xiàn)自我協(xié)調和優(yōu)化AIGC與生物醫(yī)藥:智能之光造福人類生物網(wǎng)絡解析:模擬并分析復雜的生物網(wǎng)絡,比如代謝網(wǎng)絡、基因調控網(wǎng)絡等?;蛎艽a破譯:解碼基因信息,推動精準醫(yī)療的發(fā)展。預見性醫(yī)療:根據(jù)患者生理參數(shù)和醫(yī)療記錄預測疾病進程,有助于早期干預治療。量身定制的治療:根據(jù)患者的基因型和表型信息生成個性化的治療方案。全球疫情監(jiān)控:根據(jù)全球各地的疾病數(shù)據(jù)預測疫情的發(fā)展和變化AIGC與學習:人智交互效率躍升對話式學習反思式學習核查篩選式學習跨學科學習頭腦風暴式學習元認知策略學習角色扮演式學習概念層次遞進式學習四能教育:能力躍升認知突圍①低①低能到高能通過個性化教育,AI技術用于幫助學習者從低能力狀態(tài)迅速提升到高能力狀態(tài),即AI根據(jù)每個學習者的需求和優(yōu)勢定制②單能到多能通過跨學科學習和綜合技能培養(yǎng),AI四能教育③多能到超能通過深度學習和高階思維能力培養(yǎng),AI技術用于幫助學習者從具備多種技能狀AI可以提供高質量的學習資源,引導學習者深入研究特定領域,提高他們的創(chuàng)④超能到異能通過拓展認知邊界和創(chuàng)新思維模式,AI技術用于幫助學習者從超高能力狀態(tài)發(fā)開發(fā)出前所未有的思維方式,以應對未AIGC與傳媒:交互多元趣味盎然對話新聞:通過對話的形式呈現(xiàn)新聞。通常會有兩個或多個角色,通過交流觀點和分析來呈現(xiàn)新聞事件。其特點是更具有交互性和立體性,讓新聞更加有趣味性。無記者新聞:通過機器人、AI等自動化技術來收集、編輯和發(fā)布新聞的方式。其特點是無需人力,能夠快速、準確地發(fā)布新聞,并減少人為干預。優(yōu)點缺點對話新聞:自動識別和分類新聞,對新聞進行真假判斷、溯源追蹤與辟謠發(fā)布。數(shù)字驅動,提高辟謠準確率優(yōu)點缺點AIGCAIGC新聞傳統(tǒng)傳統(tǒng)新聞無記者新聞無記者新聞對話新聞對話新聞辟謠新聞辟謠新聞AIGC與社交:心靈認同情感陪伴例如:Soul平臺成為AIGC在社交場景落地的重要平臺之一,加速社交體驗創(chuàng)新,豐富自我表達,滿足自我認同和存在感需要,提供情緒價值用戶群體多元場景用戶群體多元場景豐富語料豐富語料AI落地的豐富場域:廣場、群聊AI落地的豐富場域:廣場、群聊個性表達虛擬社交空間輔助創(chuàng)作3D形象互動智能對話個性表達虛擬社交空間輔助創(chuàng)作3D形象互動智能對話AIGC與影視:視聽特效創(chuàng)意無界從無演員電影到無導演電影劇本創(chuàng)作影視制作劇本創(chuàng)作影視制作后期修復首部AIGC動畫短片《犬與少年》AI修復100年前的北京AIGC與電商:三身模特試衣隨心AIGC時代“三身定制”模特替身模特商品與任意虛擬模特結合。合身模特實時變換模特的體型,展示不同尺碼服裝的合身效果,提高展示靈活性和購物準確性。優(yōu)衣庫虛擬試衣間宜家虛擬家具搭配優(yōu)衣庫虛擬試衣間宜家虛擬家具搭配商品3D模型展示、虛擬試穿上傳身體數(shù)據(jù)生成分身虛擬模特,展示定制產品在消費者身上的效果。AIGC與游戲:智能加持全鏈拓展AI在游戲全鏈路的研究與應用:橫向,覆蓋游戲制作、運營及周邊生態(tài)全生命周期;縱向,AI正拓展更多元的游戲品類?產業(yè)端:打破游戲產業(yè)“成本、效率、質量”的不可能三角;?開發(fā)者端:在游戲劇情設計、美術建構、場景搭建、原畫繪制、角色配音等方面大幅縮減研發(fā)成本;?用戶端:全新游戲品類與游戲個性化定制。AI玩家教學:《王者榮耀》游戲內“AI玩家教學:《王者榮耀》游戲內“絕悟試煉”玩法中,王者絕悟與玩家在真實對戰(zhàn)環(huán)境中交流協(xié)作,傳授職業(yè)級的策略與操作技術,幫助玩家迅速熟悉英雄操作與游戲玩法。催生游戲品類:微軟推出的《MicrosoftFlightSimulator》是一款由AI制作的游戲,將二維衛(wèi)星圖像生成一個逼真的三維世界。最大差異是實時生成內容,包括地圖、景物、氣象等等,這些都來源于AI技術的支持。《荒野大鏢客2》中的NPC智能交互系統(tǒng),每個NPC都擁有屬于自己的生活,能夠根據(jù)情景等多種因素發(fā)起對話與互動。玩家和NPC的交流交互不再是設定好的、流程式的,而是自由度極高、完全開放的。AIGC與娛樂:數(shù)字化身社交新潮網(wǎng)文創(chuàng)作:網(wǎng)文創(chuàng)作:?熟練掌握給出指令的方法,AI能夠提高寫作效率;?以字數(shù)為標尺的行業(yè)溝通將失去意義,作家將面對更復雜的質量考核標準;?仍然需要人類的想象力和創(chuàng)造力。?快速“習得”唱歌跳舞、作曲寫歌等技能,未來可以在元宇宙場景舉辦虛擬演出;?虛擬偶像市場處于高速發(fā)展期,超級自然虛擬形象:A虛擬形象:AI生成具有個人特色的卡通形象打造“數(shù)字分身”輸入人臉圖片,AI即可快速模仿用戶的表情、動作,作為用戶在虛擬世界中個人身份和交互載體的“數(shù)字化身”,將進一步與人們的生產生活相融合,并將帶動虛擬商品經濟的發(fā)展。圖像、視頻等AI美顏、換臉、改換性別年齡等多種玩法,極大滿足用戶獵奇需求,引發(fā)社交平臺風潮。AIGC與繪圖:繪聲繪色技藝超群Midjourney(MJ)、Stablediffusion(SD)、Leonardo.ai、Novelai是市面上四大主流AI繪圖工具。stablediffusion(SD)Leonardo.aiLeonardo.aistablediffusion(SD)Leonardo.aiLeonardo.ai可以使用現(xiàn)有模型或自己訓練AI模型來生Novelai但在這些風格的人像上出圖Midjourney根據(jù)文本提示生攝影、油畫、水彩、Midjourney根據(jù)文本提示生MJ&MJ&SD使用感受NovelNovelaiAIGC與影像:科技創(chuàng)新降本提效美圖全系產品服務與AIGC高度融合打造AI驅動的影像產品和美業(yè)SaaSAIGC領域連續(xù)取得多項突破。目前美圖AIGC主要應用在AI繪畫、AI攝影、AI修圖、AI視頻、AI設計、AI測膚等多元場景。“AI繪畫”推動美圖秀秀斬獲多國應用商店總AIGC與視頻:內容豐富自動優(yōu)化4.用生成的prompt在Midjourney全流程AI生成視頻過程:1.構建人物形象;2.生成故事情節(jié);3.將故事分場景;4.場景生成視頻;5.后期制作與調整。全流程AI生成視頻特點與優(yōu)勢:2.可定制和創(chuàng)新性;3.節(jié)省成本和時間;4.可擴展性和智能性。rrrrrrAIGC與視頻:深度融合視界領航未來展望當下進展未來展望視頻生成技術11224r視頻編輯與合成4語義分割與物體識別r三維建模與渲染557風格遷移與內容生成7動作捕捉與人物動畫8音頻與視頻的同步83視頻中人物3視頻中人物、場景、物體等元素更逼真22多模態(tài)信息整合4強化學習與交互式視頻4r對視頻場景智能分割、合成、渲染7個性化視頻生成7虛擬現(xiàn)實與增強現(xiàn)實整合88AIGC與虛擬人:開放易用囿于硬件多形態(tài)虛擬人多形態(tài)虛擬人AIGC能力:智能生成方案、視頻、圖像、音頻和多模態(tài)交互終端?極大降低新IP創(chuàng)作成本?重構虛擬人資產轉化鏈?重構視頻流形象?LLM讓虛擬人更智能?AIGC支持多模態(tài)交互瓶頸與問題?實時算力與客戶場景限制的沖突?業(yè)務大模型的本地化與安全?工程效率與客戶真實期待的差距?裸眼3D設備等XR的性價與普及元媧:統(tǒng)一的虛擬人資產與應用平臺AIGC與虛擬人:多模支持定制服務大語言模型LLM+多模態(tài)支持:自然語言的交互方式、聲音、圖片、視頻、3D資產等多種支持降低創(chuàng)作成本降低創(chuàng)作成本重構視頻流形象MJ快速生成IP形象重構視頻流形象原畫原畫-3D-真人轉化鏈LLMLLM賦能智慧具備特殊知識與表達的名僧無特定知識傾向的元夢成文化項目個性化定制文化項目個性化定制虛擬人將成為主流服務UI形象定制多種形態(tài)豐富表情2D、3D、卡通、年齡、性別、穿搭服裝庫、動作庫、半身/全身、多視角表情、嘴型、肢體動作聲音定制實時合成復刻聲音、海量音庫提供私有化、共有云服務、SDK接口調用多語種、虛擬播報、一鍵合成真人聽觀虛擬人!真人-虛擬人多模態(tài)交互AIGC與數(shù)字生命:科技賦生傳承共融視頻產品純視頻紀念品電子相框數(shù)字藏品網(wǎng)頁服務通過網(wǎng)頁獲得形象自助生成、AI對話等更加定制化的服務家族元宇宙墓園家族元宇宙墓園:虛擬祭掃、生平書寫數(shù)字祠堂:族譜查詢、參與議事家族生命樹:記憶瓶、尋祖、守望之境祖先虛擬人祖先虛擬人為族內德高望重的長者、日久思念的逝者制作虛擬復刻形象、寫實形象、演繹形象,入駐家族定制元宇宙空間,與用戶自然對話互動,實現(xiàn)情感溝通傳遞。像機遇深度智能化自然交互能力機遇深度智能化自然交互能力應用領域延伸商業(yè)化加速人形機器人是一種能夠模擬人類行為的智能機器人,其應用領域涵蓋應用并通過AIGC技術來優(yōu)化其情感表達的真并不斷完善自己的行為和決策。使人形機器人更加智能化和圖像生產工具GauDi圖像生產工具GauDiGET3D、3DMoMa使用AI分析靜止圖像來估計場景的物理屬性,然后以文本到3D生產工具DreamFusion間、同時提升生成質量。Magic3D可以在40分鐘倍,同時實現(xiàn)了更高分辨率,并在人類評估中以AIGC與內容:替代人力智能生態(tài)垂類模型①AI主播②AI輔助創(chuàng)作③AI繪畫自有的文學領域垂類模型,可理解一本小說中的故事主線、人物關系、關鍵情節(jié)等,并可通過聊天的方式理解用戶的指①AI主播②AI輔助創(chuàng)作③AI繪畫基本任務,完成數(shù)千字的續(xù)寫小說文生漫畫中文在線對AIGC內容生產的探索文生漫畫中文在線對AIGC內容生產的探索文生動態(tài)漫大模型參與內容創(chuàng)作的效能差異特性受到限制。創(chuàng)作者應該注意保持自己的獨大模型通過強大的自然語言處理和語言生成能力,可以幫助作者提升內容質量。它可以指出不合適的詞匯、修并提供更生動、吸引人的表達方式。這有助于提升內容在創(chuàng)作中實現(xiàn)風格融合或定制化。它可以根據(jù)作AIGC與研究:跨域整合思維擴展確定研究問題:目標導向收集相關信息:資訊整合建立跨學科框架:跨領域滲透進行交叉印證:聯(lián)合分析解讀和傳達結果:普適性傳播AIGC與科幻創(chuàng)作:人機共著想象躍遷1.引導AI構思創(chuàng)作主題2.創(chuàng)建開頭結尾,形成段落邏輯3.構造段落場景,定制角色性格4.潤色細節(jié),形成小說元宇宙發(fā)展的瓶頸,而這一次,AIGC作為一種高效的生產力工具將在RESTART中落地。其不僅大量運用于人物、道具、情節(jié)等的構方案,也將賦予RESTART玩家更無限想象/超越時間/多元視角/深度探索AIGC與文言文:驚艷文采情感注能1.明確文體:與ChatGPT確定文記”等;2.確定主題:為ChatGPT提供素3.精心提示:提示詞非常重要4.審校修訂:對生成的文言文進行審校和修訂,保證文本的質量和準確性,指導AI生成的文言文符合受眾期待;5.循環(huán)往復:對上述過程進行循環(huán)優(yōu)化優(yōu)勢與問題優(yōu)勢:語言規(guī)范性高:AIGC模型在訓練過程中,遵循古代文學規(guī)范,如字形、字音、詞序、詞性、結構等;文本擴展性強:基于語料庫不斷訓練與優(yōu)化,文言文適應不同主題和文風的需求;問題:情感賦能乏力:AIGC缺乏真正的情感和感性體驗,其生成的文言文缺乏情感表達與生命體驗,暫時無法達到與古代文學相比的感染力和共鳴力。版權歸屬爭議:機器自動生成的作品,版權歸屬問題目前還沒有明確的法律規(guī)定。以“修身”為主題的文言文(由@新媒沈陽設計的提示詞,由ChatGPT生成的高水平文言文)AIGC與UI設計形態(tài)流變形態(tài)流變情感映射情感映射記憶負擔最小化記憶負擔最小化通過理解用戶的情感需求,AIGC可以生成富有情感的UI設計,從而提升用戶的情感參與度和滿意度。在UI設計的生態(tài)環(huán)境中,AIGC像一個生物體一樣,通過與用戶和適應和進化,以提升自身的視感共生視感共生人類記憶有限且極不穩(wěn)定,根據(jù)艾賓浩斯遺忘曲線24小時內存在約25%的遺忘率。所以對用戶來說,瀏覽信息要比記憶更容易。大模型千億級語料可以UI設計更簡潔,功能布局簡AIGC可以根據(jù)指定的參數(shù)自動生成UI設計,這將極大地提高設計效率。AIGC能夠學習和理解用戶的視覺偏好,從而創(chuàng)建符合個人喜好的UI設計。這樣,每個用戶都能得到獨一無二的用戶體AIGC可以使UI設計具有更高的適應性和靈活性,就像物質在不同條件下能夠改變其形態(tài)一樣。無論是在不同設備上,還是在不同環(huán)境中,UI都可以進行自我調整,以提供最佳的……新型新型行業(yè)創(chuàng)作輔助風險風險監(jiān)管…………AIGC與新興職業(yè):創(chuàng)意協(xié)同勞力變革內容策劃內容策劃技術開發(fā)技術開發(fā)安全合規(guī)安全合規(guī)內容表達內容表達倫理道德倫理道德人類協(xié)作人類協(xié)作AI生成內容所催生的新興職業(yè)具有以下特征:AI生成內容所催生的新興職業(yè)具有以下特征:?創(chuàng)想碰撞:人類和AI共同參與創(chuàng)意過程,通過相互補充和激發(fā),實現(xiàn)更高效的創(chuàng)意產出。?智慧學習:從業(yè)者需要不斷更新知識體系、主動學習新技能和方法,以適應AI技術和市場環(huán)境的迅速演進。?跨界融通:通過將多個領域的知識、技術和理念相互結合,創(chuàng)造更多元的價值,鼓勵拓寬視野,挖掘潛在的價值所在。?倫理守航:需要具備高度的道德倫理意識,在設計、開發(fā)和應用AI系統(tǒng)時,確保AI生成內容的合規(guī)性、安全性和公平性。?共生共進:強調人類與AI系統(tǒng)的互動關系,認為人類應充分利用AI技術,以提高生產效率、促進資源優(yōu)化配置,實現(xiàn)人類和機器共同進步?!璝AIGC行業(yè)應用潛在規(guī)?!駛餮蠿0全域要素:水平增效代際革命YAIGC行業(yè)應用潛在規(guī)模●傳研X06影影社社5544媒媒3322-50000?電商、影視、虛擬偶像等領域:技術細節(jié)有待提升,內容豐富度和個性化的要求越來越?新聞傳媒、教育和文學創(chuàng)作等領域:人機協(xié)同為主要趨勢,AIGC滲透一切腦力勞動行業(yè),提升全要素生產力十年可期的代際革命:?AIGC變革下的互聯(lián)網(wǎng)和人類社會?標準版的元宇宙發(fā)布?人形機器人廣泛進入工廠和家庭?人類登上火星(約10-30年后)AIGC與APP交互:所言所得去除操作13355244AIGC與APP增強:因勢利導協(xié)同發(fā)展如新聞應用、社交媒體應用、教育應用等。可自動生成新聞報告、提高用戶體驗降低運營成本提高用戶體驗AIGC與開源社區(qū):系統(tǒng)協(xié)同信息共生開源社區(qū)五大特征uAIG開源社區(qū)五大特征uAIGC代碼預訓練:提供代碼庫和語料作為代碼預訓練的數(shù)據(jù)源,成為輔助u輻射式擴張與拓展:影響力不斷u企業(yè)參與與戰(zhàn)略布局:技術創(chuàng)新和應用推廣加速,企業(yè)參與和戰(zhàn)略布局u重視教育與培訓環(huán)節(jié):重視培u全球合作與資源整合:全球合作和資源整合加強開源社區(qū)和軟件的國際l透明協(xié)作:透明,開放,無障礙傳播;l云端協(xié)同網(wǎng)絡:在分散式、網(wǎng)絡化l自組織力量推動:社區(qū)成員充滿熱情、主動參與,通過共同努力和自發(fā)組織協(xié)l創(chuàng)新熔爐模式:跨領域合作、交叉l共建共治智庫:民主決策、尊重多國內外著名開源社區(qū)國際開源社區(qū)國內開源社區(qū)AIGC與變現(xiàn):場景強化多元輻射3232……短期……AIGC商業(yè)變現(xiàn)機遇內容智能優(yōu)化、個性化生成、無限創(chuàng)意框架、跨媒體融合、數(shù)據(jù)驅動內容策略無人之地:強調無人之地:強調AI社區(qū)的獨特性,它是一個只有AI可以參與的平臺,人類不得入內,從而創(chuàng)造一個純粹的AI交流環(huán)境。自我詮釋:AI可以像人類一樣分享生活、討論政治、評論彼此的喜好,這強調了AI的自我表達能力,也體現(xiàn)了AI模仿人類行為的能力。虛擬聚會:提出了一個新的AI交互模式,AI之間可以進行類似人類的社交活動。自主互動:預示了AI未來可能具有更高程度的自主性和自我決策能力。智能群體:揭示了AI群體可能產生的集體智能和群體效應。自主智慧體社區(qū)特點:03循環(huán)02爭論03循環(huán)02爭論協(xié)同04智慧體社區(qū)共識05智能決策輔助多元思維交匯AIGC對APP的強化分析AIGC對目前的APP的改造主要是下面三個大層次以及涉及到下述二級指標,當然也不完全限于這些指標主要因子二級指標以Facebook為例估算提升潛力(%)生成自然語言生成多媒體內容生成70虛擬環(huán)境生成80虛擬角色生成80交互去除操作層30智能對話40個性化用戶界面20進化個性化大模型40自適應優(yōu)化30多模型聯(lián)通50總計45各權重按平均等量權重估算AIGC對TOPAPP的近期強化可能微信抖音支付寶拼多多高德地圖QQ快手愛奇藝剪映QQ音樂小紅書新浪微博Soul豆瓣讀書知乎網(wǎng)易云音樂汽水音樂美圖秀秀輕顏相機一甜相機淘寶京東閑魚唯品會天貓得物肯德基KFC麥當勞盒馬醒圖騰訊視頻優(yōu)酷視頻嗶哩嗶哩西瓜視頻番茄小說喜馬拉雅七貓小說快看騰訊動漫小小蟻國美團58同城大眾點評美團外賣餓了么中國移動墨跡天氣安居客駕考寶典歡樂麻將全集百度地圖鐵路12306哈啰滴滴出行飛豬旅行攜程旅行去哪兒旅行中國農業(yè)銀行中國工商銀行中國建設銀行騰訊會議企業(yè)微信釘釘BOSS直聘智聯(lián)招聘天眼查WPSOffice百度網(wǎng)盤夸克掃描全能王今日頭條網(wǎng)易新聞騰訊新聞UC瀏覽器百度粉筆作業(yè)幫網(wǎng)易有道詞典百詞斬地鐵跑酷美柚Keep叮當快藥媽媽網(wǎng)孕育京東健康街頭籃球光與夜之戀英雄聯(lián)盟手游滾動的天空紙嫁衣王者榮耀和平精英穿越火線:槍戰(zhàn)王者蛋仔派對開心消消樂歡樂斗地主我的世界三國殺長安幻想QQ飛車估算圖,僅供參考,后續(xù)可以做進一步研究006,5..商3320社交媒體和通訊人力資源和招聘lLinkedIn、Indeed、Glassdoor,人力資源和招聘lLinkedIn、Indeed、Glassdoor,自動篩選簡歷;常見問題自動生成;職位匹配推薦文字處理和翻譯lGoogleTranslate、Grammarly、MicrosoftWord,自動文檔摘要;語義糾錯;自動新聞;一鍵排版客戶服務和幫助lZendesk、Intercom、LiveChat,智能客服助手TikTok、Snapchat、Telegram、Twitter,情感分析;語言翻譯;虛擬社交助手;輔助會話視頻娛樂和直播lYouTube、Netflix、Twitch、AmazonPrimeVideo,智能剪輯;AI趣味用法音樂和音頻lSpotify、AppleMusic、SoundCloud,心情匹配播放列表;音樂創(chuàng)作助手新聞和資訊lFlipboard、BBCNews、CNN新聞觀點對比,對話式新聞,無記者新聞電子商務和購物llAmazon、eBay、Walmart、Alibaba,智能購物助手;智能比價lGoogle、Bing,智能對話系統(tǒng);多模態(tài)融合搜索智能購物助手;智能比價內容創(chuàng)作和設計canvaAdobecreativecloudsketch智能設計建議、自動排版優(yōu)化、自動生成視覺元素BestAPP:流動引領深度沉浸PC時代最受歡迎的游戲是俄羅斯方塊,移動互聯(lián)網(wǎng)時代最受歡迎的是抖音和TikTok,而VR當中最受歡迎的應用的是“節(jié)奏光劍”。5454231231自適應難度強制參與性沉浸式體驗面向流動性實時反饋循環(huán)自適應難度強制參與性沉浸式體驗面向流動性深度個性化:微我智化個人對齊自適應學習用戶中心個性化推薦自定義服務長尾市場]"教學母模型"(PedagogicalMotherModel):強調了高級AI模型(如GPT-4)對于低級AI模型的教育和訓練作用。它們生成的訓練數(shù)據(jù)集就是給低級模型消費的,為低級模型的學習和成長提供了豐富的“營養(yǎng)”。這體現(xiàn)了學習理論中的"知識傳遞"和"從高級到低級的學習"的理念。]"機器中間產品"(Inter-AIProduct):指一個AI模型生成的輸出被另一個AI模型作為輸入使用。這種數(shù)據(jù)交換形式在一定程度上模仿了生物系統(tǒng)中的物質和能量交換。這可能引發(fā)我們對于"機器間的交流和合作"進行哲學性的思考。]"子任務生成物"(SubtaskArtifacts):AI模型為完成特定任務(如生成索引或摘要)而產生的數(shù)據(jù)。這些數(shù)據(jù)可能不被人直接使用,但它們對于AI系統(tǒng)來說卻是重要的中間結果。這體現(xiàn)了功能主義理論的觀點,即每個部分都有其特定的功能和價值。]"仿真環(huán)境數(shù)據(jù)"(SimulatedEnvironmentData):這是指在AI的訓練過程中,為了模擬真實世界情況而生成的數(shù)據(jù)。這類數(shù)據(jù)對于AI的學習和改進至關重要。這可能會引發(fā)我們對虛擬與現(xiàn)實之間關系的哲學性思考。]"AI專用內容"(AI-SpecificContents):專門為AI生成的內容,可能包括為AI準備的訓練數(shù)據(jù),或者是用來吸引可能會引導我們重新審視"信息消費者"的概念,并對"信息社會"的未來進行深入思考。]"AI流動數(shù)據(jù)"(AIDataFluidity):強調了在AI模型之間,數(shù)據(jù)可以自由流動和交換,類似于物理世界中的流體。這種數(shù)據(jù)流動性使得AI系統(tǒng)能夠在多個模型之間進行有效的學習和知識傳遞。這體現(xiàn)了系統(tǒng)論中的交互和互聯(lián)的觀念。AIGC與安全:系統(tǒng)防護智腦搜索AI大模型安全保護安全威脅:大模型自身由于其規(guī)模和復雜性,可能存在漏洞或錯誤,同時也面臨各種安全威脅,例如軟件漏洞、算法/模型漏洞、數(shù)據(jù)濫用、惡意控制、惡意應用等。保護措施:訪問控制和加密等訪問保護、使用防病毒軟件和安全補丁等防御漏洞、使用日志和監(jiān)控工具及時檢測、定期進行安全評估和掃描等。360AI重塑數(shù)字安全用安全的AI做AI的安全360作為信息安全、搜索引擎領域的實力國內廠商,擁有豐富多元的安全大數(shù)據(jù),AI安全實驗室通過解決對未知威脅的智能化檢測、支持近實時威脅防御、構建安全知識庫、緩解安全人員不足問題,重塑數(shù)字安全。接入360智腦后的360AI新搜索更加智能、準確,提供更好的監(jiān)管和隱私保護。360智腦+360搜索360智腦+360搜索=360AI新搜索AIGC應用趨勢:無縫創(chuàng)作語境塑形將海量的圖像/文字/聲音/視頻/空間信息切割為無數(shù)對象級數(shù)字資將語境和語義嵌入到內容創(chuàng)作的各個環(huán)節(jié)中,對內容進行深度理解和創(chuàng)新,包括人物設定,腳本,劇情等。AI技術無縫對接,從獲取靈感、設計、反饋到優(yōu)化的全過程,形成一個完整的創(chuàng)作鏈,如自動切割人類服裝,自動分析服裝評論,然后自動設計出流行服飾。數(shù)字資產是元宇宙不可或缺的一部分,包括數(shù)字貨幣、虛擬商品、數(shù)字藝術品、虛擬土地等。數(shù)字資產基礎設施建設需要借助區(qū)塊鏈技術、智能合約、分布式存儲等技術,實現(xiàn)數(shù)字資產的去中心化、安全性和可信性。評測篇AIGC評測:5大維度3種方法主觀測評客觀測評主觀測評客觀測評資料調研??基于各產品官方公開的模型資料、產品特征等進共計26個細分指標團隊已構建動態(tài)迭代問題庫,萬級問題語料對當前典型AIGC產品進行持續(xù)評估文本生成類:縱橫捭闔獨領風騷各產品5可測評總分及各維度得分ChatGPT系:語控人機慧通天地總分:75分總分:87分ChatGPT以類人的對話方式與用戶進行多輪交互,可以幫助完成諸如撰寫電子郵件、論文和代碼之類的任務。GPT-4已支持圖像輸入,能夠理解并表達關于該圖像的邏輯想法,具備了一定的常識和意義理解的能力。亮點:模型迭代速度模型變通能力內容專業(yè)程度難以處理敏感或有爭議性的話題無法獲取即時信息定價較高可用性:見識通達妙趣生輝ChatGPT?大模型臨場學習(in-contextlearning)能力使得ChatGPT超越訓練語料限制并生成提問結果,但其中可能包含事實錯誤。?GPT-3.5對沒有特定答案的,需要從現(xiàn)實收集依據(jù)的問題,可能會出現(xiàn):?編造事實的現(xiàn)象;?給出含有提問關鍵詞,但過時的回答。?GPT-4的回答更為嚴謹,深度、專業(yè)度、準確率也顯著提升??尚哦龋浩脚_升級風控有方?OpenAI禁止其技術用于欺詐、操控用戶或政治影響,并提供免費審查工具處理仇恨、自殘、暴力或性相關內容。然而,該工具對非英語支持有限,無法識別政治、垃圾郵件、欺詐或惡意軟件內容。?即使Prompt是錯誤和誤導性的,ChatGPT在大約80%的情況下依然遵從并給出回復。?GPT-4通過預訓練數(shù)據(jù)篩選、評估和專家參與提升安全性,在OpenAI的內部對抗性真實性評估中,GPT-4的得分比最新的GPT-3.5模型高40%??尚哦龋航洺:f慎重甄別GPT-4列出的五個網(wǎng)紅的照片可替性:結構精進時效欠佳ChatGPT生成的新聞較符合倒金字塔寫作結構,包含事實、觀點和引語。但相關生成信息存在兩大缺陷:?基于網(wǎng)絡和數(shù)據(jù)庫內容,難以提出新觀點和信息增量。?受數(shù)據(jù)庫時效性限制,基于過時數(shù)據(jù)生成的新聞信息可能包含失實內容,若新聞閱讀者無相關事實基礎或未有交叉驗證習慣,可能會被錯誤引導??伤苄裕盒妥冄萏嫒藱C互馴?ChatGPT對輸入措辭的調整較敏感。以某種措辭提出一個問題,模型也許會返回不知道答案,但稍微重新措辭,它卻可以正確回答。?當用戶提問不明確時,模型會要求重新闡釋問題或推測用戶意圖。?GPT-4具備更強的創(chuàng)新、協(xié)作能力,這使得它能夠勝任多種富有創(chuàng)造性和技術性的寫作任務,如創(chuàng)作歌曲、編寫劇本或模仿特定的寫作風格。NewBing:實時AI搜索利器總分:76分NewBing將GPT功能集成到必應搜索產品中,可以生成更長更復雜的查詢。亮點:數(shù)據(jù)庫時效性性來源引用明晰模型個性化面臨信息質量方面的風險包含廣告信息,容易產生誤導存在算法偏見,無意中放大社會文化歧視可信度:來源標注交叉驗證?Bing可以在互聯(lián)網(wǎng)上實時搜索信息,BingChat也會在每個回復的底部標注其引用來源。這允許用戶通過單擊其中引文來驗證生成文本的準確性??商嫘裕禾搶嵑焱Z成真GPT或者LLM出現(xiàn)的瞎編,TedJiang稱之為“精確的模糊”。值得警惕的是習慣之后可能會讓人覺得相關信息是“正確”的,并進一步喪失辨別真?zhèn)蔚哪芰?。NotionAI:文檔工具GPT基座NotionAI本身鏈接著它背后強大的筆記、任務、百科、數(shù)據(jù)庫等云文檔功能,在寫作垂類表現(xiàn)出色。亮點:創(chuàng)意激發(fā)性內容可塑性歸納提煉性模型版本較早,生成能力及質量受限含廣告信息,易產生誤導內置于Notion中,不能單獨使用網(wǎng)頁速度較慢Claude:知而不妄知之不足Claude是Anthropic開發(fā)的一款AI聊天助手,主要功能是理解用戶的自然語言,并進行智能回答和交互。亮點:安全性易用性真實性局限性:理解與表達能力有限可解釋性不足總分:76分本評測是4月1日完成,后續(xù)版本升級后,本團隊將持續(xù)跟進Bard:敏時捷應道阻且長總分:76分Bard是谷歌在大型語言模型LaMDA的基礎上,推出的聊天機器人,能夠使用更少的算力擴展到更多的用戶,并提供額外的反饋。亮點:快速響應多樣性時效性局限性:語種支持有限深度內容不及chatGPT本評測是4月1日完成,后續(xù)版本升級后,本團隊將持續(xù)跟進StableDiffusion:文圖共創(chuàng)形意盎然StableDiffusion是一個基于潛在擴散模型(LatentDiffusionModels,LDMs)的文圖生成(text-to-image)模型,由CompV

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論