版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大模型和Copilot在微軟的產(chǎn)業(yè)應用祝曉鳳微軟(美國)高級應用科學家經(jīng)理目錄自然語言(NLP)處理以及日常應用大語言模型的前世今生ChatGPT在Microsoft的工程化落地狂潮背后隱藏的風險大模型的發(fā)展前景SpeechRecognitionSpamDetectionMachineTranslation案例簡介各個領域對大模型寄予厚望,各式應用尤其是Copilot層出不窮。在本次討論和分享中我們會了解自然語言處理技術的日常應用,從概率模型到網(wǎng)絡語義模型到大語言模型的迭代過程和背后技術提升的原理。微軟作為Copilot的發(fā)起者在各個產(chǎn)品比如Github,Office進行了大模型的深度集成。對于上線的Copilot產(chǎn)品,如何趨利避害有效使用用戶反饋是一個重要的課題。我們會一起深入淺出大語言模型的局限比如幻覺,信息不能及時更新,并且探討落地的解決方案比如使用檢索增強生成。語音識別
(Speech
Recognition)垃圾郵件檢測(Spam
Detection)機器翻譯(Machine
Translation
)檢索自動補全(Autocomplete
in
Search
Engine)情感分析
(Sentiment
Analysis)語法檢錯(Grammar
Checkers)聊天機器人(ChatBot)文本總結(Text
Summarization)圖片標題生成
(Image
Captioning
(multimodal)視覺問答(Visual
Question
Answering(multimodal)
)
…5/area/natural-language-processing你可以列舉出常見的自然語言應用嗎?NLP解決的問題是我們如何讓機器理解并且生成語言使用統(tǒng)計模型到深度學習模型將語言符號轉化成機器可以理解的格式Awordisan
index.Awordisa
vector.Asub-wordisacontextual
vector.6https://dugas.ch/artificial_curiosity/GPT_architecture.html語言模型真的是“大大益善”嗎(統(tǒng)計基于March
2024)Everyday,GPT-3generatestheequivalentofanentireUSpubliclibrary(80,000books)ofnew
content.GPT-3wasestimatedtoconsume500billiontokensandtakeatleast34dayson1024A100(80GB)GPUs~$5
millions!7訓練一個大模型需要燒多少錢?8https://lifearchitect.ai/models/Hey,
GPT!
請你猜猜我要說的下一個字是什么?請猜一猜下一個單詞是“capes”,“pants”,or
“socks”…的概率Test
onunseen
inputs9https://jalammar.github.io/how-gpt3-works-visualizations-animations/Prompts:
您的愿望就是我的命令10Theartofknittingorpaperquillingin
MidjourneyAskRightQuestions:Role+Background+
ObjectiveGPT-4
–
多任務和多模態(tài)學習多任務(Multi-task):
同時訓練多個任務,e.g.,translation,questionanswering,summarization,
etc.多模態(tài)(Multi-modal):多種類型的數(shù)據(jù),e.g.,text,image,audio,
etc.11/blog/2023/03/13/what-are-foundation-models/GitHub
Copilot–
程序也是一種語言!Presentation
Title/items?itemName=GitHub.copilot12您打算如何入圍
ChatGPT
Copilot?Presentation
Title13https:///en-us/microsoft-365/blog/2023/03/16/introducing-microsoft-365-copilot-a-whole-new-way-to-work/AI
還沒有達到準確解釋自己的程度https:///r/ChatGPT/comments/120w4zz/googles_bard_is_truly_something/14我們在使用過程中發(fā)現(xiàn)了哪些局限呢?15TrainedondatauntiltheendofApril2023
(GPT-4)Highcostper
queryNotopen-sourceyet(challengingto
reproduce)Noabilitytosearchtheinternet
directlyCannotcitesourcesaccurately(itcanbeconvincedtoinventreal-sounding
sources!)Verbose
answersInputandoutput
lengthsComparably
slowEthicalsafeguardsareeasily
defeatedNo
personalizationCanbeveryconfident(andright-seeming)evenwhenwrong-
hallucination12.…h(huán)ttps:///r/ChatGPT/comments/zls17p/according_to_chatgpt_1kg_iron_is_heavier_than_1kg/我們如何讓ChatGPT更可靠?16ChatGPT
煉金術–
獎勵還是懲罰?17/2023/01/16/what-is-rlhf/ProximalPolicyOptimization
(PPO)如何讓ChatGPT
接地氣–
檢索增強生成
(RAG)18/en-us/azure/search/retrieval-augmented-generation-overview終極選擇:Finetuning,Prompt
Engineering,
Retrieval-augmented
Generation19ScenariosPreferenceSmallandMedium
LLMsFinetuningSpecificDomainOptimization&
variousmodalitiesFinetuningLonger/shorterinput
lengthsFinetuningUptodate
informationRAGPrivate
dataRAGFactual
groundingRAGLower
costIt
variesSimple&quickintegrationand
testingPromptEngineering&
RAGReasoningLackthegeneralcapabilitiesoflarger
modelsUpdateLLMswithdomain-specificcontextAdaptLLMswithcustomizedinput
requirementsQueryup-to-dateinformationfromweband
databasesStaycompliantwithuserdata
boundaryEvaluateandinspectusingretrieval
resultsPrompt
engineering
&
RAG
does
not
need
model
fine-tuning
butlongpromptsarealso
expensiveAzure
OpenAI
on
Your
Data,
Azure
ML
PromptFlow,
LangChain/@bijit211987/when-to-apply-rag-vs-fine-tuning-90a34e7d6d25ChatGPT
公平性AI-
AzureAI
Content
Safety20/en-us/pricing/details/cognitive-services/content-safety/ExplainableRAI
MetricsHarmful(text)contentdetection(100+
languages)Jailbreaking,Hallucinations,Copyrightinfringements,
etc.Microsoft
產(chǎn)品中蓬勃發(fā)展的Copilot
體驗21/en-us/coilot/定制你的Copilots
-Microsoft
Copilot
Studio22/en-us/microsoft-copilot/microsoft-copilot-studio#modal-12根據(jù)項目任務找到最合適的基礎模型–
Azure
ML23/en-us/azure/machine-learning/concept-model-catalog?view=azureml-api-2總結
Summary24/blog/2023/03/16/introducing-microsoft-365-copilot-your-copilot-for-work/大語言模型的風口
(NLP
in
Daily
Life)大模型風起云涌(TheExplosion
of
LargeLanguage
Models)ChatGPT在微軟的成功產(chǎn)品案例
(ChatGPT
Use
Cases)安全性,可解釋性的緩解措施(Limitations
&
Resolution
Discussions)如火如荼的發(fā)展前景和規(guī)劃(Expectations
on
LLMs)期待您的反饋25感謝致敬Xiaofeng.Zhu@microsoft.co
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版美容院美容養(yǎng)生課程設計與培訓協(xié)議4篇
- 2025年度鍋爐房消防安全管理與培訓合同4篇
- 2025版企業(yè)行政部全面合同管理規(guī)范與實施辦法3篇
- 2025版房產(chǎn)買賣雙方委托代理服務協(xié)議3篇
- 二零二五年食品超市生鮮區(qū)營業(yè)員食品安全合同范本3篇
- 二零二五年度現(xiàn)代智能家居租賃服務合同4篇
- 鐵礦粉購銷合同樣本2025版5篇
- 二零二五年度工地食堂員工宿舍配套合同3篇
- 凈身出戶離婚協(xié)議書二零二五版:2025年度版編寫指南6篇
- 二零二五年度綠化用地租賃及生態(tài)保護補償協(xié)議4篇
- 簡易勞務承包合同范本
- 檢驗員績效考核
- 農(nóng)藥合成研發(fā)項目流程
- 機電安裝工程安全管理
- 2024年上海市第二十七屆初中物理競賽初賽試題及答案
- 信息技術部年終述職報告總結
- 理光投影機pj k360功能介紹
- 六年級數(shù)學上冊100道口算題(全冊完整版)
- 八年級數(shù)學下冊《第十九章 一次函數(shù)》單元檢測卷帶答案-人教版
- 帕薩特B5維修手冊及帕薩特B5全車電路圖
- 小學五年級解方程應用題6
評論
0/150
提交評論