2024工商銀行人工智能大模型白皮書_第1頁
2024工商銀行人工智能大模型白皮書_第2頁
2024工商銀行人工智能大模型白皮書_第3頁
2024工商銀行人工智能大模型白皮書_第4頁
2024工商銀行人工智能大模型白皮書_第5頁
已閱讀5頁,還剩63頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

前?前?產(chǎn)業(yè)變?,智能引領(lǐng)。習(xí)近平總書記指出,世界百年未有之?變局加速發(fā)展?臨新的戰(zhàn)略機(jī)遇。??智能是引領(lǐng)這?輪科技?命和產(chǎn)業(yè)變?的戰(zhàn)‘頭雁’為??智能產(chǎn)業(yè)提供了強(qiáng)有?的?撐和引導(dǎo),推動科研和應(yīng)?躋?世界先康發(fā)展提供了有?政策導(dǎo)向和法規(guī)保障。商業(yè)銀?作為數(shù)字化和智能化的?模型技術(shù)和?業(yè)應(yīng)?深度融合的最佳?范。等多??的挑戰(zhàn)和機(jī)遇,需要充分利???智能等新技術(shù)提升服務(wù)質(zhì)量和前?前??成式?模型作為近年來??智能領(lǐng)域的最新技術(shù)成果,以其強(qiáng)?的表達(dá)??進(jìn)?調(diào)研和全景式展?,為商業(yè)銀?的數(shù)字化發(fā)展提供理論和實踐參考。?錄?錄? 錄第一章概述 2(?)源起:通?智能?標(biāo)?遠(yuǎn),模型規(guī)模持續(xù)增? 2(?)成?:新模型架構(gòu)?彰其能,?成式技術(shù)嶄露頭? 3(三)爆發(fā):會話智能驚艷市場,產(chǎn)業(yè)跟進(jìn)百舸爭流 4第二章人工智能大模型發(fā)展現(xiàn)狀 7(?)技術(shù)升級夯實基礎(chǔ),應(yīng)??態(tài)蓬勃發(fā)展 7(?)評測體系逐步完善,可信治理持續(xù)健全 35第三章人工智能大模型應(yīng)用案例 49(?)?模型場景實踐:全流程嵌?助?業(yè)務(wù)提質(zhì)增效 49(?)?模型應(yīng)?范式:模板化復(fù)?加速?案設(shè)計落地 56第四章總結(jié)與展望 60(?)技術(shù)跟蹤:研判技術(shù)趨勢,前瞻布局務(wù)實規(guī)劃 61(?)創(chuàng)新驅(qū)動:打造產(chǎn)品標(biāo)桿,敏捷創(chuàng)新賦能業(yè)務(wù) 63(三)安全合規(guī):完善安全體系,保障應(yīng)?健康發(fā)展 64(四)?效運營:強(qiáng)化成本意識,提?資源使?效率 66(五)結(jié)語 66第?章概述(?)源起:通?智能?標(biāo)?遠(yuǎn),模型規(guī)模持續(xù)增???智能技術(shù)在過去??年?取得了巨?的發(fā)展,形成了完備的產(chǎn)業(yè)70-80%AI要?量的?事?議的建模和模型訓(xùn)練,應(yīng)?開發(fā)成本和實施周期始終是規(guī)2018年以來,?模型技術(shù)逐漸發(fā)展成為通往通???智能的關(guān)鍵演進(jìn)型尚需通過少量的場景專屬任務(wù)的標(biāo)注數(shù)據(jù)來進(jìn)?微調(diào),以便能夠理解需要解決的任務(wù)類型,最終形成為場景專屬模型真正落地。?模型的出現(xiàn)在?定程度上解決了??標(biāo)注成本?的問題。通過對海量數(shù)據(jù)進(jìn)??監(jiān)督學(xué)習(xí),可以有效地從?量標(biāo)記和未標(biāo)記的數(shù)據(jù)中捕獲知識,讓模型學(xué)習(xí)到更多的通?特征。借助“預(yù)訓(xùn)練+微調(diào)”可對特定任務(wù)進(jìn)型參數(shù)規(guī)模越?使得?樣本的學(xué)習(xí)也能達(dá)到?以前更好的能?,極?的降低了?業(yè)應(yīng)?AI的成本。2017(transformer)GPT等(1)2020OpenAI參1750(如?臉)圖像的隨機(jī)?成,或者將?張圖?在兩種特定的?格之間轉(zhuǎn)換(如卡通?格和實物?格2021Meta等頭部科技公司紛紛推出以??圖(DALL-E,Mae-a-SceneATI等)(NUAMae--VideoCogVideo等),相關(guān)質(zhì)量已能達(dá)到商業(yè)應(yīng)?的要求。尤其特別的是跨模態(tài)?模型使圖像和?視頻的?成能夠通過?然語?的輸?進(jìn)?控制和調(diào)節(jié),為多媒體內(nèi)容?成應(yīng)?打下了必備的基礎(chǔ)。圖1:?模型演化歷程(三)爆發(fā):會話智能驚艷市場,產(chǎn)業(yè)跟進(jìn)百舸爭流2022年11???智能領(lǐng)域科創(chuàng)公司OpenAI以云端服務(wù)的形式發(fā)布?NLP任務(wù)。這種以?度擬?化的通?交互模式向普羅?眾提供開放域AI服務(wù)的能?,被認(rèn)為是通???智能發(fā)展的?程碑事件,獲得了市場的?泛關(guān)注,僅?2個?就創(chuàng)造了??數(shù)過億的新記錄,引爆了新?輪研發(fā)和應(yīng)?熱潮。2023年以來,國內(nèi)外頭部科技公司競相發(fā)布?模型,形成了“百模?Sora憑借在視頻質(zhì)量和?致性??的出?表現(xiàn),掀開新篇章;能(?表?。(?表??向垂類?業(yè)則發(fā)(?表三?模型能?呈現(xiàn)向任務(wù)和?業(yè)縱深的快速拓展的態(tài)勢。類別簡介典型代表語??模型旨在理解和?成?類語?,通過學(xué)習(xí)到總結(jié)、翻譯等任務(wù)。LLaMa、GPT、Claude、Vicuna、視覺?模型通過學(xué)習(xí)視覺特征和語義信息的關(guān)系,務(wù)。DALL·E2、DALL·E3、Stablediffusion、SDXL、i2vgen-xl等語??模型通過學(xué)習(xí)語?信號中的聲學(xué)特征和語義信息,從?能夠進(jìn)?語?識別和合成等任務(wù)。Voicebox、VALL-EX、USM、SpeechGPT、whisperSALMONN 、 拉雅?頻?模型等多模態(tài)?模型語?等成、圖?問答等任務(wù)。PaLI、VisCPM、NExT-GPT、MMICL、紫東太初、Qwen-VL、Sora、GPT-4o、Gemini等類別簡介典型代表程序開發(fā)?模型通過?量代碼樣本的訓(xùn)練,學(xué)習(xí)代碼的結(jié)構(gòu)和特征,從??動?成符合要求的CodeGeex、Code Llama、CodeFuse、CodeGemma通義靈碼等商業(yè)智能?模型獲取實時數(shù)據(jù)的圖表展?,也可?動總結(jié)與圖表相關(guān)的業(yè)務(wù)結(jié)論。ChatBI、SugarBI等調(diào)度規(guī)劃?模型的效率。HuggingGPT、ToolLLM等表三:?業(yè)?模型類別簡介典型代表?融?業(yè)?模型理、智能投顧、反欺詐等。BloombergGPT、軒轅、AntFinGLM、FinGPT、LightGPT等法律?業(yè)?模型果預(yù)測等。ChatLaw、LawGPT、韓?等通信?業(yè)?模型其旨在利??然語?技術(shù)來處理通?動識別?本中的關(guān)鍵信息,并解答客?問詢。九天、TeleChat、泓湖等交通?業(yè)?模型等。TransGPT、TrafficGPT等醫(yī)療?業(yè)?模型通過醫(yī)療書籍、病例等數(shù)據(jù)訓(xùn)練?研發(fā)等。、靈醫(yī)等天?預(yù)報?模型利?深度學(xué)習(xí)的?法了解各種?象數(shù)據(jù)中的關(guān)系,以快速預(yù)測未來的天?狀況。NowcastNetCMA-AIM、伏羲等施、數(shù)據(jù)準(zhǔn)備、算法調(diào)優(yōu)、安全可信等??均提出了新的挑戰(zhàn),需要商業(yè)銀?持續(xù)探索和優(yōu)化建設(shè)路徑,形成?融?模型的最佳實踐。第?章??智能?模型發(fā)展現(xiàn)狀(?)技術(shù)升級夯實基礎(chǔ),應(yīng)??態(tài)蓬勃發(fā)展AI訓(xùn)練集群為研發(fā)百億級參數(shù)規(guī)模以上的?模型提供了注意?機(jī)制的應(yīng)?改進(jìn)了模型對?程依賴關(guān)系的建模能?;指令微調(diào)技術(shù)強(qiáng)化了模型對??提問意圖理解和反饋偏好的適配程度等等。鑒于?模型技術(shù)棧的復(fù)雜性,?模型?程化平臺成為?模型企業(yè)級應(yīng)?的必數(shù)算協(xié)同能?涌現(xiàn),模型學(xué)習(xí)才識并重算?設(shè)施當(dāng)代以深度神經(jīng)元?絡(luò)為代表的??智能模型涉及?數(shù)據(jù)吞吐量的矩(或者單機(jī)上可以訓(xùn)練的深度?絡(luò)模型,?成式?模型的參數(shù)規(guī)模??數(shù)千際的?模型研發(fā)中往往會進(jìn)?步提?模型訓(xùn)練的并發(fā)度,推升算?集群達(dá)圖2:隨著模型參數(shù)量增加,模型對算?需求不斷增??前通?的??智能芯?以英偉達(dá)的GPU產(chǎn)品為主流。其中英偉達(dá)的BlackwellGB200Blackwell架構(gòu)的超級芯?,旨在AIB200BlackwellGPUGraceCPUB200GPU2080420petaflopsFP4GraceCPU72核?的ArmNeoverseV2TDP2700WGB200在推理?語?模型性能上?前代H100301/25GB200384GB900GB/sNVLinkGPUCPU1.41.8AI任務(wù)GB200NVLink國產(chǎn)AI算?產(chǎn)業(yè)近年來取得了??的發(fā)展。華為昇騰910對標(biāo)業(yè)界先AI(FP32)99(FP16)376(INT8)752Atlas900A2PoDc最?可擴(kuò)展?包含8000昇騰芯?的AI算?集群,提供3EFLOPS超強(qiáng)算?,計算節(jié)點間通過200GRoCE?絡(luò)互聯(lián),保障集群訓(xùn)練時的?線性度。模型并?框架在集群化AI算?設(shè)施的基礎(chǔ)上,?模型的訓(xùn)練可以通過以下?種并?模式開展。(由于當(dāng)前的?模型規(guī)模往往遠(yuǎn)超單個計算設(shè)備的它基于矩陣運算分解的數(shù)學(xué)原理在模型的層內(nèi)進(jìn)?分割,形成的單個?模采取基于深度的切分,將?模型的不同層級拆解到各個計算設(shè)備并通過流?操作的?式形成各個層級運算的并發(fā)執(zhí)?。相對于流?線并?中分布式數(shù)據(jù)交換主要發(fā)?在承載相鄰層級的計算設(shè)備之間,張量并?中各個計算?在?機(jī)多卡的服務(wù)器節(jié)點內(nèi)部的并發(fā)實現(xiàn)。圖3:?模型訓(xùn)練的并?模式:模型并?[1](備上的模型實例來參加訓(xùn)練過程,設(shè)備相互之間定期地就訓(xùn)練所得的模型參數(shù)或者參數(shù)優(yōu)化的梯度值進(jìn)?同步,保證所有設(shè)備上的模型狀態(tài)保持?致。數(shù)據(jù)并??般要求每個設(shè)備上的訓(xùn)練實例儲存和維護(hù)完整的模型參數(shù)AI(ZeROZeroRedundancyOptimizer)訓(xùn)練實例動態(tài)地從其他設(shè)備通訊獲取需要的模型參數(shù)和梯度值來完成本地的訓(xùn)練計算,從?極?提升數(shù)據(jù)并發(fā)模式下的內(nèi)存使?效率。[1]引自https://openmlsys.github.io/chapter_distributed_training/methods.html圖4:大模型訓(xùn)練的并行模式:數(shù)據(jù)并行[1](在實際應(yīng)?中往往綜合模型并?和數(shù)據(jù)并?等多數(shù)據(jù)并?+流?線并?+張量并?的模式可以充分利?算?資源和通信帶寬達(dá)到兼顧模型的內(nèi)存擴(kuò)展性和訓(xùn)練加速的?的。圖5:?模型訓(xùn)練的并?模式:混合并?[1]?前主流的AI計算框架?態(tài)均已?持以上全部或者?多數(shù)的并?訓(xùn)練模式。全球來看,典型的如PyTorch+DeepSpeed?態(tài)和TensorFlow+Mesh-?態(tài)。國內(nèi)來看,近兩年國內(nèi)?商推出的AI框架市場占有率也正穩(wěn)步提升。百度?槳在2023年針對于?模型開發(fā)新發(fā)布了PaddleFleetX的昇思MindSpore框架充分考慮?模型開發(fā)時可能會遇到的問題,通過軟硬件協(xié)同優(yōu)化,實現(xiàn)??代碼即可完成模型?動切分、分布式并?計算,將80%訓(xùn)練數(shù)據(jù)訓(xùn)練數(shù)據(jù)的多樣性、規(guī)模和質(zhì)量,對模型能?的提升起著關(guān)鍵作?,被?泛認(rèn)為是AI?模型競爭的重要因素。在所有的?模型訓(xùn)練數(shù)據(jù)集中,語料數(shù)據(jù)的規(guī)模遙遙領(lǐng)先,有?地?撐了語??模型的快速發(fā)展。體數(shù)據(jù)和公共數(shù)據(jù)集等多樣性的渠道。這些渠道提供的數(shù)據(jù)涵蓋眾多不同語?樣式和主題,?常有助于?模型通?能?的學(xué)習(xí)。提供了?量的語?表達(dá)和?化背景,有助于模型學(xué)習(xí)到更多的語?規(guī)律和?格。新聞和媒體數(shù)據(jù):新聞報道和媒體?章數(shù)據(jù)可以涵蓋各種主題和領(lǐng)域,有助于模型學(xué)習(xí)到與時俱進(jìn)的語?表達(dá)和話題。CommonCrawl、GutenbergProject等。中?語料??,智源研究20多100TB200G·模的數(shù)據(jù)亦有利于提升模型的泛化能?,加強(qiáng)模型對于不同主題和領(lǐng)域表訓(xùn)練數(shù)據(jù)集HTML的重復(fù)數(shù)據(jù)甚?在訓(xùn)練過程中可能導(dǎo)致模型陷??意義的局部最優(yōu)。為了訓(xùn)練數(shù)據(jù)集人工評人工評估增加/修改清洗規(guī)則擴(kuò)充敏感詞表數(shù)據(jù)分詞增加/修改清洗規(guī)則擴(kuò)充敏感詞表數(shù)據(jù)處理平臺基于模型的數(shù)據(jù)評估隱私過濾數(shù)據(jù)去重數(shù)據(jù)清洗圖6:?模型訓(xùn)練數(shù)據(jù)處理流程將?本分割成有意義的詞語。常?的分詞?法包括基于規(guī)則的分詞和基于統(tǒng)計的分詞。模型架構(gòu)結(jié)構(gòu)為核?單元組件(?圖7)。轉(zhuǎn)換器能夠并發(fā)地接收?序列數(shù)據(jù)輸?(?如??本),基于對當(dāng)前數(shù)據(jù)序列的分析??判斷每個數(shù)據(jù)元素與其他任意元素的相關(guān)(也即注意?進(jìn)?步加權(quán)計算和提煉出數(shù)據(jù)特相對距離間的元素進(jìn)??視同仁的相關(guān)性建模,能夠有效的捕捉到?序列換器機(jī)制在2017發(fā)布后在各種?然語?處理(NLP)任務(wù)上都取得了令?矚圖(AttentionMechanism)OpenAI擁有1750億參數(shù)的超?規(guī)模?絡(luò),包含有96層轉(zhuǎn)換器結(jié)構(gòu),利?了多頭注的模型結(jié)構(gòu)據(jù)稱和類似。混合模型采?多個相對獨?的神經(jīng)元?絡(luò),相當(dāng)于將多個相對較?的都需要經(jīng)過模型的全部計算所導(dǎo)致的訓(xùn)練成本的平?級增?問題,因此也稱為混合專家模型(MoE-MixtureofExperts)。對于單個任務(wù)輸?來說,?般務(wù)輸?需要激活的?模型,混合模型機(jī)制引?了?個決策?的機(jī)制以?成要激活的?模型索引,因此在控制??增加了復(fù)雜度。?歌的SwitchTransformer是混合模型的典型代表。?前?成式模型的佼佼者GPT-4據(jù)悉也采?了混合模型的MoE架構(gòu),對后續(xù)超?模型的進(jìn)?步發(fā)展可能起到相當(dāng)?shù)膶?dǎo)向效應(yīng)。訓(xùn)練算法階段數(shù)據(jù)算法模型強(qiáng)化學(xué)習(xí)生成最大獎階段數(shù)據(jù)算法模型強(qiáng)化學(xué)習(xí)生成最大獎勵的token二分類預(yù)測獎勵一致性語言建模預(yù)測下一token語言建模預(yù)測下一token提示詞~10K-100K提示詞數(shù)量低,質(zhì)量高對比100K-10M對比數(shù)量低,質(zhì)量高論證理想輔助反應(yīng)~10-100K(提示詞、回復(fù))數(shù)量低,質(zhì)量高原始網(wǎng)頁萬億字文本數(shù)量大,質(zhì)量低強(qiáng)化學(xué)習(xí)獎勵學(xué)習(xí)監(jiān)督微調(diào)預(yù)訓(xùn)練基礎(chǔ)模型微調(diào)模型獎勵學(xué)習(xí)模型強(qiáng)化學(xué)習(xí)模型圖8:?模型訓(xùn)練?法分類[2]多模態(tài)等?泛的領(lǐng)域均取得了顯著的成效。預(yù)訓(xùn)練主要采取?監(jiān)督學(xué)習(xí)的[2]引自微軟AndrejKarpathy的演講PDFStateofGPT:https://karpathy.ai/stateofgpt.pdf預(yù)訓(xùn)練隨機(jī)地隱去輸??本中的部分字詞,要求模型預(yù)測?本中缺失的部據(jù)對模型做進(jìn)?步的預(yù)訓(xùn)練。這?步驟對于商業(yè)銀?的?模型應(yīng)??常重?融領(lǐng)域的問題和任務(wù)更加精確和可靠。習(xí)中的補(bǔ)全任務(wù)外沒有其他解決問題的能?,需要使?有標(biāo)簽的數(shù)據(jù)集進(jìn)原始模型的主要參數(shù)只對部分參數(shù)進(jìn)?訓(xùn)練。低秩適配(LoRA-LowRank級中的參數(shù)變化值建模為?對約簡的矩陣,通過訓(xùn)練簡化后的矩陣參數(shù)的獎勵模型訓(xùn)練:獎勵模型?于評判?模型的輸出是否符合?類偏好和習(xí)的?式基于?量的?類偏好數(shù)據(jù)擬合?成。偏好數(shù)據(jù)集的構(gòu)建可以利?注員按照預(yù)定義的指導(dǎo)原則對回答進(jìn)???偏好排序。訓(xùn)練過程往往使?最終促使獎勵模型成功地模仿??評判來對?模型的輸出內(nèi)容進(jìn)?標(biāo)量化打分。境的獎懲反饋和更新??的策略,來逐漸提???的?為性能以達(dá)成優(yōu)化在訓(xùn)練過程中利?融合了?類專家知識的獎勵模型對?模型的輸出內(nèi)容進(jìn)??動評分,針對評分不佳的回答采取?強(qiáng)化學(xué)習(xí)中的近端策略優(yōu)化技術(shù)對?模型的內(nèi)容?成策略進(jìn)?迭代優(yōu)化,最終實現(xiàn)?模型內(nèi)容?成和?類價值觀的對?。在經(jīng)過以上所有訓(xùn)練步驟后,?模型成為兼具常識和相關(guān)領(lǐng)域?qū)I(yè)知模型輕量化技術(shù)任何技術(shù)的繁榮都離不開社會化創(chuàng)新。?模型要?向千?百業(yè)的普及(?基于原訓(xùn)練集上做?定的微調(diào),以避免由于?絡(luò)結(jié)構(gòu)變化?出現(xiàn)的性能下降。剪枝剪枝剪枝后剪枝前圖9:模型輕量化技術(shù):剪枝技術(shù)328布密集的值域區(qū)間采取較精細(xì)的刻度以提?表達(dá)的精確性?;旌暇?案(?圖模型的學(xué)習(xí)過程;或者逐層提取?模型的中間層輸出作為?模型對應(yīng)層的監(jiān)督信號來分層次進(jìn)?知識遷移。知識蒸餾可以在保證?定精度的前提下獲得較?的模型壓縮率,但需注意可能導(dǎo)致的模型過擬合等問題。圖10:模型輕量化技術(shù):知識蒸餾提?引導(dǎo)巧?模型,沉淀提煉應(yīng)?范式提??程?成式?模型依據(jù)輸?的?結(jié)構(gòu)化?然語?指令來執(zhí)?任務(wù),在極?輸入輸入... ... ...輸入...輸入輸出輸入...輸出輸入輸出 輸出輸出輸出輸入輸出輸入輸出出提示

思維鏈?zhǔn)?/p>

自洽式思維鏈 (d)思維樹提示圖11:?模型提?語設(shè)計模式[3][3]ShunyuYao,etal.TreeofThoughts:DeliberateSolvingwithLargeLanguageModels,/abs/2305.1060111(IOPrompting)Prompting,即沒有?例)或多個?例(Few-ShotPrompting),來讓?模型理解任務(wù)的?標(biāo),并?成合適的12(Chain-of-Thought在輸?輸出提?問題并展?每個步驟的過程性輸出,特別有助于解決依賴深層次邏輯思維的任務(wù)。?洽式思維鏈(Chain-of-ThoughtPromptingSelf-Consistency)是思這種?法可以降低?模型單次采樣時可能出現(xiàn)的隨機(jī)性和錯誤性,提?在復(fù)雜推理任務(wù)上的準(zhǔn)確性和可解釋性。思維樹提?(Prompting)通過提供思維的樹形邏輯結(jié)構(gòu)來引導(dǎo)模型的解答?成過程。它

圖12:提?模板?例相對于傳統(tǒng)深度?絡(luò)模型需要通過微調(diào)訓(xùn)練來適配任務(wù),?模型通過提?詞?程可以在不改變模型本?的情況下完成?向場景的對?,極?地App。用戶應(yīng)用用戶應(yīng)用I大語言模型API直接API調(diào)?是?前最普遍的?模型應(yīng)?模式,?圖13。App接受?App基本是這種模式。?向特定領(lǐng)域和任務(wù)的應(yīng)?,要和環(huán)境進(jìn)?互動來構(gòu)建綜合解決?案,從?推動了檢索增強(qiáng)?成(Retrieval-AugmentedGeneration)和AI智能體(Agent)兩種?模型應(yīng)?范式的演進(jìn)。檢索增強(qiáng)?成是?種知識密集型任務(wù)的應(yīng)?模式,通過語義檢索機(jī)制賦予?模型動態(tài)獲取外部知識的能?。該模式下的系統(tǒng)通常由三個組成部分構(gòu)成:?模型、知識源和語義檢索模塊(?圖14)。對于輸?的問題,()中找到相關(guān)的?持性內(nèi)容,然后將這些內(nèi)容與原輸?聯(lián)合在?起提交給?(最具代表性的產(chǎn)品為微軟NewBing的聊天式問答?;谒接蛑R的檢索增強(qiáng)?成應(yīng)?也已開始在商業(yè)銀?落地和推?。圖14:檢索增強(qiáng)?成(Retrieval-AugmentedGeneration)技術(shù)AI智能體是?類能夠?主完成任務(wù)的系統(tǒng),可以由?成式?模型和?套可以調(diào)?的外部?具集構(gòu)成。?具賦予智能體實施?動并取得反饋的能API領(lǐng)對(例如:確定服務(wù)調(diào)?需要的?參在智能體應(yīng)?中的錯誤率降?個位數(shù)才能夠獨?完成?作,當(dāng)前整體受限于當(dāng)前模型能?,智能體仍未出現(xiàn)規(guī)?;瘧?yīng)?。應(yīng)?開發(fā)?具LangChainLamaIndexDustLangChain(Prompt之前的問答等任務(wù)記錄,?便開發(fā)者為?成式?模型提供?關(guān)重要的上下全棧開發(fā)集?成者,綜合平臺化繁為簡排和應(yīng)?部署等復(fù)雜的流程和技術(shù)棧,對開發(fā)者的知識和技能?平要求很持已經(jīng)成為必不可少的基礎(chǔ)設(shè)施。傳統(tǒng)??智能開發(fā)平臺,如MLOPSSageMaker對前沿?模型的集成AzureML的?模型優(yōu)化?具包等。此外,?模型技術(shù)浪潮也催?了?批HuggingFace,F(xiàn)ast.AI等。相對于傳統(tǒng)平臺,這些平臺更加迅速地集成和提供豐富的預(yù)訓(xùn)練?模型和領(lǐng)先的?模型應(yīng)?開發(fā)HuggingFaceHuggingFace是?個開源?規(guī)模機(jī)器學(xué)習(xí)平臺,提供了從數(shù)據(jù)準(zhǔn)備、模30持開發(fā)?員便捷地在模型庫中搜索和調(diào)?需要的?模型。平臺還提供?規(guī)模的標(biāo)注數(shù)據(jù)集,?持?鍵加載使?。在此基礎(chǔ)上,HuggingFace整合了模型訓(xùn)練、評價、部署?具。平臺內(nèi)置了Transformer模型的應(yīng)?編程接?,NLPCV等EvaluateGPU的集群資源進(jìn)??模型的訓(xùn)練,并通過平臺發(fā)布模型應(yīng)?或API服務(wù)。百度千帆NLPERNIEBLOOMLlama在內(nèi)的各種模型結(jié)構(gòu),都經(jīng)過了中?corpus的預(yù)訓(xùn)練,可以直接應(yīng)?于?本理解、對話、翻譯等通?任務(wù)。??也可以基于平臺提供的數(shù)據(jù)集,使?PaddlePaddle框架對PaddleHub?具,??可以便捷地使?模型,實現(xiàn)模型部署,并提供預(yù)測服務(wù)。ModelZoo華為推出的?模型開發(fā)平臺ModelZoo2,為?模型開發(fā)者提供了全?位的?持與服務(wù)。它?持多種深度學(xué)習(xí)框架,如PyTorch、TensorFlow、MindSporeGPU模型的訓(xùn)練和部署更加靈活和?效。平臺的模型庫?前已經(jīng)接?了主流的?模型,如盤古系列、Baichuan、Llama、GLM等,覆蓋視覺、語?、多模API模型適配?融領(lǐng)域,能?建設(shè)多管?下以?模型為代表的新?代??智能技術(shù)正在成為數(shù)字經(jīng)濟(jì)發(fā)展的新動?模型在各業(yè)務(wù)領(lǐng)域和場景的應(yīng)?。圖15:?模型在企業(yè)的適配模式及落地應(yīng)?場景按照能?的專業(yè)度?平劃分,?模型在商業(yè)銀?的使?有基礎(chǔ)?模型、?業(yè)?模型、企業(yè)?模型、任務(wù)?模型四種形態(tài),?圖15?;A(chǔ)?模型是業(yè)?模型基于基礎(chǔ)?模型和銀?業(yè)領(lǐng)域數(shù)據(jù)進(jìn)?再訓(xùn)練,可以解決具備?型的基礎(chǔ)上進(jìn)?步結(jié)合企業(yè)私域數(shù)據(jù)訓(xùn)練具備個性化特點的企業(yè)?模型,或者?向特定的專屬問題結(jié)合任務(wù)數(shù)據(jù)微調(diào)訓(xùn)練任務(wù)?模型,定向攻克?價值重點業(yè)務(wù)場景。?融?業(yè)和/或企業(yè)?模型。對于急缺的場景?持能?,也可采?模型微調(diào)滿?賦能訴求,或者基于產(chǎn)品配套的模型微調(diào)?具結(jié)合場景數(shù)據(jù)敏捷開發(fā)任務(wù)級模型。應(yīng)當(dāng)在原有??智能技術(shù)棧的基礎(chǔ)上,結(jié)合企業(yè)針對以下四個??研判設(shè)?平向通???智能演化,促進(jìn)??智能與?融業(yè)務(wù)深度融合。加強(qiáng)算?基礎(chǔ)設(shè)施建設(shè)?模型參數(shù)量的增加導(dǎo)致訓(xùn)練過程的計算需求呈現(xiàn)指數(shù)級增?。為了快速訓(xùn)練和規(guī)模化應(yīng)?模型,需要強(qiáng)?的計算能?來?持?效的分布式訓(xùn)?建設(shè)?標(biāo)應(yīng)當(dāng)以業(yè)務(wù)需求為導(dǎo)向,明確應(yīng)??模型邊際效?突出的業(yè)務(wù)AI構(gòu)建?質(zhì)量數(shù)據(jù)集數(shù)據(jù)是?模型的重要?產(chǎn)要素,數(shù)據(jù)的規(guī)模和質(zhì)量對?模型性能提升在數(shù)據(jù)處理??,?是設(shè)計合理的數(shù)據(jù)使?機(jī)制,如合理數(shù)據(jù)配?等,引?領(lǐng)先模型技術(shù)?模型技術(shù)仍然在快速發(fā)展和演化過程中,商業(yè)銀?應(yīng)當(dāng)以動態(tài)發(fā)展的眼光持續(xù)關(guān)注國內(nèi)外?模型的最新進(jìn)展和趨勢,根據(jù)新技術(shù)特點和企業(yè)造?素質(zhì)的?模型研究和應(yīng)?孵化團(tuán)隊,以強(qiáng)化新技術(shù)研判能?和加快業(yè)務(wù)賦能進(jìn)程。打造研發(fā)運營流?線緊跟?模型研發(fā)運營?體化的發(fā)展趨勢,商業(yè)銀?應(yīng)當(dāng)引?和借鑒業(yè)16。?向業(yè)務(wù)、AI科技研發(fā)?員,基于底層?模型基圖16:?模型研發(fā)運營流?線(?)評測體系逐步完善,可信治理持續(xù)健全(10兩個確定的數(shù)值商業(yè)銀?在深?研究并探索?模型潛?的同時,需認(rèn)真對待其潛在的評測維度:保障評測全?位覆蓋模型能?評估?規(guī)模語?模型(LargeLanguageModel,LLM)基于提??程(PromptEngineering)、上下?學(xué)習(xí)(In-contextLearning)、思維鏈推理(ChainofLLM逐漸演化成為?向不同任務(wù)的基座模型。LLM在不斷刷新傳統(tǒng)評估任務(wù)榜單成績的同時,也引起了如何有效、體系化的衡量作為基座模型的LLM在多領(lǐng)域多任務(wù)能?的思考與實踐。模型能?的體系化量化評估能夠直觀反映不同模型之間的差距,也能何全?評估模型的綜合能?,讓模型在測試評估中的得分能更真實的反映實際??體驗。模型安全評估??智能模型因為其性能??泛應(yīng)?,?因為其決策難以理解的?盒或不確定環(huán)境時的表現(xiàn)進(jìn)?評估,例如通過添加輕微錯誤或改變語義等?(透明性)??,?模型評估關(guān)注模型解釋的合理性、?致性。模型的可解釋性可以從模型在處理某個任務(wù)時是否有合理的依據(jù),以及模型對于輸出結(jié)果的不確制模型?成特定?格或者含有特定元素的內(nèi)容。這個評測標(biāo)準(zhǔn)主要是為了確保模型在實際使?中的靈活性和適?性。模型倫理評估了真實世界的錯誤與?擾,?具備更多參數(shù)的?模型往往更善于模擬訓(xùn)練(性別/種族/宗教是否公平對待所有群體。通常評估?法是檢查模型是否更傾向于對某種群體進(jìn)?負(fù)?或錯誤的標(biāo)記,或者在處理涉及不同種群體的任務(wù)時是否存在/?模型評測?法Chinchilla(69.3)在5-shot設(shè)置下的MMLU表現(xiàn)?乎是所有?類評分者平均值(34.5)的兩GPT-4(86.4)在5-shot設(shè)置下已經(jīng)?分接近?類專家(89.8)的?場景需要設(shè)計新的評估?法。例如,在代碼?成任務(wù)中,常?的評測指標(biāo)pass@k需要多次采樣?成結(jié)果,然后使?編譯器或解釋器執(zhí)?檢查。的?動評估主要依賴于標(biāo)準(zhǔn)化的度量和基準(zhǔn)測試集,我們也看到了近期更多針對?模型的基準(zhǔn)測試集出現(xiàn)?;诖蚍窒到y(tǒng)的??評估可以提?模型評價的豐富性和準(zhǔn)確性,因為相較于針對特定NLP任務(wù)構(gòu)建的學(xué)術(shù)基準(zhǔn)測試集,?類主觀構(gòu)建的話題以及對于模型回答的判斷可能更適?于評判通?聊天機(jī)器?的好壞。例如UC伯克利提出的聊天機(jī)器?競技場(ChatbotArena),利?Elo等級分制度引??類評價對?語?模型進(jìn)?排名。使?Vicuna可以根據(jù)有?在編程或數(shù)學(xué)問題上還不能給出良好的評估。?模型評測指標(biāo)模型在該任務(wù)上的平均正確率。對于可以直接?較模型回復(fù)和標(biāo)準(zhǔn)答案的(Eac-mch)(eall精確度(Precision)和F1等指標(biāo);對于有參考答案的其他條件?本?成任務(wù),BLEUTER,ROUGE和METEORRRNDCGPassBPB(ECE)ECE低的模型預(yù)測1000700個是有毒的。模型的穩(wěn)健性和公平性評估?式較為類似,通常通過?較模型在不同輸?下的精度差別來衡量:對模型輸?施加錯別字或語義等擾動模擬真實?模型評測數(shù)據(jù)集?模型評估??已經(jīng)出現(xiàn)了?些有代表性且?泛使?的綜合基準(zhǔn)數(shù)據(jù)BIG-Bench是?個各領(lǐng)域?qū)<液螲ELM16組核?場7MMCU數(shù)據(jù)集,覆蓋教育、醫(yī)學(xué)、?理學(xué)、法律4除了以上綜合測試集外,還有專注于評估?語?模型特定能?的測試TyDiQAMGSM、?于復(fù)雜推理的HellaSwag、?于閱讀理解的SQUAD、?于代碼?成的HumanEvalCivilCommentsSAESuperGLUE18個?險管理:助?打造負(fù)責(zé)任應(yīng)?對于?模型在安全可信??的問題,我國?度重視?模型技術(shù)?險的管理。2023年7?,?信辦會同六部委共同發(fā)布《?成式??智能服務(wù)管(為?成式??智能的發(fā)展和應(yīng)?推?成式??智能技術(shù)創(chuàng)新和?險防范等??積極展開合作和研究。以下從性能缺陷、脆弱性、倫理三??對?模型技術(shù)?險管理展開討論。性能缺陷?險管理?前?模型對于其?成內(nèi)容的可信性缺乏保障,容易?成?然流暢但?業(yè)帶來的?險采取針對性回應(yīng)舉措:法律法規(guī)??建?系列規(guī)章制度,對主管部?的?融政策指導(dǎo)實施監(jiān)管和規(guī)范,同時加強(qiáng)?融?模型的技術(shù)創(chuàng)新和防御研究;企業(yè)層?,建議?融企業(yè)設(shè)?相關(guān)部?負(fù)責(zé)?模型技術(shù)?險管理,整體考慮和設(shè)計符合?融業(yè)務(wù)場景的?模型安全制度體系,擴(kuò)??模型安全專業(yè)?才隊伍,提升相關(guān)?融技術(shù)?員的專業(yè)技能。脆弱性?險管理?前?模型在?對攻擊?為時具有脆弱性,例如在?臨特定形式的輸?模型技術(shù)在?融服務(wù)中的使?帶來了極?的安全?險,需要采取措施防范潛在的惡意攻擊:?業(yè)層?,建??向?融?業(yè)的?模型脆弱性?險管理標(biāo)準(zhǔn)規(guī)范,健全技術(shù)體系以?持落實國家監(jiān)管政策,針對?模型的對抗和投毒攻擊?企業(yè)層?,針對?融?模型脆弱性采取相應(yīng)的技術(shù)?段進(jìn)?防范,??為應(yīng)當(dāng)及時停?服務(wù)并視情況采取懲罰。倫理?險管理?模型由于其?質(zhì)量內(nèi)容?成的能?,導(dǎo)致其在使?的同時可能引發(fā)容可能誘導(dǎo)使?者進(jìn)?不合理甚??法的?融?為;?成內(nèi)容中可能存在于模型?成內(nèi)容的有害程度和偏?與歧視問題形成度量標(biāo)準(zhǔn),同時構(gòu)建相關(guān)問題的測評技術(shù)體系,指導(dǎo)企業(yè)對?模型?成內(nèi)容進(jìn)??動化檢驗;?成誘導(dǎo)性或偏?與歧視性內(nèi)容。技術(shù)探索:提供安全可信技術(shù)?撐信息追溯技術(shù)ChatGPT為代表的?成式AI技術(shù)已經(jīng)表現(xiàn)出了?常驚艷的AI技術(shù)實際部署出現(xiàn)問題時,對特定結(jié)果的產(chǎn)?原因、關(guān)鍵環(huán)節(jié)等要素進(jìn)?因果溯源分析,保障?成結(jié)果與事實的?致性是實現(xiàn)?融?模型可信?成的基礎(chǔ)之?。為了降低?模型的性能缺陷?險,實現(xiàn)?成式AI技術(shù)在?融業(yè)務(wù)場景源的?式特定?融結(jié)果的產(chǎn)?原因、關(guān)鍵環(huán)節(jié)等要素進(jìn)?快速的因果溯源分析。該?法主要由檢索器和?模型兩個模塊實現(xiàn)結(jié)果的整編和溯源:攻擊防御技術(shù)現(xiàn)有的基于?模型的內(nèi)容?成技術(shù)屬于深度學(xué)習(xí)技術(shù)范疇,其運作?乎完全由數(shù)據(jù)驅(qū)動??由?為規(guī)則確定,因?容易存在難以察覺到的脆弱性問題;再加上訓(xùn)練及應(yīng)?環(huán)境直接?向數(shù)據(jù)提供商及??產(chǎn)?的?然語??本及圖像等復(fù)雜?結(jié)構(gòu)化數(shù)據(jù),模型?臨極?的不確定性和被攻擊可究基于內(nèi)容安全檢測的攻擊防御技術(shù),針對?融?模型開發(fā)和應(yīng)?階段涉Prompt注?等對模型的對抗攻擊;可解釋技術(shù)們只能看到數(shù)據(jù)的輸?和輸出,其內(nèi)部判斷的運?規(guī)律和因果邏輯尚不清機(jī)理和輸出的可解釋性、建?合適的可視化機(jī)制來評估和解釋模型的中間為了降低?融業(yè)務(wù)場景的?模型倫理?險監(jiān)管難度,幫助?融機(jī)構(gòu)識別潛在的模型?險并可以及時調(diào)整和改進(jìn)推理結(jié)果,主要研究融?因果理論的?成式?融?模型:模?融數(shù)據(jù)的?成過程,對因果機(jī)制和?盒模型進(jìn)?協(xié)同優(yōu)化來消除模型并利?可視化等技術(shù)?段實現(xiàn)?成過程的可解釋分析,幫助??更好地理解?融概念和決策;基于因果?預(yù)的可控?成技術(shù):借助因果?預(yù)和反事實推測?段,研究?向?融領(lǐng)域的?模型可控?成?法,結(jié)合梯度的低秩分解對模型的第三章??智能?模型應(yīng)?案例以?成式?模型為代表的新?代??智能技術(shù)將極?地加速?融業(yè)數(shù)(對商業(yè)銀???尤其是?語?模型的?成式能?已成為數(shù)據(jù)處理的(?)?模型場景實踐:全流程嵌?助?業(yè)務(wù)提質(zhì)增效17。以下結(jié)合中國?商銀?的典型實踐案例來介紹?模型的銀?業(yè)應(yīng)?場景和業(yè)務(wù)價值。

圖17:?模型在?融領(lǐng)域的重點應(yīng)?領(lǐng)域?解決率與客?滿意度。不過鑒于?前?模型在?成內(nèi)容可控性??的問案例?:坐席助?提升客?服務(wù)體驗?前,商業(yè)銀?主要通過??客服和智能客服兩種?式為客?提供咨程銀?業(yè)務(wù)中將知識搜索與?模型技術(shù)結(jié)合,實現(xiàn)基于實時通話向坐席?辦公協(xié)作NLP?模型的?本?成、問答能?,全?案例?:智能辦公助?辦公模式?效化ee企郵等案例?:智能助?賦能?試流程智能化HR??篩選招聘員HR??分析應(yīng)聘者的情況及能?提供了便利。案例三:?融市場咨詢分析、?成?動化商銀?利??模型的?本?成能?,實現(xiàn)投研晨報等?融市場各類報告的運營管理案例?:?點助?賦能業(yè)務(wù)流程?動化85%服經(jīng)理萬余?。制度查詢服務(wù)可智能化?成便于員?理解的操作流程和術(shù)案例?:?單分析、?成?動化?商銀?每?需處理數(shù)?萬件客?意??單,傳統(tǒng)??智能技術(shù)已可答復(fù)環(huán)節(jié)對原有模式進(jìn)?創(chuàng)新,利??模型可根據(jù)員?與客?電話核實情研究開發(fā)相較于傳統(tǒng)純??開發(fā)的?技術(shù)?檻和???需求,基于?模型技術(shù)案例?:智能研發(fā)助?研發(fā)數(shù)智化智能研發(fā)屬于特定細(xì)分領(lǐng)域的專業(yè)化應(yīng)?,存在?融屬性弱且?研難?險防控案例?:信貸全流程審批智能化傳統(tǒng)信貸業(yè)務(wù)模式主要依靠業(yè)務(wù)?員累積的經(jīng)驗,??審核和評估信案例?:可疑報告?成?動化?商銀?依托?數(shù)據(jù)及傳統(tǒng)??智能技術(shù)建成客?盡職調(diào)查、?額報案例三:智能員?助?內(nèi)控合規(guī)智能化e控溝通交流平臺,為基層員(?)?模型應(yīng)?范式:模板化復(fù)?加速?案設(shè)計落地實際需求和應(yīng)?實踐,創(chuàng)新打造適配?融?業(yè)的“1+X”?模型應(yīng)?范式,X插即?的零代碼?程化解決?案,?幅提升?模型在全?規(guī)?;瘧?yīng)?的效率和質(zhì)量。?檔編寫在通過?模型將簡單的事實陳述擴(kuò)寫成?篇資料。分析研判旨在對照專家編寫研判報告過程,基于?模型的閱讀理解能?對多種參考資料等進(jìn)?閱讀、素材抽取,并形成研判分析報告。智能搜索?成問題答案及來源,最終業(yè)務(wù)?員反饋問題答案。

圖18:智能搜索應(yīng)?范式的流程索?模型和?成式?模型分別完成知識搜索和答案?成,最終業(yè)務(wù)?員反圖19:知識檢索應(yīng)?范式的流程智能中樞?、調(diào)度場景等。

圖20:智能中樞應(yīng)?范式的流程

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論