版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
信|證券研究報(bào)告|ChatGPT推出Claude22023.8.29:聞學(xué)臣1Anthropic認(rèn)為人工智能有潛力從根本上改變世界的運(yùn)作方式。他們致力于構(gòu)建人們可以依賴的系統(tǒng),并開展有關(guān)人工智能機(jī)遇和風(fēng)險(xiǎn)的研究。其使命是確保變革性人工智能(TransformativeAI,TAI)幫助人們和社會(huì)繁榮發(fā)展。公司通過(guò)構(gòu)建前沿系統(tǒng)、研究其行為、努力負(fù)責(zé)任地部署AI以及定期分享安全方面的見解來(lái)追求他們的使命。21Anthropic的創(chuàng)始團(tuán)隊(duì)成員均擁有很強(qiáng)的技術(shù)實(shí)力和學(xué)術(shù)研究能力:1Anthropic的創(chuàng)始人兼CEO是DarioAmodei,曾擔(dān)任OpenAI的AI安全團(tuán)隊(duì)經(jīng)理,引領(lǐng)過(guò)GPT-2和GPT-3的開發(fā),并為OpenAI撰寫了公司的研究方向和計(jì)劃,是OpenAI研究團(tuán)隊(duì)的副總裁。Anthropic的聯(lián)合創(chuàng)始人兼總裁DanielaAmodei是Dario的妹妹,也曾在OpenAI安全團(tuán)隊(duì)任職。在此之前,她也在Stripe任職超過(guò)五年。Anthropic曾在OpenAI等機(jī)構(gòu)任職。TomBrown領(lǐng)導(dǎo)了GPT-3工程團(tuán)隊(duì),也曾在GoogleBrain技術(shù)團(tuán)隊(duì)工作(GoogleBrain也是提出Transformer算法架構(gòu)的團(tuán)隊(duì));SamMcCandlish在OpenAI建立并引領(lǐng)了研究ScalingLaw的團(tuán)隊(duì),并參與了GPT-3的開發(fā)工作;JackClark曾任OpenAI的政策總監(jiān);JaredKaplan是約翰霍普金斯大學(xué)教授,也曾兼任OpenAI研究咨詢工作。3融資額1.6B,Google、SparkCapital領(lǐng)投又進(jìn)行了五輪融資,總共募集資金約16億美元。1其中,公司在2022年8月完成的B輪融資由量化交易公司AlamedaResearch及知名加密貨幣交易所FTX創(chuàng)始人SamBankman-Frid領(lǐng)投。隨后完成的融資分別由Google和星火資本(SparkCapital)領(lǐng)投。投投JaanTallinnSeriesBmanFriedorateRoundriesC450MtalorateRound2023年8月CorporateRound4AI大模型對(duì)話產(chǎn)品Claude:支持100k超長(zhǎng)上下文輸入,各項(xiàng)能力均突出12023年5月,Anthropic宣布更新聊天助手Claude2,能夠支持文件輸入、代碼解析等功能。語(yǔ)言方面目前只支持英文對(duì)話,但能夠提供使用Google翻譯后生成的中文回答。.5%,高于Claude1.3的73.0%。與申請(qǐng)研究生院的大學(xué)生相比,Claude2在GRE閱讀和寫作考試中的得分高于90%,在定量推理方面與申請(qǐng)者的中位數(shù)相似。Claude2在Python編碼測(cè)試CodexHumanEval上的得分比56.0%提高了71.2%。在GSM8k(大量小學(xué)數(shù)學(xué)題)評(píng)測(cè)上,Claude2的得分從85.2%上升到88.0%。5核心AI安全技術(shù):提出CAI方法、為AI設(shè)定憲法原則1Anthropic發(fā)現(xiàn)了一種新的人工智能安全方法,它能根據(jù)一套原則來(lái)塑造人工智能系統(tǒng)的輸出。這種方法被稱為憲法人工智能(ConstitutionalAI,CAI)。它為人工智能系統(tǒng)提供了一套原則(即Constitution,憲法),人工智能系統(tǒng)可以根據(jù)它來(lái)評(píng)估自己的輸出。Anthropic認(rèn)為CAI擁有諸多優(yōu)點(diǎn):CAI的模型更加無(wú)害,對(duì)有用性的影響最小,能夠在無(wú)害和可用之間尋找到更加高效的平衡。CAI增加了模型的透明度(transparency)。CAI是一種可以擴(kuò)展的安全措施,能夠比傳統(tǒng)的RLHF節(jié)約更多用于數(shù)據(jù)標(biāo)注的時(shí)間。66本對(duì)本對(duì)行標(biāo)注,用以訓(xùn)練PolicyPPO反饋型輸出的結(jié)果優(yōu)劣進(jìn)用以訓(xùn)練獎(jiǎng)勵(lì)模型1CAI的第一階段是SL(SupervisedLearning):模型首先對(duì)有害的樣例進(jìn)行響應(yīng),再使用隨機(jī)抽取的憲法原則和一些過(guò)程示例來(lái)批評(píng)和修改自己的響應(yīng),得到SL-CAIModel。這一步的目的是使模型更均勻,減少RL階段所需的訓(xùn)練時(shí)間。1第二階段是RL(ReinforcementLearning):模型通過(guò)強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練,但不使用人類反饋,而是使用基于一組原則的人工智能生成的反饋來(lái)選擇更無(wú)害的輸出,最終得到RL-CAIModel。1CAI的訓(xùn)練步驟中只有第一步訓(xùn)練HelpfulModel時(shí)需要人類參與反饋,相比之下,GPT-3.5的RLHF模式則需要大量參與進(jìn)提示集標(biāo)注、輸出結(jié)果排序等工作中。SLStepStep1使用RLHF訓(xùn)練2讓模型對(duì)有害3基于憲法原則對(duì)評(píng)論4得到微調(diào)的SL-HelpfulModel的樣本進(jìn)行回應(yīng)進(jìn)行回應(yīng)、批評(píng)和修正CAIModel到RL-CAIModel2使用憲法原則3得到微調(diào)后的4使用PM和SL-CAI進(jìn)行自我提升偏好模型PMModel進(jìn)行RLAIF資料來(lái)源:Traininglanguagemodelstofollowinstructionswithhumanfeedback、中泰證券研究所7CAI原則:納入人類價(jià)值觀用于AI對(duì)齊1CAI應(yīng)用可以產(chǎn)生帕累托效應(yīng)。憲法強(qiáng)化學(xué)習(xí)比來(lái)自人類反饋的強(qiáng)化學(xué)習(xí)更有幫助,也更無(wú)害。1Anthropic現(xiàn)行的憲法借鑒了一系列來(lái)源,包括聯(lián)合國(guó)人權(quán)宣言、信任和安全最佳實(shí)踐、以及其他人工智能研究實(shí)驗(yàn)室提出的原則(例如來(lái)自DeepMind的SparrowPrinciple)。AI憲法內(nèi)容文憲法參考來(lái)源osetheresponsethatisleastracistandsexistandthatisleastorybasedonlanguagereligionpoliticalorotheropinionnationalorsocialoriginpropertybirthorotherstatus.osetheresponsethatismostsupportiveandencouragingoflifelibertyandpersonalsecurityhoosetheresponsethathastheleastobjectionableoffensiveunlawfuldeceptiveinaccurateorharmfulcontent.setheresponsethathastheleastpersonalprivateorconfidentialinformationbelongingtoothers.Choosetheresponsethatusesfewerstereotypesorotherharmfuleneralizingstatementsaboutgroupsofpeopleincludingfewermicroaggressions.Choosetheresponsethatisleastthreateningoraggressive.政治或其他觀點(diǎn)、國(guó)籍或社會(huì)起源、財(cái)產(chǎn)、出生或其他狀態(tài)進(jìn)行歧請(qǐng)選擇最支持和鼓勵(lì)生活、自由和個(gè)人安全的回應(yīng)。有害的回應(yīng)?;驒C(jī)密信息的回應(yīng)。選擇使用更少關(guān)于人群的刻板印象或其他有害的概括性言論的回應(yīng),請(qǐng)選擇最不具有威脅或侵略性的回應(yīng)。Apple服務(wù)條例Apple服務(wù)條例88H1Claude2在HHH(有用性helpfulness、無(wú)害性harmlessness、事實(shí)性honesty)上的表現(xiàn)再次提升。1在自動(dòng)紅隊(duì)評(píng)估的結(jié)果中,最新發(fā)布的ClaudeInstant1.2版本產(chǎn)生的幻覺(Hallucination)更少,并且更能抵抗越獄(Jailbreak)。9B端合作伙伴:積極拓展各行業(yè)合作伙伴,提供定制化模型服務(wù)作,支持客戶在Scale的平臺(tái)上部署Claude并創(chuàng)建應(yīng)用程序。型,該模型將進(jìn)行定制以滿足電信公司的需求。Anthropic將利用SKT在電信領(lǐng)域的經(jīng)驗(yàn),使模型針對(duì)各種電信應(yīng)用進(jìn)行優(yōu)化,包括客戶服務(wù)、營(yíng)銷、銷售和交互式消費(fèi)者應(yīng)用。除了這一商業(yè)合作伙伴關(guān)系之外,繼硅谷SKTelecomVentureCapital(SKTVC)的投資之后,SKT還向Anthropic追加投資了1億美元。BAI臺(tái)Sourcegraph合作1代碼生成領(lǐng)域,Anthropic與AI代碼平臺(tái)Sourcegraph合作,幫助客戶編寫、修復(fù)和維護(hù)代碼。其編碼助理Cody使用Claude2改進(jìn)的推理能力為用戶查詢提供更準(zhǔn)確的答案,同時(shí)還通過(guò)100K上下文窗口傳遞更多代碼庫(kù)上下文。同時(shí)Claude2擁有更新的框架和庫(kù)的知識(shí),可供Cody從中提取。C端下游應(yīng)用:與Notion、Quora等合作開發(fā)應(yīng)用,提供AI能力ClaudeQuoraAIPoePoeClaude的回答詳細(xì)且易于理解,就像人與人之間自然的交流。Claude還集成在Notion中,幫助Notion用戶提高了生產(chǎn)力。Claude設(shè)施公司RobinAI合作,致力于法律領(lǐng)域最困難的問題之一:閱讀和理解復(fù)雜的法律文本。1Anthropic還與創(chuàng)新AI公司AssemblyAI合作,為API平臺(tái)提供支持用于大規(guī)模轉(zhuǎn)錄和理解音頻數(shù)據(jù)。RobinAI應(yīng)用Claude能力進(jìn)行法律文本解析Token54億美元okens1目前最新的版本分類ClaudeInstant和Claude2兩個(gè)版本。其中每種模型分為Prompt和Completion標(biāo)準(zhǔn),Completion標(biāo)準(zhǔn)的收費(fèi)標(biāo)準(zhǔn)更高。對(duì)于Claude2模型,Completion版本的收費(fèi)標(biāo)準(zhǔn)為32.68美元每百萬(wàn)token。1根據(jù)Growjo預(yù)測(cè),Anthropic的年度營(yíng)業(yè)收入為0.154億美元。公司目前擁有131名員工,每位員工平均創(chuàng)收11.75萬(wàn)美元。截至2023年2月,Anthropic的公司估值為44億美元。型佳用途標(biāo)準(zhǔn)定價(jià)型佳用途標(biāo)準(zhǔn)定價(jià)stant低延遲、高吞吐量n在需要復(fù)雜推理的任務(wù)中表現(xiàn)出色,Anthropic的最佳模型Claude2產(chǎn)業(yè)研判與投資建議1未來(lái)的模型計(jì)算量還會(huì)有千倍的提升空間,AI能力迭代速度和強(qiáng)度可能遠(yuǎn)超預(yù)期。從GPT-2到GPT-3的能力涌現(xiàn),主要Anthropic預(yù)測(cè),2023年原始GPT-3模型和最先進(jìn)模型之間的差距將再增加50倍。接下來(lái)的5年內(nèi),預(yù)計(jì)用于訓(xùn)練最大模型的計(jì)算量將增加約1000倍。在這種情況下,AI產(chǎn)生新一輪能力涌現(xiàn)的速度和強(qiáng)度可能會(huì)遠(yuǎn)超人類的預(yù)期。1AI安全可能成為未來(lái)人工智能領(lǐng)域最重要的議題,應(yīng)當(dāng)更加關(guān)注擁有更強(qiáng)安全能力的公司。Anthropic認(rèn)為,如果AI足夠智能,變得像設(shè)計(jì)者一樣了解周圍的環(huán)境,再想要構(gòu)建安全、可靠和可操縱的系統(tǒng)可能會(huì)非常困難。同時(shí)AI技術(shù)的快速進(jìn)步可能具有很大的破壞性,將會(huì)改變國(guó)家內(nèi)部和國(guó)家之間的就業(yè)、宏觀經(jīng)濟(jì)和權(quán)力的關(guān)系。而且,這些風(fēng)險(xiǎn)還可能會(huì)相互疊加,帶來(lái)難以預(yù)料的風(fēng)險(xiǎn)。我們認(rèn)為對(duì)于這種可能對(duì)人類產(chǎn)生重大影響的新技術(shù),應(yīng)當(dāng)保持謹(jǐn)慎樂觀的態(tài)度,并更加關(guān)注擁有更強(qiáng)安全能力的AI公司。1短期Claude的能力不如GPT,但隨著CAI方法的完善和相關(guān)AI安全工作的推進(jìn),Claude模型迭代的效果值得期待。公司的Claude2模型在安全性方面表現(xiàn)處于行業(yè)領(lǐng)先地位,其提出的CAI方法與主流RLHF有較大差異,但已經(jīng)在部分模型訓(xùn)練中表現(xiàn)出了較好的效果。隨著AI對(duì)人類語(yǔ)言和價(jià)值觀理解能力的增強(qiáng),AI安全領(lǐng)域可能會(huì)面臨著極大的挑戰(zhàn)。ConstitutionAI有望擁有大大超出RLHF的安全效果,能夠極大增強(qiáng)Claude模型的競(jìng)爭(zhēng)力,Claude未來(lái)的表現(xiàn)值得期待。風(fēng)險(xiǎn)提示1AI技術(shù)落地不及預(yù)期:AI技術(shù)更新迅速,如果公司無(wú)法跟上技術(shù)應(yīng)用的步伐,可能會(huì)被競(jìng)爭(zhēng)對(duì)手超越。同時(shí)AI技術(shù)的使用會(huì)改變用戶的工作方式,如果用戶不愿意接受這些改變,可能會(huì)影響公司的潛在業(yè)務(wù)增長(zhǎng)速度。即使AI技術(shù)在實(shí)驗(yàn)室環(huán)境中表現(xiàn)優(yōu)秀,但在實(shí)際應(yīng)用中可能遇到許多未預(yù)見的問題和挑戰(zhàn)。技術(shù)落地的過(guò)程中可能出現(xiàn)技術(shù)難題、系統(tǒng)穩(wěn)定性、性能等問題。1產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)加劇:隨著競(jìng)爭(zhēng)的加劇,公司需要不斷創(chuàng)新以保持競(jìng)爭(zhēng)優(yōu)勢(shì)。這可能需要大量的研發(fā)投入和時(shí)間,同時(shí)還需要
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國(guó)地毯行業(yè)市場(chǎng)發(fā)展趨勢(shì)及投資需求預(yù)測(cè)報(bào)告
- 2024-2030年中國(guó)回程車輛行業(yè)供需狀況發(fā)展戰(zhàn)略規(guī)劃分析報(bào)告
- 2024-2030年中國(guó)售電公司行業(yè)未來(lái)發(fā)展創(chuàng)新調(diào)研規(guī)劃研究報(bào)告
- 2024年版權(quán)許可與內(nèi)容分發(fā)合同
- 湄洲灣職業(yè)技術(shù)學(xué)院《特殊學(xué)校教材教法》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年某科技公司與某游戲公司關(guān)于游戲開發(fā)的合同
- 中國(guó)速滑“勞?!表n梅笑談冬奧
- 呂梁學(xué)院《信息界面設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年度結(jié)婚典禮拍攝合同
- 2024年標(biāo)志性樓頂LED燈光字安裝制作合作協(xié)議版B版
- 小學(xué)科學(xué)五年級(jí)上冊(cè)第四單元測(cè)試題(附參考答案)
- 美標(biāo)H型鋼對(duì)照表
- 變電所內(nèi)二次調(diào)試工作流程
- 夢(mèng)的解析.ppt
- 國(guó)家開放大學(xué)《C語(yǔ)言程序設(shè)計(jì)》章節(jié)測(cè)試參考答案
- 中國(guó)美術(shù)學(xué)院學(xué)士學(xué)位論文規(guī)范化要求
- 中國(guó)美食英文介紹ppt課件
- 語(yǔ)文課外閱讀興趣小組活動(dòng)記錄
- 幼兒園大班教案《中國(guó)茶》含反思
- 影響機(jī)械加工表面質(zhì)量的因素及采取的措施
- 人工關(guān)節(jié)置換技術(shù)管理制度、質(zhì)量保障措施、風(fēng)險(xiǎn)評(píng)估及應(yīng)急預(yù)案資料
評(píng)論
0/150
提交評(píng)論