計(jì)算機(jī)：Anthropic：專注研發(fā)安全可靠的AGI對(duì)標(biāo)ChatGPT推出Claude

上傳人：策*** IP屬地：山西上傳時(shí)間：2023-09-02 格式：DOCX 頁(yè)數(shù)：33 大?。?.62MB 積分：20 舉報(bào) 版權(quán)申訴

計(jì)算機(jī)：Anthropic：專注研發(fā)安全可靠的AGI對(duì)標(biāo)ChatGPT推出Claude_第2頁(yè)

計(jì)算機(jī)：Anthropic：專注研發(fā)安全可靠的AGI對(duì)標(biāo)ChatGPT推出Claude_第3頁(yè)

計(jì)算機(jī)：Anthropic：專注研發(fā)安全可靠的AGI對(duì)標(biāo)ChatGPT推出Claude_第4頁(yè)

計(jì)算機(jī)：Anthropic：專注研發(fā)安全可靠的AGI對(duì)標(biāo)ChatGPT推出Claude_第5頁(yè)

已閱讀5頁(yè)，還剩28頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

信|證券研究報(bào)告|ChatGPT推出Claude22023.8.29：聞學(xué)臣1Anthropic認(rèn)為人工智能有潛力從根本上改變世界的運(yùn)作方式。他們致力于構(gòu)建人們可以依賴的系統(tǒng)，并開展有關(guān)人工智能機(jī)遇和風(fēng)險(xiǎn)的研究。其使命是確保變革性人工智能(TransformativeAI，TAI)幫助人們和社會(huì)繁榮發(fā)展。公司通過(guò)構(gòu)建前沿系統(tǒng)、研究其行為、努力負(fù)責(zé)任地部署AI以及定期分享安全方面的見解來(lái)追求他們的使命。21Anthropic的創(chuàng)始團(tuán)隊(duì)成員均擁有很強(qiáng)的技術(shù)實(shí)力和學(xué)術(shù)研究能力：1Anthropic的創(chuàng)始人兼CEO是DarioAmodei，曾擔(dān)任OpenAI的AI安全團(tuán)隊(duì)經(jīng)理，引領(lǐng)過(guò)GPT-2和GPT-3的開發(fā)，并為OpenAI撰寫了公司的研究方向和計(jì)劃，是OpenAI研究團(tuán)隊(duì)的副總裁。Anthropic的聯(lián)合創(chuàng)始人兼總裁DanielaAmodei是Dario的妹妹，也曾在OpenAI安全團(tuán)隊(duì)任職。在此之前，她也在Stripe任職超過(guò)五年。Anthropic曾在OpenAI等機(jī)構(gòu)任職。TomBrown領(lǐng)導(dǎo)了GPT-3工程團(tuán)隊(duì)，也曾在GoogleBrain技術(shù)團(tuán)隊(duì)工作(GoogleBrain也是提出Transformer算法架構(gòu)的團(tuán)隊(duì))；SamMcCandlish在OpenAI建立并引領(lǐng)了研究ScalingLaw的團(tuán)隊(duì)，并參與了GPT-3的開發(fā)工作；JackClark曾任OpenAI的政策總監(jiān)；JaredKaplan是約翰霍普金斯大學(xué)教授，也曾兼任OpenAI研究咨詢工作。3融資額1.6B，Google、SparkCapital領(lǐng)投又進(jìn)行了五輪融資，總共募集資金約16億美元。1其中，公司在2022年8月完成的B輪融資由量化交易公司AlamedaResearch及知名加密貨幣交易所FTX創(chuàng)始人SamBankman-Frid領(lǐng)投。隨后完成的融資分別由Google和星火資本(SparkCapital)領(lǐng)投。投投JaanTallinnSeriesBmanFriedorateRoundriesC450MtalorateRound2023年8月CorporateRound4AI大模型對(duì)話產(chǎn)品Claude：支持100k超長(zhǎng)上下文輸入，各項(xiàng)能力均突出12023年5月，Anthropic宣布更新聊天助手Claude2，能夠支持文件輸入、代碼解析等功能。語(yǔ)言方面目前只支持英文對(duì)話，但能夠提供使用Google翻譯后生成的中文回答。.5%，高于Claude1.3的73.0%。與申請(qǐng)研究生院的大學(xué)生相比，Claude2在GRE閱讀和寫作考試中的得分高于90%，在定量推理方面與申請(qǐng)者的中位數(shù)相似。Claude2在Python編碼測(cè)試CodexHumanEval上的得分比56.0%提高了71.2%。在GSM8k(大量小學(xué)數(shù)學(xué)題)評(píng)測(cè)上，Claude2的得分從85.2%上升到88.0%。5核心AI安全技術(shù)：提出CAI方法、為AI設(shè)定憲法原則1Anthropic發(fā)現(xiàn)了一種新的人工智能安全方法，它能根據(jù)一套原則來(lái)塑造人工智能系統(tǒng)的輸出。這種方法被稱為憲法人工智能(ConstitutionalAI，CAI)。它為人工智能系統(tǒng)提供了一套原則(即Constitution，憲法)，人工智能系統(tǒng)可以根據(jù)它來(lái)評(píng)估自己的輸出。Anthropic認(rèn)為CAI擁有諸多優(yōu)點(diǎn)：CAI的模型更加無(wú)害，對(duì)有用性的影響最小，能夠在無(wú)害和可用之間尋找到更加高效的平衡。CAI增加了模型的透明度(transparency)。CAI是一種可以擴(kuò)展的安全措施，能夠比傳統(tǒng)的RLHF節(jié)約更多用于數(shù)據(jù)標(biāo)注的時(shí)間。66本對(duì)本對(duì)行標(biāo)注，用以訓(xùn)練PolicyPPO反饋型輸出的結(jié)果優(yōu)劣進(jìn)用以訓(xùn)練獎(jiǎng)勵(lì)模型1CAI的第一階段是SL(SupervisedLearning)：模型首先對(duì)有害的樣例進(jìn)行響應(yīng)，再使用隨機(jī)抽取的憲法原則和一些過(guò)程示例來(lái)批評(píng)和修改自己的響應(yīng)，得到SL-CAIModel。這一步的目的是使模型更均勻，減少RL階段所需的訓(xùn)練時(shí)間。1第二階段是RL(ReinforcementLearning)：模型通過(guò)強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練，但不使用人類反饋，而是使用基于一組原則的人工智能生成的反饋來(lái)選擇更無(wú)害的輸出，最終得到RL-CAIModel。1CAI的訓(xùn)練步驟中只有第一步訓(xùn)練HelpfulModel時(shí)需要人類參與反饋，相比之下，GPT-3.5的RLHF模式則需要大量參與進(jìn)提示集標(biāo)注、輸出結(jié)果排序等工作中。SLStepStep1使用RLHF訓(xùn)練2讓模型對(duì)有害3基于憲法原則對(duì)評(píng)論4得到微調(diào)的SL-HelpfulModel的樣本進(jìn)行回應(yīng)進(jìn)行回應(yīng)、批評(píng)和修正CAIModel到RL-CAIModel2使用憲法原則3得到微調(diào)后的4使用PM和SL-CAI進(jìn)行自我提升偏好模型PMModel進(jìn)行RLAIF資料來(lái)源：Traininglanguagemodelstofollowinstructionswithhumanfeedback、中泰證券研究所7CAI原則：納入人類價(jià)值觀用于AI對(duì)齊1CAI應(yīng)用可以產(chǎn)生帕累托效應(yīng)。憲法強(qiáng)化學(xué)習(xí)比來(lái)自人類反饋的強(qiáng)化學(xué)習(xí)更有幫助，也更無(wú)害。1Anthropic現(xiàn)行的憲法借鑒了一系列來(lái)源，包括聯(lián)合國(guó)人權(quán)宣言、信任和安全最佳實(shí)踐、以及其他人工智能研究實(shí)驗(yàn)室提出的原則(例如來(lái)自DeepMind的SparrowPrinciple)。AI憲法內(nèi)容文憲法參考來(lái)源osetheresponsethatisleastracistandsexistandthatisleastorybasedonlanguagereligionpoliticalorotheropinionnationalorsocialoriginpropertybirthorotherstatus.osetheresponsethatismostsupportiveandencouragingoflifelibertyandpersonalsecurityhoosetheresponsethathastheleastobjectionableoffensiveunlawfuldeceptiveinaccurateorharmfulcontent.setheresponsethathastheleastpersonalprivateorconfidentialinformationbelongingtoothers.Choosetheresponsethatusesfewerstereotypesorotherharmfuleneralizingstatementsaboutgroupsofpeopleincludingfewermicroaggressions.Choosetheresponsethatisleastthreateningoraggressive.政治或其他觀點(diǎn)、國(guó)籍或社會(huì)起源、財(cái)產(chǎn)、出生或其他狀態(tài)進(jìn)行歧請(qǐng)選擇最支持和鼓勵(lì)生活、自由和個(gè)人安全的回應(yīng)。有害的回應(yīng)?；驒C(jī)密信息的回應(yīng)。選擇使用更少關(guān)于人群的刻板印象或其他有害的概括性言論的回應(yīng)，請(qǐng)選擇最不具有威脅或侵略性的回應(yīng)。Apple服務(wù)條例Apple服務(wù)條例88H1Claude2在HHH(有用性helpfulness、無(wú)害性harmlessness、事實(shí)性honesty)上的表現(xiàn)再次提升。1在自動(dòng)紅隊(duì)評(píng)估的結(jié)果中，最新發(fā)布的ClaudeInstant1.2版本產(chǎn)生的幻覺(Hallucination)更少，并且更能抵抗越獄(Jailbreak)。9B端合作伙伴：積極拓展各行業(yè)合作伙伴，提供定制化模型服務(wù)作，支持客戶在Scale的平臺(tái)上部署Claude并創(chuàng)建應(yīng)用程序。型，該模型將進(jìn)行定制以滿足電信公司的需求。Anthropic將利用SKT在電信領(lǐng)域的經(jīng)驗(yàn)，使模型針對(duì)各種電信應(yīng)用進(jìn)行優(yōu)化，包括客戶服務(wù)、營(yíng)銷、銷售和交互式消費(fèi)者應(yīng)用。除了這一商業(yè)合作伙伴關(guān)系之外，繼硅谷SKTelecomVentureCapital(SKTVC)的投資之后，SKT還向Anthropic追加投資了1億美元。BAI臺(tái)Sourcegraph合作1代碼生成領(lǐng)域，Anthropic與AI代碼平臺(tái)Sourcegraph合作，幫助客戶編寫、修復(fù)和維護(hù)代碼。其編碼助理Cody使用Claude2改進(jìn)的推理能力為用戶查詢提供更準(zhǔn)確的答案，同時(shí)還通過(guò)100K上下文窗口傳遞更多代碼庫(kù)上下文。同時(shí)Claude2擁有更新的框架和庫(kù)的知識(shí)，可供Cody從中提取。C端下游應(yīng)用：與Notion、Quora等合作開發(fā)應(yīng)用，提供AI能力ClaudeQuoraAIPoePoeClaude的回答詳細(xì)且易于理解，就像人與人之間自然的交流。Claude還集成在Notion中，幫助Notion用戶提高了生產(chǎn)力。Claude設(shè)施公司RobinAI合作，致力于法律領(lǐng)域最困難的問題之一：閱讀和理解復(fù)雜的法律文本。1Anthropic還與創(chuàng)新AI公司AssemblyAI合作，為API平臺(tái)提供支持用于大規(guī)模轉(zhuǎn)錄和理解音頻數(shù)據(jù)。RobinAI應(yīng)用Claude能力進(jìn)行法律文本解析Token54億美元okens1目前最新的版本分類ClaudeInstant和Claude2兩個(gè)版本。其中每種模型分為Prompt和Completion標(biāo)準(zhǔn)，Completion標(biāo)準(zhǔn)的收費(fèi)標(biāo)準(zhǔn)更高。對(duì)于Claude2模型，Completion版本的收費(fèi)標(biāo)準(zhǔn)為32.68美元每百萬(wàn)token。1根據(jù)Growjo預(yù)測(cè)，Anthropic的年度營(yíng)業(yè)收入為0.154億美元。公司目前擁有131名員工，每位員工平均創(chuàng)收11.75萬(wàn)美元。截至2023年2月，Anthropic的公司估值為44億美元。型佳用途標(biāo)準(zhǔn)定價(jià)型佳用途標(biāo)準(zhǔn)定價(jià)stant低延遲、高吞吐量n在需要復(fù)雜推理的任務(wù)中表現(xiàn)出色，Anthropic的最佳模型Claude2產(chǎn)業(yè)研判與投資建議1未來(lái)的模型計(jì)算量還會(huì)有千倍的提升空間，AI能力迭代速度和強(qiáng)度可能遠(yuǎn)超預(yù)期。從GPT-2到GPT-3的能力涌現(xiàn)，主要Anthropic預(yù)測(cè)，2023年原始GPT-3模型和最先進(jìn)模型之間的差距將再增加50倍。接下來(lái)的5年內(nèi)，預(yù)計(jì)用于訓(xùn)練最大模型的計(jì)算量將增加約1000倍。在這種情況下，AI產(chǎn)生新一輪能力涌現(xiàn)的速度和強(qiáng)度可能會(huì)遠(yuǎn)超人類的預(yù)期。1AI安全可能成為未來(lái)人工智能領(lǐng)域最重要的議題，應(yīng)當(dāng)更加關(guān)注擁有更強(qiáng)安全能力的公司。Anthropic認(rèn)為，如果AI足夠智能，變得像設(shè)計(jì)者一樣了解周圍的環(huán)境，再想要構(gòu)建安全、可靠和可操縱的系統(tǒng)可能會(huì)非常困難。同時(shí)AI技術(shù)的快速進(jìn)步可能具有很大的破壞性，將會(huì)改變國(guó)家內(nèi)部和國(guó)家之間的就業(yè)、宏觀經(jīng)濟(jì)和權(quán)力的關(guān)系。而且，這些風(fēng)險(xiǎn)還可能會(huì)相互疊加，帶來(lái)難以預(yù)料的風(fēng)險(xiǎn)。我們認(rèn)為對(duì)于這種可能對(duì)人類產(chǎn)生重大影響的新技術(shù)，應(yīng)當(dāng)保持謹(jǐn)慎樂觀的態(tài)度，并更加關(guān)注擁有更強(qiáng)安全能力的AI公司。1短期Claude的能力不如GPT，但隨著CAI方法的完善和相關(guān)AI安全工作的推進(jìn)，Claude模型迭代的效果值得期待。公司的Claude2模型在安全性方面表現(xiàn)處于行業(yè)領(lǐng)先地位，其提出的CAI方法與主流RLHF有較大差異，但已經(jīng)在部分模型訓(xùn)練中表現(xiàn)出了較好的效果。隨著AI對(duì)人類語(yǔ)言和價(jià)值觀理解能力的增強(qiáng)，AI安全領(lǐng)域可能會(huì)面臨著極大的挑戰(zhàn)。ConstitutionAI有望擁有大大超出RLHF的安全效果，能夠極大增強(qiáng)Claude模型的競(jìng)爭(zhēng)力，Claude未來(lái)的表現(xiàn)值得期待。風(fēng)險(xiǎn)提示1AI技術(shù)落地不及預(yù)期：AI技術(shù)更新迅速，如果公司無(wú)法跟上技術(shù)應(yīng)用的步伐，可能會(huì)被競(jìng)爭(zhēng)對(duì)手超越。同時(shí)AI技術(shù)的使用會(huì)改變用戶的工作方式，如果用戶不愿意接受這些改變，可能會(huì)影響公司的潛在業(yè)務(wù)增長(zhǎng)速度。即使AI技術(shù)在實(shí)驗(yàn)室環(huán)境中表現(xiàn)優(yōu)秀，但在實(shí)際應(yīng)用中可能遇到許多未預(yù)見的問題和挑戰(zhàn)。技術(shù)落地的過(guò)程中可能出現(xiàn)技術(shù)難題、系統(tǒng)穩(wěn)定性、性能等問題。1產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)加劇：隨著競(jìng)爭(zhēng)的加劇，公司需要不斷創(chuàng)新以保持競(jìng)爭(zhēng)優(yōu)勢(shì)。這可能需要大量的研發(fā)投入和時(shí)間，同時(shí)還需要

人人文庫(kù)> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

計(jì)算機(jī)：Anthropic：專注研發(fā)安全可靠的AGI對(duì)標(biāo)ChatGPT推出Claude

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔