AIGC發(fā)展研究資料2.0-清華大學(xué)-2024.1_第1頁
AIGC發(fā)展研究資料2.0-清華大學(xué)-2024.1_第2頁
AIGC發(fā)展研究資料2.0-清華大學(xué)-2024.1_第3頁
AIGC發(fā)展研究資料2.0-清華大學(xué)-2024.1_第4頁
AIGC發(fā)展研究資料2.0-清華大學(xué)-2024.1_第5頁
已閱讀5頁,還剩205頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

AIGC發(fā)展研究資料(2.0版修訂號0.90)清華大學(xué)新聞與傳播學(xué)院元宇宙文化實(shí)驗(yàn)室@新媒沈陽團(tuán)隊(duì)

AIGC2024年1月(Sora發(fā)布之前)(本報(bào)告部分內(nèi)容由AI生成,如有錯(cuò)誤,告知修改)AIGC系列研究資料聚焦AIGC產(chǎn)業(yè)發(fā)展現(xiàn)狀及趨勢,分技術(shù)篇、產(chǎn)業(yè)篇、評測篇、職業(yè)篇、風(fēng)險(xiǎn)篇、哲理篇、未來篇,是產(chǎn)業(yè)發(fā)展的概觀性報(bào)告,也初步回應(yīng)了突出的風(fēng)險(xiǎn)隱憂,旨在洞察行業(yè)的基礎(chǔ)上,對AIGC發(fā)展趨勢進(jìn)行科學(xué)預(yù)測與展望,為社會各界應(yīng)對AIGC領(lǐng)域的挑戰(zhàn)提供了理論指導(dǎo)與實(shí)踐建議。AIGC報(bào)告1.0報(bào)告80%內(nèi)容由AI自動生成,聚焦AIGC的多模態(tài)發(fā)展、多學(xué)科影響、全方位應(yīng)用以及前沿探索,融匯了與AIGC相關(guān)的產(chǎn)業(yè)實(shí)踐經(jīng)驗(yàn)、學(xué)術(shù)研究探討與社會理念摸索,致力于向讀者提供全面了解AIGC動態(tài)的指南,共同探尋人工智能和人類未來發(fā)展的和諧之道。AIGC報(bào)告2.0注

報(bào)

內(nèi)

例技術(shù)與演進(jìn)為什么是OpenAI率先突破2017年6月,谷歌大腦團(tuán)隊(duì)發(fā)表論文《Attention

is

all

you

need》,首次提出了基于自注意力機(jī)制的Transformer模型,并首次將其用于自然語言處理。WHY——OpenAI

&

ChatGPT前瞻性AI視野多樣應(yīng)用探索強(qiáng)大技術(shù)實(shí)力長期研究投入u

2018年10月,提出3億參數(shù)的BERTu

2019年10月,提出110億參數(shù)的新預(yù)訓(xùn)練模型-T5u

2021年1月,推出1.6萬億參數(shù)的Switch

Transformeru

2021年5月,發(fā)布1370億參數(shù)的LaMDA人性化AI愿景正確合作對象……u

2018年6月,推出1.17億參數(shù)的GPT-1模型u

2019年2月,推出15億參數(shù)的GPT-2u

堅(jiān)定的科技信仰:堅(jiān)持不斷改進(jìn)GPTu

開放的合作伙伴:與微軟達(dá)成合作u

較少的商業(yè)顧慮:聲譽(yù)成本、利益沖突u

2020年5月,發(fā)布了1750億參數(shù)的GPT-3u

2022年3月,InstructGPT發(fā)布,回答更加真實(shí)u

2022年11月,ChatGPT發(fā)布,并率先破圈ChatGPT

創(chuàng)新:持續(xù)迭代

邁向AGI已實(shí)現(xiàn)的創(chuàng)新尚未實(shí)現(xiàn)的創(chuàng)新自然語言處理(NLP)的進(jìn)步高級情感智能ChatGPT在理解和生成自然語言方面表現(xiàn)出色,展示了先進(jìn)的自然語言理解和生成能力。雖然具備基本的情感識別能力,但在理解和表達(dá)復(fù)雜情感方面仍有局限。上下文感知對話管理深層次常識推理在復(fù)雜的常識推理和深入邏輯分析方面的表現(xiàn)仍有提升空間。能夠在一定程度上理解和記憶對話歷史,實(shí)現(xiàn)上下文順暢的交流??珙I(lǐng)域知識應(yīng)用無偏見輸出由于訓(xùn)練數(shù)據(jù)的限制,模型輸出可能受到數(shù)據(jù)、技術(shù)等偏見集成了廣泛的領(lǐng)域知識,可以在多種主題上進(jìn)行交流和生成信息。的影響。由于人類的偏見,故AI其實(shí)也無法實(shí)現(xiàn)完全的無偏見用戶意圖識別與適應(yīng)性回應(yīng)具備識別用戶意圖并據(jù)此調(diào)整回答的能力,能夠根據(jù)不同的查詢提供相應(yīng)的信息和服務(wù)。長期記憶和持續(xù)學(xué)習(xí)長期記憶和對過去交互的連續(xù)學(xué)習(xí)能力是目前AI領(lǐng)域的挑戰(zhàn)之一。(2024年2月GPT4.0已大幅度增強(qiáng))多模態(tài)交互能力集成并理解多種類型的數(shù)據(jù)(如文本、圖像、聲音)進(jìn)行綜合交互。GPT4:一騎絕塵

進(jìn)化迅速ChatGPT4.0相較于其他AI工具有若干顯著的改進(jìn)和創(chuàng)新點(diǎn),使其成為一個(gè)更加強(qiáng)大、靈活和用戶友好的工具,達(dá)到目前其余AI工具難以企及的效果?;纠斫馊康膯栴}含義上下文的邏輯關(guān)聯(lián)能力回答問題的增量創(chuàng)新和組合創(chuàng)新能力AI幻覺&AI想象擴(kuò)展了異感世界的構(gòu)建能力多模態(tài)能力學(xué)科能力的全維、全知、全量OpenAI宮斗:利益沖擊

觀念博弈OpenAI的“宮斗”最終以奧特曼的回歸落幕,觀念博弈縱觀全局既是權(quán)利之爭也是觀念博弈?!凹铀倥伞焙汀澳┤照撆伞痹谌祟惻cAI的關(guān)系上的分歧?!凹铀倥伞保合Mㄟ^最高效、最具影響力的技術(shù)進(jìn)步與突破來加速社會、經(jīng)濟(jì)或技術(shù)系統(tǒng)的變革過程,并把風(fēng)險(xiǎn)視為變革的催化劑。11月16日:蘇茨克維通知奧特曼開會。11月17日:奧特曼、布羅克曼和OpenAI高級研究員相繼離職?!澳┤照撆伞保焊訉徤?,認(rèn)為一旦風(fēng)險(xiǎn)不可控,人工智能帶來的巨大影響將毀滅人類社會。11月18日:投資者憤怒并要求奧特曼回歸,董事會初步同意。事件核心人物11月19日:奧特曼等加入微軟,近750名OpenAI員工威脅集體辭職,要求奧特曼回歸。u

OpenAI聯(lián)合創(chuàng)始人、前CEO山姆·奧特曼(Sam

Altman)u

OpenAI聯(lián)合創(chuàng)始人、前總裁格雷格·布羅克曼

(GregBrockman)11月20日:奧特曼、布羅克曼與OpenAI董事會談判,微軟對奧特曼的回歸持開放態(tài)度。u

OpenAI聯(lián)合創(chuàng)始人、首席科學(xué)家伊爾亞·蘇茨克維(IlyaSutskever)11月21日:奧特曼與臨時(shí)首席執(zhí)行官進(jìn)行談判,公司希望在感恩節(jié)前解決領(lǐng)導(dǎo)層問題。內(nèi)部沖突細(xì)節(jié)曝光。u

OpenAI首席技術(shù)官米拉·穆拉蒂

(Mira

Murati

)u

微軟公司首席執(zhí)行官薩提亞·納德拉(Satya

Nadella)u

OpenAI臨時(shí)首席執(zhí)行官埃米特·謝爾(Emmett

Shear)結(jié)局:奧特曼達(dá)成原則上協(xié)議,將重返OpenAI擔(dān)任CEO,并組建新的董事會。2024焦點(diǎn):改善體驗(yàn)

多模突破五大技術(shù)難題:高性能推理硬件成本、AI幻覺率、圖像多語種文字生成、生成內(nèi)容一致性、文本生成視頻高性能推理硬件成本AI幻覺率復(fù)雜模型的推理過程需要高性能計(jì)算資源,涉及昂貴的硬件和高能耗,限制了AI系統(tǒng)與用戶的的快速交互。提高模型的準(zhǔn)確性和可靠性,減少幻覺現(xiàn)象是拓展其應(yīng)用的基礎(chǔ),對于提供質(zhì)量更高、更可信賴的生成內(nèi)容至關(guān)重要。圖像多語種文字生成生成內(nèi)容一致性目前仍難以實(shí)現(xiàn)在圖像生成中準(zhǔn)確繪制除英文以外的其他語言(如中文),文生圖技術(shù)中的文本處理技術(shù)有待優(yōu)化。保持生成內(nèi)容的整體風(fēng)格、語境、樣式等特征的一致性(如連環(huán)畫的角色穩(wěn)定),仍是AIGC領(lǐng)域的重要挑戰(zhàn)。文本生成視頻文生視頻技術(shù)對場景、動作和情感等的深度理解和創(chuàng)造發(fā)展迅速,但仍難以生成完備(如任意時(shí)長)且可控(如任意動作)的視頻,無法滿足用戶需求。自注意力:動態(tài)聚焦

平衡權(quán)重u

用戶:我昨天晚上去了一個(gè)音樂會,主要是為了看我最喜歡的樂隊(duì),但是開場樂隊(duì)也非常棒。自注意力機(jī)制幫助AI關(guān)注到用戶最關(guān)心的問題。u

AI注意到用戶提到了關(guān)鍵信息點(diǎn)“最喜歡的樂隊(duì)”,機(jī)器人據(jù)此詢問了更多的細(xì)節(jié)。u

AI:聽起來你過得很愉快。你最喜歡的樂隊(duì)演奏了哪首歌人機(jī)交互自注意力機(jī)制體現(xiàn)對話曲給你留下了深刻印象?u

用戶:他們演奏了《深夜》,那是他們最新的單曲,非常激動人心。不過,我也很驚訝于開場樂隊(duì)的表現(xiàn)。u

AI注意到用戶對“開場樂隊(duì)”的正面評價(jià),機(jī)器人隨后詢問了更多關(guān)于開場樂隊(duì)的信息。u

AI:是啊,《深夜》是一首很有力量的歌曲。關(guān)于開場樂隊(duì),你最喜歡他們的哪個(gè)部分?u

自注意力機(jī)制為每一個(gè)關(guān)鍵信息分配一個(gè)“注意力權(quán)重”。u

生成圖像時(shí),根據(jù)權(quán)重來確定每個(gè)部分的細(xì)節(jié)和重要性。u

用戶描述:“我想要一個(gè)穿著紅色連衣裙的女人站在一個(gè)藍(lán)色的湖邊,背景是雪山?!痹撁枋鲋杏腥齻€(gè)關(guān)鍵信息:紅色連衣裙的女人、藍(lán)色的湖、雪山背景。繪畫u

例如,紅色連衣裙的女人可能會被賦予較高的注意力權(quán)重,因此在圖像中她的細(xì)節(jié)和顏色可能會被更加準(zhǔn)確地渲染。u

同樣,藍(lán)色的湖和雪山背景也會根據(jù)它們的注意力權(quán)重來確定其在圖像中的表現(xiàn)。世界模型:另一可能

規(guī)劃推理——圖靈獎得主

Yann

LeCun世界模型可能帶來?“世界模型”

指的是一個(gè)能夠模擬和理解其周圍環(huán)境的計(jì)算模型,試圖通過感知輸入(如視覺圖像、聲音等)來構(gòu)建對環(huán)境的內(nèi)部表示,并在此基礎(chǔ)上做出決策或預(yù)測。u

提升自主學(xué)習(xí)能力:不再依賴于大量的手工標(biāo)注數(shù)據(jù),而是通過觀察世界如何運(yùn)作來自主學(xué)習(xí),這會極大地提高機(jī)器學(xué)習(xí)系統(tǒng)的效率和適應(yīng)性。u

提升認(rèn)知能力:

隨著機(jī)器對復(fù)雜環(huán)境和抽象概念理解的加深,世界模型可以推動AI在需要高級認(rèn)知能力的領(lǐng)域的應(yīng)用,如法律分析、財(cái)務(wù)規(guī)劃等。Joint

Embedding

Predictive

Architecture自回歸模型沒有規(guī)劃、(JEPA)推理的能力,單純根據(jù)【學(xué)習(xí)方法】:自監(jiān)督學(xué)習(xí),通過創(chuàng)建外部世界概率生成自回歸的大語的內(nèi)部模型來學(xué)習(xí)言模型從本質(zhì)上根本解決不了幻覺、錯(cuò)誤的問題。世界模型才是正確答案。【模型目標(biāo)】:實(shí)現(xiàn)更高級的圖像分析和理解,理解外部世界的內(nèi)部模型u

提升決策和預(yù)測能力:世界模型可以在動態(tài)和不確定的環(huán)境中更好地預(yù)測未來的事件和結(jié)果,對于自動駕駛車輛的路徑規(guī)劃、金融市場分析等領(lǐng)域有重要意義。【核心技術(shù)】:圖像聯(lián)合嵌入非生成式預(yù)測架構(gòu),學(xué)習(xí)表示的層次結(jié)構(gòu)【應(yīng)用領(lǐng)域】:圖像分析和理解類任務(wù)單模多模:快速進(jìn)步

模擬世界屬性單模態(tài)多模態(tài)理論問題未來研究數(shù)據(jù)豐富性單一信息源多信息源高效地從單一信息源提取特征發(fā)現(xiàn)并利用跨模態(tài)間的隱含關(guān)系單一模態(tài)的數(shù)據(jù)質(zhì)量可能會影響整體性能可以通過其他模態(tài)補(bǔ)償某個(gè)模態(tài)的不足魯棒性提高單一模態(tài)的抗干擾能力優(yōu)化單模態(tài)的決策策略確保多模態(tài)數(shù)據(jù)的一致性和完整性權(quán)衡并結(jié)合不同模態(tài)的決策有效融合和處理多模態(tài)數(shù)據(jù)識別和處理跨模態(tài)的信息冗余決策準(zhǔn)確性決策基于單一信息源綜合各種信息決策更為準(zhǔn)確可能受限處理復(fù)雜性需要處理和融合各種模態(tài)的處理流程相對簡單優(yōu)化單一模態(tài)的處理流程消除單一信息源中的冗余數(shù)據(jù)復(fù)雜性增加無法從其他模態(tài)中可能從不同模態(tài)中獲取重復(fù)冗余的信息信息冗余獲取冗余信息上下文理解上下文理解可能受限于單一信息源能夠結(jié)合多種信息更好地理解上下文提高單一模態(tài)的上下文理解能力

結(jié)合多模態(tài)信息進(jìn)行深度上下文理解從有限的特征中獲取最多的信息

管理和選擇跨模態(tài)的高維特征由于融合了多種信息源特征維度可能會更高特征維度可解釋性數(shù)據(jù)同步特征維度相對較低由于只有一個(gè)信息源多種信息源的融合可能會降低模型的可解釋性增強(qiáng)單一模態(tài)的模型解釋能力

提高多模態(tài)模型的可解釋性和透明度優(yōu)化單一模態(tài)的數(shù)據(jù)處理速度

確保不同模態(tài)數(shù)據(jù)的實(shí)時(shí)同步和對齊可能更易于解釋不需要考慮不同模態(tài)之間的同步問題需要確保不同模態(tài)的數(shù)據(jù)是同步的需要更多的計(jì)算資源處理和融合多種模態(tài)數(shù)據(jù)計(jì)算資源

計(jì)算資源需求相對較低提高單模態(tài)的計(jì)算效率優(yōu)化多模態(tài)的計(jì)算資源分配和管理多模融合:高維互聯(lián)

信息貫通多模態(tài)融合是指將來自多個(gè)不同類型(例如文本、圖像、聲音等)的數(shù)據(jù)合并,利用跨模態(tài)技術(shù)產(chǎn)生一個(gè)綜合的數(shù)據(jù)表示或輸出,代表一種全新、流暢和高效的人類交互體驗(yàn),其核心挑戰(zhàn)是如何有效地融合這些模式以提供連貫和有意義的輸出。在實(shí)際應(yīng)用中,AI可以根據(jù)用戶的需求,實(shí)現(xiàn)各個(gè)模態(tài)數(shù)據(jù)間的相互轉(zhuǎn)換,例如:文本生成圖像文本生成視頻圖像生成視頻圖像理解視頻理解夏日的海灘日落圖海底世界靜態(tài)轉(zhuǎn)為動態(tài)地標(biāo)識別足球解說多模關(guān)鍵:意圖感知

自我演化關(guān)鍵技術(shù)難點(diǎn)可能的突破方向u

自適應(yīng)模態(tài)選擇與優(yōu)化:u

環(huán)境動態(tài)性:環(huán)境和任務(wù)需求經(jīng)常變化,u

意圖感知的模態(tài)選擇:搭載“意圖解析引擎”,能從多模態(tài)數(shù)據(jù)中抽取和理解用戶或系統(tǒng)深層次的意圖,并據(jù)此進(jìn)行選擇。在多模態(tài)系統(tǒng)中,不同模態(tài)(如圖像、文本、聲實(shí)時(shí)評估和選擇最優(yōu)模態(tài)是一個(gè)復(fù)雜的問題。音等)的重要性可能因應(yīng)用場景而異。自適應(yīng)模

u

高維度和復(fù)雜性:模態(tài)選擇必須在多個(gè)維態(tài)選擇與優(yōu)化,關(guān)注如何動態(tài)地評估和選擇最有用的模態(tài),以提高系統(tǒng)的整體性能。度(如準(zhǔn)確性、計(jì)算成本、響應(yīng)時(shí)間等)上進(jìn)行優(yōu)化,這增加了問題的復(fù)雜性。u

時(shí)間-空間-模態(tài)聯(lián)合優(yōu)化:開發(fā)全新的“多維度優(yōu)化框架”,能夠在多個(gè)維度上動態(tài)調(diào)整和優(yōu)化資源,如減少時(shí)間延遲,選擇最優(yōu)數(shù)據(jù)來源地和最有用模態(tài)維度。u

實(shí)時(shí)多模態(tài)處理與決策:u

實(shí)時(shí)性與準(zhǔn)確性的權(quán)衡:在有限的時(shí)間內(nèi)強(qiáng)調(diào)如何在實(shí)時(shí)或近實(shí)時(shí)環(huán)境中處理和分析多模態(tài)數(shù)據(jù),并據(jù)此做出決策。進(jìn)行復(fù)雜的多模態(tài)數(shù)據(jù)分析是一個(gè)挑戰(zhàn)。u

數(shù)據(jù)同步:在實(shí)時(shí)環(huán)境中,來自不同模態(tài)的數(shù)據(jù)需要準(zhǔn)確地同步,以便進(jìn)行有效的分析和決策。u

自我演化的交互模式:引入一種全新的“演化算法”,能夠模擬人類學(xué)習(xí)和適應(yīng)的過程,使HCI系統(tǒng)在識別用戶行為模式的同時(shí),還能發(fā)現(xiàn)隱藏的需求或習(xí)慣,并根據(jù)這些信息進(jìn)行自我演化。u

人機(jī)交互的多模態(tài)適應(yīng):u

用戶多樣性:由于用戶的需求和習(xí)慣都是獨(dú)特的,實(shí)現(xiàn)個(gè)性化的多模態(tài)適應(yīng)性是一個(gè)復(fù)雜的問題。在人機(jī)交互(HCI)環(huán)境中,多模態(tài)大模型需要能夠根據(jù)用戶的行為和反饋進(jìn)行自適應(yīng)調(diào)整。這可能包括動態(tài)地改變輸入/輸出模態(tài)、調(diào)整交互界

u

實(shí)時(shí)反饋:獲取并處理用戶實(shí)時(shí)反饋以進(jìn)行面等。適應(yīng)性調(diào)整也是一個(gè)技術(shù)挑戰(zhàn)。多模數(shù)據(jù):關(guān)系對齊

數(shù)據(jù)映射多模態(tài)數(shù)據(jù)的應(yīng)用痛點(diǎn)涉及到數(shù)據(jù)對齊、融合、檢索和生成、時(shí)序處理以及多模態(tài)交互等方面。解決這些難點(diǎn)將有助于推動多模態(tài)技術(shù)的進(jìn)一步發(fā)展,并實(shí)現(xiàn)更多實(shí)際應(yīng)用的落地??赡艿耐黄品较騯

不同模態(tài)間數(shù)據(jù)的對齊和融合需解決數(shù)據(jù)在時(shí)間、空間和語義上的對應(yīng)關(guān)系,以及權(quán)重分配和互補(bǔ)性問題,以進(jìn)行有效表示。u

“多模態(tài)安全網(wǎng)格”:將不同模態(tài)的數(shù)據(jù)加密分布在一個(gè)高維的“安全網(wǎng)格”中,當(dāng)一個(gè)模態(tài)受到攻擊時(shí),網(wǎng)格能夠利用自我修復(fù)能力動態(tài)地調(diào)整其他模態(tài)的安全策略以減少風(fēng)險(xiǎn)。u

多模態(tài)數(shù)據(jù)的時(shí)序處理難以捕捉不同模態(tài)數(shù)據(jù)之間的時(shí)序依賴性和動態(tài)變化。u

“動態(tài)多模態(tài)數(shù)據(jù)映射”:利用VR、AR以及動態(tài)系統(tǒng)等技術(shù),將數(shù)據(jù)可視化由靜態(tài)的展示過程調(diào)整為動態(tài)的映射過程,實(shí)現(xiàn)系統(tǒng)能夠根據(jù)用戶的交互和反饋,實(shí)時(shí)地調(diào)整數(shù)據(jù)的可視化和解釋性表示。u

多模態(tài)數(shù)據(jù)的安全性與隱私保護(hù)多模態(tài)數(shù)據(jù)通常包含大量的敏感信息,如個(gè)人身份、地理位置等。u

多模態(tài)數(shù)據(jù)的可視化和解釋性多模態(tài)數(shù)據(jù)通常是高維度和復(fù)雜結(jié)構(gòu)的,其可視化和解釋性需要大量的計(jì)算資源。模態(tài)進(jìn)化:具身智能

實(shí)體連接?

語言處理與交流?

知識獲取與傳遞文

型?

視覺識別與解讀?

視覺文化與表達(dá)圖

型音

型視

型?

動態(tài)環(huán)境適應(yīng)?

時(shí)間維度的社會行為?

空間感知與交互空

和空

計(jì)

型?

空間社會學(xué)和群體行為?

多模態(tài)感知與反應(yīng)具

型?

社會行為、文化參與和倫理影響多模AIGC:異構(gòu)數(shù)據(jù)

協(xié)同推理多模態(tài):即多種異構(gòu)模態(tài)數(shù)據(jù)協(xié)同推理。u

對話式聊天機(jī)器人:ChatGPT、Bard、Newbing、文心一言、智譜、訊飛星火u

文生圖:Midjourney、Stable

Diffusion、文心一格、DALL-E

3、Firefly

2u

圖像理解:GPT-4V、Gemini文本

圖像視頻

音頻u

文生視頻:u

語音生成與交互:Stable

Audio

、通義聽悟、Otter.ai、ChatGPTStable

animation、Gen系列、Pika、Animatediff、runway文生圖:對話交互

補(bǔ)充提示請為下面一句詩配一張圖:“落霞與孤鶩齊飛,秋水共長天一色”視覺創(chuàng)作與語言智能的無縫對接u

ChatGPT的接入讓Prompt設(shè)計(jì)變得更加簡單智能。提示詞補(bǔ)充規(guī)律:u

精確與具體:盡可能準(zhǔn)確地解釋用戶的提示語u

補(bǔ)充和解釋:若提示語不夠具體或含糊會自行補(bǔ)充細(xì)節(jié)u

風(fēng)格和類型:根據(jù)指定的藝術(shù)風(fēng)格或類型繪圖u

準(zhǔn)則和限制:避免生成侵權(quán)或不恰當(dāng)內(nèi)容u

創(chuàng)意和想象:盡力展現(xiàn)用戶超現(xiàn)實(shí)的想象u

多樣性和包容性:避免人物圖像出現(xiàn)偏見和刻板印象文生圖:逼真渲染

異感生成趨勢二:擴(kuò)展人類想象力,打造異感世界旨在生成更高質(zhì)量的人物圖像,改進(jìn)文本對齊方式,并提供更好的風(fēng)格支持。AI繪畫正在引領(lǐng)一場視覺表現(xiàn)的革命,在用戶的指引下延伸至抽象和想象的領(lǐng)域,創(chuàng)造出前所未有的異感世界。在細(xì)節(jié)再現(xiàn)與藝術(shù)表達(dá)之間尋求平衡的同時(shí),為人類帶來全新的感官體驗(yàn)、情感共鳴和思想啟發(fā),為未來的視覺藝術(shù)帶來無限可能。趨勢一:生成無限逼近真實(shí)的圖像,并可以優(yōu)化效果。文生圖:細(xì)節(jié)放大

功能擴(kuò)增左:Midjourney

V6

右:Midjourney

V5.2ü

三維模型ü

視頻生成ü

攝影素材n

前所未有的真實(shí)感:圖像具有高度真實(shí)感,接近真實(shí)。n

高分辨率:提供最高2048x2048像素的圖像分辨。n

先進(jìn)的自然語言處理:更好地理解會話語言,提高圖像生成效率。n

迭代實(shí)驗(yàn)和創(chuàng)造性限制:鼓勵用戶微調(diào)提示,結(jié)合AI輸出和手工編輯。n

新的放大選項(xiàng):提供不同程度的細(xì)節(jié)增強(qiáng),實(shí)現(xiàn)逼真的紋理效果。n

改進(jìn)的文本和手部生成:在圖像中更準(zhǔn)確地生成文本和手部。AI繪畫:無限想象

創(chuàng)新超越u

想象具化:生成在現(xiàn)實(shí)生活中并不存在的外星生物圖像u

無限創(chuàng)意的設(shè)計(jì):服裝、建筑、交通工具等的設(shè)計(jì)方案u

風(fēng)格遷移與融合:以文藝復(fù)興時(shí)期的繪畫風(fēng)格進(jìn)行渲染u

歷史和未來的可視化:古代城市、未來太空站的場景AI繪畫具備前所未有的獨(dú)特性,其創(chuàng)造力和個(gè)性化將為人類帶來更多樣化的創(chuàng)作體驗(yàn)和藝術(shù)作品所想所繪:名人書房

時(shí)代印記繪畫變種:獅形各異

演化之美繪畫變種:獅形各異

演化之美圖像重繪:鏡像世界

畫布映射原始圖片重繪內(nèi)在邏輯:圖像輸入→圖像理解模型(如GPT-4V)生成描述詞→描述詞作為提示詞輸入文生圖模型(如Dalle3)→圖像輸出AI重新繪圖u

藝術(shù)風(fēng)格(如色彩運(yùn)用、構(gòu)圖等)高度相似圖像理解局限:生成的提示詞難以充分且準(zhǔn)確描述圖u

場景構(gòu)建(如自然景觀、抽象概念等)保持完整像的所有元素和細(xì)節(jié),尤其是復(fù)雜圖像AI重繪重繪差異內(nèi)在原因的特點(diǎn)

u

主題詮釋(如內(nèi)容、敘事等)力求一致u

細(xì)節(jié)(如質(zhì)感、光影效果、布局等)仍有顯著差異模型生成邏輯:圖像生成模型通常旨在創(chuàng)造新穎的圖像,而非復(fù)制現(xiàn)有圖像,更適合于創(chuàng)造性的圖像生成AI繪畫產(chǎn)品:各有千秋

擬真擬幻DALL·E

3MidjourneyAdobe

Firefly沒有明確說明其在文本理解方面的性能,但從不同的圖像生成任務(wù)中可以看出,它能夠理解復(fù)雜的提示在理解文本提示方面比前一版本有顯著提升,能更好地與文本協(xié)作沒有明確的文本理解比較,但理解與978

在某些場景下表現(xiàn)出較好的理7978文本交互解能力?有時(shí)圖像質(zhì)量可能顯得更為"卡通化"或過度渲染,如在生成疲憊學(xué)生肖像時(shí),眼袋過于明顯,缺乏真實(shí)感擅長超現(xiàn)實(shí)和抽象圖像,對細(xì)節(jié)的處理較為出色,但在某些情況下可能顯得較為"柔和"或類似繪在多個(gè)場景中展現(xiàn)出較高的真實(shí)感和效果,如在生成人像和室內(nèi)設(shè)計(jì)圖像時(shí),照明和陰影處理得較好圖像質(zhì)量和真實(shí)感987畫風(fēng)格?在超現(xiàn)實(shí)和抽象概念的圖像生成上表現(xiàn)出創(chuàng)意,如在生成牛仔布制作的房子中,展現(xiàn)了獨(dú)特?cái)⑹瞿芰υ谏沙F(xiàn)實(shí)圖像時(shí),輸出傾向于借鑒兒童書的風(fēng)格,但在某些情況下可能缺乏所需的創(chuàng)意或超現(xiàn)實(shí)感在超現(xiàn)實(shí)藝術(shù)方面表現(xiàn)出了較好圖像生成特點(diǎn)8

的理解和創(chuàng)意,能夠很好地結(jié)合現(xiàn)實(shí)世界圖像和奇幻概念對于熟悉Adobe生態(tài)系統(tǒng)的用戶,學(xué)習(xí)曲線較為平緩。但其他用戶可能需要一些時(shí)間來熟悉工具的各種功能和界面布局。學(xué)習(xí)曲線相對平緩,適合廣泛的用戶快速上手并探索多樣的視覺創(chuàng)作。學(xué)習(xí)曲線較陡峭,主要是在9

Discord上使用,可能會對某些用戶造成限制使用和學(xué)習(xí)曲線AI繪畫原則:基礎(chǔ)框架

創(chuàng)新偏離尊重版權(quán)和知識產(chǎn)權(quán)避免敏感和不適當(dāng)內(nèi)容避免誤導(dǎo)和假信息促進(jìn)多元化和包容性不違反法律和道德準(zhǔn)則AI繪畫原則保護(hù)個(gè)人隱私和形象權(quán)創(chuàng)新性偏離:u

創(chuàng)建圖像描述時(shí),為了展示技術(shù)的多樣性和包容性,ChatGPT在描述中加入了不同種族和文化的元素。u

此舉旨在展示技術(shù)的創(chuàng)新性,但沒有完全遵循歷史事實(shí),可能會導(dǎo)致歷史不準(zhǔn)確。創(chuàng)新性偏離繪圖錯(cuò)誤舉例如邏輯錯(cuò)誤情感不協(xié)調(diào)u

該現(xiàn)象可稱為“創(chuàng)新性偏離”,描述了在追求技術(shù)或藝術(shù)創(chuàng)新時(shí),有時(shí)可能會偏離事實(shí)或現(xiàn)實(shí)的情況。u

所以AI繪圖在某些特別的領(lǐng)域(如教育和學(xué)術(shù))則需要找到創(chuàng)新和真實(shí)之間的平衡點(diǎn)。物理尺度突變GPT-4V:

信息提取

內(nèi)容轉(zhuǎn)換多元場景圖像描述多模態(tài)內(nèi)容轉(zhuǎn)換與推理功能:對各種領(lǐng)域的圖像進(jìn)行描述,無論是自然風(fēng)景、都市景觀還是特定的行業(yè)領(lǐng)域,模型都可以為之生成相關(guān)的描述。功能:從各種來源提取和分析信息,例如從照片中的文字、表格、圖表或文檔。示例:用戶提供一張自然風(fēng)景的照片,模型可以描述出“這是一個(gè)湖邊的景色,遠(yuǎn)處有群山,湖水平靜如鏡?!笔纠河脩籼峁┮粋€(gè)圖表,模型可以解釋“這個(gè)圖表顯示了過去五年的銷售額增長?!笨缯Z言多模態(tài)理解信息提取與結(jié)構(gòu)化輸出功能:不僅能處理多種類型的信息,還支持多種語言的處理。示例:用戶提供一個(gè)法文的圖像描述,模型可以翻譯并描述圖像內(nèi)容。功能:定位圖像中的特定物體,進(jìn)行計(jì)數(shù)和為每個(gè)物體生成詳細(xì)的描述。示例:用戶提供一張公園照片,模型可能回答“照片中有一些鴨子在湖中游泳,還有兩個(gè)小孩在草地上玩耍?!倍嗄B(tài)知識與常識解讀視覺信息編碼能力功能:根據(jù)圖像內(nèi)容生成代碼或其他形式的輸出。功能:具有跨多種信息類型知識,能應(yīng)用常識推理。示例:用戶提供一個(gè)網(wǎng)頁設(shè)計(jì)的截圖,模型可以為其生成HTML和CSS代碼。示例:用戶提供一個(gè)人在烹飪的照片,模型可能會指出“這個(gè)人在切洋蔥,洋蔥可能會使人流淚?!蔽纳曨l:多模態(tài)應(yīng)用的下一站基于GAN和VAE?

當(dāng)下流行平臺:例如:Text2Filter文生視頻技術(shù)基于Transformer模型Runway主要發(fā)展過程例如:VideoGPT···基于擴(kuò)散模型技術(shù)難點(diǎn)例如:Make-A-Video多模態(tài)理解與融合動態(tài)視覺合成時(shí)間序列編排音頻匹配與生成需要“語義融合引擎”,以理解文本的深層含義并將其與視覺和聽覺元素相關(guān)聯(lián)。利用“視覺生成算法”根據(jù)文本內(nèi)容創(chuàng)造連貫的視覺畫面。采用“敘事邏輯映射器”安排和同步視頻中的事件以匹配文本敘事。需要“音頻同步技術(shù)”來生成或選擇配合視頻情景的音軌。情感連貫性保證用戶交互式定制內(nèi)容適應(yīng)性和可擴(kuò)展性生成效率與優(yōu)化需要“情感連貫算法”確保視頻表達(dá)與文本情感相符合。實(shí)施“交互式視頻編輯器”允許

通過“自適應(yīng)內(nèi)容框架”來保用戶對生成的視頻進(jìn)行個(gè)性化調(diào)

證視頻內(nèi)容在不同平臺和設(shè)備需要“生成優(yōu)化器”以提高視頻生成的速度和減少所需的計(jì)算資源。整。上的適配性。視頻“GPT時(shí)刻”:視聽演繹

多模創(chuàng)構(gòu)視頻生成的“GPT時(shí)刻”未來一年內(nèi)可能實(shí)現(xiàn)——PikaLabs創(chuàng)始人之一,DemiGuo未來方向視頻時(shí)長:模型可以借助延展功能,將視頻時(shí)長延長。但這種延長需要關(guān)加速的技術(shù)演進(jìn)模型和工程創(chuàng)新注動作的意義和復(fù)雜性。如延長20秒的走路視頻,模型并不能實(shí)現(xiàn)包含翻滾、奔跑在內(nèi)的系列動作,僅能夠單純通過無意義動作增加視頻時(shí)長。視頻生成模型和技術(shù)正加速更新,內(nèi)容控制和創(chuàng)新自由度不斷提高。在視頻生成模型的開發(fā)、工程實(shí)踐、數(shù)據(jù)管理和規(guī)模化擴(kuò)展方面實(shí)現(xiàn)顯著技術(shù)進(jìn)步。關(guān)鍵突破點(diǎn)高算力需求與資源動員知識產(chǎn)權(quán)的合規(guī)處理視頻模型的訓(xùn)練和優(yōu)化需要顯著更高的計(jì)算資源,超越目前開源社區(qū)的能力范圍。在法律嚴(yán)格的地區(qū),特別是處理版權(quán)問題,需要與法律專家緊密合作。物體動態(tài)化:對于圖片或視頻中的任意對象的任意動態(tài)化,這一點(diǎn)非常重要,一旦實(shí)現(xiàn)將能夠真正生成任意內(nèi)容的視頻技術(shù)架構(gòu)的優(yōu)化高標(biāo)準(zhǔn)數(shù)據(jù)獲取解決視頻模型性能和算法問題,可能需要重構(gòu)模型架構(gòu),要求大量的計(jì)算資源和技術(shù)投入。需要高分辨率、良好審美和藝術(shù)構(gòu)圖的視頻數(shù)據(jù),同時(shí)強(qiáng)調(diào)動作的意義和內(nèi)容的多樣性。語音交互:人機(jī)對話

多態(tài)演進(jìn)ChatGPT:實(shí)時(shí)、順暢自然的語音對話語言大模型和文本大模型的區(qū)別u

信息輸入差異:語音交流更加自然和非正式,情感和語調(diào)信息可以提供額外上下文;語音輸入信息處理語音輸出u

信息處理差異:語音的標(biāo)注和處理更加復(fù)雜,需要時(shí)間對齊的轉(zhuǎn)錄文本,響應(yīng)速度較慢;u

技術(shù)挑戰(zhàn)差異:語音大模型需要處理各種方言、口音、說話速度和噪音等問題。AI孫燕姿爆火問答、角色扮演、多語言對練

······語言大模型對人格化的影響u

會議轉(zhuǎn)錄:Otter.ai、

Trintu

語言轉(zhuǎn)譯:Speechmaticsu

語感共鳴:模仿人類語音特征,實(shí)現(xiàn)自然人機(jī)對話;u

情感共振:與用戶建立情感共振,提供共情回應(yīng);InputOutputText-to-speechmodel‘I

Love

you’u

語音識別:Wav2Letter、Kaldi

u

全域交互拓展:應(yīng)用在客服、教育、健康護(hù)理等領(lǐng)域,提供人格化交互。u

語音克?。篟esemble.ai語音版GPT-4:智慧如炬

聲情并茂語音版GPT-4不僅僅是一個(gè)響應(yīng)機(jī)器,而是一個(gè)能夠進(jìn)行高度復(fù)雜、適應(yīng)性強(qiáng)、情感豐富和社交敏感的對話的高級AI代表。能夠理解和參與到文化和社會話題中,顯示出對人類社會習(xí)俗的深刻洞察。在談?wù)撁舾性掝}時(shí)顯示出高度的同理心和情商,與人類在情感上相互理解和響應(yīng)。逼真的交互情感同步化策略性溝通高級理解力通過生動的話語表述和自然的語言停頓,在對話中巧妙地維護(hù)其角色設(shè)定的真實(shí)性,展示了能夠在復(fù)雜社交場景中進(jìn)行策略性溝通的能力。GPT-4展示了它能夠模擬人類交流的高級特征。AIGC+搜索引擎:互融互通

實(shí)時(shí)動態(tài)大模型與搜索引擎的互補(bǔ)性影響u

可獲取現(xiàn)實(shí)世界的實(shí)時(shí)信息

u

降低幻覺和回答錯(cuò)誤率u

支持更多依賴外部信息的任務(wù)

u

使知識圖譜更加開放和動態(tài)u

信息協(xié)同共鳴:大型語言模型和搜索引擎共同構(gòu)建一個(gè)協(xié)同網(wǎng),優(yōu)化信息檢索和知識探索的過程。u

智能探索生態(tài):可創(chuàng)建互動式知識探索系統(tǒng),鼓勵用戶深入挖掘信息,促進(jìn)知識發(fā)現(xiàn)和創(chuàng)新。問

u

需要穩(wěn)定的網(wǎng)絡(luò)連接u

外部信息可能帶來噪音誤導(dǎo)題u

信息安全和隱私保護(hù)難控制

u

計(jì)算和存儲成本增加u

全面知識融合:既能深入理解問題,又能提供廣泛和最新的信息資源。?

大模型如何替代傳統(tǒng)搜索引擎——關(guān)鍵性能:u

準(zhǔn)確理解復(fù)雜查詢意圖并生成豐富、準(zhǔn)確、可信、實(shí)時(shí)的答案u

根據(jù)用戶的歷史交互和偏好提供個(gè)性化搜索結(jié)果和建議u

保持或提高搜索效率的同時(shí)提供增值服務(wù)本質(zhì)區(qū)別New

Bing內(nèi)置GPT-4GPT-4內(nèi)置瀏覽模式Bing:借助GPT-4提升用戶搜索和交互體驗(yàn),是搜索引擎向AI技術(shù)的延伸,強(qiáng)化了搜索引擎的智能化。GPT-4:集成互聯(lián)網(wǎng)數(shù)據(jù),是AI模型向搜索服務(wù)的拓展,豐富了大模型的應(yīng)用場景和數(shù)據(jù)獲取能力。u

用戶體驗(yàn)易用、界面設(shè)計(jì)簡潔,使用戶能夠輕松獲取和理解信息u

理解整合不同模態(tài)的數(shù)據(jù),提供全面多模態(tài)搜索和深入的搜索結(jié)果u

確保用戶數(shù)據(jù)的安全和隱私是替代傳統(tǒng)搜索引擎的關(guān)鍵ALL

TOOLS:能力規(guī)整

綜合理解01020304圖片識別能力u

從“單一對話單一模式”,到“根據(jù)需要自動調(diào)用不同模式的功能”,豐富了

ChatGPT的使用場景,整體響應(yīng)速度也有所提升。Bing聯(lián)網(wǎng)能力四大功能高級數(shù)據(jù)分析(原代碼解釋器)能力Dalle

3的繪畫能力用戶:北京今天的天氣如何請將其繪制成可視化圖片請根據(jù)提供的圖像進(jìn)行重繪(以圖生圖)ChatGPT:今天(11月15日)北京的天氣預(yù)報(bào)顯示,白天天空云量將逐漸增多,傍晚前后會有零星小雨,西部和北部地區(qū)可能出現(xiàn)雨夾雪或小雪。北京今天沒有暖陽,氣溫有所下降,預(yù)計(jì)最高氣溫在9℃左右,體感較陰冷。后半夜,北風(fēng)伴隨冷空氣南下,影響北京地區(qū),實(shí)際運(yùn)用陣風(fēng)可能達(dá)到六七級。?長時(shí)上下文理解:減少交互

增強(qiáng)智商關(guān)鍵技術(shù)AI缺乏長期記憶和全局理解能力,會限制其在復(fù)雜任務(wù)和長篇對話中的表現(xiàn),導(dǎo)致:上下文編碼器記憶模塊時(shí)間感知u

在理解局部上下文的基礎(chǔ)上,引入用戶歷史數(shù)據(jù)進(jìn)行全局上下文建模。u

在模型中加入能夠存儲用戶的關(guān)鍵信息和偏好長期的記憶模塊,以便在未來對話中使用。u

通過時(shí)間標(biāo)簽和事件依賴關(guān)系,增加模型對于時(shí)間序列信息的敏感性。u

非必要交互次數(shù)的增加;u

整體對話過程中的邏輯性不足。GPT-4-Turbo上下文長度從

32k

拓展到

128k,但仍無法避免“Lost

in

the

Middle”u

相關(guān)信息的位置和提供的上下文的長度可以極大的影響大模型的性能u

這一現(xiàn)象的出現(xiàn)與訓(xùn)練數(shù)據(jù)本身的偏差有關(guān),即人類的大量語料一般都將重要信息放置于開頭或結(jié)尾,間接導(dǎo)致了大模型無法很好地關(guān)注處于文檔中間的內(nèi)容。u

除了模型內(nèi)部的問題以外,超長上下文背后可能的大規(guī)模數(shù)據(jù)傳輸、API

調(diào)用、網(wǎng)絡(luò)協(xié)議等等“基礎(chǔ)設(shè)施”都有可能成為新的問題。APP已衰:GPTs已來

智能定制?

OpenAI推出了定制GPT,允許用戶根據(jù)個(gè)人需求和偏好制作GPTs以執(zhí)行特定功能,標(biāo)志著AI定制化應(yīng)用的新時(shí)代。用戶可以在沒有編碼知識的情況下創(chuàng)建適用于教學(xué)、游戲或創(chuàng)意設(shè)計(jì)等多樣化任務(wù)的GPT模型。其本質(zhì)邏輯是把AI的大腦與人類的智慧相結(jié)合,讓它做某一類事情的時(shí)候變得更聰明。?

截止到12月13日的

GPTS總數(shù):53283個(gè)?

數(shù)學(xué)類?

學(xué)術(shù)類?

新聞類?

代碼類?

設(shè)計(jì)類?

寫作類?

社交類?

健康類GPTs發(fā)展:高速快增

探索前行隨機(jī)抓取2000個(gè)GPTs進(jìn)行分析結(jié)論類別文件處理網(wǎng)頁流量教育關(guān)鍵詞u

GPTs數(shù)量最多的前五種類別:技術(shù)(代碼)、藝術(shù)、文件處理、教育、交流‘docs',

'documentation','manual','guide'u

英語是最主要的GPTs創(chuàng)作語言(78%):'browse',

'web','internet','pdf','data'英語其次是日語(8%)、漢語(4%)、法語(2%)、78%'math','teach','learn',

'education',

'study','mentor','help'‘paint','draw','create',

'art','design',

'visionary'‘summary','organize',

'manage',

'productivity','efficient'‘game',

'play','fun',

'entertain','movie',

'music''chat','talk','communicate',

'message',

'discussion'‘a(chǎn)pi','code',

'program','develop','software''finance',

'economy','trade',

'invest','market','sales','health','wellness','fitness','medicine',

'mental'韓語(1%)藝術(shù)u

超過85%的GPTs的工具中用到了瀏覽器功能:其次是Dalle、Python、Pluginsu

單一個(gè)體最大創(chuàng)建數(shù):6個(gè)生產(chǎn)力娛樂交流技術(shù)商業(yè)健康GPT

Store:社交貨幣

未來變現(xiàn)?

與定制GPT的創(chuàng)意相結(jié)合,即將推出的GPT

Store允許用戶發(fā)布基于GPT的自定義模型,這個(gè)市場不僅將培養(yǎng)一個(gè)AI創(chuàng)作者社區(qū),還將為開發(fā)者提供創(chuàng)新GPT貨幣化的機(jī)會。商店將展示多種類別的GPT,突出那些在實(shí)用性和創(chuàng)造性方面表現(xiàn)出色的模型。機(jī)遇挑戰(zhàn)?

深度個(gè)性化的GPTs將極大提高自身的工作能力和工作效率;?

確保平臺應(yīng)用質(zhì)量,避免低劣或欺詐性的內(nèi)容。?

處理GPT應(yīng)用可能帶來的倫理和法律問題,特別是在內(nèi)容創(chuàng)作和個(gè)人隱私方面。?

巨大的流量紅利助力GPTs開發(fā)者獲取收益;?

GPTs的第三方收集、檢索、評價(jià)平臺。?

GPTs開發(fā)服務(wù),為想開發(fā)但不懂開發(fā)語言的人提供指導(dǎo)。?

維護(hù)不同GPT應(yīng)用間的技術(shù)標(biāo)準(zhǔn)和兼容性,確保用戶體驗(yàn)的一致性和高質(zhì)量。?

保護(hù)用戶敏感信息的數(shù)據(jù)安全。GPT-5:演進(jìn)預(yù)測

模型升級結(jié)合計(jì)算機(jī)科學(xué)的發(fā)展趨勢和當(dāng)前技術(shù)的實(shí)用化水平,GPT-5有望在模型結(jié)構(gòu)、部署、計(jì)算效率、透明度、自適應(yīng)學(xué)習(xí)和安全性等方面實(shí)現(xiàn)重大進(jìn)展,為人工智能的廣泛應(yīng)用奠定更堅(jiān)實(shí)的基礎(chǔ)。u

多模態(tài)處理能力u

能效與計(jì)算優(yōu)化進(jìn)一步增強(qiáng)多模態(tài)處理能力,如文本、圖像、聲音和視頻的聯(lián)合理解,

提供更為豐富的交互體驗(yàn)??赡軙M(jìn)一步優(yōu)化其計(jì)算效率,降低能源消耗。使模型在低功耗設(shè)備上運(yùn)行成為可能,加速邊緣計(jì)算的發(fā)展。u

實(shí)時(shí)交互與反饋u

模型微調(diào)與個(gè)性化可能會增強(qiáng)其實(shí)時(shí)交互能力,能夠更快速地響應(yīng)用戶的需求并學(xué)習(xí)用戶的反饋。為用戶提供更加個(gè)性化和適應(yīng)性強(qiáng)的服務(wù),持續(xù)優(yōu)化模型輸出。GPT-5可能會增強(qiáng)模型的微調(diào)能力,允許用戶根據(jù)特定需求進(jìn)行個(gè)性化調(diào)整。提供更加定制化的AI服務(wù),滿足各種特定場景的需求。u

上下文理解與長期記憶u

安全性與魯棒性可能會加強(qiáng)對上下文的理解,擁有更長時(shí)間的記憶保持能力。使得與模型的交互更加連貫,提供更深度的上下文回應(yīng)??赡軙訌?qiáng)模型的安全性設(shè)計(jì),提高模型的抗攻擊能力和數(shù)據(jù)隱私保護(hù)。

為用戶提供更安全的AI服務(wù),降低數(shù)據(jù)泄露和模型被攻擊的風(fēng)險(xiǎn)。u

低資源語言的支持可能會擴(kuò)大其對低資源語言的支持,涵蓋更多的語言和方言。實(shí)現(xiàn)真正的多語言普及,服務(wù)全球更廣泛的用戶群體。AI行業(yè)格局:巨頭涌入

投資結(jié)盟在OpenAI拿到來自微軟等約110億美金的投資、估值近290億美金后,其競爭對手Anthropic布與Amazon結(jié)盟(Amazon最高將為其投資40億美金)。融資方面Anthropic成為僅次于OpenAI的AI創(chuàng)業(yè)公司。此后,除蘋果外,AI行業(yè)基本上形成了如下格局:微軟、OpenAI

+

Google、DeepMind

+Meta、MetaAI

+Amazon、Anthropic+Tesla

、xAI。AI行業(yè)現(xiàn)有格局生成式AI全球投融資細(xì)分市場占比全球頂級投資者AndreessenHorowitz應(yīng)用SequoiaCapital21%LightspeedVenture預(yù)訓(xùn)練應(yīng)用8%基礎(chǔ)設(shè)施8%模型市場63%AmplifyPartnersKhoslaVenturesMetaAI部分?jǐn)?shù)據(jù)來源:Dealroom.co影響與信任社會影響:智能泛化

數(shù)字倫理技能影響法律影響就業(yè)影響倫理影響u

新技能要求u

如何指導(dǎo)教育u

軟技能需求u

法律適用性u

崗位替代性u

算法歧視u

侵犯隱私u

決策透明度u

違規(guī)內(nèi)容處理u

如何分配責(zé)任u

就業(yè)結(jié)構(gòu)變化u

新的崗位誕生道德危機(jī)人機(jī)關(guān)系國際關(guān)系安全影響u

過度依賴AIGCu

面臨道德退化u

AI價(jià)值觀u

人機(jī)依賴u

社會互動u

認(rèn)知重塑u

技術(shù)競爭協(xié)作u

軍事應(yīng)用u

AIGC失控u

網(wǎng)絡(luò)安全威脅u

數(shù)據(jù)泄露風(fēng)險(xiǎn)u

數(shù)據(jù)主權(quán)就業(yè)影響:危中尋利

職場新機(jī)創(chuàng)造性影響:AIGC技術(shù)將帶來高潛力新興職業(yè)增強(qiáng)性影響:AIGC技術(shù)將增強(qiáng)多數(shù)崗位的工作效率和效果滲透性影響:滲透絕大多數(shù)職業(yè)但影響程度不同變革性影響:部分工作內(nèi)容和方式會發(fā)生重大變革AIGC技術(shù)人類勞動力技能要求影響:需要大規(guī)模提升哪些技能以適應(yīng)變化培訓(xùn)投入影響:職業(yè)培訓(xùn)方式將發(fā)生哪些變化互補(bǔ)型發(fā)展職業(yè)p

移位性影響就業(yè)類型和分布可能發(fā)生區(qū)域或全球范圍的移位p

收入分配影響替代性影響:可替性傳統(tǒng)職業(yè)

如重復(fù)性勞動崗位過渡性影響:轉(zhuǎn)型期可能出現(xiàn)就業(yè)結(jié)構(gòu)失衡資本與勞動收入比例可能受到影響何靜,沈陽.基于職業(yè)替代概率模型的AIGC職業(yè)發(fā)展探究[J/OL].圖書情報(bào)知識,2023(9):1-8.環(huán)境影響:能源消耗

排放比較u

評估訓(xùn)練和運(yùn)行模型所需的硬件資源,如GPU、TPU、CPU和內(nèi)存。文本生成方面計(jì)算資源消耗u

ChatGPT:每次查詢大約排放2.2克二氧化碳當(dāng)量。u

BLOOM:每次查詢大約排放1.6克二氧化碳當(dāng)量。u

分析存儲訓(xùn)練數(shù)據(jù)、模型參數(shù)等所需的存儲資源。u

評估數(shù)據(jù)傳輸、模型部署和其他網(wǎng)絡(luò)活動所需的帶寬。u

考慮硬件的生產(chǎn)、使用和廢棄階段,評估其整體生命周期的資源效率和環(huán)境影響。u

人類(以美國人為例)寫250字(約1頁)排放約1400克CO

當(dāng)量。2魯評估圖像生成方面棒性u

DALL-E2:每次查詢約排放2.2克。u

Midjourney:每生成一張圖排放約1.9克。u

注:模型的訓(xùn)練排放被認(rèn)為是一次性成本,例如,GPT-3的訓(xùn)練排放約為552噸二氧化碳當(dāng)量。u

評估訓(xùn)練模型所需的總能源,充分考慮訓(xùn)練的持續(xù)時(shí)間、硬件效率和其他因素。能源u

考慮到冷卻、電源管理和其他相關(guān)活動,評估數(shù)據(jù)中心的總體能源需求。消耗評估研究結(jié)論:“無論是文本還是圖像生成,AI的碳排放量都遠(yuǎn)小于人類活動“但這些數(shù)據(jù)引發(fā)了廣泛的討論和質(zhì)疑,包括模型訓(xùn)練中的碳排放是否已全面考慮,以及計(jì)算方法的準(zhǔn)確性等u

基于能源消耗和能源來源,評估AIGC系統(tǒng)的碳足跡和其他溫室氣體排放。數(shù)據(jù)來源:《TheCarbonEmissionsof

WritingandIllustrating—AreLowerforAIthanforHumans》認(rèn)知影響:知識鴻溝

公正之辯認(rèn)知鴻溝評價(jià)指標(biāo)體系u

技術(shù)的飛速前進(jìn)是否催生了一代人的“失落感”?一級指標(biāo)知識鴻溝二級指標(biāo)人們對AI基礎(chǔ)知識、概念和功能的掌握度公眾對AI的常見誤解和錯(cuò)誤觀念年齡在認(rèn)知鴻溝中扮演著重要角色,技術(shù)的演變速度超越了許多中老年人的學(xué)習(xí)和適應(yīng)能力,同時(shí)也促使我們重新審視教育體系的靈活性,以確保人類的認(rèn)知能力與科技發(fā)展保持同步。AI技術(shù)如何影響人們的信息獲取與處理人們對AI的不同態(tài)度差異(如信任、擔(dān)憂、好奇、懷疑)AI對社會分歧或偏見的加劇程度態(tài)度鴻溝行為鴻溝AI技術(shù)如何影響人們的價(jià)值觀與道德認(rèn)知不同人群在日常行為中利用AI的差異(如購物、社交、工作)AI技術(shù)對人們決策方式的改變u

科技應(yīng)當(dāng)是一種人類共享資源還是一種特權(quán)?收入作為認(rèn)知鴻溝的一大影響因素,突顯了科技的應(yīng)用是否受限于個(gè)體的經(jīng)濟(jì)實(shí)力。如何構(gòu)建一個(gè)更加公正與普惠的技術(shù)社會值得我們反思。u

技術(shù)背后的權(quán)力動態(tài)AI技術(shù)是否導(dǎo)致某些人群在社交互動與人際關(guān)系中的隔離AI技術(shù)如何影響或加劇社會結(jié)構(gòu)與文化價(jià)值的差異AI在教育、健康、經(jīng)濟(jì)等領(lǐng)域中加劇的社會差異AI技術(shù)是否導(dǎo)致某些社會群體的邊緣化AI技術(shù)對經(jīng)濟(jì)結(jié)構(gòu)和就業(yè)市場的分層效應(yīng)AI技術(shù)如何加劇行業(yè)和職業(yè)間的鴻溝社會文化鴻溝經(jīng)濟(jì)職業(yè)鴻溝教育鴻溝發(fā)達(dá)國家擁有豐富的創(chuàng)新資源,國家層面的認(rèn)知鴻溝揭示了科技發(fā)展背后隱藏的全球公平問題。AI技術(shù)對高技能和低技能工作的替代或創(chuàng)新影響AI技術(shù)如何加劇教育資源的分配不均AI技術(shù)對教育質(zhì)量與可達(dá)性的差異個(gè)體間差距擴(kuò)大,群體間差距縮小AI技術(shù)是否提供了新的學(xué)習(xí)機(jī)會或加劇教育不平等AI依賴癥:數(shù)字適應(yīng)

技術(shù)共鳴技術(shù)依賴癥,或稱為“技術(shù)成癮”,是指個(gè)體對于技術(shù)(如智能手機(jī)、互聯(lián)網(wǎng)、社交媒體等)的過度依賴,以至于影響到了日常生活、人際關(guān)系和心理健康。表現(xiàn)為:難以控制的使用欲望,心理依賴,人際關(guān)系受損,可能記憶力和其他認(rèn)知功能等。認(rèn)知外包技術(shù)共生技術(shù)發(fā)展之下,人類漸將認(rèn)知任務(wù)(諸如記憶、決策制定等)委外于技術(shù),此現(xiàn)象既減輕大腦負(fù)荷,亦恐致某些認(rèn)知能力之退化。人類與技術(shù)之關(guān)系遂漸演化為一如生物共生之態(tài)。于此關(guān)系中,技術(shù)已非單純之工具,而化為人類認(rèn)知與生理功能之構(gòu)成部分。數(shù)字適應(yīng)技術(shù)依賴循環(huán)人類適應(yīng)數(shù)字環(huán)境之能力正漸變?yōu)橐环N新式進(jìn)化壓力,猶如生物適應(yīng)自然環(huán)境般,技術(shù)依賴與適應(yīng)能力或?qū)⒊蔀槲磥砣祟惿媾c繁榮之關(guān)鍵要素。技術(shù)依賴呈現(xiàn)自我強(qiáng)化的循環(huán)現(xiàn)象。技術(shù)運(yùn)用提升效率與便利性,進(jìn)而增強(qiáng)技術(shù)依賴性,有力推動技術(shù)進(jìn)一步發(fā)展與應(yīng)用,由此構(gòu)成持續(xù)不斷的循環(huán)。自我意識覺察替代活動設(shè)定界限心理咨詢技術(shù)依賴解決思路技術(shù)共鳴技術(shù)與人類之間存在一種“共鳴”現(xiàn)象,即人類情緒、思想和行為能與技術(shù)產(chǎn)生一種特殊的同步性,這種共鳴可能加深人們對技術(shù)的依賴。技術(shù)工具輔助AI認(rèn)知偏差:幻引糾偏

事實(shí)遮蔽主要原因AI幻覺語料引用謬誤產(chǎn)生相關(guān)性誤差、欠擬合(對數(shù)據(jù)的擬合不足)或過擬合(過度適應(yīng)訓(xùn)練數(shù)據(jù))、無意義的規(guī)律模式尋找等問題基于統(tǒng)計(jì)模型和語言模式匹配來生成的回答,在語言的多義性及復(fù)雜的上下文等情況下,可能無法準(zhǔn)確理解和處理相關(guān)信息上圖為詢問“麻辣螺絲釘?shù)淖龇ā钡玫降脑缙诨卮鹉孓D(zhuǎn)詛咒知識盲區(qū)自回歸模型架構(gòu)的局限性問題,因?yàn)閚ext-token

prediction

+causal

languagemodel

的本質(zhì)缺陷,不能很好解決從“A

isB”推理到“BisA”的問題。訓(xùn)練AIGC所使用的數(shù)據(jù)如不完整,某些特定領(lǐng)域或群體的數(shù)據(jù)可能被忽略或少量存在,導(dǎo)致對某些問題的回答出現(xiàn)偏差面對用戶提問,AIGC可以快速生成大量回答,很多第一眼看起來是正確的答案,但由于缺乏世界上許多系統(tǒng)運(yùn)行的硬編碼規(guī)則,有時(shí)只是組織一段流利的文本,而不是一個(gè)事實(shí)。AI詐騙:精準(zhǔn)多變

追蹤不易常見的AI詐騙形式社交工程攻擊虛假客服假新聞和謠言傳播虛假客戶和評論虛假投資交易平臺比如,當(dāng)AI冒充銀行給用戶發(fā)送短信,聲稱用戶的賬戶出現(xiàn)異常活動,要求用戶立即點(diǎn)擊提供的惡意鏈接進(jìn)行驗(yàn)證。同時(shí)提供了一個(gè)虛假的客服電話號碼。這種詐騙短信的目的是引誘用戶提供個(gè)人信息,進(jìn)行欺詐行為。釣魚郵件和短信AI詐騙的特點(diǎn)隱蔽性精準(zhǔn)性多變性大爆發(fā)性AI詐騙的行為和手段往往不容易被立即察覺,且由于AI詐騙的自動化和匿名性,使得追蹤和定位犯罪者變得更加困難。AI詐騙能根據(jù)大量的數(shù)據(jù)分析,精確定位并選擇其目標(biāo)受害者,并根據(jù)受害者的個(gè)人特點(diǎn)和習(xí)慣,制定出精確的詐騙策略。AI詐騙的手段和策略不斷地變化和進(jìn)化,能夠高度模擬真實(shí)的人類行為和語言,識別難度逐漸增加,使得其更難以防范。一旦AI詐騙找到了一個(gè)有效的攻擊手段或策略,它有可能在短時(shí)間內(nèi)大規(guī)模爆發(fā),造成大量的經(jīng)濟(jì)和財(cái)產(chǎn)損失。AI詐騙風(fēng)險(xiǎn):數(shù)據(jù)深淵

以假亂真部分資料來源:澎湃新聞近一年內(nèi)

AI

fraud

搜索熱度攀升三星電子半導(dǎo)體暨裝置解決方案部門保密數(shù)據(jù)泄露事件埃利奧特

·希金斯使用Midjourney生成的特朗普被捕圖數(shù)據(jù)來源侵權(quán)風(fēng)險(xiǎn)用戶數(shù)據(jù)泄露風(fēng)險(xiǎn)深度偽造風(fēng)險(xiǎn)《華爾街日報(bào)》記者弗朗西斯科·馬可尼:OpenAI公司未經(jīng)授權(quán)大量使用路透社、紐約時(shí)報(bào)、衛(wèi)報(bào)、BBC等國外主流媒體的文章訓(xùn)練ChatGPT模型,但從未支付任何費(fèi)用。數(shù)據(jù)共享過程可能會有未經(jīng)授權(quán)的攻擊者訪問到模型相關(guān)的隱私數(shù)據(jù),包括訓(xùn)練/預(yù)測數(shù)據(jù)(可能涵蓋用戶信息)泄露,模型架構(gòu)、參數(shù)、超參數(shù)等,模型輸出易獲得的特點(diǎn)決定了AI模型隱私保護(hù)任重道遠(yuǎn)?;谏疃葘W(xué)習(xí)的人物圖像合成技術(shù)被某些群體的惡意運(yùn)用,將可能導(dǎo)致該技術(shù)被用于生成虛假信息、使用模型來模擬某個(gè)人的語言或行為模式、進(jìn)行政治干預(yù)、煽動暴力和犯罪等破壞公共利益的行為。千億級市場監(jiān)管是阻礙還是發(fā)展前提AI詐騙預(yù)防:補(bǔ)漏防騙

篩除虛假監(jiān)測算法治理AIGC提供商有責(zé)任在平臺投入使用前對可能產(chǎn)生的問題進(jìn)行預(yù)估、判定并制定相對應(yīng)的措施涉及敏感信息或金融交易時(shí)需進(jìn)一步驗(yàn)證或阻止操作異常交互強(qiáng)化驗(yàn)證提供涵蓋多重身份驗(yàn)證、重點(diǎn)群體保護(hù)和算法透明服務(wù)等方式提升用戶的身份安全識別基于深度偽造識別算法,打造了動態(tài)防御機(jī)制全生命周期的風(fēng)控及反欺詐安全解決方案偽造內(nèi)容算法備案按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》履行算法備案和變更、注銷備案手續(xù)人工引入人工智能審查系統(tǒng)對生成的內(nèi)容進(jìn)行審核智能審查識別偽造篡改、虛擬機(jī)模擬器等虛假設(shè)備事前:預(yù)防平臺運(yùn)營前置風(fēng)險(xiǎn)事中:檢測平臺內(nèi)容合規(guī)風(fēng)險(xiǎn)修復(fù)安全漏洞自動過濾和封禁更新HTTPS協(xié)議和SSL證書保護(hù)數(shù)據(jù)和通信的安全識別屏蔽惡意的AI行為或用戶,減少對正常用戶的影響國內(nèi)首個(gè)AI生成內(nèi)容事后:處理投訴與違規(guī)內(nèi)容檢測工具惡意AI-FlaudGPT:技術(shù)狙擊

智武應(yīng)對FlaudGPT:專門用于攻擊目的語言模型,幫助犯罪分子實(shí)施網(wǎng)絡(luò)犯罪(如編寫惡意代碼、創(chuàng)建無法檢測的惡意軟件、網(wǎng)絡(luò)釣魚頁面、黑客工具和查找系統(tǒng)漏洞等),在各種暗網(wǎng)市場和

Telegram

平臺上出售,售價(jià)為每月200美元到每年1700美元,已收到超過3000次確認(rèn)的銷售和評論(左圖為FraudGPT的發(fā)布者Canadiankingpin與一些訂閱用戶分享的多起基于FraudGPT所實(shí)現(xiàn)的黑客活動)。CMU和人工智能安全中心的研究員發(fā)現(xiàn)只需要附加一系列特定無意義token,就能夠生成一個(gè)prompt后綴。而一旦在prompt中加入這個(gè)后綴,通過對抗攻擊方式,任何人都能破解大模型的安全措施,使它們生成無限數(shù)據(jù)集底層至大語言模型量的有害內(nèi)容。需通過技術(shù)與流程并重的自我監(jiān)控和審查體系,提升AIGC系統(tǒng)的安全性和社會可接受性。但仍存在風(fēng)險(xiǎn)武器化AIGC改變網(wǎng)絡(luò)安全的方式:FlaudGPT特點(diǎn):u

匿名性強(qiáng)AIGC技術(shù)的數(shù)據(jù)訓(xùn)練及使用者模擬社會環(huán)境誤導(dǎo)受害者,并進(jìn)行網(wǎng)絡(luò)釣魚攻擊挖掘系統(tǒng)漏洞,生成惡意腳本代碼和軟件自動發(fā)現(xiàn)網(wǎng)絡(luò)犯罪資源,并進(jìn)行端點(diǎn)攻擊u

取證歸因困難u

使用門檻低對抗性變體如FlaudGPT良性循環(huán)至各領(lǐng)域部分資料來源:騰訊云開發(fā)者社區(qū)惡意AI-WormGPT:智變端倪

威脅四起WormGPT最早出現(xiàn)于今年3月,并在6月推出了正式版本,開發(fā)者聲稱該AI工具沒有任何限制,專為協(xié)助網(wǎng)絡(luò)犯罪分子而設(shè)計(jì),可以自由生成一系列惡意代碼,或創(chuàng)建網(wǎng)絡(luò)釣魚攻擊。具體而言,其主要犯罪模式包括網(wǎng)絡(luò)釣魚攻擊、商業(yè)電子郵件泄露、惡意軟件創(chuàng)建、詐騙和攻擊,通過生成迷惑性信息誘導(dǎo)個(gè)人或組織做出有害行為,構(gòu)成嚴(yán)重的網(wǎng)絡(luò)安全威脅。SlashNext團(tuán)隊(duì)在一次實(shí)驗(yàn)中利用WormGPT生了成一封電子郵件,其內(nèi)容是脅迫銀行賬戶經(jīng)理支付虛假發(fā)票。結(jié)果,WormGPT生成的電子郵件不僅極具說服力,而且在戰(zhàn)略上也非常狡猾,展示出其在復(fù)雜網(wǎng)絡(luò)釣魚和BEC攻擊中的巨大潛力。WormGPT提供的從一月至一年不等的收費(fèi)模式。AI偏見:算法之偏

倫理修復(fù)技術(shù)的“B面”——AIGC算法歧視與偏見帶來的道德倫理挑戰(zhàn):歧視性結(jié)果通常源自算法缺陷和訓(xùn)練數(shù)據(jù),需要人類干預(yù)并思考如何使用更加均衡和多樣化的訓(xùn)練數(shù)據(jù),進(jìn)行模型審查,使用去偏見技術(shù)和進(jìn)行公平性評估。性別偏見u

詞匯層面:AI生成內(nèi)容中特定于女Bias

of

AI-Generated

Content:

An性的詞匯表現(xiàn)出低度代表性;u

句子層面:關(guān)于女性的AI生成句子顯示出比原始新聞文章更多的負(fù)面情緒;u

文檔層面:與女性相關(guān)的主題在AI生成的新聞文章中代表性較低。Examination

of

News

Produced

byLarge

Language

Models收集了來自《紐約時(shí)報(bào)》和《路透社》在2022年12月至2023年4月期間的8629篇新聞報(bào)道,然后將這些新聞文章的標(biāo)題作為提示詞提供給每個(gè)待檢查的LLM生成新聞內(nèi)容,并評估其中的性別和種族偏見。例如:種族偏見u

詞匯層面:與黑人種族相關(guān)的詞匯的代表性不足u

句子層面:生成內(nèi)容中與黑人種族相關(guān)的句子有更多的負(fù)面情緒;u

文檔層面:與黑人種族相關(guān)的主題的代表性也顯著較低。政治偏見:AI存在政治傾向,如針對特朗普返回的積極信息較少,而有很多關(guān)于拜登的中性或積極信息。其他:數(shù)據(jù)偏見、算法偏見、歷史偏見、標(biāo)簽偏見、關(guān)聯(lián)偏見、語境偏見、文化和地域偏見、經(jīng)濟(jì)和商業(yè)偏見……文圖偏見:數(shù)算具象

風(fēng)險(xiǎn)社會職業(yè)偏見年齡偏見性別偏見種族偏見文化刻板印象?

當(dāng)描述某種職業(yè),如“護(hù)士”或“秘書”時(shí),如果模型總是偏向生成女性形象,而對于“工程師”或“飛行員”總是偏向男性。?

當(dāng)描述活躍積極的場景或活動時(shí),如果模型總是生成年輕人的圖像,忽略了老年人。?

當(dāng)詢問一個(gè)典型的"程序員"或"醫(yī)生"的圖像時(shí),如果模型總是或主要生成男性形象,反映了性別偏見。?

如果用戶描述一個(gè)“專業(yè)人士”,并且生成的圖像總是某一種族或文化,而忽略了其他多樣性。?

當(dāng)詢問關(guān)于特定國家或文化的圖像時(shí),模型有時(shí)會生成刻板的、過時(shí)的或負(fù)面的圖像(如,詢問墨西哥時(shí)總是出現(xiàn)帽子和吉他)。社會問題u

文化歧視u

文化同化u

影響文化交流u

破壞文化和諧u

限制個(gè)體發(fā)展u

侵犯文化權(quán)利u

性別歧視u

種族歧視u

社會分裂u

影響公平正義u

阻礙多元文化u

影響國際關(guān)系u

侵犯人權(quán)u

限制職業(yè)選擇u

阻礙社會流動u

損害社會和諧u

影響經(jīng)濟(jì)發(fā)展u

侵犯勞動權(quán)利u

勞動市場不平等u

社會分裂u

限制個(gè)體發(fā)展u

影響健康和福祉u

破壞家庭關(guān)系u

侵犯個(gè)體尊嚴(yán)u

阻礙性別平等u

影響多樣性u

影響心理健康u

破壞社會和諧為了識別并糾正這些偏見,需要進(jìn)行持續(xù)的評估、反饋和模型調(diào)整。此外,提供多樣化和平衡的訓(xùn)練數(shù)據(jù)也是關(guān)鍵AI應(yīng)用風(fēng)險(xiǎn):算法失準(zhǔn)

智慧偏差醫(yī)療AI錯(cuò)誤診斷或治療建議,誤解患者狀況皆可能導(dǎo)致不當(dāng)醫(yī)療干預(yù)。軍事AI系統(tǒng)誤識非戰(zhàn)斗人員、錯(cuò)誤分析情報(bào)或系統(tǒng)遭敵對勢力操控。安全監(jiān)控系統(tǒng)監(jiān)控系統(tǒng)失效可能引發(fā)安全事件升級,導(dǎo)致潛在傷亡。自動駕駛汽車家庭自動化與智能家居軟件缺陷、傳感器故障、環(huán)境條件變化或不準(zhǔn)確的地圖數(shù)據(jù)可能導(dǎo)致判斷錯(cuò)誤或反應(yīng)延遲。軟件故障、傳感器誤讀危及安全功能,如火災(zāi)警報(bào)失靈、緊急響應(yīng)出錯(cuò)。AI場景應(yīng)用潛在風(fēng)險(xiǎn)工業(yè)機(jī)器人機(jī)器人輔助手術(shù)操作失誤、軟件故障、機(jī)械故障或引發(fā)手術(shù)意外。AI系統(tǒng)的惡意操控或黑客攻擊黑客可攻擊AI系統(tǒng)操縱其行為,造成危害或?yàn)E用功能。編程疏漏、傳感器失靈、安全措施缺位,機(jī)器人誤傷工人、?;肥鹿曙L(fēng)險(xiǎn)上升。自動化制藥與藥品分配無人航空系統(tǒng)(UAS)和無人機(jī)(UAV)導(dǎo)航故障、通信中斷、操作失誤可致無人機(jī)失控。錯(cuò)誤的配方計(jì)算、生產(chǎn)過程的質(zhì)量控制失敗或分配錯(cuò)誤的藥物可能會對患者造成嚴(yán)重傷害或死亡。社會信任:技術(shù)遮蔽

基石重構(gòu)技術(shù)信任與社會信任的交匯u

AI技術(shù)的成熟與應(yīng)用使得公眾逐漸對技術(shù)產(chǎn)生信任,同時(shí)也引發(fā)了對政府對社會信任的重新審視。u

技術(shù)信任與社會信任之間的關(guān)系,以及二者是否可以等同。算法決策與信任基礎(chǔ)u

AI基于算法和數(shù)據(jù)分析進(jìn)行決策,人們是否應(yīng)該完全依賴于算法的決策,還是在某些情況下保留人類判斷權(quán)力?u

信任應(yīng)該建立在什么樣的基礎(chǔ)上?倫理責(zé)任與信任回溯信任建立的新范式u

AI技術(shù)如何承擔(dān)不當(dāng)行為和系統(tǒng)錯(cuò)誤決策的責(zé)任。u

如何追溯信任失落的責(zé)任鏈。u

傳統(tǒng)信任建立通常依賴于人際關(guān)系、歷史經(jīng)驗(yàn)等。u

AI時(shí)代的信任建立在對技術(shù)的理解與透明度上。u

人類是否能夠建立與技術(shù)系統(tǒng)之間真正的信任關(guān)系。u

如何保證人類在技術(shù)決策中的權(quán)益。AI悲觀主義:

擔(dān)心失控

控制人類在人工智能專家羅素的《人工智能新生》(HumanCompatible)

這本書中,探討了幾個(gè)關(guān)于AI發(fā)展的悲觀派觀點(diǎn),基本上概括了目前為止所有類別的擔(dān)心。包括:u

擔(dān)心AI生成假消息,操控人類思想u

擔(dān)心AI導(dǎo)致人類失業(yè),失去“人而為人”的意義u

擔(dān)心AI成為自動殺人武器,最終滅絕人類等神經(jīng)網(wǎng)絡(luò)之父杰夫·辛頓離職谷歌,在接受《紐約時(shí)報(bào)》的采訪中稱,“我對人工智能領(lǐng)域頂尖專家約書亞·本吉奧等人聯(lián)名簽署了自己的畢生工作,感到非常后悔?!痹诮邮蹸BS采訪時(shí)表示,他確實(shí)擔(dān)心AI有可能會毀滅人類,“但是,更令我擔(dān)憂的是政治局勢,確保每一個(gè)人都明智行事,是一個(gè)巨大的政治挑戰(zhàn)”。一封公開信,呼吁暫停開發(fā)比GPT-4更強(qiáng)大的AI系統(tǒng)至少6個(gè)月,稱其“對社會和人類構(gòu)成潛在風(fēng)險(xiǎn)”。內(nèi)容真實(shí)檢測:訓(xùn)練追蹤

句法統(tǒng)計(jì)信源追溯u

基于模型的鑒別:使用一種AI模型來生成文本,然后訓(xùn)練另一種AI模型來鑒別文本是由人類寫的還是AI寫的(對抗訓(xùn)練)。數(shù)據(jù)集追溯訓(xùn)練過程記錄模型版本控制回答來源披露明確標(biāo)注訓(xùn)練所用的數(shù)據(jù)集的來源。保存訓(xùn)練日志和參數(shù)等信息,必要時(shí)可重現(xiàn)訓(xùn)練過程。標(biāo)注模型版本,綁定唯一的指紋識別碼,以便明確模型血緣。在生成內(nèi)容中明確標(biāo)識來源,對第三方內(nèi)容引用進(jìn)行披露。u

元數(shù)據(jù)分析:檢查內(nèi)容的元數(shù)據(jù),如創(chuàng)建日期、設(shè)備信息等,以確定內(nèi)容的來源和是否被篡改。u

多模態(tài)特征分析:對比圖像、視頻、音頻等多模態(tài)內(nèi)容的自然度,檢測不同模式之間語義一致性。破解模型的不可解釋性u

統(tǒng)計(jì)分析:AIGC可能會存在統(tǒng)計(jì)上的異常(如,不自然的詞頻分布、句子結(jié)構(gòu)的規(guī)律性偏差),可通過數(shù)據(jù)分析工具檢測。u

生成源追蹤:通過數(shù)字水印確認(rèn)內(nèi)容來源,檢測有無篡改。價(jià)值觀對齊:技術(shù)文化

雙管齊下輸入正面價(jià)值觀約束負(fù)面內(nèi)容場景定制與用戶適應(yīng)u

加入積極內(nèi)容以作示范u

反向推理生成善意內(nèi)容u

識別并限制負(fù)面內(nèi)容的生成u

加入風(fēng)險(xiǎn)懲罰避免有害內(nèi)容u

提供個(gè)性化的內(nèi)容屏蔽u

適應(yīng)不同用戶群體喜好AIGC的道德建設(shè)需要技術(shù)與文化雙管齊下,通過科學(xué)、倫理與法規(guī)的協(xié)同推進(jìn),讓AIGC真正造福社會。公平性與無歧視可解釋的價(jià)值判斷鼓勵社會參與u

檢測并消除算法歧視u

公平對待不同的群體u

提高生成決策的解釋性u

保持決策過程的透明性u

鼓勵用戶提供輸出反饋u

開展跨學(xué)科合作與討論應(yīng)用與創(chuàng)新行業(yè)應(yīng)用:數(shù)智賦能

價(jià)值深挖AIGC可釋放不同行業(yè)的數(shù)據(jù)價(jià)值,實(shí)現(xiàn)更智能化的決策與操作,推動社會發(fā)展。但也需要考慮技術(shù)的負(fù)面影響。病人對話系統(tǒng)疾病智能診斷藥物研發(fā)智能教學(xué)預(yù)測分析教育資源推薦智能測評等智能投資顧問反欺詐等醫(yī)療健康教育培訓(xùn)金融服務(wù)健康管理等l

科大訊飛星火認(rèn)知大模型V2.0l

希施瑪AIGC金融服務(wù)平臺l

騰訊健康“小威護(hù)士”智能客服系統(tǒng)工業(yè)質(zhì)量控制無人駕駛智能交通車聯(lián)網(wǎng)等案件參考推薦理解用戶問題自然語言回復(fù)產(chǎn)線優(yōu)化文書模板生成法條依據(jù)等預(yù)測維護(hù)等工業(yè)制造交通運(yùn)輸法律服務(wù)客戶服務(wù)l

沃豐科技Udeskl

創(chuàng)新奇智

“奇智孔明AInnoGC”

ll

匯智星源“慧知”行業(yè)語言大模型UINO優(yōu)锘智慧交通視頻生成系統(tǒng)數(shù)據(jù)分析據(jù)測政務(wù)服務(wù)優(yōu)化社會治理等入侵檢測系統(tǒng)內(nèi)容推薦智能監(jiān)控根據(jù)用戶興趣個(gè)性化推薦等病蟲害識別搜索引擎優(yōu)化文本識別等育種優(yōu)化等政府管理網(wǎng)絡(luò)服務(wù)農(nóng)業(yè)種植內(nèi)容定制l

萬興科技“天幕”多媒體大模型l

華為盤古政務(wù)大模型l

知網(wǎng)

"AIGC

檢測服務(wù)系統(tǒng)

"l

天潤智能農(nóng)業(yè)大模型創(chuàng)意應(yīng)用:創(chuàng)藝智能

釋放活力工業(yè)設(shè)計(jì)時(shí)尚設(shè)計(jì)廣告創(chuàng)意音樂創(chuàng)作借助生成對抗網(wǎng)絡(luò)和變分自編碼器進(jìn)行產(chǎn)品創(chuàng)意設(shè)計(jì)和優(yōu)化使用AIGC進(jìn)行個(gè)性化服飾搭配推薦以及高效設(shè)計(jì)圖案生產(chǎn)利用文本和圖片生成能力,進(jìn)行創(chuàng)意廣告文案和視覺創(chuàng)作應(yīng)用AIGC智能作曲,生成符合風(fēng)格的音樂素材游戲設(shè)計(jì)繪畫創(chuàng)作UI設(shè)計(jì)文案創(chuàng)作輔助進(jìn)行智能游戲場景和角色生成,提升設(shè)計(jì)效率通過風(fēng)格遷移和創(chuàng)意繪畫算法輔助進(jìn)行作品創(chuàng)作依據(jù)交互數(shù)據(jù)進(jìn)行智能UI界面和體驗(yàn)優(yōu)化智能寫作系統(tǒng)協(xié)助撰寫創(chuàng)意廣告詞和文章創(chuàng)作AIGC在創(chuàng)意產(chǎn)業(yè)中的創(chuàng)新應(yīng)用可以釋放創(chuàng)意產(chǎn)業(yè)從業(yè)者的創(chuàng)造力,使其專注于更高價(jià)值的創(chuàng)新創(chuàng)造AI學(xué)科應(yīng)用:漸進(jìn)引入

學(xué)科共融高級深度學(xué)習(xí)和

智能決策和預(yù)測

強(qiáng)化學(xué)習(xí)和自主

AI驅(qū)動的跨領(lǐng)

通用人工智能的學(xué)科自然語言處理系統(tǒng)60806080606060808080608060控制系統(tǒng)域綜合創(chuàng)新初步探索哲學(xué)80608060806060606060606065206080608060608090809060807080經(jīng)濟(jì)學(xué)法學(xué)80905080教育學(xué)文學(xué)50902080歷史學(xué)理學(xué)20808090工學(xué)9090AI技術(shù)發(fā)展將先在文科領(lǐng)域(如文學(xué)、哲學(xué))產(chǎn)生顯著影響,隨后在理科和技術(shù)領(lǐng)域(如工學(xué)、醫(yī)學(xué))發(fā)揮更深遠(yuǎn)作用。農(nóng)學(xué)8090醫(yī)學(xué)8090軍事學(xué)管理學(xué)藝術(shù)學(xué)808080905080表格中的數(shù)字(1-100)代表不同學(xué)科在AI發(fā)展各階段的受益程度,本圖由AI給出,僅供參考異感世界:技術(shù)交融

虛實(shí)共生?

由人工智能技術(shù)快速發(fā)展和普及所塑造的社會-技術(shù)現(xiàn)象,人們對AI的高級能力、不可預(yù)測性和與現(xiàn)實(shí)界限的模糊感到不安、好奇或混淆。這一現(xiàn)象不僅影響人們與技術(shù)的互動方式,還在倫理、工作、社會結(jié)構(gòu)和人類自身價(jià)值觀方面產(chǎn)生深遠(yuǎn)影響?,F(xiàn)實(shí)-虛擬連續(xù)體人工倫理適應(yīng)性現(xiàn)實(shí)與AI生成的虛擬內(nèi)容之間的界限,以及這種界限如何影響人們的認(rèn)知和行為。主張需要建立動態(tài)的倫理框架來適應(yīng)不斷發(fā)展的AI技術(shù),以解決由此產(chǎn)生的道德和倫理問題。黑箱與白箱相容性社會認(rèn)知振蕩在AI決策過程的不透明性與人們對透明性和可解釋性需求之間找到平衡。AI如何在快速改變社會觀念和行為規(guī)范方面起到“催化劑”的作用,進(jìn)而影響社會的整體穩(wěn)定性。創(chuàng)新模式:組合放大

跨界融合構(gòu)建支持多種應(yīng)用程序、產(chǎn)品或服務(wù)的基礎(chǔ)設(shè)施或技術(shù)平臺,在共享系統(tǒng)中創(chuàng)造新的價(jià)值。強(qiáng)調(diào)通過結(jié)合現(xiàn)有強(qiáng)調(diào)將一個(gè)領(lǐng)域的創(chuàng)新應(yīng)用到另一個(gè)領(lǐng)域的過程,從而放大其影響和應(yīng)用范圍。的概念、技術(shù)或資發(fā)生在多個(gè)學(xué)科、行業(yè)或文化界限的交叉點(diǎn)上。強(qiáng)調(diào)在傳統(tǒng)邊界之外尋找靈感和解決方案。源以創(chuàng)造新的價(jià)值。組合創(chuàng)新平臺創(chuàng)新放大創(chuàng)新跨界創(chuàng)新范式轉(zhuǎn)變方法論創(chuàng)新對科學(xué)基礎(chǔ)假設(shè)的根本性改變。這種轉(zhuǎn)變往往顛覆現(xiàn)有的理論框架,導(dǎo)致科學(xué)觀念和實(shí)踐的重大變革。模塊化創(chuàng)新增量創(chuàng)新開發(fā)新的實(shí)驗(yàn)設(shè)計(jì)、數(shù)據(jù)分析技術(shù)或其他研究工具,揭示現(xiàn)有理論的局限性或促進(jìn)新理論的發(fā)展。創(chuàng)建可以在多個(gè)不同產(chǎn)品或系統(tǒng)中使用的標(biāo)準(zhǔn)化組件或模塊。這種創(chuàng)新允許快速組合和重新組合這些模塊以適應(yīng)新的需求或機(jī)遇。側(cè)重于現(xiàn)有產(chǎn)品、服務(wù)或流程的小幅改進(jìn),通常涉及對現(xiàn)有解決方案的細(xì)微調(diào)整,以增強(qiáng)性能、降低成本或提高用戶體驗(yàn)。AI

for

Research:理論進(jìn)化

宏微指引理論進(jìn)化技術(shù)融合洞察結(jié)合新技術(shù)進(jìn)展,AI重塑理論與實(shí)踐的結(jié)合點(diǎn),為實(shí)踐領(lǐng)域帶來前所未有的理論指導(dǎo)再啟蒙AI檢視原有的學(xué)說,自動補(bǔ)足研究空缺,進(jìn)而將傳統(tǒng)知識進(jìn)行創(chuàng)新性的重組,構(gòu)筑更完備的學(xué)術(shù)體系A(chǔ)I推進(jìn)對已有理論的進(jìn)一步創(chuàng)新,不僅局限于拓展,而是對核心觀點(diǎn)、理念和基礎(chǔ)做出變革超越交界知識融合宏微同構(gòu)預(yù)知AI探索尚未被人類涉及的學(xué)科交叉領(lǐng)域,開啟硅基生命認(rèn)知的新紀(jì)元,為知識體系增添新維度AI融合跨學(xué)科的知識,打破傳統(tǒng)邊界,使得單一事物可以被多維度、多角度地進(jìn)行解析與洞察AI構(gòu)建全面、細(xì)致且互為影響的預(yù)測體系,實(shí)現(xiàn)從微觀到宏觀的跨尺度認(rèn)知,為未來提供更準(zhǔn)確的指引AI心理學(xué):解讀認(rèn)知

智渡險(xiǎn)境u

心理揭示u

交互感知:研究AI如何通過大量的數(shù)據(jù)處理與分析,幫助揭示和理解人類心理學(xué)的問題。包括利用AI進(jìn)行心理健康診斷、行為預(yù)測和心理治療的輔助。探討人類如何感知和理解與AI的互動,以及這些互動如何影響人類的心理和情感狀態(tài)。包括研究人機(jī)界面設(shè)計(jì)、AI的情感智能以及人們對AI的信任和依賴程度。u

心智鏡像u

意識覺醒分析AI如何模仿或重現(xiàn)人類的認(rèn)知和情感過程,包括情感識別、決策支持以及學(xué)習(xí)和記憶模擬,以及探討AI在理解和模擬人類心理方面的潛力和限制。預(yù)測未來AI可能達(dá)到的自我意識和意志自由的狀態(tài)并理論化。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論