版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
人工智能創(chuàng)作中數(shù)據(jù)獲取與利用的著作權(quán)風險及化
解路徑
一、問題的提出
隨著人工智能技術(shù)的快速發(fā)展和廣泛應(yīng)
用,近年來,由人工智能自主創(chuàng)作詩歌、小
說、美術(shù)、音樂等已不再是新鮮事情。如同
人類作者創(chuàng)作需要已有文獻資料作為創(chuàng)作素
材一樣,人工智能創(chuàng)作也需要創(chuàng)作素材來“喂
養(yǎng)”,這些創(chuàng)作素材是以數(shù)據(jù)形式表現(xiàn)的各
種數(shù)字化作品。作為智能化的信息處理技術(shù),
人工智能創(chuàng)作需要將作為創(chuàng)作素材的海量作
品轉(zhuǎn)化為機器可識別的數(shù)據(jù)導入人工智能系
統(tǒng)中,形成龐大的內(nèi)容庫供機器學習使用,
并在此基礎(chǔ)上經(jīng)過對算法的設(shè)計、驗證和測
試,使計算機自主生成在外觀上與人類創(chuàng)作
具有同樣獨創(chuàng)性的作品。可見,人工智能創(chuàng)
作高度依賴于對已有數(shù)據(jù)作品的大規(guī)模利用。
根據(jù)著作權(quán)法的一般原理,任何人使用他人
處于權(quán)利保護期內(nèi)的作品,都應(yīng)當通過訂立
合同取得授權(quán)并支付費用(除非屬于著作權(quán)
的限制與例外情形,例如合理使用或者法定
許可),否則屬于侵害著作權(quán)的行為。由此便
提出人工智能在創(chuàng)作過程中獲取和利用數(shù)據(jù)
時所面臨的著作權(quán)侵權(quán)風險問題,這一問題
如果不能妥當?shù)赜枰越鉀Q,將不可避免地使
人工智能創(chuàng)作的作品一經(jīng)生成便背負上侵權(quán)
“原罪”,從而影響該作品的后續(xù)傳播與使
用,最終阻礙人工智能技術(shù)的廣泛應(yīng)用和社
會文化藝術(shù)的繁榮發(fā)展。
與人工智能創(chuàng)作不斷繁榮的圖景相比,
當前在解決人工智能創(chuàng)作中獲取與使用數(shù)據(jù)
的合法性問題上面臨諸多困境:立法上,2021
年6月1日實施的新修訂的《著作權(quán)法》(以
下稱現(xiàn)行《著作權(quán)法》)關(guān)于著作權(quán)限制與例
外的條款并未就此問題作出明確回應(yīng),使得
這一問題在現(xiàn)行立法框架下如何解決仍缺乏
規(guī)范依據(jù);司法上,在我國已經(jīng)發(fā)生的兩起
因人工智能創(chuàng)作引發(fā)的著作權(quán)侵權(quán)糾紛中,
當事人及審理法院僅將人工智能的創(chuàng)作結(jié)果
是否屬于作品及其著作權(quán)歸屬作為爭議焦點,
對于人工智能創(chuàng)作所使用的數(shù)據(jù)來源是否合
法則未予關(guān)注;理論上,當前關(guān)于人工智能
創(chuàng)作的諸多研究中,多數(shù)文獻將討論重心聚
焦于人工智能創(chuàng)作結(jié)果的可版權(quán)性及權(quán)利歸
屬上,對于人工智能創(chuàng)作來源的合法性問題
則關(guān)注不多。近期與此有關(guān)的研究文獻中,
有的以“合理使用制度的整體重塑”為關(guān)注
對象,有的則以“文本與數(shù)據(jù)挖掘”為討論
視角,直接從人工智能創(chuàng)作視角關(guān)注數(shù)據(jù)作
品獲取與使用的著作權(quán)風險的研究仍為數(shù)不
多。立足于此,本文將深入分析人工智能創(chuàng)
作中數(shù)據(jù)獲取與使用的著作權(quán)風險緣起,充
分評估人工智能創(chuàng)作中獲取與使用數(shù)據(jù)的風
險類型,在此基礎(chǔ)上借鑒國際立法并結(jié)合中
國實際探尋科學、合理、務(wù)實的化解之道,
希冀有助于深化人工智能創(chuàng)作的知識產(chǎn)權(quán)問
題研究,并借此推動人工智能技術(shù)應(yīng)用和文
化產(chǎn)業(yè)發(fā)展。
二、風險緣起:人工智能創(chuàng)作中的數(shù)據(jù)獲取與利用
(一)數(shù)據(jù)獲取與利用貫穿人工智能創(chuàng)
作全過程
首先是數(shù)據(jù)的獲取與輸入,這一環(huán)節(jié)也
可稱為“機器閱讀”。同人類作者創(chuàng)作一樣,
人工智能創(chuàng)作首先也需要獲取海量的創(chuàng)作素
材;但同人類作者創(chuàng)作不同的是,人工智能
創(chuàng)作所需的創(chuàng)作素材已不再是傳統(tǒng)形式的文
本、圖像、語音、視頻等,而是以數(shù)據(jù)集表
現(xiàn)的數(shù)字化作品。由此決定了人工智能創(chuàng)作
必須首先建立在數(shù)據(jù)的獲取與輸入基礎(chǔ)之上,
即從外部收集和提取數(shù)據(jù)并輸入人工智能系
統(tǒng)中形成數(shù)據(jù)副本,以此建立相應(yīng)的數(shù)據(jù)內(nèi)
容庫供后續(xù)機器學習之用,此階段即為人工
智能創(chuàng)作的“機器閱讀”環(huán)節(jié)。由此可見獲
取數(shù)據(jù)對于人工智能創(chuàng)作的重要性,正如有
學者指出的,“海量數(shù)據(jù)之于AI創(chuàng)作,就
如無數(shù)的語言詞匯之于一部名篇巨著”。據(jù)
微軟公司的人工智能研發(fā)人員介紹,世界上
第一部百分之百由人工智能作者“小冰”于
2017年創(chuàng)作的詩集《陽光失了玻璃窗》,就
是人工智能在學習了500多位詩人的現(xiàn)代詩
后,經(jīng)過上萬次訓練最終創(chuàng)作而成。從這一
意義上講,數(shù)據(jù)作品的獲取與輸入是人工智
能創(chuàng)作的基礎(chǔ)和前提。
其次是數(shù)據(jù)的處理與分析,這一環(huán)節(jié)也
可稱為“機器學習”。人工智能的核心競爭
力就在于其具有強大的自主學習能力,這種
自主學習能力主要體現(xiàn)在機器的深度學習上。
深度學習可以通過算法從原始數(shù)據(jù)中提取模
式并自動構(gòu)建特征,使機器可以在無人類干
預的情形下從數(shù)據(jù)中發(fā)掘出有價值的內(nèi)容。
具體表現(xiàn)為,人工智能系統(tǒng)通過對大量已有
數(shù)據(jù)作品進行分類和整理,分析這些作品所
表達的思想感情、所采用的語言特征、所特
有的表達風格等,從中抽取和提煉出這些作
品的規(guī)則、模式、結(jié)構(gòu)、趨勢,再將這些規(guī)
則和模式應(yīng)用到具體創(chuàng)作場景之中,其后通
過自我觀察,獨立地、持續(xù)地改進和優(yōu)化其
分析和處理過程。機器學習幾乎壟斷了人工
智能領(lǐng)域里所有流行的技術(shù)方向,也是人工
智能創(chuàng)作得以完成的核心,甚至可以說“無
學習,不AI”。美國微軟公司與荷蘭國際銀
行合作開發(fā)的“下一個倫勃朗”人工智能創(chuàng)
作項目,就是通過收集荷蘭畫家倫勃朗的大
量作品,通過深度學習倫勃朗繪畫的風格從
而“發(fā)現(xiàn)”了倫勃朗作品的典型特征和創(chuàng)作
規(guī)則,最終利用這些特征和規(guī)則創(chuàng)作出模仿
倫勃朗獨特風格的原創(chuàng)繪畫。從這一意義上
講,機器學習過程就是數(shù)據(jù)作品的處理與分
析過程。
最后是數(shù)據(jù)的生成與傳播,這一環(huán)節(jié)也
可稱為“機器輸出”。經(jīng)過上述數(shù)據(jù)輸入和
自主學習兩個環(huán)節(jié)后,人工智能已經(jīng)能夠構(gòu)
建出解決不同目標任務(wù)所需要的函數(shù)模型算
法,此時只要人工智能使用者向人工智能系
統(tǒng)發(fā)出創(chuàng)作的要求和指令,人工智能系統(tǒng)就
會通過算法對任務(wù)進行處理,最終生成相應(yīng)
的學習結(jié)果并予以輸出。由此生成的結(jié)果可
以達到人類作品的獨創(chuàng)性,有些甚至比人類
作者創(chuàng)作的作品更具有藝術(shù)價值。例如繼
2017年自主創(chuàng)作出詩集《陽光失了玻璃窗》
后,微軟“小冰”2019年7月又在中央美術(shù)
學院美術(shù)館舉辦了全球首個人工智能個人畫
展“或然世界”,展出的畫作都是“小冰”
歷經(jīng)22個月對過往400年藝術(shù)史上236位著
名畫家繪畫作品學習后,獨立完成的100%原
創(chuàng)繪畫作品。美國羅格斯大學(Rutgers
University)的一項研究表明,在未披露真
實信息的情形下,一些受訪者不僅無法區(qū)分
人工智能創(chuàng)作的作品和人類作者創(chuàng)作的作品,
甚至認為人工智能創(chuàng)作的繪畫在視覺結(jié)構(gòu)和
靈感方面更具有藝術(shù)性。
(二)對數(shù)據(jù)的“表達性使用”使人工
智能創(chuàng)作面臨著作權(quán)侵權(quán)風險
在商標法的理論與立法中,對商標符號
的使用可以分為“商標性使用”與“非商標
性使用”,并由此產(chǎn)生不同的法律后果:前
者是認定商標侵權(quán)成立的前提,后者則是商
標不侵權(quán)抗辯的依據(jù)。在著作權(quán)立法中雖未
有類似的直接規(guī)定,但理論上亦有如此的分
類方法。有學者提出了“非展示性使用”與
“展示性使用”的概念,另有學者提出了“非
表達性使用”與“表達性使用”的概念,還
有學者提出了“作品性使用”與“非作品性
使用”的概念。本文采用“非表達性使用”
和“表達性使用”這一對表述。所謂“非表
達性使用“,是指使用原作品的目的并非為
了利用其具有獨創(chuàng)性的表達,而是將其作為
一種事實性信息進行功能性利用,在使用結(jié)
果上也未再現(xiàn)原作品的藝術(shù)價值;“表達性
使用”則是指使用原作品的目的在于利用其
獨創(chuàng)性表達,從而在使用結(jié)果上也再現(xiàn)了其
藝術(shù)價值(無論是“原樣再現(xiàn)”抑或“改編
再現(xiàn)”)。將對作品的使用作如此區(qū)分的意
義在于,“非表達性使用”與“表達性使用”
基于行為性質(zhì)的不同會產(chǎn)生迥異的法律后果:
在“非表達性使用”情形下,因使用行為并
非以再現(xiàn)作品的獨創(chuàng)性表達為目的,亦未產(chǎn)
生可能與原作品具有競爭性的替代作品,故
“不會影響原作品的正常使用,也不會不合
理損害權(quán)利人的合法權(quán)益”,從而可能成為
不侵害著作權(quán)的抗辯理由;而在“表達性使
用”情形下,由于后續(xù)行為使用的是原作品
中的獨創(chuàng)性表達,并在此基礎(chǔ)上形成了與原
作品相關(guān)聯(lián)、甚至可能替代原作品的新作品,
從而可能“影響原作品的正常使用”或者會
“不合理地損害原作品權(quán)利人的合法權(quán)益”,
使其面臨著作權(quán)侵權(quán)風險。
國內(nèi)外均有將“表達性使用”與“非表
達性使用”理論適用于司法實踐的案例。在
“美國作家協(xié)會訴谷歌公司著作權(quán)侵權(quán)糾紛”
一案中,被告谷歌公司將原告享有著作權(quán)的
大量圖書進行全文掃描用于建立“谷歌數(shù)字
圖書館”,同時向社會公眾提供這些數(shù)字化
作品的關(guān)鍵詞搜索及片段性內(nèi)容。美國聯(lián)邦
第二巡回上訴法院認為,被告實質(zhì)上是將原
告的作品作為一種數(shù)據(jù)統(tǒng)計工具進行使用,
在使用目的上具有轉(zhuǎn)換性,構(gòu)成合理使用。
該案中,被告谷歌公司的行為之所以被認定
為合理使用,是因為其復制圖書的目的不是
為了向公眾提供圖書的全文內(nèi)容,而是通過
提供關(guān)鍵詞搜索和展示小片段內(nèi)容給公眾提
供一種事實性信息,便于公眾進一步查尋圖
書相關(guān)信息,發(fā)揮其信息檢索功能,該種使
用即為“非表達性使用“,不會對原作品產(chǎn)
生實質(zhì)替代。在我國上海知識產(chǎn)權(quán)法院審理
的“上海美術(shù)電影制片廠訴浙江新影年代文
化傳播有限公司著作權(quán)侵權(quán)糾紛”一案中,
被告在其拍攝的電影《80后的獨立宣言》的
宣傳海報中使用了原告享有著作權(quán)的“葫蘆
娃”“黑貓警長”美術(shù)形象。針對被告此種
使用行為的定性,法院認為,被告在電影海
報中使用涉案作品不是為了單純地再現(xiàn)其藝
術(shù)美感,而是為了反映“80后”一代曾經(jīng)經(jīng)
歷過的、伴隨其成長的“葫蘆娃”“黑貓警
長”動畫片熱播的時代特征,屬于轉(zhuǎn)換性使
用,并不影響涉案作品的正常使用,也未不
合理地損害權(quán)利人的合法利益,構(gòu)成合理使
用。該案中法院所稱的“轉(zhuǎn)換性使用”即是
一種“非表達性使用”,因為被告只是將“葫
蘆娃”“黑貓警長”作為80年代的時代符號,
從而喚起人們對那個年代的特殊回憶,其藝
術(shù)性和審美價值到底有多高在所不問,因此
不會有人將電影海報當作“葫蘆娃”“黑貓
警長”的替代品,該電影海報也就不會對“葫
蘆娃”“黑貓警長”美術(shù)形象的版權(quán)市場構(gòu)
成競爭。
人工智能對數(shù)據(jù)作品的使用也有“表達
性使用”和“非表達性使用”之區(qū)分。例如
為了運行人臉識別智能系統(tǒng)而使用人臉照片
就是一種“非表達性使用”,該智能系統(tǒng)使
用的是照片中人臉的生理特征元素,而并非
照片中具有獨創(chuàng)性的元素(例如選擇人物的
光線、角度、色彩等)。本文所探討的“人
工智能創(chuàng)作”對于數(shù)據(jù)作品的使用顯然屬于
“表達性使用”,實際上“創(chuàng)作”一詞本身
已經(jīng)清晰表明,人工智能使用數(shù)據(jù)作品的目
的是為了“創(chuàng)作”。由此意味著人工智能對
于數(shù)據(jù)的使用并非針對原作品的事實性信息,
而是其中的獨創(chuàng)性表達;使用的結(jié)果也并非
實現(xiàn)了所謂目的性或者功能性轉(zhuǎn)換,而是形
成了與原作品有關(guān)聯(lián)的“新作品”,正是在
這一意義上,人工智能創(chuàng)作對于數(shù)據(jù)作品的
使用屬于“表達性使用”。實踐中這樣的例
子并不少見,例如由音樂制作公司
Technologie開發(fā)的人工智能系統(tǒng)AIVA
通過深度學習大量作曲家創(chuàng)作的音樂,能夠
為電影、視頻游戲、商業(yè)廣告和任何類型的
娛樂內(nèi)容創(chuàng)作配樂,由于其配樂效果絲毫不
亞于專業(yè)音樂作曲家,AIVA還因此得到法
國作曲家協(xié)會(SACEM)的資格認證,成為人工
智能領(lǐng)域首個獲得國際認證的虛擬作曲家。
正是基于人工智能創(chuàng)作對于數(shù)據(jù)作品的“表
達性使用”,其難以適用前述“谷歌數(shù)字圖
書館案”和“《80后的獨立宣言》宣傳海報
案”中的“轉(zhuǎn)換性使用”合理使用抗辯,從
而面臨著作權(quán)侵權(quán)風險。
三、風險評估:解釋論下人工智能創(chuàng)作利用數(shù)據(jù)之侵
權(quán)分析
(一)人工智能創(chuàng)作利用數(shù)據(jù)可能侵害
的權(quán)利類型
1.復制權(quán)侵權(quán)風險
首先是數(shù)據(jù)獲取與輸入環(huán)節(jié)的復制權(quán)侵
權(quán)風險。在人工智能進行深度自主學習之前,
需要將作為創(chuàng)作素材的作品進行數(shù)字化處理
并轉(zhuǎn)換為適合“機器閱讀”的標準數(shù)據(jù)格式。
一般而言,完成這一過程有三種路徑:一是
將非數(shù)字格式的作品轉(zhuǎn)化為機器可讀的數(shù)字
格式。例如將圖書進行掃描并數(shù)字化轉(zhuǎn)化為
機器可讀的數(shù)據(jù)信息。二是直接在互聯(lián)網(wǎng)上
抓取已經(jīng)數(shù)字化的數(shù)據(jù)作品。三是將已經(jīng)數(shù)
字化但格式上不兼容的數(shù)據(jù)進行標準格式的
轉(zhuǎn)換。上述三種方式都是對已有作品在不改
變內(nèi)容情形下所進行的全文復制和原樣再現(xiàn),
并且存儲在機器中形成永久復制件,屬于著
作權(quán)法上的“復制”行為,存在侵犯復制權(quán)
的風險。如果說在2021年6月1日之前,要
將數(shù)字化復制行為納入我國《著作權(quán)法》中
復制權(quán)的控制范圍,尚需對原《著作權(quán)法》
第10條第1款第(一)項中的“等”字予以擴
大解釋的話(該項列舉的7種復制類型并無
“數(shù)字化”方式);那么在2021年6月1日
現(xiàn)行《著作權(quán)法》實施后,則無需進行擴大
解釋,僅依文義即可將所有數(shù)字化復制行為
直接納入復制權(quán)的涵蓋范圍,因為現(xiàn)行《著
作權(quán)法》在原有7種復制類型后專門增加了
“數(shù)字化”復制方式。
其次是作品輸出環(huán)節(jié)的復制權(quán)侵權(quán)風險。
根據(jù)“接觸+實質(zhì)性相似”的著作權(quán)侵權(quán)判定
規(guī)則,如果人工智能最終輸出的內(nèi)容與之前
所使用的數(shù)據(jù)作品存在實質(zhì)性相似,則同樣
可能會侵犯復制權(quán)。與前述全文復制或原樣
再現(xiàn)不同的是,此種“實質(zhì)性相似”判斷還
要受到“思想/表達二分法”原則的限制,如
果構(gòu)成實質(zhì)性相似的是思想而非表達,則難
以構(gòu)成著作權(quán)法意義上的復制。例如,人工
智能提取某一位特定作者的所有作品,通過
數(shù)據(jù)處理掌握該作者的作品“風格”,從而
能夠模仿這一“風格”進行創(chuàng)作,即使創(chuàng)作
結(jié)果與該作者的“風格”構(gòu)成了實質(zhì)性相似,
但并非必然構(gòu)成侵犯復制權(quán),因為風格更接
近于思想,有可能基于“思想/表達二分法”
原則而被排除出作品保護范圍。索尼實驗室
2016年開發(fā)的FlowMachines人工智能系
統(tǒng),以披頭士樂隊的風格創(chuàng)作的《爸爸的車》
(Daddy'sCar)音樂旋律就屬于思想上的實
質(zhì)性相似。正是由于人工智能創(chuàng)作在使用數(shù)
據(jù)作品時可能會侵害復制權(quán),歐盟立法和日
本立法都將人工智能對于數(shù)據(jù)的使用規(guī)定為
復制權(quán)的例外(具體內(nèi)容后文詳述)。
2.改編權(quán)侵權(quán)風險
人工智能利用數(shù)據(jù)作品進行創(chuàng)作的結(jié)果
中無非有三種情形:一是創(chuàng)作結(jié)果屬于與原
作品完全不同的全新作品;二是創(chuàng)作結(jié)果屬
于與原作品實質(zhì)性相似的作品;三是創(chuàng)作結(jié)
果屬于在保留原作品基本表達基礎(chǔ)上形成的
具有獨創(chuàng)性的新作品。第一種情形是著作權(quán)
法所積極鼓勵的作品利用方式,不僅不侵權(quán)
而且符合著作權(quán)法”鼓勵作品創(chuàng)作與傳播”
的立法目的。在第二種情形下,如果實質(zhì)性
相似的是表達,則構(gòu)成侵犯復制權(quán);如果實
質(zhì)性相似的是思想,則不侵犯著作權(quán)。第三
種情形則屬于改編行為,存在侵犯改編權(quán)的
風險,因為改編權(quán)控制的正是“改變作品,
創(chuàng)作出具有獨創(chuàng)性的新作品”的作品利用行
為。
在人工智能創(chuàng)作中,如果最終輸出的生
成內(nèi)容雖具有一定的獨創(chuàng)性,但仍然保留了
數(shù)據(jù)庫中某一作品或者某些作品的基本表達,
應(yīng)屬于改編作品,此種創(chuàng)作行為如未經(jīng)許可
并支付報酬則可能侵害改編權(quán)。有觀點認為,
將此種情形下人工智能的創(chuàng)作結(jié)果視為演繹
作品的說法并不十分準確,理由是人工智能
創(chuàng)作“不是實質(zhì)性地以某個作品為基礎(chǔ)所進
行的再創(chuàng)作,不是對某個作品的演繹”。實
際上,從人工智能創(chuàng)作對已有數(shù)據(jù)的利用來
看,可以分為“利用同一人作品”進行創(chuàng)作
和“利用多數(shù)人作品”進行創(chuàng)作兩種情形:
前者如微軟公司開發(fā)的“下一個倫勃朗”人
工智能系統(tǒng),通過深度學習倫勃朗346幅畫
創(chuàng)作出了與倫勃朗風格相似但又具有獨創(chuàng)性
的繪畫作品;后者如微軟“小冰”深度學習
1926年以來500多位詩人的現(xiàn)代詩創(chuàng)作了
《陽光失了玻璃窗》。這兩種情形都是利用
已有作品創(chuàng)作出新作品的情形,如果被學習
的作品仍在著作權(quán)保護期限內(nèi),則都屬于侵
犯改編權(quán)的行為;區(qū)別在于前者侵害了同一
作者數(shù)個作品的改編權(quán),后者侵害了不同作
者各自作品的改編權(quán)。正是由于人工智能創(chuàng)
作在利用數(shù)據(jù)作品過程中可能會侵害改編權(quán),
日本立法將人工智能對于數(shù)據(jù)的使用規(guī)定為
改編權(quán)的例外(具體內(nèi)容后文詳述)。
3.傳播權(quán)侵權(quán)風險
傳播權(quán)并非我國《著作權(quán)法》所明確規(guī)
定的財產(chǎn)權(quán)利,是學理上對那些不依賴于作
品有形載體的移轉(zhuǎn)而以無形方式傳播作品所
產(chǎn)生的權(quán)利的概括。在我國現(xiàn)行立法中,傳
播權(quán)包括表演權(quán)、放映權(quán)、廣播權(quán)和信息網(wǎng)
絡(luò)傳播權(quán)。人工智能創(chuàng)作涉及的傳播權(quán)侵權(quán)
風險主要是信息網(wǎng)絡(luò)傳播權(quán)和廣播權(quán),表現(xiàn)
在人工智能創(chuàng)作的輸出環(huán)節(jié):若將機器學習
的數(shù)據(jù)分析結(jié)果通過網(wǎng)絡(luò)即時公開發(fā)布,可
能會侵犯作品廣播權(quán);如果延時發(fā)布,則可
能侵犯信息網(wǎng)絡(luò)傳播權(quán)。已有學者注意到人
工智能創(chuàng)作輸出環(huán)節(jié)存在的傳播權(quán)侵權(quán)風險
問題,例如有觀點提出,“一般來說,為了
進行數(shù)據(jù)挖掘或機器學習,或者為了實現(xiàn)研
究結(jié)果的可驗證性,需要將數(shù)據(jù)或文本通過
互聯(lián)網(wǎng)進行傳輸,可能涉及侵犯向公眾傳播
權(quán)”。還有觀點認為,“目前多數(shù)發(fā)布途徑
均包含網(wǎng)絡(luò)發(fā)布環(huán)節(jié),無法有效規(guī)避信息網(wǎng)
絡(luò)傳播的侵權(quán)風險”。正是由于人工智能創(chuàng)
作在使用數(shù)據(jù)作品中可能會侵害傳播權(quán),為
了避免此種侵權(quán)風險,《日本著作權(quán)法》于
2018年修訂時專門增加了“提供新的知識和
信息”的著作權(quán)例外條款,根據(jù)該條規(guī)定,
如果是為了提供新的知識或者新的信息,通
過計算機對作品進行信息處理,可以將處理
結(jié)果向公眾提供(進一步分析詳見后文)。
(二)人工智能創(chuàng)作利用數(shù)據(jù)侵權(quán)豁免
之困境
著作權(quán)法上的侵權(quán)豁免理由一般有合理
使用、法定許可和強制許可三種類型。我國
現(xiàn)行立法中尚無強制許可制度,法定許可規(guī)
則所確定的四種類型也難以適用于人工智能
創(chuàng)作場合,以下幾種合理使用情形最有可能
作為侵權(quán)抗辯依據(jù)。
1.人工智能創(chuàng)作與“個人學習、研究”
根據(jù)我國現(xiàn)行《著作權(quán)法》第24條第1
款第(一)項的規(guī)定,”為個人學習、研究或
者欣賞,使用他人已經(jīng)發(fā)表的作品“可以不
經(jīng)著作權(quán)人許可亦無需支付報酬,此即為我
國立法上的“個人使用”合理使用類型。人
工智能創(chuàng)作需要對數(shù)據(jù)作品進行學習和研究,
似乎在文義上屬于“個人使用”合理使用類
型中的“學習”“研究”范疇,但仔細分析
后可發(fā)現(xiàn),人工智能創(chuàng)作并不符合該條款的
規(guī)范意旨,從而難以適用該規(guī)定進行合理使
用抗辯。理由如下:其一,從主體要件來看,
“個人學習、研究”中的“個人”通常限于
自然人,人工智能創(chuàng)作中使用數(shù)據(jù)的行為主
體為人工智能系統(tǒng),并非自然人,而控制人
工智能創(chuàng)作系統(tǒng)的主體也是具備一定技術(shù)條
件和物質(zhì)條件的組織機構(gòu),并非單個的自然
人。雖然實踐中直接操作或者使用人工智能
系統(tǒng)進行創(chuàng)作的主體可能是作為自然人的科
研人員或者公司員工,但這些科研人員或者
公司員工所從事的“學習、研究”是為履行
人工智能所有者(一般為大型科技公司)安排
的工作任務(wù)所實施的職務(wù)行為,并非為了科
研人員或者公司員工自己創(chuàng)作而進行“學習、
研究”,因此不符合個人使用的主體要求。
其二,從目的要件來看,個人使用必須是基
于“學習、研究”的非商業(yè)目的,當前的人
工智能創(chuàng)作均由大型商業(yè)互聯(lián)網(wǎng)公司所控制
和實施,也難以符合個人使用的非商業(yè)目的
要求。
2.人工智能創(chuàng)作與“科學研究”
根據(jù)我國現(xiàn)行《著作權(quán)法》第24條第1
款第(六)項的規(guī)定,在“為科學研究,翻譯、
改編、匯編、播放或者少量復制已經(jīng)發(fā)表的
作品,供科研人員使用,但不得出版發(fā)行”
情形下,可以不經(jīng)著作權(quán)人許可亦無需支付
報酬,此即為我國立法上的“科學研究”合
理使用類型。在人工智能創(chuàng)作中,對數(shù)據(jù)作
品進行分析和處理就是一種科學研究活動,
但此種情形仍難以適用“科學研究”類型的
合理使用抗辯。理由如下:首先,著作權(quán)法
規(guī)定的科學研究合理使用類型屬于以公共利
益為目的對著作權(quán)進行的限制,因而該情形
下的科研機構(gòu)及科研活動應(yīng)“只適用于國家
設(shè)立的教育、科研公共事業(yè)單位(比如經(jīng)相關(guān)
主管部門、教委批準設(shè)立的學校、全額財政
撥款的國家科研機構(gòu)等)"。當前主導人工智
能創(chuàng)作的主體多為大型商業(yè)互聯(lián)網(wǎng)公司,例
如在國務(wù)院2017年發(fā)布的《新一代人工智能
發(fā)展規(guī)劃》中,國家所依托的四個智能開放
創(chuàng)新平臺分別由百度、阿里云、騰訊和科大
訊飛等大型商業(yè)科技公司承擔。其次,此類
合理使用對于復制作品有數(shù)量限制,即“少
量復制”。前文已述,人工智能創(chuàng)作中使用
數(shù)據(jù)作品往往涉及對作品的全文復制,因此
不符合“少量”的要求。最后,此類合理使
用要求對于數(shù)據(jù)作品應(yīng)“僅供科研人員使用”
實踐中,人工智能創(chuàng)作使用數(shù)據(jù)的主體要么
是作為人工智能所有人的大型互聯(lián)網(wǎng)企業(yè),
要么是通過購買人工智能系統(tǒng)成為使用人的
其他大型企業(yè);即使人工智能創(chuàng)作實際由科
研人員進行操作,其也是基于履行崗位職責
要求而實施的職務(wù)行為,不符合“供科研人
員使用”這一條件,因此無法適用此種合理
使用類型進行抗辯。
3.人工智能創(chuàng)作與“適當引用”
根據(jù)我國現(xiàn)行《著作權(quán)法》第24條第1
款第(二)項的規(guī)定,”為介紹評論某一作品
或者說明某一問題,在作品中適當引用他人
已經(jīng)發(fā)表的作品“,可以不經(jīng)著作權(quán)人許可
亦無需支付報酬,此即為我國立法上的“適
當引用”合理使用類型。人工智能創(chuàng)作是在
學習已有作品基礎(chǔ)上進行的二次創(chuàng)作,不可
避免地要引用已有作品,表面上看似乎屬于
適當引用,但仔細分析可以發(fā)現(xiàn),此種合理
使用類型也難以作為對人工智能創(chuàng)作使用數(shù)
據(jù)予以侵權(quán)豁免的法律依據(jù)。理由如下:其
一,人工智能創(chuàng)作使用數(shù)據(jù)不符合“適當引
用”條款所要求的目的要件。根據(jù)法條文義,
適當引用必須是“為介紹、評論某一作品或
者說明某一問題”,也就是說,“被引用的
內(nèi)容應(yīng)當是介紹評論的主要對象或者與所說
明的問題存在必然的聯(lián)系,即引用須具備足
夠的必要性”。人工智能創(chuàng)作使用數(shù)據(jù)完全
是為了生成新作品,既非“為介紹評論某一
作品”,也非“為說明某一問題”。其二,
人工智能創(chuàng)作使用數(shù)據(jù)不符合“適當引用”
條款所要求的“適當性”要件?!霸诰邆浔?/p>
要性的前提后,使用作品的數(shù)量、方式、范
圍還必須控制在一定的限度之內(nèi),避免與原
作在市場上產(chǎn)生競爭,以免對著作權(quán)人利益
造成不合理的損害,即引用須符合一定的適
當性?!笨梢?,引用的適當性要求所引用的
部分不能構(gòu)成被引作品的主要部分或?qū)嵸|(zhì)部
分,引用作品與被引作品具有主從關(guān)系和顯
著的區(qū)別,如此才不會造成引用作品構(gòu)成被
引作品的“替代品”。人工智能創(chuàng)作對于數(shù)
據(jù)作品的使用顯然已經(jīng)超出了適當性的要求,
因此不符合“適當性”要件。
4.司法政策“混合標準”下的人工智能
創(chuàng)作
我國在合理使用規(guī)則的設(shè)立上采取了封
閉式的立法技術(shù),即認定合理使用只能在《著
作權(quán)法》列舉的具體類型清單中“對號入座”,
不能在清單之外創(chuàng)設(shè)其他合理使用類型。但
是,最高人民法院于2011年發(fā)布的一項司法
政策在法定清單之外創(chuàng)設(shè)了認定合理使用的
“混合標準”。之所以將其稱為“混合標準”,
是因為其把《美國版權(quán)法》的“四要素標準”
和國際條約的“三步檢驗法”混在一起形成
了“確有必要+特殊情形+四要素標準+三步檢
測法(后兩步)”的合理使用認定規(guī)則。該項
司法政策并不屬于司法解釋,不宜直接作為
法律適用依據(jù),但可以在裁判說理中予以參
照。與《著作權(quán)法》明確列舉的合理使用類
型相比,該“混合標準”過于原則和抽象,
使得人工智能創(chuàng)作能否被認定為合理使用具
有很大的不確定性。例如同樣采用“四要素
標準”,有學者認為人工智能創(chuàng)作使用數(shù)據(jù)
可以納入合理使用范疇,另有學者得出了截
然相反的結(jié)論。因此,即使將司法政策的“混
合標準”作為司法解釋予以適用,人工智能
創(chuàng)作中的數(shù)據(jù)使用行為仍然存在著作權(quán)侵權(quán)
風險。
四、風險化解:將人工智能創(chuàng)作利用數(shù)據(jù)納入合理使
用的價值考量
(一)傳統(tǒng)許可模式難以滿足數(shù)據(jù)規(guī)模
化利用的現(xiàn)實考量
人工智能創(chuàng)作所使用的數(shù)據(jù)在價值上具
有低密度性,即單個作品對最終形成的創(chuàng)作
成果貢獻極小,由此意味著只有大批量、規(guī)
?;厥褂脭?shù)據(jù)對于人工智能創(chuàng)作才有意義。
這種低密度性特征給著作權(quán)的傳統(tǒng)授權(quán)模式
帶來極大挑戰(zhàn):一方面,要避免人工智能創(chuàng)
作物一經(jīng)生成便背負上侵權(quán)的“原罪”風險,
唯一途徑就是逐一獲得數(shù)據(jù)作品著作權(quán)人的
許可并支付報酬;另一方面,要求人工智能
系統(tǒng)使用者為了實施創(chuàng)作從“海量作者”中
點對點地獲得“海量作品”的“海量許可”
在現(xiàn)實中幾乎不太可能。由此便產(chǎn)生美國學
者戈登(WendyJ.Gordon)所提出的著作權(quán)許
可市場失靈的問題,即當事人之間無法通過
市場交易實現(xiàn)對版權(quán)作品的有效利用,此時
采用合理使用規(guī)則配置數(shù)據(jù)資源可能是實現(xiàn)
社會福利和公共利益最大化的最佳選擇。
有觀點提出,可以采用法定許可制度解
決人工智能創(chuàng)作使用數(shù)據(jù)作品的困境。筆者
以為,采用法定許可制度仍需支付報酬,由
于人工智能創(chuàng)作所使用的數(shù)據(jù)具有數(shù)量大、
種類多、范圍廣的特點,決定了實施人工智
能創(chuàng)作所支付的數(shù)據(jù)許可費用是非常巨大的。
當人工智能創(chuàng)作使用數(shù)據(jù)作品所付出的許可
費遠大于創(chuàng)作結(jié)果帶來的收益時,作為理性
“經(jīng)濟人”的人工智能投資者便不太可能接
受此種作品使用方式。此時如果不給予人工
智能創(chuàng)作使用數(shù)據(jù)以侵權(quán)豁免,則有可能會
導致兩種結(jié)果:一是人工智能投資者在面對
海量作品的巨額使用費時會減少甚至放棄人
工智能創(chuàng)作技術(shù)的研發(fā)與應(yīng)用;二是一些人
工智能企業(yè)可能會選擇鋌而走險,寧愿背負
上侵權(quán)的“原罪”,也要置著作權(quán)于不顧而
任意使用他人作品,反而加劇了侵權(quán)行為的
發(fā)生,特別是在人工智能創(chuàng)作使用數(shù)據(jù)一般
都比較隱蔽、權(quán)利人不容易發(fā)現(xiàn)的情形下,
此種情形發(fā)生的概率更大。此外,法定許可
制度所面臨的使用費難以落實的困境至今未
能有效解決,使得我國的法定許可制度在一
定程度上形同虛設(shè)。因此,即使是建議采用
法定許可制度解決人工智能創(chuàng)作使用數(shù)據(jù)問
題的學者也承認,“法定許可制度配套措施
的落實仍存在相當?shù)碾y度”。
(二)促進文化藝術(shù)繁榮的公共政策考
量
人工智能創(chuàng)作以數(shù)據(jù)為“源頭活水”,
數(shù)據(jù)的質(zhì)量往往在一定程度上決定人工智能
創(chuàng)作成果的藝術(shù)價值,為了獲得高質(zhì)量的創(chuàng)
作成果,人工智能企業(yè)需要大量優(yōu)質(zhì)的數(shù)據(jù)
來進行人工智能系統(tǒng)的培訓。一般情形下,
需要授權(quán)并付費的數(shù)據(jù)往往使用價值更高一
些,因此受著作權(quán)保護的數(shù)據(jù)作品對人工智
能訓練更具吸引力。如果不為人工智能創(chuàng)作
使用數(shù)據(jù)設(shè)置合理使用規(guī)則,要想使人工智
能創(chuàng)作使用數(shù)據(jù)避免背負侵權(quán)“原罪”的風
險,使用者就必須獲得數(shù)據(jù)作品著作權(quán)人的
許可并支付費用。但正如前文所述,人工智
能創(chuàng)作在使用數(shù)據(jù)上具有低密度特征,為了
降低使用成本并消除侵權(quán)風險,人工智能企
業(yè)往往傾向于將受著作權(quán)保護的作品剔除出
數(shù)據(jù)庫,而更多使用那些不受著作權(quán)保護的
處于公共領(lǐng)域的數(shù)據(jù)來訓練人工智能,如此
會造成創(chuàng)作結(jié)果的同質(zhì)化和低劣化,不利于
著作權(quán)法”促進文化藝術(shù)繁榮”價值目標的
實現(xiàn)。
另一方面,如果全部都使用那些不受版
權(quán)保護的處于公共領(lǐng)域的數(shù)據(jù)作品,可能會
導致人工智能開發(fā)者“獲取限制較低但帶有
偏見的數(shù)據(jù)集“來訓練算法,從而影響創(chuàng)作
結(jié)果的客觀性和準確性,這一點對科學作品
創(chuàng)作的影響尤為明顯。具體而言,在人工智
能創(chuàng)作過程中,如果機器學習所使用的數(shù)據(jù)
本身不夠完整或存在一定的價值傾向,則機
器學習的結(jié)果也會存在一定的價值傾向,從
而導致人工智能創(chuàng)作的作品存在一定的偏見。
“出現(xiàn)算法偏見的主要原因除了算法設(shè)計缺
陷、算法設(shè)計者身份同質(zhì)化之外,另一個重
要的原因是訓練算法的數(shù)據(jù)集不充足、不完
整。”當人工智能研發(fā)者無法獲得著作權(quán)人
的許可時,機器學習的資源必然會局限在已
經(jīng)進入公共領(lǐng)域的作品中,但由于這些已處
于公共領(lǐng)域的作品無法全面反映人類最新的
智慧成果,勢必會導致人工智能創(chuàng)作的作品
存在隱形偏見。當被問及人工智能系統(tǒng)AIVA
為何選擇專注于古典音樂時,AIVA
Technologies的創(chuàng)始人解釋道:”因為供
AIVA學習的所有編程函數(shù)的音樂版權(quán)都是
已經(jīng)失效的?!币虼耍瑢⑷斯ぶ悄軇?chuàng)作使用
數(shù)據(jù)納入合理使用范疇,能夠擴大人工智能
創(chuàng)作獲取學習資源的范圍,在一定程度上能
夠避免隱形偏見,為社會提供更加優(yōu)質(zhì)的作
口
口口O
(三)維護公平競爭的市場秩序考量
為了避免著作權(quán)侵權(quán)風險并降低使用成
本,在采用傳統(tǒng)的談判授權(quán)方式幾乎不可能
的情形下通過格式合同免費獲取數(shù)據(jù)成為一
些大型互聯(lián)網(wǎng)公司的選擇,當今“用戶創(chuàng)造
內(nèi)容”(UGC)模式的興起則使這種選擇成為現(xiàn)
實。隨著“人人都是創(chuàng)作者”時代的到來,
普通的終端用戶身份正在發(fā)生變化,龐大的
用戶群體每時每刻以創(chuàng)作者身份生成大量數(shù)
據(jù)信息,這些數(shù)據(jù)信息可能包括電子郵件、
博客、論壇帖子,其中不乏一些符合獨創(chuàng)性
要求而享有著作權(quán)的作品。一些大型互聯(lián)網(wǎng)
企業(yè)(例如谷歌、微軟、騰訊、蘋果、百度等)
通過設(shè)置所謂“服務(wù)條款”或者“用戶須知”
格式條款,要求用戶在注冊時選擇允許互聯(lián)
網(wǎng)企業(yè)免費使用用戶發(fā)布的信息,這樣就給
大型互聯(lián)網(wǎng)企業(yè)采取“以服務(wù)換取數(shù)據(jù)”模
式免費使用用戶的數(shù)據(jù)提供了機會,從而為
互聯(lián)網(wǎng)企業(yè)規(guī)避著作權(quán)侵權(quán)風險提供了可能。
但是,這種“以服務(wù)換取數(shù)據(jù)”模式通
常只適用于大型互聯(lián)網(wǎng)企業(yè),因為只有大型
互聯(lián)網(wǎng)企業(yè)才擁有大量的用戶?!爸T如
Facebook或IBM等大公司可通過取得用
戶授權(quán)組建訓練數(shù)據(jù),以形成龐大的訓練數(shù)
據(jù)解決使用訓練數(shù)據(jù)受限的問題,而眾多中
小公司只能使用不受版權(quán)保護、已過版權(quán)保
護期、處于公有領(lǐng)域的作品作為訓練數(shù)據(jù)?!?/p>
大公司收集的數(shù)據(jù)信息越多就越能完善其人
工智能服務(wù),從而也就能夠吸引更多用戶選
擇其服務(wù)并進而獲取更多信息。相反,中小
企業(yè)則因為用戶數(shù)量少,其可以免費使用的
數(shù)據(jù)無論在數(shù)量還是質(zhì)量上都無法與大公司
相比,久而久之會進一步加劇這種相差懸殊
的狀況,最終形成強者更強、弱者更弱的不
公正的市場競爭環(huán)境。因此,如果不將人工
智能創(chuàng)作中使用數(shù)據(jù)的行為納入合理使用,
有可能造成高科技領(lǐng)域的不公平競爭,使中
小型人工智能企業(yè)的生存更加艱難。
(四)促進人工智能技術(shù)發(fā)展的國家戰(zhàn)
略考量
在當前新一輪科技革命和產(chǎn)業(yè)變革中,
對社會影響最為廣泛的非人工智能技術(shù)莫屬,
與此相適應(yīng),世界各國都在積極營造更有利
于人工智能技術(shù)應(yīng)用和產(chǎn)業(yè)發(fā)展的政策法治
環(huán)境。我國也非常重視人工智能技術(shù)的應(yīng)用
與發(fā)展,國務(wù)院早在2017年7月就發(fā)布了《關(guān)
于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》,
指出“人工智能是引領(lǐng)未來的戰(zhàn)略性技術(shù),
世界主要發(fā)達國家把發(fā)展人工智能作為提升
國家競爭力、維護國家安全的重大戰(zhàn)略”,
并明確提出要“加緊出臺規(guī)劃和政策,圍繞
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 感恩團隊課件教學課件
- 體育籃球教案
- 兒歌走路課件教學課件
- 會議接待租賃租車協(xié)議書范本
- 個人隱私侵權(quán)賠償協(xié)議書范本
- 樂器維修服務(wù)合同模板
- 大學資料課件教學課件
- 臨時銷售經(jīng)理工作合同
- 代銷合同模板
- 交通運輸計量設(shè)備管理策略
- 啄木鳥糾錯活動方案(八篇)
- 出口退稅知識培訓
- 某水利工程引水隧洞重大設(shè)計變更索賠報告
- 山東省青島市青島第二中學2024年高三物理第一學期期中聯(lián)考模擬試題含解析
- 大學辦公室管理制度公司管理制度
- 牛津譯林版八年級英語上冊Unit 7 Seasons Grammar 示范公開課教學課件
- 居家養(yǎng)老服務(wù)管理(社區(qū)居家養(yǎng)老服務(wù)課件)
- 妊娠合并癥 妊娠合并心臟?。▼D產(chǎn)科護理課件)
- QC小組活動程序講解(自定目標值類型)
- 市民中心信息系統(tǒng)運營維護方案
- 職業(yè)衛(wèi)生檢測考試題庫(400題)
評論
0/150
提交評論