下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
分析:人工智能的崛起
研究人員最近對一個名叫ConceptNet的人工智能系統(tǒng)進行了測評。在一項為檢測兒童智商而設計的測試中,ConceptNet的得分超過了一名智商正常的四歲兒童。該測試共包含五項與詞語推理和詞匯有關的測驗,ConceptNet的總得分為69分,與之進行對比的學齡前兒童得分則為50分。并且專家認為,該系統(tǒng)的智能程度還會進一步加強。ConceptNet是一項由麻省理工學院常識計算計劃團隊(MITCommonSenseComputingInitiative)管理的開源項目。該團隊研發(fā)的ConceptNet4運用了所謂的“關系”這一概念。例如,當讓該系統(tǒng)解釋什么是“小鹿”時,它會明白“小鹿是一種鹿”,而不是”鹿是一種小鹿“。也就是說,它能夠理解這種動物的概念,以及“小鹿”和“鹿”這兩個詞匯和概念之間的關系。同時,該系統(tǒng)還可以使用所謂的“對立標記”表示負相關關系,比如“企鵝不會飛”等。研究人員讓ConceptNet4參與了“韋克斯勒學齡前兒童智力量表”測試(WPPSI-III),并將研究結(jié)果發(fā)表在論文《MeasuringanArtificialIntelligenceSystem'sPerformanceonaVerbalIQTestForYoungChildren》上。WPPSI-III測試包含14項測驗項目,以及一份針對操作智商和言語智商的完整評估表。操作智商測驗通常會要求受測人完成繪畫、解謎、記憶等任務。言語智商測驗則會考察兒童的詞語推理、詞匯及理解能力。每種智商得分的平均分都為100分。本次研究則主要針對言語智商進行測試。在測試過程中,試題會通過語言處理工具轉(zhuǎn)換成ConceptNet4能夠理解的語言,如“我們?yōu)槭裁匆帐??”、“我們?yōu)槭裁匆谙奶齑魈栫R?”和“為什么將刀子放入嘴中是不好的行為?”等等。該研究由芝加哥大學的斯特蘭?奧爾森(StellanOhlsson)帶領。在對單項測試計分時,研究人員先使用每道題目得分最高的答案計分,然后再使用每道題目得分最高的前五個答案中最好的答案計分。他們將前者稱為“嚴格計分”,后者稱為“放松計分”。在“信息”測試中,ConceptNet得到了20分,而同時參加測試的四歲兒童通過轉(zhuǎn)換后的得分為10分。這名兒童在詞語推理和理解上得分更高,均為7分,而ConceptNet在這兩項上的得分分別為2和3分。此外,ConceptNet表現(xiàn)出了更豐富的詞匯量,詞匯得分為20分,而兒童得分為13分?!癈onceptNet系統(tǒng)的得分與四歲兒童相仿,但低于五至七歲兒童的平均得分,”研究人員解釋道,“該系統(tǒng)在每個單項中得分差異很大,說明還有改進的空間。在所有測試中,‘理解’是最關乎人類常識的測試項目。得分差異大、常識方面表現(xiàn)一般,這說明ConceptNet尚不具有四歲兒童的語言能力。但本次研究說明,兒童智商測試可以為人工智能系統(tǒng)的評估和比較提供一種客觀的度量手段。”“此外,許多由ConceptNet給出的錯誤答案和兒童給出的錯誤答案不僅相去甚遠,而且違反常識?!崩纾陉P于“獅子”的詞語推理測驗中,該AI系統(tǒng)和首測兒童被給予三條線索——“雄性長著鬃毛”,“該動物生活在非洲”,以及“它是一種體型很大的棕黃色貓科動物”。由ConceptNet給出的排名前五的答案按順序排列為:狗,農(nóng)場,生物,家庭,貓。研究團隊解釋道,“生物”和“貓”尚且還能與“獅子”沾邊,但其它的答案就明顯有悖于常識了。“按照常識,受測者應該至少能將答案限制在動物的范圍內(nèi),同時能做出簡單的推理:“既然線索說它是貓科動物,那只有貓科動物能夠被列入考慮范圍。”該論文被發(fā)表在期刊《arXiv》上,共同作者包括羅伯特?斯隆(RobertSloan)、捷爾吉?圖蘭(Gy?rgyTurán)和阿隆?尤拉斯基(AaronUrasky)。測試方法研究人員讓ConceptNet4參與了“韋克斯勒學齡前兒童智力量表”測試(WPPSI-III),并將研究結(jié)果發(fā)表在論文《MeasuringanArtificialIntelligenceSystem'sPerformanceonaVerbalIQTestForYoungChildren》上。WPPSI-III測試包含14項測驗項目,以及一份針對操作智商和言語智商的完整評估表。操作智商測驗通常會要求受測人完成繪畫、解謎、記憶等任務。言語智商測驗則會考察兒童的詞語推理、詞匯及理解能力。每種智商得分的平均分都為100分。本次研究則主要針對言語智商進行測試。在測試過程中,試題會通過語言處理工具轉(zhuǎn)換成ConceptNet4能夠理解的語言,如“我們?yōu)槭裁匆帐??”、“我們?yōu)槭裁匆谙奶齑魈栫R?”和“為什么將刀子放入嘴中是不好的行為?”等等。該研究由芝加哥大學的斯特蘭?奧爾森(StellanOhlsson)帶領。在對單項測試計分時,研究人員先使用每道題目得分最高的答案計分,然后再使用每道題目得分最高的前五個答案中最好的答案計分。他們將前者稱為“嚴格計分”,后者稱為“放松計分”。什么是ConceptNetConceptNet是一項由麻省理工學院常識計算計劃團隊(MITCommonSenseComputingInitiative)管理的開源項目。該團隊研發(fā)的ConceptNet4運用了所謂的“關系”這一概念。例如,當讓該系統(tǒng)解釋什么是“小鹿”時,它會明白“小鹿是一種鹿”,而
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高純鎘項目申請報告
- 高溫滅菌干燥箱行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報告
- 2025年靜鐵芯項目可行性研究報告
- 中國注射穿刺器械市場深度分析及投資戰(zhàn)略咨詢報告
- 中國電信行業(yè)的歷史、現(xiàn)狀及趨勢分析報告
- 新材料研發(fā)項目可行性研究報告申請立項
- 一戶一冊一卡培訓會
- 實習生新生兒黃疸護理查房
- 2024至2030年中國蜂窩陶瓷填料數(shù)據(jù)監(jiān)測研究報告
- 2024至2030年中國電子級半導體灌封材料灌封膠數(shù)據(jù)監(jiān)測研究報告
- 水泥企業(yè)的個人年度工作總結(jié)
- 保險公估服務行業(yè)發(fā)展史與現(xiàn)狀分析
- 著作權(quán)案例分析
- 安全技術服務機構(gòu)應急預案
- 船舶調(diào)度年終述職報告
- 人教版四年級上冊豎式計算400題及答案
- 玻璃的浮法成型工藝
- 重慶開縣2023-2024學年七年級上學期期末數(shù)學檢測卷(含答案)
- 血氣分析結(jié)果判讀及臨床應用護理課件
- 智能船舶與海洋工程:物聯(lián)網(wǎng)在船舶與海洋工程中的應用
評論
0/150
提交評論