讓機(jī)器具備人的能力_第1頁(yè)
讓機(jī)器具備人的能力_第2頁(yè)
讓機(jī)器具備人的能力_第3頁(yè)
讓機(jī)器具備人的能力_第4頁(yè)
讓機(jī)器具備人的能力_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

王海峰:讓機(jī)器具備人的能力百度百家10月28日08:41分享到:機(jī)器人語(yǔ)言處理分類(lèi):互聯(lián)網(wǎng)摘要:人的能力體現(xiàn)在很多方面,聽(tīng)、說(shuō)、看、行、學(xué)習(xí),還有很重要的一點(diǎn)就是思考。時(shí)間:2014.10.27(下午)地點(diǎn):恒通國(guó)際創(chuàng)新園主題:TheBIGTalk第五期活動(dòng)“機(jī)器人重塑未來(lái)生活”陽(yáng)淼:各位來(lái)賓、各位百度百家的作者,歡迎大家來(lái)到 theBIGTalk第五期。我是這期的主持人陽(yáng)淼,山寨發(fā)布會(huì)創(chuàng)始人。百度百家的 theBIGTalk聚焦商業(yè)互聯(lián)網(wǎng)和未來(lái),宗旨是科技改變世界,它會(huì)定期邀請(qǐng)科技領(lǐng)域的各個(gè)領(lǐng)域頂尖專(zhuān)家來(lái)到中國(guó),為大家分享他們的所思所想。這期的主題是“機(jī)器人重塑未來(lái)”,我們?yōu)槟?qǐng)了百度技術(shù)副總裁王海峰博士,還有MIT人工智能中心實(shí)驗(yàn)室主任DanielaRus女士,以及康乃爾大學(xué)創(chuàng)意機(jī)器人實(shí)驗(yàn)室HodLipson教授,這三位重量級(jí)嘉賓為我們分享機(jī)器人如何制造,如何協(xié)同工作以及如何像人類(lèi)一樣思考。各個(gè)藝術(shù)作品對(duì)機(jī)器人的生物有不同塑造方式,給大家留下不同印象,有很大的想象空間,我們先看一段視頻,看這里面的機(jī)器人給您留下怎樣的印象。岡忖我們看到的就是前不久剛剛問(wèn)世的中文問(wèn)答機(jī)器人小度機(jī)器人,我們看到它以一個(gè)文藝女青年的形象出現(xiàn)在了江蘇衛(wèi)士芝麻開(kāi)門(mén),回答了電視、音樂(lè)、技術(shù)、電影等四十個(gè)領(lǐng)域的問(wèn)題,它回答了所有40個(gè)問(wèn)題,而且表現(xiàn)出了一定的幽默能力,調(diào)侃節(jié)目的主持人。什么樣的技術(shù)實(shí)現(xiàn)了這樣的一個(gè)萌萌噠機(jī)器人,我們看到它的互動(dòng)不是像我們跟機(jī)器和電腦一樣的機(jī)械一問(wèn)一答, 而是像人類(lèi)一樣通過(guò)自己所掌握的知識(shí)回答,關(guān)鍵就是像人類(lèi)一樣的思索,背后的秘密是什么?熱烈掌聲請(qǐng)百度技術(shù)副總裁王海峰博士為我們做精彩分享,有請(qǐng)。我們都知道百度是一家以技術(shù)為優(yōu)勢(shì)的公司,以搜索起家的,在百度,搜索引擎、互聯(lián)網(wǎng)數(shù)據(jù)挖掘、知識(shí)圖譜、自然語(yǔ)言處理等等有關(guān)的領(lǐng)域都是我面前的王海峰負(fù)責(zé)的,再次以熱烈的掌聲歡迎王博士,如何讓機(jī)器像人一樣的思考,歡迎王博士。王海峰:大家下午好!很高興來(lái)到百度百家的theBIGTalk現(xiàn)場(chǎng),與大家分享我們?cè)谥悄軝C(jī)器人方面的一些工作和思考。大家提機(jī)器人,每個(gè)人的腦子里會(huì)出現(xiàn)很多機(jī)器人形象,有的在生產(chǎn)線上做工,有的在家里幫助人們做家務(wù),甚至有的會(huì)在足球場(chǎng)、戰(zhàn)場(chǎng)上出現(xiàn)。應(yīng)該說(shuō)機(jī)器人的這些機(jī)械技術(shù)和控制技術(shù),已經(jīng)取得了非常多的成果,如何能讓一個(gè)機(jī)器人更像人呢?我們需要讓它有像人一樣的智能,大家剛才看到的小度機(jī)器人,甚至可以答出很多我們很多人答不出來(lái)的問(wèn)題,應(yīng)該說(shuō)它已經(jīng)有了很高的智能。機(jī)器人具備了什么樣的能力,就具備了人的能力呢?大家知道人的能力體現(xiàn)在很多方面,聽(tīng)、說(shuō)、看、行、學(xué)習(xí),還有很重要的一點(diǎn)就是思考。比如說(shuō)一個(gè)動(dòng)物他也會(huì)有眼睛可以看,耳朵可以聽(tīng),也可以去行動(dòng),甚至它也可以訓(xùn)練出它一些能力,比如說(shuō)看見(jiàn)一個(gè)什么場(chǎng)景會(huì)采取什么動(dòng)作,這些條件反射的能力。而人最重要的能力是思考,這是人特有的能力。人如何進(jìn)行思考,我們?nèi)绾巫寵C(jī)器人進(jìn)行思考呢?我認(rèn)為需要有三方面的能力,第一個(gè)是對(duì)語(yǔ)言的理解,大家知道語(yǔ)言是人特有的一種高級(jí)的智力活動(dòng),僅僅有語(yǔ)言,僅僅可以說(shuō)話還不夠,我們還需要知道該說(shuō)什么,這就是背后需要有知識(shí)的支撐,需要對(duì)知識(shí)的掌握,知識(shí)的運(yùn)用,以及知識(shí)的推理等等。另一方面,人生活在一個(gè)社會(huì)里,除了跟這些客觀知識(shí)打交道以外,還需要和人打交道。我們同一句話說(shuō)給不同的人聽(tīng)的時(shí)候,他的感受是不一樣的,反應(yīng)不一樣,這就需要機(jī)器人能夠?qū)Σ煌娜诉M(jìn)行建模。我講一個(gè)故事給大家,大家知道間諜是一群很神秘?fù)碛泻軓?qiáng)的能力人,非常善于偽裝自己,打入敵人內(nèi)部讓敵人發(fā)現(xiàn)不了。曾經(jīng)有一個(gè)故事就是一個(gè)女特工,她能力非常強(qiáng),做得非常好,但是她最后暴露了身份,原因是什么?是她在分娩的時(shí)候,不由自主的喊出了母語(yǔ),被人發(fā)現(xiàn)了。這個(gè)故事說(shuō)明了什么呢?語(yǔ)言是人思維的一個(gè)基本載體,不同母語(yǔ)不同語(yǔ)言的人,語(yǔ)言的特點(diǎn)會(huì)影響她的思維活動(dòng)。我們學(xué)英語(yǔ),如果你學(xué)到比較高的境界需要用英語(yǔ)思考,用英語(yǔ)思考相當(dāng)于你的思維模式發(fā)生變化。同樣一句話用中文說(shuō)和英文說(shuō)是不同的,例如屏幕上顯示的這些,用中文和英文語(yǔ)序、用詞、肯定和否定不一樣,這說(shuō)明語(yǔ)言本身會(huì)影響人的思維。當(dāng)一個(gè)人需要和機(jī)器交流的時(shí)候,比如說(shuō)問(wèn)它一些問(wèn)題,問(wèn)它天氣怎么樣,或者說(shuō)跟它聊天等等這些呢,其實(shí)都是用語(yǔ)言來(lái)進(jìn)行交互的。我們?nèi)绾巫寵C(jī)器理解語(yǔ)言呢?大家知道語(yǔ)言是人類(lèi)發(fā)展了很多年發(fā)展出來(lái)的,她充分的承載了人類(lèi)知識(shí)、思維、情感方方面面的積累。語(yǔ)言本身是很復(fù)雜的,用我們都熟悉的中文舉例來(lái)說(shuō)。大家知道中文詞與詞之間沒(méi)有空格的,所以說(shuō)中文面臨第一個(gè)任務(wù)就是分詞。請(qǐng)看屏幕上,“劉清楚楚動(dòng)人”,大家看到這樣六個(gè)字可以很容易知道這個(gè)詞是什么,前面是一個(gè)人名劉清,后面是楚楚動(dòng)人。同樣類(lèi)似的我們?cè)黾恿艘粋€(gè)字,“劉華清楚這件事”,這里便不是“劉清”了,而應(yīng)該是“劉華”。再改一點(diǎn),“劉華清楚地重游”,又是另一種分詞結(jié)果又加一個(gè)字,“劉華清楚地記得”,又變成了劉華。下面這個(gè)例子也很有意思的,“你老張著什么急啊”,是說(shuō)“老張”別著急,。但再看下一句話,“你老張著什么嘴啊”,又不同了。上面的那些應(yīng)該說(shuō)還是有一個(gè)基本的分法可以分出來(lái)的,但是這句話大家看,“乒乓球拍賣(mài)完了”,到底是“乒乓球拍”賣(mài)完了,還是“乒乓球”“拍賣(mài)”完了呢?這兩種說(shuō)法都是對(duì)的,這就是語(yǔ)言的復(fù)雜性,也正是它的魅力所在,中文是一個(gè)非常有魅力的語(yǔ)言。下面看在百度的搜索里一個(gè)真實(shí)的例子,如果大家在百度搜索框里搜索這個(gè)是身高1.80以上的自由泳運(yùn)動(dòng)員,我們會(huì)直接給出這些答案,這么復(fù)雜的一個(gè)搜索,我們想把它理解好,可以找到相應(yīng)的答案。左邊這棵樹(shù),就是我們自然語(yǔ)言處理技術(shù)的基礎(chǔ):語(yǔ)義語(yǔ)法分析,我們可以分析出來(lái)詞與詞之間的關(guān)系,從而知道更準(zhǔn)確的理解用戶到底找什么。配合后臺(tái)知識(shí)庫(kù)里面存大量的知識(shí)檢索出來(lái),最后得到了這樣的一個(gè)答案。大家看其實(shí)“謝霆鋒的兒子是誰(shuí)”和“謝霆鋒是誰(shuí)的兒子”,這兩句話的字是一樣,但是順序不一樣。如果說(shuō)用傳統(tǒng)的搜索技術(shù),我們會(huì)對(duì)其分詞,算 term重要性等等,由算出來(lái)的相關(guān)性找到的東西是一樣的。顯然這兩句話問(wèn)題是不一樣的,我們?cè)趺纯梢宰龅竭@一點(diǎn)呢?需要對(duì)語(yǔ)言有很深入的分析,對(duì)語(yǔ)義理解,從而知道他們要找的答案是不一樣。大家上百度就可以看到,“謝霆鋒的兒子是誰(shuí)”,可以給“謝振軒”和“謝振南”,這是基于很深刻的語(yǔ)言的分析、理解技術(shù)。再說(shuō)一種就是和上下文相關(guān)的理解,比如說(shuō)我們“問(wèn)北京的今天天氣如何”,然后給一個(gè)答案。然后又問(wèn)“上海呢?”這個(gè)時(shí)候問(wèn)上海呢,就三個(gè)字,如果說(shuō)僅看這一句話不知道問(wèn)的是什么,但是上下文相關(guān)就會(huì)知道問(wèn)的就是上海的天氣,而且是今天的天氣。下面一個(gè)例子也是類(lèi)似的,“我計(jì)劃周日北京飛杭州,幫我訂票”。這個(gè)時(shí)候用戶給了很多的信息,哪一天哪到哪,接下來(lái)說(shuō)“請(qǐng)幫我預(yù)定酒店”,知道是到目的地酒店,哪一天的也知道,這是基于上下文的理解,才能做到這一點(diǎn)。句和句之間的上下文不夠,還可以用篇章級(jí)的上下文。比如說(shuō)我們問(wèn)天空為什么是藍(lán)的,如果我們就是給出一個(gè)經(jīng)典搜索的結(jié)果,百度知道里找到一個(gè)結(jié)果,就像左邊的結(jié)果。但是大家看到直接拿出來(lái)的這一句話,不是真正解釋天空為什么是藍(lán)的,展開(kāi)后才能看完整的解釋。在很長(zhǎng)的一大段話里,我把真正最相關(guān)的答案這一部分找出來(lái),摘要就會(huì)是一個(gè)更好的答案。如果我們做到更好,可以給出非常明確的解答。篇章級(jí)分析應(yīng)該說(shuō)比句子級(jí)更放大,對(duì)一個(gè)事件持續(xù)很長(zhǎng)時(shí)間,幾個(gè)月,甚至是幾年的時(shí)間,其中有一些關(guān)鍵的時(shí)間點(diǎn)出現(xiàn)了一些里程碑的事件,我們也可以分析。在更長(zhǎng)的時(shí)間段里,更多的數(shù)據(jù)里把這些關(guān)鍵的時(shí)間點(diǎn)發(fā)生的關(guān)鍵事件提取出來(lái),這就是我們說(shuō)的事件脈絡(luò)。我給這個(gè)例子也是在百度搜索可以看到的,比如說(shuō)在百度搜索棱鏡門(mén)和斯諾登,右側(cè)會(huì)給過(guò)去一段時(shí)間跟棱鏡門(mén)相關(guān)的重要事件。剛才我講的所有例子都是中文相關(guān)的。其實(shí)人類(lèi)的語(yǔ)言,就像剛才我也講了間諜的故事,還會(huì)涉及到其它的語(yǔ)言,除了我們母語(yǔ)以外的其它語(yǔ)言。例如去國(guó)外旅游,到歐洲旅游但我不懂當(dāng)?shù)卣Z(yǔ)言,有一個(gè)翻譯器幫我點(diǎn)菜和當(dāng)?shù)厝私涣?,這是對(duì)大家有幫助的。我們針對(duì)這種語(yǔ)言的理解,開(kāi)發(fā)了多語(yǔ)言翻譯系統(tǒng),現(xiàn)在已經(jīng)覆蓋 14個(gè)語(yǔ)種,36個(gè)翻譯方向。既可以在網(wǎng)頁(yè)和PC打一段文字給你翻譯,包括在手機(jī)可以拿著它直接和人對(duì)話,甚至你看到一個(gè)外文菜單不懂,拿著手機(jī)攝象頭一照,百度翻譯就會(huì)自動(dòng)為你把菜單翻譯成中文的,這相當(dāng)于你看到的就是一個(gè)中文菜單而不是用其它語(yǔ)言的菜單了。還有一個(gè)更高的境界,我們擁有語(yǔ)言能力,除了基本的交流和對(duì)話等等,我們發(fā)展出一些文學(xué)形式。比如說(shuō)中國(guó)語(yǔ)言發(fā)展的非常好的詩(shī)歌,我們基于我們語(yǔ)言翻譯技術(shù),開(kāi)發(fā)了這樣的一個(gè)寫(xiě)詩(shī)的系統(tǒng)。我給系統(tǒng)輸進(jìn)去照片,自動(dòng)就會(huì)做出一首詩(shī),這是完全自動(dòng)做出來(lái)的。比如說(shuō)這首詩(shī)就是“日出日落一天天,人去人生幾十年,人水無(wú)聲情不斷,水天一色韻相連。 ”我接下來(lái)講知識(shí)挖掘,對(duì)應(yīng)人對(duì)知識(shí)的學(xué)習(xí),可以從書(shū)本上學(xué),老師家長(zhǎng)朋友等等很多不同渠道來(lái)學(xué)。學(xué)到這些知識(shí)以后,我們構(gòu)建了一個(gè)非常龐大的知識(shí)圖譜,這樣一個(gè)知識(shí)圖譜我們有上億級(jí)別的實(shí)體,比如說(shuō)桌子一個(gè)實(shí)體,椅子是,攝像機(jī)都也是。每一個(gè)實(shí)體有很多的屬性。這個(gè)凳子是白色的,是什么材質(zhì)的,有很多的屬性,這些屬性已經(jīng)有上百億級(jí)別。而無(wú)論是實(shí)體還是屬性,其增長(zhǎng)都是線性,更多的會(huì)是什么呢?實(shí)體之間的關(guān)系,實(shí)體之間組合起來(lái),量就會(huì)急劇增加。一個(gè)實(shí)體可以跟很多實(shí)體有不同的關(guān)系,例如一個(gè)人可能跟很多不同的人有關(guān)系,同學(xué)關(guān)系、朋友關(guān)系等等。這時(shí)候會(huì)構(gòu)建更復(fù)雜的網(wǎng)絡(luò),這個(gè)知識(shí)圖譜描述能力更強(qiáng),現(xiàn)在我們已挖掘了千億級(jí)別的關(guān)系在我們的知識(shí)圖譜里。這些一方面從網(wǎng)頁(yè)里挖掘,網(wǎng)頁(yè)里有很多信息,除了本身文字信息,圖片信息,還有它的排版信息,它的字號(hào)信息,它的連接等等,構(gòu)成了網(wǎng)頁(yè)非常豐富的信息,可以挖掘很多基本的知識(shí)出來(lái)。還有文字,又回到我最開(kāi)始說(shuō)的語(yǔ)言上來(lái)了,語(yǔ)言文字里面蘊(yùn)含很多信息。這樣一句話“奢侈品牌路易威登1854年成立法國(guó)巴黎”,我們分析清楚知道里面的語(yǔ)法和語(yǔ)義關(guān)系,我們可以提取很多有用的知識(shí)來(lái)。比如說(shuō)路易威登成立的時(shí)間,成立在哪兒,這是一個(gè)奢侈品牌。包括巴黎是法國(guó)的,這些都可以從這樣簡(jiǎn)單的一句話里抽取出來(lái),所以說(shuō)大家看到我們可以抽取到的知識(shí)其實(shí)是非常多。抽取這些知識(shí)以后就涉及到知識(shí)的存儲(chǔ)、檢索和管理,我們把這些知識(shí)大量存在知識(shí)圖譜里,要對(duì)知識(shí)相互之間的關(guān)系進(jìn)行計(jì)算。“謝霆鋒的兒子是誰(shuí)”,問(wèn)題理解了是第一步,需要在龐大的庫(kù)里找到答案,這就是做相應(yīng)的檢索。這里包括了線下做很多的數(shù)據(jù)處理,以及線上實(shí)時(shí)地去響應(yīng)用戶需求。知識(shí)推理。講到推理其實(shí)是很復(fù)雜的一件事,比如說(shuō)破案的時(shí)候有非常復(fù)雜的推理,甚至還有一些直覺(jué)在推理里面。我講一個(gè)非常簡(jiǎn)單的例子,我們知識(shí)庫(kù)里知道很多人的生日。我這里舉了兩個(gè)例子,一個(gè)是劉德華,一個(gè)是李彥宏先生。他們兩個(gè)人的生日我們都能知道,如果問(wèn)年齡,大家知道年齡是一個(gè)動(dòng)態(tài)的,今年問(wèn)和明年問(wèn),這個(gè)月問(wèn)和下個(gè)月問(wèn),其實(shí)是不一樣的。這時(shí)候不能簡(jiǎn)單說(shuō)把一條某某人的年齡存在那兒,靜態(tài)的放在那兒。而隨著時(shí)間的遷移答案就不對(duì),所以要計(jì)算。這種計(jì)算人看來(lái)并不復(fù)雜,但是要讓機(jī)器知道年齡這樣一件事應(yīng)該怎么算,這個(gè)技術(shù)本身讓機(jī)器如何知道,是一個(gè)我們需要做的技術(shù)。大家看到比如說(shuō)劉德華是 9月份生日,所以現(xiàn)在用今年2014年減去61年現(xiàn)在是53歲。李彥宏是11月份生的,現(xiàn)在沒(méi)有到過(guò)生日的時(shí)候,所以用今年2014減生日1968應(yīng)該是46,但是因?yàn)闆](méi)有過(guò)生日就是45,這個(gè)是真正實(shí)時(shí)算出來(lái)的。我們有了龐大的知識(shí)庫(kù)以后,我們希望通過(guò)擴(kuò)充聯(lián)想不斷豐富知識(shí)庫(kù),讓它有越來(lái)越強(qiáng)大的能力。舉這樣一個(gè)例子,上面的這行字“謝霆鋒兒子的母親的前夫的父親”,這句話聽(tīng)起來(lái)拗口,但是實(shí)際上我們把這一個(gè)一個(gè)的關(guān)系分析出來(lái),之后得到這是謝賢,這就是聯(lián)想推理過(guò)程。我們把一些實(shí)體放在庫(kù)里以后,怎么解答一些問(wèn)題呢?比如說(shuō)我們要找觀賞魚(yú),我們可以先進(jìn)行細(xì)分類(lèi),因?yàn)橐粋€(gè)用戶來(lái)找觀賞魚(yú)的時(shí)候,可能是對(duì)觀賞魚(yú)的某個(gè)小類(lèi)更感興趣。里面分很多小的不同的分類(lèi),我們?nèi)绻阉智宄?,可能?duì)某一類(lèi)更加有興趣,這時(shí)要在后臺(tái)要做知識(shí)分類(lèi)的工作。包括右邊舉了狗品種的例子,美食和小說(shuō),這都是在百度真實(shí)實(shí)現(xiàn)的。還有一類(lèi)知識(shí),比如我們現(xiàn)在百度一個(gè)搜索結(jié)果,在左側(cè)有很多自然的結(jié)果出來(lái),同時(shí)我們?cè)谟覀?cè)會(huì)有一些相關(guān)的推薦。張飛右側(cè)會(huì)推跟他相關(guān)的一些趙云、關(guān)羽、諸葛亮等等。例如趙云,下面還有灰色的字,給的是推薦理由。推薦理由也是我們通過(guò)自動(dòng)的知識(shí)挖掘把它相關(guān)的,就是張飛和趙云是什么關(guān)系。我們這里給了,大家可以看到寫(xiě)的是“同事”,這個(gè)同事不是我們?nèi)司幍?,真的是在網(wǎng)上大量的挖掘,挖掘出來(lái)最后發(fā)現(xiàn)他們是同事關(guān)系。按道理張飛和趙云在三國(guó)時(shí)代沒(méi)有同事概念,這就是互聯(lián)網(wǎng)的能力。網(wǎng)友把他來(lái)的關(guān)系寫(xiě)成“同事”被我們挖掘出來(lái)了,關(guān)系比較貼切。點(diǎn)了關(guān)羽,進(jìn)了關(guān)羽的搜索頁(yè),推薦了很多人出來(lái),有一個(gè)是貂蟬,貂蟬下面給的理由就是同鄉(xiāng)。我看過(guò)三國(guó),聽(tīng)過(guò)三國(guó)的評(píng)書(shū),看過(guò)電視劇,了解很多三國(guó)相關(guān)的知識(shí),但是之前真的不知道他們兩個(gè)是同鄉(xiāng)。看到這個(gè)結(jié)果以后,我想知道是對(duì)是錯(cuò),我在網(wǎng)上做了些調(diào)研,發(fā)現(xiàn)真是說(shuō)他們兩個(gè)是同鄉(xiāng),機(jī)器可以挖掘出來(lái)很多普通人不了解的知識(shí)。同一個(gè)名字“李娜”,很多人都叫李娜,這個(gè)時(shí)候推薦哪一個(gè)李娜出來(lái),這是一個(gè)問(wèn)題。比如我的Query是小威,可能就是網(wǎng)球員李娜,給的標(biāo)簽就是“小威的對(duì)手”。但是如果搜的就是一首歌呢,我推薦的就是歌手李娜。人的腦袋里也是,你有好幾個(gè)同學(xué)都是同一個(gè)名字,突然說(shuō)這個(gè)名字,你反應(yīng)出哪一個(gè)人,有和他相關(guān)的一些事情限定:這是中學(xué)同學(xué),那是大學(xué)同學(xué)等等。除了我剛才講的這些大家比較直觀的看到這些知識(shí)以外,還有一類(lèi)也是人的高級(jí)智力活動(dòng)。很多人喜歡下棋,有的下圍棋,有的下象棋。國(guó)際象棋,很多年以前國(guó)際象棋,計(jì)算機(jī)已經(jīng)戰(zhàn)勝人類(lèi),圍棋復(fù)雜度高很多,所以我們讓我們的機(jī)器具備了一些下更難的圍棋的能力。我們現(xiàn)在已經(jīng)做到9x9圍棋達(dá)到了職業(yè)選手水平,19x19也可以達(dá)到業(yè)余段位棋手水平。剛才講了對(duì)語(yǔ)言的理解,對(duì)知識(shí)的掌握和運(yùn)用,還有剛才我要說(shuō)就是對(duì)人的理解。人可以是對(duì)某一個(gè)個(gè)人,即使是兩個(gè)親兄弟,兩個(gè)同學(xué),他們都是不一樣,但是他們有共性。真是兄弟倆一定有很多的共性,如果是同學(xué)兩個(gè)人,也有很多的相似性。所以我們既要對(duì)個(gè)體建模,也要對(duì)群體建模。比如咱們今天在會(huì)場(chǎng)的這些人,一定是對(duì)“科技改變世界”會(huì)有興趣,我們有一些共同的興趣。還有社會(huì)整體趨勢(shì),現(xiàn)在越來(lái)越多的人開(kāi)始使用智能手機(jī),整個(gè)社會(huì)整體在發(fā)生變化。我舉一個(gè)簡(jiǎn)單的例子,這是我們真實(shí)的從百度搜索用戶需求角度,我們做了一些分析,這一分析利用很多我們數(shù)據(jù)挖掘技術(shù),自動(dòng)分析出來(lái)的。用戶對(duì)一些不同類(lèi)別的需求,工作時(shí)間和業(yè)余時(shí)間的不同。大家可以看第三到七列是跟游戲相關(guān),藍(lán)色是工作時(shí)間,黃色是業(yè)余時(shí)間。按道理,打游戲應(yīng)該都是業(yè)余時(shí)間的事,但我們看到這張圖,大家可以發(fā)現(xiàn)這很有意思,這種大型游戲工作時(shí)間玩的人不多,但是也有。但是業(yè)余時(shí)間玩的人很多,但大家看網(wǎng)頁(yè)游戲,反倒是工作時(shí)間玩的人很多,這個(gè)很有意思,我們一推理可能也一定,就是很多人工作時(shí)間忍不住想玩一下,但是玩大型網(wǎng)游肯定不方便,小游戲一打開(kāi)玩兩下,網(wǎng)頁(yè)游戲很方便,這看上去符合人的直覺(jué),這也是一種建模。這是另一個(gè)模型,我們每天要一日三餐,考慮吃什么,吃川菜,粵菜,做了全國(guó)各地不同地區(qū)對(duì)不同菜系感興趣的模型,川菜受歡迎的程度很高,除了廣州大家最感興趣的還是粵菜,全國(guó)各地很多地方對(duì)川菜感興趣。這是個(gè)性化的例子,這怎么看?如果不同的用戶,一個(gè)用戶是對(duì)動(dòng)漫感興趣,一個(gè)是對(duì)快遞感興趣。我們搜SF這兩個(gè)字母的時(shí)候,用戶找的東西是不一樣,如果對(duì)動(dòng)漫感興趣的可能是找跟動(dòng)漫相關(guān)的,快遞的用戶找的就是順豐速遞,我們根據(jù)個(gè)人不同興趣進(jìn)行推薦,會(huì)推薦不同的東西出來(lái)。剛才講了三方面,語(yǔ)言、知識(shí)、對(duì)人的理解,我們結(jié)合起來(lái)會(huì)有綜合的思考能力,綜合的思考能力可以從很多方面來(lái)展現(xiàn)。大家看了小度機(jī)器人,這樣一個(gè)小度機(jī)器人可以聽(tīng)人的問(wèn)題,可以去回答。背后是什么,背后就是對(duì)語(yǔ)言的理解,對(duì)知識(shí)的掌握,從而形成我們叫“深度問(wèn)答技術(shù)”。除了小度機(jī)器人,這些技術(shù)應(yīng)用在百度的產(chǎn)品,我們問(wèn)瀕臨滅絕的動(dòng)物是什么,或者問(wèn)某一個(gè)片子的片尾曲,百度都可以給出答案?!霸袐D可以吃荔枝嗎”,在座的朋友有多少可以回答這個(gè)問(wèn)題,其實(shí)這類(lèi)的問(wèn)題不同人可能會(huì)有不同的回答,該怎么辦?百度會(huì)告訴你,有多少人認(rèn)為能吃,還會(huì)告訴你相應(yīng)的能吃的原因是什么,認(rèn)為不能吃的原因是什么。包括問(wèn)“寶寶打嗝怎么辦”,百度會(huì)告訴你怎么辦,會(huì)把這些答案精煉提取出來(lái)。說(shuō)智能交互,交互有很多形式,剛才我說(shuō)的問(wèn)答也是一種交互,對(duì)話也是一種交互。我們的機(jī)器不僅具備了語(yǔ)言交互能力,可以識(shí)別聲音,可以識(shí)別圖像,這就是我們所說(shuō)的我們可以做“多通道、多輪對(duì)話的智能交互”。我給大家看這樣一幅圖片,問(wèn)大家這是什么花?有可能有人會(huì)覺(jué)得是櫻花或者是梅花,看上去有一點(diǎn)像。圖片相對(duì)花的部分比較小,所以機(jī)器這個(gè)時(shí)候可以很智能的提示用戶說(shuō),我看不清楚,照一個(gè)花的特寫(xiě)。有了特寫(xiě)以后,因?yàn)楝F(xiàn)場(chǎng)照的,我們可以結(jié)合很多信息,我知道現(xiàn)在是什么時(shí)間照的,通過(guò)定位信息知道什么地方照的,春天的時(shí)候在玉淵潭照的很有可能就是櫻花,我們結(jié)合這樣的背景信息可以猜到答案是什么。如果沒(méi)有這些信息后臺(tái)我們會(huì)挖掘很多知識(shí),大家記得我們會(huì)挖掘很多知識(shí),知識(shí)會(huì)知道櫻花和梅花之間的區(qū)別,花柄會(huì)有不同。我問(wèn)用戶有沒(méi)有花柄,用戶不知道,我有一個(gè)花柄的特寫(xiě),他一看這就是花柄,他說(shuō)那是有的。實(shí)際我們就知道它是什么花了。剛才舉的是一個(gè)形象的例子,這在百度的產(chǎn)品里已經(jīng)實(shí)現(xiàn)了,大家如果拿手機(jī)就可以拍一個(gè)花,有一個(gè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論