楊強:從“互聯(lián)網(wǎng)+”到+智能_第1頁
楊強:從“互聯(lián)網(wǎng)+”到+智能_第2頁
楊強:從“互聯(lián)網(wǎng)+”到+智能_第3頁
楊強:從“互聯(lián)網(wǎng)+”到+智能_第4頁
楊強:從“互聯(lián)網(wǎng)+”到+智能_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

楊強:從“互聯(lián)網(wǎng)+”到“+智能【注:本文由楊靜lillian(lillian_yang_1111)授權(quán)轉(zhuǎn)載,原文由中國人工智能學會供稿,靜沙龍記者王嘉俊整理】2015年8月14日,由中國科協(xié)、中國科學院指導,中國人工智能學會主辦的第五屆中國智能產(chǎn)業(yè)高峰論壇在上海長榮桂冠酒店順利召開。下面是中國人工智能學會副理事長、2015國際人工智能大會IJCAI-15程序委員會主席、香港科技大學教授楊強的發(fā)言。楊強在報告中總結(jié):互聯(lián)網(wǎng)+為我們帶來了大數(shù)據(jù),而大數(shù)據(jù)又為我們帶來了智能的可能性。通過“群體智能”,“終生學習”和“特征工程”,大數(shù)據(jù)讓傳統(tǒng)的服務(wù)變成又智能的服務(wù)。這也是我們所倡導的“+智能”的精髓。這種“深度+”是通過大數(shù)據(jù)來產(chǎn)生的,具有領(lǐng)域知識的、有群體智能,終生學習,特征工程的“+”【楊強】

我非常榮幸能夠跟在這里和大家一起交流。今天,我們聽了很多的議題,都是關(guān)于“智能”和“智能產(chǎn)業(yè)”的。下面,我將從學術(shù)界的角度給大家一個觀點,通過我知道的幾個例子闡述“智能在產(chǎn)業(yè)中的位置”這個問題。我的報告題目叫:從“互聯(lián)網(wǎng)+”到“+智能”。首先,我們知道,當下比較熱門的一個話題叫“互聯(lián)網(wǎng)+”。大家所知道的“互聯(lián)網(wǎng)+”的意思就是:利用互聯(lián)網(wǎng)的連接能力來賦予傳統(tǒng)行業(yè)產(chǎn)生一個新生的活力,把傳統(tǒng)行業(yè)帶到千家萬戶。同時,為傳統(tǒng)行業(yè)提供一個更加簡潔、更加高效的分析和運作能力。我們知道這樣的一個“互聯(lián)網(wǎng)+”的理念,實際上是離不開互聯(lián)網(wǎng)的本質(zhì)。它的本質(zhì)我們可以總結(jié)幾點:最重要的是連接,連接很多人和物。另外,它提供了一個實時的服務(wù)。所有的這些服務(wù)產(chǎn)生的大數(shù)據(jù),使得我們了解一個長尾的分布,并加以分析,可以更關(guān)注用戶的個性化的需求。而所有的這些服務(wù)和個性化的需求,是通過什么來實現(xiàn)的呢?這就是“大數(shù)據(jù)”,我們常用四個V來總結(jié)它:體量大、速度快、類別多、真實性強。如果我們把“互聯(lián)網(wǎng)+”連接到傳統(tǒng)企業(yè)的話,需要怎么樣的“+”法呢?現(xiàn)在有各種各樣的“+”法,有淺層的“+”法,也就是說簡單的把傳統(tǒng)行業(yè)的一些帳號、注冊,掛號過程,提供給大家,使得互聯(lián)網(wǎng)能給大家?guī)硪恍┍憬?。但是這個僅僅是在做一種非常淺層的連接。它的作用只不過是使得傳統(tǒng)行業(yè)的觸角變得更遠,但并沒有在本質(zhì)上使傳統(tǒng)行業(yè)產(chǎn)生深刻的變化。反過來說,如果我們可以在互聯(lián)網(wǎng)的基礎(chǔ)上更進一步,使得傳統(tǒng)行業(yè)能夠直接和用戶對接,并了解用戶的需求,學習到深層的領(lǐng)域知識,從而進行個性化,持續(xù)的服務(wù)。這種進一步的“+”法是一種深入的“+”,也就是說,這個“+”的中心實質(zhì)問題是人工智能,是AI,所以這里就用這個“+”中帶有AI的符號來代表。就像剛才講的,這種“+”的需求是由于互聯(lián)網(wǎng)帶來的一種長尾效應(yīng)。這種長尾效應(yīng)體現(xiàn)在服務(wù)的種類和用戶的需求是在指數(shù)型的擴展。它帶來的互聯(lián)網(wǎng)的增值,體現(xiàn)在“個性化”上面。因為每個用戶的需求,每個產(chǎn)品提供的功能都是不一樣的。在如此廣泛的范圍之內(nèi),我們不可能只依靠人工來提供這樣的服務(wù),讓用戶得到滿足。所以,要提供機器學習的功能,通過很強的人工智能來提供這樣的服務(wù)。機器學習,就要依賴于大數(shù)據(jù)做模型訓練,因此我們就說這種深入的“+”,是離不開大數(shù)據(jù)的。如果互聯(lián)網(wǎng)只是在表層淺顯的和每一個傳統(tǒng)行業(yè)接觸的話,僅僅提供一個新的入口,就不能夠獲得所需的領(lǐng)域知識,也就不能夠真正的為用戶提供這樣的一個深層次的服務(wù)。

比如:在和銀行呼叫中心對接的時候,通過互聯(lián)網(wǎng)收取大數(shù)據(jù),就會學到不同的策略??梢詫Σ煌挠脩艚⒉煌姆?wù)的策略,拓展價值客戶的識別,開展對VIP客戶的挽留等等。這些都需要很深層次的領(lǐng)域知識。所需的數(shù)據(jù)種類可以大有不同:有語音、圖像、推薦,搜索的數(shù)據(jù)等等。利用這些數(shù)據(jù),我們可以建立各種各樣的專業(yè)領(lǐng)域內(nèi)的知識圖譜來提供服務(wù)。我們問,用大數(shù)據(jù)和人工智能為我們帶來的這種變化,這種深度“+”,對于用戶來說,是有強大吸引力的,所以我們說的這種加法是有黏性的“+”,是把智能加到互聯(lián)網(wǎng)和傳統(tǒng)企業(yè)之間的,產(chǎn)生像潤滑劑一樣的效果。所以,我們管它叫做“+智能?!毕旅妫揖徒o大家舉幾個例子,來展示幾個不同的角度,我認為“深度+”應(yīng)該怎么樣來實現(xiàn)。讀者也許會問:互聯(lián)網(wǎng)+的“+”在互聯(lián)網(wǎng)的后面,為什么+智能的“+”要放在智能前面?我們知道,人工智能的應(yīng)用是需要一個平臺來“附著”的。這個平臺可以是互聯(lián)網(wǎng),可以是傳統(tǒng)行業(yè)(如金融),也可以是互聯(lián)網(wǎng)+傳統(tǒng)行業(yè),但無論如何,它是錦上添花的“花“,是需要有一個附著點來發(fā)力的。第一個例子是這樣的;我們知道高考這個事兒是我們每個人都經(jīng)歷過的的。但是高考之后遇到的一個問題,就是大家如何選擇正確的學校這件事兒。這種選擇是一種雙向的選擇。學生在想:我到底是要有名氣的學校,還是比較保險的,可以接受我的高考分數(shù)的學校?同時,想得比較深一點的考生,就會想:“更適合我的專業(yè)是哪些?也許我的目的是想提高本人的價值,或者是賺到更多的錢,或者是找到比較好的朋友?!蹦敲此赡芤驗榫哂胁煌哪康?,想去的地方也不同。這里我要舉的例子,是一個叫做IPin的公司,他們利用互聯(lián)網(wǎng)大數(shù)據(jù),通過個人簡歷所積累成的大數(shù)據(jù),建立了一個智能擇校系統(tǒng),為高考生服務(wù)。大家可能看過一個卡通片叫《花木蘭》,它在決定它自己是否去從軍的時候,就有很多的祖先來給它提供各種各樣的建議。有人說:“去?!庇腥苏f:“不去?!蔽覀兠恳粋€人在面臨這樣的人生抉擇的時候,也希望有這樣的一個長輩來告訴他你應(yīng)該走這條路,之后走這條路。IPin的這個大數(shù)據(jù)系統(tǒng)可以把這些簡歷作為基本的數(shù)據(jù),提煉解析后,在簡歷里面按照時間軸來羅列每個人所去的學校,進行的工作種類,以及他在學校的所做活動,和他所取得的一些成就,由此,就將成千上萬人的上述內(nèi)容,變成一個完整的具有時間和空間的職業(yè)圖譜。因為這個圖譜是集中上億人的數(shù)據(jù),所以應(yīng)該說它的質(zhì)量是非常好的。有了這樣一個圖譜,我們就可以根據(jù)每個人的情況和所提的要求進行個性化的智能推薦了。比方說,以華中科技大學為例。一個高考的學生可能在問:我要不要上這所學校???通過大數(shù)據(jù)系統(tǒng),我們可以推斷,他畢業(yè)后在哪個城市的可能性比較大,這些學生大部分是學的什么專業(yè)?或者是說學的專業(yè)的比例,去的哪些公司等等。所以在下一步,他就可以去想,我應(yīng)不應(yīng)該去上這一所大學。同時,這樣的一個圖譜,也為考生們提供了更多的職場知識:我們就可以知道,假設(shè)我的目標是去騰訊這樣的公司,那么我們想知道里面員工平均的情況。他之前和之后員工的來源和去向都是有哪些,這些職業(yè)規(guī)劃是不是適合我們工作。像這樣的一種在互聯(lián)網(wǎng)和教育行業(yè)之間的連接,才真正的為每個人提供了一個有深度知識的連接,為考生提供了一個智能的導師。再近一步,利用這種知識圖譜還可以為你提供多步的規(guī)劃,可以通過機器學習里的強化學習,就像機器人規(guī)劃一個在物理空間的移動一樣,我們也可以把某個人在一個虛擬空間的移動軌跡進行一個優(yōu)化,把這個人生的軌跡、最優(yōu)的軌跡給顯示出來,滿足多個人生目標,這個就是強化學習。我的第二個例子是有關(guān)微信的。在微信這個平臺上,有很多的人工智能的研究可以展開。我們很多人都在用微信,但是大家可能不知道的是微信后面有一個從事“模式識別”的團隊,他們提供的很多功能現(xiàn)在大家都是在用的,比如圖像和語音識別。通過機器學習,可以進行在照片上人臉識別,可以掃描人、掃描物,圖象風格和甚至進行3D的虛擬現(xiàn)實等。今天我要舉的例子是“群體智能”:如何通過微信提供的成千上萬人的力量,產(chǎn)生一個質(zhì)變的效應(yīng),來做一件我們以前做不了的事情。這里我要舉一個公益方面的例子,就是微信利用群體智能所做的一個嘗試,這個名字叫作“聽見”。它的目標是利用微信和群體智能,為盲人、盲胞進行有聲讀物,幫助盲胞讀書。我們知道盲胞如果要聽一本書的話,在過去我們是找一位非常有名的播音員把這個書從頭到尾讀下來。這樣做雖然質(zhì)量雖然高,但是讀書的數(shù)量卻有限。如果我們能夠利用大家的碎片時間,讓每個微信用戶都可以有機會去讀一段文字,再利用人工智能把眾多的讀物喝起來,就可以很便捷的合成一個有聲讀物。比如:我們可以獲得《紅樓夢》的某個自然段,然后把我們讀的聲音上傳到云端,在云端利用語音識別去識別這個自然段的質(zhì)量,最后把高質(zhì)量的語音片斷連接起來,變成一本有聲書。這個例子,就是群體智慧的一個語音版。到現(xiàn)在為止,微信和許多公益團體,企業(yè),成功地做出了100多本讀物,分發(fā)給盲人同胞,產(chǎn)生了巨大的反響。我剛剛講的第一個是大數(shù)據(jù)和互聯(lián)網(wǎng)帶來的一個新的連接的可能,就是群體智能。群體智能為“互聯(lián)網(wǎng)+”,為“智能+”提供了新鮮血液。下面我要說的是另外一個方面,就是互聯(lián)網(wǎng)+帶來的是源源不斷的數(shù)據(jù),讓系統(tǒng)有機會進行“終生學習。”首先,終生學習的概念是這樣的:在過去,我們的學習方法是拿一個訓練數(shù)據(jù),訓練出一個模型然后再應(yīng)用。在我們到一個新的領(lǐng)域,又要重新開始訓練。這樣,過去學到的知識并沒有被利用起來。但是,我們知道,大數(shù)據(jù)是不斷的更新,就像智能的老鼠在一個迷宮里面,它也不斷地得到新的信息,然后產(chǎn)生新的模型。這個新的模型再利用進來,他又得到新的反饋。這個循環(huán)以后,這個系統(tǒng)就不斷的改進,不斷的提高,這個我們叫作“終生學習”?!敖K生學習”是很通俗易懂的。我們在互聯(lián)網(wǎng)電商的產(chǎn)品推薦問題上,也需要終生學習的能力。比方說,用戶們看到了某類廣告的的投放,滿足自己需要的,就可以去點擊。用戶點擊了的產(chǎn)品廣告,就表示他有興趣。但是如果他沒有點擊呢,我們就不知道了,我們可以理解成或者沒有興趣,或者他有興趣而沒有點擊。如果我們看一下點擊的變化,沿著時間軸的數(shù)據(jù)流動,每一個產(chǎn)品,用戶群對它感興趣的程度就是一個時間的函數(shù)。也就是說,用戶的興趣也不是恒定不變的。那么放到個人身上,我們就很容易理解為什么一個用戶的興趣是在演變的。比如:我們在春節(jié)的時候感興趣的產(chǎn)品,在夏天就不一定感興趣。所以說,在網(wǎng)上用戶的點擊可以來自用戶興趣的變化,這個變化就需要我們的智能系統(tǒng)不斷地學習,也就是終生學習。終生學習的需求還來自另外一個方面,就是當預(yù)測廣告點擊的模型變得非常成功以后,對未來的數(shù)據(jù)就會變得麻木,從而使得系統(tǒng)收到挑戰(zhàn)。如果我們現(xiàn)在看到的是一些正例和負例,系統(tǒng)就可以根據(jù)正例和負例建立一個模型。但是如果這個模型非常好的話,那么我們以后今后得到的例子也往往大都是正例。而我們再利用這些正例來重新訓練我們的模型,那這樣的模型往往就會變得有偏差。為什么呢?因為我們誤以為今后所有的例子都是正例,而負例我們看不到,所以我們沒有辦法讓負例來參加我們的訓練,那么我們的模型就會有偏,所以準確率就會下降。這就是說,我們過去說“失敗時成功之母”,在這里我們應(yīng)該反過來說:成功是失敗之母。在模型成功的時候,就孕育著失??;當失敗多了以后,有足夠多的負例,我們就會迎來新的成功。這種不斷的學習,是對終生學習的一種挑戰(zhàn)。

在這個方面,我們也在進行各種研究。比如:利用強化學習和深度學習相結(jié)合,根據(jù)用戶眼下可以進行的點擊,同時也根據(jù)用戶在無限擴展的多步以后可能點擊的廣告的收益,來共同來建立這樣的一個行為的規(guī)劃模型。接下來我要講的是“智能”為互聯(lián)網(wǎng)+帶來的另外一種改變,就是:我們過去在模型的建立上面下很多功夫。但是在互聯(lián)網(wǎng)+和傳統(tǒng)行業(yè)對接的時候,我們更應(yīng)該到在“特征工程”上面下功夫。這種從“模型”到“特征”的轉(zhuǎn)變,是“+智能”的一個重要轉(zhuǎn)折點。比如:在圖像識別領(lǐng)域準確率的提供,實際上是人們在特征工程的一種成功。這里來舉一個在金融領(lǐng)域的例子。這個大數(shù)據(jù)公司叫“第四范式”公司,他們?yōu)閭鹘y(tǒng)企業(yè)提供大數(shù)據(jù)的服務(wù)。以金融行業(yè)為例。在金融產(chǎn)業(yè)有無數(shù)的用戶,他們可能對某種產(chǎn)品有興趣,而金融領(lǐng)域的客戶經(jīng)理,如何把正確的產(chǎn)品推薦給正確的客戶,就是一個典型的業(yè)務(wù)問題。有了金融大數(shù)據(jù)以后,這個問題就可以用機器學習來做了。比如,在銀行的分期付款這個問題上,對于某一個產(chǎn)品的購買者,到底應(yīng)不應(yīng)該推送分期付款的短信,應(yīng)該提供什么樣的建議,以及在什么場合,以什么方式來推送?這些問題的解決取決于能不能從用戶和產(chǎn)品的數(shù)據(jù)中抽取大量的特征。過去利用人工,金融行業(yè)可以建立幾十維特征的模型?,F(xiàn)在利用大數(shù)據(jù),這個第四范式公司建立的上百萬維的特征模型,和以前相比,有了68%這么多的提高,帶來的是大幅提高的收益。這個是得益于什么呢?得益于特征的增加。另外一個方面,雖然模型的特征增加了,但是并不表明模型的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論