人機平臺(商業(yè)未來行動路線圖)_第1頁
人機平臺(商業(yè)未來行動路線圖)_第2頁
人機平臺(商業(yè)未來行動路線圖)_第3頁
人機平臺(商業(yè)未來行動路線圖)_第4頁
人機平臺(商業(yè)未來行動路線圖)_第5頁
已閱讀5頁,還剩120頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

人機平臺商業(yè)未來行動路線圖目錄\h第一部分人腦與機器\h01最難接受的事\h02最像人腦的機器\h03你好,機器人\h04技術(shù)與人性\h第二部分產(chǎn)品與平臺\h05新技術(shù)的沖擊\h06從互補品到數(shù)字化平臺\h07算法速配的O2O平臺\h08產(chǎn)品有出路嗎\h第三部分核心與大眾\h09大眾的勃興\h10大眾與專家的較量\h11萬物民主化之夢\h12公司過時了嗎第一部分

人腦與機器01

最難接受的事這些新機器的趨勢是在各個層次上取代人類的判斷力,而不是用機器的能量和力量取代人類的能量和力量。諾伯特·維納(NorbertWiener),1949年大約20年前,世界各地的企業(yè)理順了人與電腦之間的分工,它看起來合乎情理。機器負(fù)責(zé)基礎(chǔ)計算、記錄保存和數(shù)據(jù)傳輸。這樣就把人解放出來,讓他們做決策,做判斷,利用自己的創(chuàng)造力和直覺,彼此交流以解決問題,服務(wù)好客戶。從人手到人機這種方法廣為流傳,以至現(xiàn)在的人已經(jīng)很難想起此前的文書流轉(zhuǎn)時代,當(dāng)時,一車車滿載的文件夾往返于人群和部門之間?!拔臅V井”是該時代“碩果僅存”且令人困擾的一個地方,它設(shè)在地下,是由美國政府人事管理辦公室負(fù)責(zé)的一個低效率部門。保留這個地點,是為了處理聯(lián)邦雇員退休時所需的行政手續(xù)。由于這些手續(xù)尚未電腦化,因此需要600人處理日常業(yè)務(wù),他們在超市一般大小的房間工作,房間里放滿了高高的文件柜。由于巴洛克設(shè)計風(fēng)格的原因,這個房間設(shè)在地下200多英尺\h[1]的一個廢棄石灰?guī)r礦井處。1977年,完成聯(lián)邦雇員退休的文書工作平均需要61天。該項工作現(xiàn)在用的是基本相同的流程,仍然需時61天。在得克薩斯州,工作流程已經(jīng)數(shù)字化,事情只用兩天就做完了。邁克爾·哈默(MichaelHammer)和詹姆斯·錢皮(JamesChampy)于1993年出版《企業(yè)再造》(ReengineeringtheCorporation)一書,提出了化解世上繁文縟節(jié)的知識藍圖。這本書取得了巨大成功。它在世界各地的銷量超過200萬冊,被《時代周刊》提名為有史以來最具影響力的25本商業(yè)書籍之一。哈默和錢皮的基本想法是:企業(yè)不能認(rèn)為自己是在部門內(nèi)執(zhí)行任務(wù)(例如在采購部門內(nèi)購買原材料),它們應(yīng)該把自己看成在執(zhí)行業(yè)務(wù)流程(例如采購、組裝并按客戶訂單裝運),這本來就是跨部門的事。這種說法現(xiàn)在聽起來理所當(dāng)然,在當(dāng)時卻被認(rèn)為是新穎的、重要的。20世紀(jì)杰出的商業(yè)大師彼得·德魯克當(dāng)時表示:“再造是新的,它必須完成?!绷鞒桃暯峭芸闯鲈S多不必要的、可以剔除的任務(wù),或者像哈默和錢皮說的那樣,干脆把它們抹掉。20世紀(jì)90年代中期,有兩項進展使業(yè)務(wù)流程再造運動加速,這就是企業(yè)信息系統(tǒng)和萬維網(wǎng)。在企業(yè)信息系統(tǒng)出現(xiàn)之前,\h[2]企業(yè)通常有一堆各種各樣的軟件包,其中許多沒有相互連接。公司越大,軟件就越雜亂。企業(yè)級系統(tǒng)堅守用單一大型軟件包代替一堆軟件的承諾,\h[3]它設(shè)計清晰,用于執(zhí)行一組特定的跨職能業(yè)務(wù)流程。這種軟件可從思愛普和甲骨文等供應(yīng)商那里購買現(xiàn)成產(chǎn)品,然后在一定程度上進行配置和定制。企業(yè)信息系統(tǒng)迅速流行。據(jù)估計,到1999年,超過60%的《財富》1000強公司已經(jīng)采用了其中至少一種。盡管這些系統(tǒng)的安裝維護相當(dāng)昂貴和費時,但它們在很大程度上兌現(xiàn)了承諾。例如,布萊恩約弗森與同事思南·阿拉爾(SinanAral)和D.J.吳(D.J.Wu)的研究發(fā)現(xiàn),一旦企業(yè)開始使用新的企業(yè)級系統(tǒng),那么其勞動生產(chǎn)率、庫存周轉(zhuǎn)率和資產(chǎn)利用率就有顯著提高。萬維網(wǎng)的出現(xiàn),使企業(yè)級系統(tǒng)的覆蓋面和功能通過電腦(以及稍后出現(xiàn)的平板電腦和手機)延伸到個人消費者。萬維網(wǎng)誕生于1989年,當(dāng)時,蒂姆·伯納斯–李(TimBerners-Lee)開發(fā)了一套協(xié)議,允許文本、圖片等在線內(nèi)容相互鏈接,從而使科技大腕范內(nèi)瓦·布什(VannevarBush)和電腦預(yù)言家泰德·尼爾森(TedNelson)提出的超文本愿景變成現(xiàn)實,布什于1945年首先描述了這一設(shè)想,但只是使用微縮膠片進行理論探討,而尼爾森的仙那度項目(ProjectXanadu)則從未落地。萬維網(wǎng)迅速將互聯(lián)網(wǎng)從純文本網(wǎng)絡(luò)轉(zhuǎn)變?yōu)榭梢蕴幚韴D片、聲音和其他媒介的網(wǎng)絡(luò)。1994年,網(wǎng)景公司發(fā)布了名為“領(lǐng)航員”的第一款商業(yè)化網(wǎng)絡(luò)瀏覽器,由此,比以往任何時候都更豐富、更容易導(dǎo)航的多媒體奇觀進入主流。網(wǎng)景公司的共同創(chuàng)始人之一是馬克·安德森(MarcAndreessen),他當(dāng)時是一名22歲的程序員,曾開發(fā)過早期的網(wǎng)絡(luò)瀏覽器,我們將在第10章更多地談到他。\h[4]這一事件與先前主打?qū)W術(shù)的互聯(lián)網(wǎng)的商業(yè)化進程成為“天作之合”。萬維網(wǎng)使企業(yè)能夠?qū)I(yè)務(wù)流程擴展到邊界之外,一直延伸到消費者,這一趨勢被稱為電子商務(wù)。人們開始使用萬維網(wǎng),他們不僅可以搜索和了解企業(yè)的產(chǎn)品,而且還可以訂購和支付。這種效率和便利性的結(jié)合被證明是無法抗拒的。網(wǎng)景瀏覽器推出10年后,電子商務(wù)占了美國非美食、非汽車類零售業(yè)銷售額的10%左右。此后20年,基于萬維網(wǎng)的企業(yè)級系統(tǒng)完成了各種常規(guī)任務(wù),包括跟蹤賬戶余額和交易,計算原材料交付的數(shù)量和時間,給員工發(fā)放工資,讓客戶選擇產(chǎn)品并進行支付,等等,從而促成了越來越多的業(yè)務(wù)流程。人要相信自己一旦企業(yè)級軟件和萬維網(wǎng)之類的技術(shù)把員工從繁文縟節(jié)中解放出來,那么他們應(yīng)該做些什么呢?哈默和錢皮在《企業(yè)再造》一書中給出了明確的答案:隨著電腦接管日常事務(wù),人們應(yīng)該被授權(quán)行使自己的判斷力?!按蠖鄶?shù)的檢查、調(diào)和、等待、監(jiān)測、跟蹤——也就是非生產(chǎn)性工作……通過再造被剔除了……在再造后的流程中工作的人必須得到授權(quán)。作為流程團隊工作人員,他們被允許和被要求進行思考、交流,行使判斷力,并做出決定?!边@是關(guān)于一種共同信念的明確表述:即使身處硬件、軟件和網(wǎng)絡(luò)無處不在的世界,人類仍然因其判斷力而彰顯價值,我們的推理能力比利用現(xiàn)有數(shù)據(jù)進行機械式計算要高出一籌。大多數(shù)人都承認(rèn),如果我們能做的無非就是常規(guī)工作,那么我們現(xiàn)在就會失業(yè),因為電腦做這些事太容易了。但幾乎所有人也都相信,即使數(shù)字化技術(shù)繼續(xù)從摩爾定律中獲益,我們也能夠比它們做更多的事。所謂摩爾定律,是指隨著時間的推移,同額美元購買的電腦硬件在數(shù)量上劇增,導(dǎo)致處理能力的指數(shù)級增強。數(shù)十年來的研究證實,我們實際上有兩種不同的推理方式。這一突破性的工作使丹尼爾·卡尼曼\h[5]獲得了諾貝爾獎,他與合作者阿莫斯·特沃斯基(AmosTversky)一起在行為經(jīng)濟學(xué)領(lǐng)域開宗立派。卡尼曼及其同事的工作表明,我們有“系統(tǒng)1”和“系統(tǒng)2”\h[6]兩種思維方式。系統(tǒng)1快速、自發(fā)、事關(guān)小腦皮層,不怎么費腦力,它與我們所說的直覺密切相關(guān)。系統(tǒng)2則相反,它是緩慢、有意識的,事關(guān)大腦皮層,很費腦力。正如卡尼曼在《思考,快與慢》(Thinking,FastandSlow)一書中所寫:系統(tǒng)1的運行是無意識且快速的,不怎么費腦力,沒有自主控制感。系統(tǒng)2將注意力轉(zhuǎn)移到費腦力的活動上,包括復(fù)雜的計算。系統(tǒng)2的運行通常與行為、選擇和專注等主觀體驗相關(guān)聯(lián)。這兩個系統(tǒng)都可以隨著時間的推移而改善。系統(tǒng)2通過學(xué)習(xí)數(shù)學(xué)或邏輯課程而改進,而系統(tǒng)1則通過謀生計、理解實例而變得更自如、更廣博。消防隊員久經(jīng)歷練,能夠判斷大火如何在建筑物蔓延;人事經(jīng)理閱人無數(shù),能夠看出誰更適合公司;圍棋選手用心下棋,終成大師。當(dāng)然,這兩個系統(tǒng)可以——也應(yīng)該同步改進。病理學(xué)家(診斷疾病的醫(yī)學(xué)專家)既研究生物化學(xué),也觀察許多患病組織和健康組織的實例,從而改善自己的技能。當(dāng)我們既了解基本原理,又通過活生生的個案將其實例化時,學(xué)習(xí)往往更深入、更快速。商業(yè)教育的主導(dǎo)方式也是這兩個系統(tǒng)的結(jié)合。商學(xué)院學(xué)生通過會計、金融和微觀經(jīng)濟學(xué)課程提高了系統(tǒng)2技能。他們還討論了企業(yè)家精神、領(lǐng)導(dǎo)力、道德和其他領(lǐng)域的許多案例,以此改善自己的直覺和判斷,這些是系統(tǒng)1技能。許多課程結(jié)合了兩種方法。醫(yī)學(xué)院和法學(xué)院也采取類似的措施。關(guān)于人在系統(tǒng)1和系統(tǒng)2方面的能力,一個公認(rèn)的終極發(fā)現(xiàn)是人與人的差別很大。有的人在解方程、動腦筋方面得心應(yīng)手,但缺乏直覺和實踐智慧。有的人連算術(shù)都不會做,卻具有強大的直覺能力。隨著技術(shù)的普及,后一類人不再低聲下氣。實際上,他們時來運轉(zhuǎn)。電腦做了所有合乎邏輯、合乎規(guī)矩的工作,使他們得以脫身,從事哈默和錢皮所倡導(dǎo)的事務(wù):做判斷,做決定,與他人交流以解決問題,抓住機遇,服務(wù)顧客。事實上,在我們看來,在當(dāng)今大部分的商業(yè)場合中,系統(tǒng)1的重要性都在上升。卸任的公司老總寫書時用上了諸如“堅守初心,直面艱難”這樣的書名。而那些太過專注數(shù)據(jù),與現(xiàn)實世界復(fù)雜性脫節(jié)的公司領(lǐng)導(dǎo)人,則背上了“技術(shù)控”的罵名。2010年出版的《重新思考MBA:十字路口商業(yè)教育》(RethinkingtheMBA:BusinessEducationataCrossroads)一書將“在凌亂的非結(jié)構(gòu)化環(huán)境中形成判斷和直覺”列為MBA課程未能滿足的重大需求之一。上述論據(jù)與《企業(yè)再造》的觀點不謀而合:讓人們發(fā)展、行使自己的直覺和判斷力,做出明智的決定,讓電腦做好計算和記錄。我們已經(jīng)多次聽過、看過人腦與機器之間的這種分工,故而稱之為“標(biāo)準(zhǔn)伙伴關(guān)系”。除非自己不靠譜標(biāo)準(zhǔn)伙伴關(guān)系的說法很生動,但有時它根本不奏效。完全不靠人的判斷,甚至不靠那些經(jīng)驗豐富、聲譽卓著的人的判斷,只依靠代入公式的數(shù)字,常常會帶來更好的結(jié)果。這是一個違反直覺的發(fā)現(xiàn)。由于明顯的原因,它也不受人歡迎。所以我們必須“一站到底”。然而在這樣做之前,我們應(yīng)該強調(diào),系統(tǒng)1在商業(yè)上并非一文不值。事實上,它遠非如此。我們將會看到,人類的直覺、判斷力和快思維仍然具有重要的作用,領(lǐng)先的企業(yè)正在以新穎、精彩的方式運用它們,這些方式意味著人腦與機器之間新的、改進的伙伴關(guān)系。但我們必須先說出系統(tǒng)1的一些弱點。看看下面這些標(biāo)新立異的研究,它們表明,即使是專家的判斷和直覺也常常有嚴(yán)重的局限。?社會學(xué)教授克里斯·斯奈德斯(ChrisSnijders)用荷蘭企業(yè)購買的5200臺電腦建立了一個數(shù)學(xué)模型,可用于預(yù)測預(yù)算的遵從度、交貨的及時性及買家對每筆交易的滿意度。然后,他使用這個模型來預(yù)測在若干行業(yè)發(fā)生的一組交易的相關(guān)結(jié)果,并同時請這些行業(yè)的一組采購經(jīng)理做同樣的預(yù)測。斯奈德斯的模型擊敗了經(jīng)理人,甚至擊敗了處于平均水平以上的經(jīng)理人。他還發(fā)現(xiàn),資深的經(jīng)理人比新手好不了多少,而且一般來說,經(jīng)理人在分析自己所在行業(yè)的交易時,其結(jié)果與他們分析其他行業(yè)的交易差不多。?經(jīng)濟學(xué)教授奧利·阿森費爾特(OrleyAshenfelter)建立了一個簡單的模型,它僅使用4個可公開獲取的氣候變量,在波爾多葡萄酒還未能品嘗的時候,該模型就成功地預(yù)測了它們的質(zhì)量和價格。這些未熟酒的價格歷來深受知名葡萄酒專家意見的影響,但是阿森費爾特寫道:“這類研究提出的最有趣問題之一,就是它所暗指的專家意見對葡萄酒定價所起的作用……有證據(jù)表明,專家意見與葡萄酒質(zhì)量的根本決定因素?zé)o關(guān),亦即兩者彼此獨立……這自然而然地提出了一個懸而未決的問題,即究竟是什么決定了對專家意見的需求?!?布萊恩約弗森與沃頓商學(xué)院教授吳林恩(LynnWu)合作研發(fā)了一個預(yù)測房屋銷量和價格的簡單模型。他們使用谷歌趨勢中的數(shù)據(jù),這些數(shù)據(jù)顯示了美國各州每月搜索“房地產(chǎn)代理”“房貸”和“房價”等關(guān)鍵詞的次數(shù)。他們用該模型預(yù)測未來的房屋銷量,并將預(yù)測結(jié)果與美國國家房地產(chǎn)經(jīng)紀(jì)人協(xié)會專家發(fā)布的預(yù)測進行比較。結(jié)果,他們的模型以高達23.6%的優(yōu)勢完勝專家。這反映出將谷歌搜索數(shù)據(jù)納入預(yù)測模型的威力。?布萊恩約弗森的另一個項目更接近本行,這是一個為學(xué)術(shù)界開發(fā)的“開腦洞”模型。他與麻省理工學(xué)院的迪米特里斯·伯特西馬斯(DimitrisBertsimas)、約翰·希爾伯霍茲(JohnSilberholz)和沙查爾·雷奇曼(ShacharReichman)合作,預(yù)測誰將在頂尖大學(xué)取得永久教職。他們研究了青年學(xué)者早期出版記錄和引用形式的歷史數(shù)據(jù),并利用網(wǎng)絡(luò)理論中的一些概念,觀察有哪些學(xué)者寫出最具影響力的論文。他們校正模型,預(yù)測哪些學(xué)者將最終在運籌學(xué)領(lǐng)域獲得永久教職。該模型的預(yù)測結(jié)果有70%與職稱委員會的意見一致,但是在不一致的情況下,通過模型預(yù)測產(chǎn)生的一批學(xué)者與職稱委員會遴選的學(xué)者相比,前者此后在頂級期刊上發(fā)表了更多的論文,其研究也被更多地引用。?沙伊·丹吉格(ShaiDanzinger)及其同事的一項研究表明,以色列法官在一天的開始和用餐休息之后更有可能給予假釋。在法官休息之前,他們想必已經(jīng)疲憊不堪,抑或血糖過低,因而更有可能建議繼續(xù)監(jiān)禁。其他研究支持了司法決定往往受手頭罪案之外因素影響的觀點。經(jīng)濟學(xué)家厄茲坎·埃倫(OzkanEren)和納吉·莫坎(NaciMocan)發(fā)現(xiàn),在美國某個州,畢業(yè)于某所區(qū)域名校的法官在母校橄欖球隊意外敗北之后,馬上就給出了極其嚴(yán)厲的判決,而且這些判決“多數(shù)由黑人被告背黑鍋”。?在佛羅里達州布洛沃縣學(xué)區(qū),父母或老師的提名曾經(jīng)是把孩子認(rèn)定為天賦學(xué)生的第一步。布洛沃縣的大多數(shù)學(xué)生都是少數(shù)族裔,但天賦班的學(xué)生中竟然有56%是白人。21世紀(jì)的前10年,該區(qū)決定取消主觀選拔方式,嘗試使其盡量系統(tǒng)、客觀。他們讓區(qū)內(nèi)每個孩子進行非口頭的智商測試。根據(jù)經(jīng)濟學(xué)家戴維·卡德(DavidCard)和勞拉·朱利亞諾(LauraGiuliano)的記錄,這一變化的結(jié)果令人震驚:被認(rèn)定為有天賦的非洲裔學(xué)生和西班牙裔學(xué)生分別增加了80%和130%。?法學(xué)教授泰德·魯格(TedRuger)、寶麗·金(PaulineKim)與政治學(xué)者安德魯·馬?。ˋndrewMartin)、凱文·奎因(KevinQuinn)一起,對馬丁和奎因開發(fā)的一個6變量簡單模型進行了測試,看看它對美國最高法院2002年期間的裁決預(yù)測是否優(yōu)于一個由83位著名法律專家組成的團隊的預(yù)測結(jié)果。這83位法律專家中,有38位擔(dān)任過最高法院法官,33位是法學(xué)講座教授,6位是現(xiàn)任或前任法學(xué)院院長。平均而言,該團隊的預(yù)測與法院裁決結(jié)果相符的略低于60%。而算法則預(yù)測對了75%。以上所列事例是否有代表性?是否公平?或者說,我們是否有意無意地凸顯了人類判斷敗給純數(shù)據(jù)驅(qū)動方法的個例,同時忽略了人類勝出的例子?有足夠的研究表明,答案是否定的。由心理學(xué)家威廉·格羅夫(WilliamGrove)領(lǐng)導(dǎo)的一個團隊查找了50年的文獻,挑選出心理學(xué)和醫(yī)學(xué)領(lǐng)域公開發(fā)表且經(jīng)同行評議的論文,這些論文研究的是臨床預(yù)測和統(tǒng)計預(yù)測的配對比較,即比較經(jīng)驗豐富的人類專家判斷與100%數(shù)據(jù)驅(qū)動方法的預(yù)測。他們找到了136項這樣的研究,涵蓋從智商預(yù)測到心臟病診斷的方方面面。在48%的研究中,兩者并無顯著差異,換言之,平均來說,專家并沒有比公式做得更好。然而以下發(fā)現(xiàn)給了人類判斷力的優(yōu)越性當(dāng)頭一棒:在46%的研究中,人類專家實際上表現(xiàn)得比純數(shù)字和公式差得多。這意味著人類只在6%的研究中勝出。作者由此得出結(jié)論,幾乎在人做得更好的所有研究中,“臨床醫(yī)生得到的數(shù)據(jù)比機械預(yù)測要多”。保羅·米爾(PaulMeehl)是一位傳奇心理學(xué)家,他從20世紀(jì)50年代初開始記載和描述人類專家判斷的不良記錄,正如他所總結(jié):像(統(tǒng)計預(yù)測與臨床預(yù)測的相對效度)這樣,展現(xiàn)數(shù)量如此眾多的、多樣化的定性研究,如此一致地指向同一方向,這在社會科學(xué)中是沒有爭議的。當(dāng)你進行100多次調(diào)查,預(yù)測從足球比賽結(jié)果到肝臟疾病診斷之類的事情,而你卻很難找到幾項研究來表明哪怕是一點點有利于臨床醫(yī)師的趨勢時,就是給出實際結(jié)論的時候了。我們認(rèn)為,這個實際的結(jié)論就是:我們要更少依賴專家的判斷和預(yù)測。越來越多的美國公司也得出了同樣的結(jié)論。布萊恩約弗森和多倫多大學(xué)教授克里斯蒂娜·麥克爾赫倫(KristinaMcElheren)與美國人口普查局合作,對一個包含1.8萬家制造工廠的代表性樣本進行了調(diào)查,結(jié)果發(fā)現(xiàn),數(shù)據(jù)驅(qū)動型決策的應(yīng)用正在快速增加,其動力來自日益增多的信息技術(shù)應(yīng)用,以及采用這一做法的公司的優(yōu)異業(yè)績。盡管有這些令人信服的例子,我們?nèi)孕枇谐鲆恍┲匾臈l件,把關(guān)于算法成功的熱議冷卻一下。顯然,為了將人的判斷與數(shù)學(xué)模型進行比較,首先必須有一個模型。而如波蘭尼悖論所暗示,這并不總是說有就有。這類模型必須用多種相似實例的數(shù)據(jù)集進行測試和改進,而這種情況只代表了人類必須做出的決策的一小部分。不過總體格局是明朗的,一旦模型可以建立和測試,那么在一個接一個的事例中,它的表現(xiàn)就與做類似決策的人類專家一樣好,甚至更勝一籌。然而在許多情況下,即使機器做得更好,我們還是繼續(xù)依靠人的判斷。人心精妙,但有錯漏僅靠系統(tǒng)2,一味對數(shù)字進行邏輯理性的計算,這種方法怎么可能比結(jié)合了系統(tǒng)2和系統(tǒng)1的方法更好呢?畢竟,系統(tǒng)1是人類與生俱來的、深刻的本能思維工具,它已經(jīng)做得足夠好,幫我們克服了各種無情的、全球75億人口仍需面對的達爾文進化挑戰(zhàn),使人類獲得生存,繼續(xù)發(fā)展。它怎么會讓我們這么失望呢?這些問題太大,只用一本書是說不清楚的,更不用說是書里面的一章。但是在《思考,快與慢》一書中,卡尼曼對大量研究(許多是他自己進行的研究)給出了簡單總結(jié):系統(tǒng)1自發(fā)運行,不能隨意關(guān)閉,因此直覺的錯誤往往難以防止。偏見總是難免,因為系統(tǒng)2可能沒有錯誤的線索。簡而言之,系統(tǒng)1很棒,但它同時也是錯漏的真正所在。它常常走捷徑,而不是透徹地推理。它還有一個驚人的偏見大集合。在心理學(xué)和卡尼曼幫助建立的行為經(jīng)濟學(xué)領(lǐng)域,研究人員已經(jīng)確認(rèn)了許多系統(tǒng)1的錯漏并加以命名。這些錯漏的完整列表會使人不勝其煩,灰心喪氣。羅夫·多貝爾里(RolfDobelli)關(guān)于這一主題的專著《清晰思考的藝術(shù)》(TheArtofThinkingClearly)共有99章,而根據(jù)最近的統(tǒng)計,維基百科的“認(rèn)知偏見清單”有175個條目。軟件公司Slack的產(chǎn)品經(jīng)理巴斯特·本森(BusterBenson)找到了一種我們認(rèn)為很好的方法,將這些偏見歸類,并提醒我們它們帶來的問題:\h[7]1.信息過載很糟糕,所以我們盡力過濾……(但是)我們過濾掉的一些信息實際上是有用的、重要的。2.意義的缺失令人困惑,所以我們填補空白……(但是)我們尋求意義時會產(chǎn)生錯覺。我們有時會想象由自己的假設(shè)所填補的細節(jié),由此建構(gòu)本來沒有的意義和故事。\h[8]3.(我們)需要快速行動,以免失去機會,所以我們匆匆得出結(jié)論……(但是)快速決策可能有嚴(yán)重缺陷。我們草率做出的一些快速反應(yīng)和快速決策是不合適的,自私的,甚至是適得其反的。4.全部記住不易,所以我們試著記住要點……(但是)我們的記憶強化了誤差。我們記住一些東西,留待他日所用,這只會使上述認(rèn)知更有偏見,進一步損害我們的思維過程。請注意認(rèn)知能力的另一個嚴(yán)重問題:我們無法知道系統(tǒng)1何時奏效,何時失效。換句話說,我們拿不準(zhǔn)自己的直覺。我們不知道自己做出的快速判斷或決定究竟是準(zhǔn)確的,還是受制于自己的一種或多種偏見。于是,發(fā)生了與波蘭尼悖論相悖的怪事:對系統(tǒng)1的認(rèn)知結(jié)果而言,我們所知的竟然少于我們所能說的。系統(tǒng)2的理性計算通??梢詮?fù)查,但是正如卡尼曼所指出的那樣,系統(tǒng)1真的做不到,它只能靠自己。最近的研究揭示了一種與波蘭尼悖論有關(guān)的鬼使神差般的偏差:往往是系統(tǒng)1得出一個結(jié)論,然后讓系統(tǒng)2來解釋它。心理學(xué)家喬納森·海德特(JonathanHaidt)說:“判斷和舉證是兩個獨立的過程?!毕到y(tǒng)1激發(fā)的判斷幾乎在瞬間發(fā)生,然后系統(tǒng)2用理性、合理的說法給予肯定。\h[9]這種“托詞”不僅經(jīng)常愚弄別人,而且也愚弄始作俑者自己。事實上,正如心理學(xué)家理查德·尼斯比特(RichardNesbitt)和蒂莫西·德坎普·威爾遜(TimothyDeCampWilson)所說,我們往往“說的比我們知道的更多”。所以說,我們標(biāo)記為理性化和自適化的行為并不只是制造借口的手段,它們是一些更本質(zhì)的事情:工作中的系統(tǒng)1。2006年,在財捷集團和微軟工作的兩位數(shù)據(jù)分析專家阿維納什·考??耍ˋvinashKaushik)和羅尼·科哈維(RonnyKohavi)提出了首字母縮略詞“HiPPO”,用它來總結(jié)大多數(shù)公司的主要決策風(fēng)格。HiPPO的意思是“最高薪酬的人的意見”(highest-paidperson’sopinion)。我們喜歡這種速記并多次使用它,因為它生動地說明了標(biāo)準(zhǔn)伙伴關(guān)系。即使做出決策的人不領(lǐng)最高薪酬,他們也總是以觀點、判斷、直覺、本能和系統(tǒng)1為依據(jù)。很明顯,這種辦法通常效果不佳,而且HiPPO往往敗事有余。新人機關(guān)系我們?nèi)绾芜\用所有這些關(guān)于系統(tǒng)1和系統(tǒng)2的偏差與故障的知識呢?這些知識怎樣才能引導(dǎo)我們更聰明地做決策,以及做出更好的決策呢?最明顯的方法,就是在可能的情況下放手讓機器做決策,系統(tǒng)2的純數(shù)字化演繹因摩爾定律而功力大增,通過源源不斷地導(dǎo)入數(shù)據(jù),讓它給出答案,無須系統(tǒng)1的輸入。這正是越來越多的公司隨著時間的推移而著手進行的事情。第二經(jīng)濟據(jù)我們所知,在企業(yè)計算時代剛剛到來的時候就有了全自動化決策的先例,它就是體現(xiàn)人們信譽的數(shù)字化記分系統(tǒng)——評估人們償還一定數(shù)額貸款的可能性。傳統(tǒng)上,這一關(guān)鍵決策是由銀行分行的本地貸款人員做出的,他們根據(jù)自己的經(jīng)驗評估貸款申請,有時也結(jié)合了相關(guān)規(guī)則或指南。然而比爾·法伊爾(BillFair)和伊爾·艾薩克(EarlIsaac)覺得用數(shù)據(jù)可以做得更好。他們于1956年創(chuàng)立了FairIsaac(費埃哲公司),推出FICO(個人信用評分)計算信用評分。自動信用評估很快成為常態(tài)。到1999年,《美國銀行家》(AmericanBanker)雜志報道說:“甚至無須(人)去評估任何5萬美元以下的(信用申請),電腦就搞定了?!盕ICO及同類系統(tǒng)已被證明是高度可靠的還貸預(yù)測工具,而且,隨著近年來個人數(shù)字信息的數(shù)量和類別的增加,這種“大數(shù)據(jù)”方法也被用來提升和延伸信用評分。這些評分系統(tǒng)的開發(fā)人員必須小心翼翼,免得被誤認(rèn)是從事數(shù)字化歧視業(yè)務(wù)(一種非法業(yè)務(wù),以種族或部落人群為由,拒絕或降低某些地理區(qū)域的信貸)。一般來說,他們提供了一種有價值的服務(wù),讓更多人獲得信貸機會,讓放款人有信心擴大業(yè)務(wù)。有證據(jù)顯示,隨著信貸決策趨于自動化,經(jīng)濟歧視實際上是減少了。2007年,美聯(lián)儲報告說,信用評分模式“減少了從事非法歧視行為的機會……有助于降低信貸決策受個人特征或法律禁止的其他因素(如種族、部落等)影響的可能性”。今天,有價值、高質(zhì)量的完全自動化決策事例比比皆是。亞馬遜和其他電子商務(wù)網(wǎng)站會為每位購物者的每次訪問給出推薦,盡管許多人錯過機會,但有些人受到極大的吸引。例如,亞馬遜估計,其銷售額的35%來自推薦項目之類的交叉銷售活動。飛機航班和酒店客房的價格一直在變,反映了供需預(yù)測的演化,以及每分鐘又如何發(fā)生實際的變更。對無數(shù)企業(yè)來說,這種被稱為收益管理的定價方法至關(guān)重要(我們將在第7章討論這個主題),但是,收益管理算法產(chǎn)生的價格在提交給客戶之前,很少(如果有的話)由人工復(fù)查一遍。實體商品現(xiàn)在也實行自動化的價格變動。2015年感恩節(jié)之后的第一天,亞馬遜和沃爾瑪在美國的所有存貨分別提價16%和13%。事實上,諸多完全自動化的決策正在我們周圍發(fā)生,以至經(jīng)濟學(xué)家布萊恩·阿瑟(BrianArthur)用“第二經(jīng)濟”來形容它,其中交易沒有人類的介入,其發(fā)生形態(tài)是“巨大的、沉靜的、彼此連接的、看不見的、自主的”。隨著時間的推移,這種自動化的第二經(jīng)濟正延伸到我們熟知的以人為中介的經(jīng)濟體,算法接管了專家和HiPPO人士的工作。全世界越來越多的信息被數(shù)字化了,由此帶來了大量數(shù)據(jù),它們可用于改進工作,將直覺轉(zhuǎn)化為數(shù)據(jù)驅(qū)動的決策。長期以來,廣告公司不僅幫助客戶從事制作新電視廣告片的創(chuàng)意工作,而且還幫他們確定在何時何地進行展示,即確定哪些電視節(jié)目、哪些地域市場和哪些時段最能匹配廣告客戶的目標(biāo)和預(yù)算。就這項工作而言,數(shù)據(jù)和技術(shù)早有應(yīng)用,熱播劇《廣告狂人》(MadMen)的廣告代理1969年就買下第一臺電腦(IBMSystem/360),以幫助其更好地投放廣告并吸引客戶,但該項工作仍主要受人的判斷和決策的驅(qū)動。丹·瓦格納(DanWagner)在巴拉克·奧巴馬2012年成功連任的競選活動中擔(dān)任高級分析師,當(dāng)時他發(fā)現(xiàn)機器分析原來可以這么精準(zhǔn),還能帶來如此多的好處。瓦格納和他的同事為每位美國選民建立名冊。該分析團隊使用機器學(xué)習(xí)技術(shù)(下一章將詳細討論),為名冊上的每個人建立了三個單獨的評分:一個“支持評分”,用于預(yù)測每個人支持奧巴馬的可能性(相對于競選對手米特·羅姆尼);一個“投票評分”,用于預(yù)測每個人在11月實際去投票站投票的可能性;以及一個“勸說評分”,用于預(yù)測每個人在接收奧巴馬競選團隊的信息之后對他產(chǎn)生好感的可能性。多年來,每個電視節(jié)目都有人口統(tǒng)計數(shù)據(jù),例如,統(tǒng)計丹佛地區(qū)有多少18—24歲的男士在周二晚上10點觀看動畫節(jié)目《惡搞之家》(FamilyGuy)重播。傳統(tǒng)上,傳媒買家和戰(zhàn)略家在做決策時嚴(yán)重依賴這些信息。如果奧巴馬2012年的競選團隊想在科羅拉多州18—24歲的男士眼前發(fā)布信息,那么有很多公司和人士可以就周二晚上《惡搞之家》重播時是否插播競選廣告提供建議。但是,像其他大多數(shù)廣告買家一樣,奧巴馬團隊知道依靠人口統(tǒng)計數(shù)據(jù)很不靠譜。他們的廣告受眾可能主要是羅姆尼的鐵桿支持者,又或者看廣告的人基本上都已經(jīng)決定投票選舉奧巴馬,那么這就是浪費時間。依靠人口統(tǒng)計意味著依靠判斷和粗糙的估計,這樣做幾乎等同于以下猜測:選舉期間特別抓取的一個更容易接受奧巴馬競選信息的群體,就是18—24歲的男士,或者說是《惡搞之家》的觀眾,甚至可以說是一般卡通片的觀眾。瓦格納和他的同事們意識到,他們那份詳盡的選民名冊有可能生成一種好得多的媒體購買方式。有了這份名冊,競選團隊可以確定哪些人屬于最需要接觸的兩個群體:一是需要勸說以便在投票日真正去票站投票的奧巴馬支持者,二是有可能被說服支持奧巴馬的騎墻選民。前者是“出門投票組”,后者是“可說服組”。分析團隊認(rèn)為,這兩組人分布在廣泛的人口統(tǒng)計類別,所以僅僅基于人口統(tǒng)計數(shù)據(jù)來選定電視節(jié)目就會錯失團隊希望接觸的人群。該團隊還從早期的實驗結(jié)果中獲知,令兩組人有反應(yīng)的廣告類型大不相同,因此在購買電視節(jié)目時段時要區(qū)分開來。2012年,一些評級公司已經(jīng)遠不滿足于抓取電視節(jié)目人口統(tǒng)計數(shù)據(jù),它們能夠界定哪些人正在看節(jié)目。\h[10]這正是瓦格納及其同事所需的第二類數(shù)據(jù)。他們向這些公司提供競選團隊的“出門投票組”和“可說服組”列表,然后拿到了每組中有多少人觀看每個節(jié)目的信息。\h[11]這樣一來,他們就輕而易舉地找到最佳買點,也就是說,每一美元廣告開支所買下的電視節(jié)目都能讓最多屬于“出門投票組”和“可說服組”的人看到。瓦格納告訴我們說:“我們最終購買了美國有線電視臺的深夜節(jié)目,這真的很奇怪。它就像冒出來似的,而它冒出來的原因無非就是很便宜。那些節(jié)目有很多‘可說服組’的選民觀看,所以我們就買下來了?!边x舉后,瓦格納創(chuàng)立了CivisAnalytics(一家大數(shù)據(jù)公司),將這種深受數(shù)據(jù)驅(qū)動的媒體購買方法做成產(chǎn)品,然后提供給企業(yè)和其他組織。他相信當(dāng)下是這類產(chǎn)品的大好時機,在很大程度上,很多企業(yè)都有包羅萬象的個人名冊,如潛在客戶,可能有后續(xù)采購的現(xiàn)有客戶,等等。他說:“如果你銷售昂貴的輪胎,那么會有一小部分人愿意花大價錢買它,另有90%的人絲毫不在乎,因為他們不開車,抑或他們從不購買昂貴輪胎。你對目標(biāo)客戶有相當(dāng)好的判斷,但是說到他們在看什么電視節(jié)目,你從沒辦法知道得同樣精準(zhǔn),同樣有把握。現(xiàn)在好了,你可以做到了?!睂τ趶V告商來說,投放電視廣告是一個重要的決策,它用到一些數(shù)據(jù),也用到許多判斷。CivisAnalytics正在努力改變這一點,使得媒體購買成為一種近乎優(yōu)化而不是直覺的工作。誠然,即使是高度優(yōu)化的數(shù)據(jù)驅(qū)動系統(tǒng)也未臻完美,當(dāng)輸入的數(shù)據(jù)有質(zhì)量缺陷時尤其如此。2016年,希拉里·克林頓的競選團隊采取了許多類似的方法,卻以微弱劣勢落敗,其部分原因就是民調(diào)數(shù)據(jù)失準(zhǔn),本來預(yù)測她在中西部三個州大幅領(lǐng)先,最終卻全部惜敗。另一種常見的風(fēng)險是決策者不擅長優(yōu)化正確的終極目標(biāo),也就是“HiPPO”一詞的首創(chuàng)者之一羅尼·科哈維所說的“整體評估標(biāo)準(zhǔn)”。就算瓦格納的團隊能夠成功地使克林頓在全民投票中的領(lǐng)先地位最大化,這也不是正確目標(biāo)。決定美國總統(tǒng)大選結(jié)果的是選舉團而不是全民投票,它需要有更加微妙的針對各個州的戰(zhàn)略。同樣,衡量在線廣告活動產(chǎn)生的網(wǎng)頁瀏覽量或點擊率很容易,但大多數(shù)公司更關(guān)心的是長期銷售,它通常經(jīng)由不同類型的廣告活動達到最大化。因此,仔細選擇正確的數(shù)據(jù)輸入和正確的績效指標(biāo),特別是整體評估標(biāo)準(zhǔn),是成功的數(shù)據(jù)驅(qū)動決策者的一個關(guān)鍵特征。糟糕的算法將決策交給機器的真正風(fēng)險在于,算法系統(tǒng)中的偏見可能會延續(xù)甚至放大社會上的一些有害偏見。例如,哈佛大學(xué)教授拉坦婭·斯威尼(LatanyaSweeney)就有一段廣為人知的郁悶經(jīng)歷,有一次她在谷歌搜索引擎中輸入自己的名字,與搜索結(jié)果一起出現(xiàn)的還有這么一段廣告:拉坦婭·斯威尼,被捕?(1)輸入名稱和所在州(2)訪問完整的背景信息。立即檢查可至。該廣告提示她有犯罪記錄,但事實上她從未被捕。隨著進一步的研究,斯威尼發(fā)現(xiàn),與勞麗(Laurie)、布蘭登(Brendan)等白人的名字相比,搜索諸如特利文(Trevon)、拉基沙(Lakisha)或拉坦婭之類的非裔美國人名字更可能顯示“被逮捕?”的信息。雖然我們不知道為什么會出現(xiàn)這種模式,但斯威尼提出了一種令人不安的解釋:谷歌的自動化廣告投放算法可能已經(jīng)注意到,當(dāng)廣告與貌似黑人的名字相關(guān)聯(lián)時,人們更可能點擊去看。因此,這一種族偏見并非反映任何投放廣告的人或谷歌公司的人有意歧視,它更可能是反映并放大了數(shù)百萬用戶點擊廣告而生成的全社會歧視決策類型。同樣,2017年1月,在谷歌的圖像搜索中輸入“科學(xué)家”或“祖母”時,產(chǎn)生的絕大多數(shù)是白人頭像。在《自然》雜志的一篇文章中,凱特·克勞福德(KateCrawford)和賴恩·卡洛(RyanCalo)指出了這么一種危險:“在當(dāng)前的一些情況下,人工智能系統(tǒng)的缺點不成比例地影響了因種族、性別和社會經(jīng)濟背景等因素而處于不利地位的群體,這凸顯了考慮此類系統(tǒng)有意或無意的社會影響的重要性?!蔽覀冋J(rèn)同這些關(guān)注,也看到越來越依賴算法決策的挑戰(zhàn)和機會。挑戰(zhàn)就是:這種方法會嵌入和延續(xù)不公平的、有害的和不必要的偏見。更糟糕的是,即使設(shè)計人員有創(chuàng)建無偏見系統(tǒng)的良好初衷,這些偏見也可能會出現(xiàn),如果沒有廣泛的測試,它們可能難以識別。所有的系統(tǒng)設(shè)計都必須直面這一挑戰(zhàn)。機會則是:人們通常可以測試和改進基于機器的系統(tǒng)。一經(jīng)糾正,它們就不太可能再犯同樣的錯誤。相比之下,讓人類承認(rèn)自己的偏見很難,有多少人會公開聲稱種族歧視或性別歧視呢?更不用說要克服這些困難了。采用一種決策系統(tǒng)(無論是基于機器,基于人類,還是基于兩者的某種組合)的最終標(biāo)準(zhǔn)實際上都不是完美的。任何系統(tǒng)都可能會出錯,都有偏見。因此,我們的目標(biāo)應(yīng)該是選擇使偏差和錯誤最小化,并能夠使之輕易快速被糾正的方法。讓人類加入系統(tǒng)決策過程人們應(yīng)該在決策中扮演什么角色?根據(jù)我們所知的系統(tǒng)1的偏見和錯漏,以及唾手可得的海量數(shù)據(jù)和計算能力,第二經(jīng)濟看起來就要接管第一經(jīng)濟了,而數(shù)字化的系統(tǒng)2也很快就能做出大部分的決定。有一個古老的笑話,未來的工廠只有兩個員工:一個人和一條狗。人的工作是喂狗,狗的工作是不讓人接觸任何機器。未來的企業(yè)果真如此嗎?我們并不這么看。雖然我們確實帶有電腦所沒有的偏見,但我們也有電腦不具備的優(yōu)勢。首先,我們一直從感官中吸收非常大量的數(shù)據(jù),沒有預(yù)先選擇,只是來者不拒。即使在短時間內(nèi),我們也難以只傾聽某些聲音或只看到某些事物。而電腦正相反,它們很難從其開發(fā)者和程序員所允許的數(shù)據(jù)源搜集多種多樣的數(shù)據(jù)。這種差異為米爾所說的“斷腿角色”人群帶來了一項重要的工作??匆豢此e出的例子:幾年來,有位教授每周二晚上都去看電影。電腦模型會合理地預(yù)測她下周是否會再去看電影。不幸的是,教授周二上午摔斷了腿,臀部裝了固定器,沒法坐在電影院的座位上(這是1954年編造的故事)。任何一個人都會馬上知道教授的電影之夜將被取消,但這種“特殊力量”不容易被電腦算法復(fù)制。影響教授行為的“不尋常的、意料之外的因素”實在太多了。任何設(shè)計電腦系統(tǒng)的人都無法搜集所有這些因素的優(yōu)質(zhì)數(shù)據(jù),以使程序能夠考慮它們。唯一的辦法就是建立一個比任何電腦系統(tǒng)都要全面得多的世界級模型。人類擁有的另一個巨大優(yōu)勢是古老常識。一些人比其他人有更多常識,但是所有人的常識都比最先進的電腦要多得多。人出生之后就開始學(xué)習(xí)關(guān)于世界如何運作的重要事情,我們認(rèn)真、快速地學(xué)習(xí)。然而,盡管經(jīng)過幾十年的研究,我們?nèi)匀徊惶私馊巳绾潍@得常識,而且,正如我們在下一章所討論的,迄今為止,將常識植入電腦的嘗試是敗績累累。因此,在很多情況下,讓人檢查電腦決策以確保萬無一失是有道理的。資深的數(shù)據(jù)分析和技術(shù)學(xué)者托馬斯·達文波特(ThomasDavenport)把這種做法稱為“看看窗外”。這句話不僅僅是一個令人深思的比喻。它是達文波特偶遇一位飛行員所得到的啟示,飛行員講述他自己如何嚴(yán)重依賴飛機的儀器,但發(fā)現(xiàn)視線偶爾掃向天際依然至關(guān)重要。這種方法非常有益,它不僅可以防止錯誤,而且還可以維護公司的聲譽。打車服務(wù)商Uber在2014年年底艱難地掌握了這種方法。當(dāng)時,該公司因其高峰定價(繁忙時段提高票價)而臭名昭著,這是一種許多用戶難以接受的方法。Uber堅稱高峰定價有助于平衡這些時段的供需關(guān)系,我們也同意這一點。該公司的算法給出高價,以期當(dāng)實際或預(yù)期的汽車供應(yīng)跟不上消費者需求時,鼓勵更多的司機參與進來。2014年12月,當(dāng)一名伊朗牧師在澳大利亞悉尼的一家咖啡館綁架18名人質(zhì)時,這種做法使該公司受到非議。許多人逃離事發(fā)地區(qū),其中有些人試圖呼叫Uber。Uber的電腦系統(tǒng)啟動高峰定價,應(yīng)對這一突如其來的需求。對許多人來說,這是對一場危機的一個非常不合適的反應(yīng),于是該公司面臨激烈抨擊。Uber發(fā)表了這樣的聲明:“我們沒有(在悉尼事件期間)直接叫停高峰定價。這是錯誤的決定。”該公司也顯然建立了在某些情況下推翻自動化高峰定價的能力。從2015年11月13日晚上開始,恐怖分子在巴黎進行了一系列襲擊。事發(fā)30分鐘內(nèi),Uber就取消了該市的高峰定價,并提醒其所有用戶進入緊急狀態(tài)。\h[12]這些例子表明了讓人類的主觀判斷和算法同時發(fā)揮作用的明智之處。但是,企業(yè)采用這種方式時要非常小心。人類非常喜歡自己的判斷力,對此過分自信,所以即使電腦的決策更好,我們中的許多人(如果不是大部分人)也會很快地推翻它。本章前面提到克里斯·斯奈德斯針對采購經(jīng)理的預(yù)測進行研究,他發(fā)現(xiàn),“你通??吹降氖?,有電腦輔助的專家的判斷效果處于模型和無電腦幫助的專家之間。所以說,如果你把模型給專家,他們會做得更好,但模型本身表現(xiàn)得更好”?;诿谞柡瓦_文波特所描述的原因,我們支持讓人類進入模型決策過程,但是我們也主張企業(yè)盡可能地“保留分?jǐn)?shù)”,即隨時跟蹤算法決策相對于人類決策的準(zhǔn)確性。如果人類決策比基準(zhǔn)算法更好,那么一切就應(yīng)該照常。不然的話,事情就需要改變,而第一步就是讓人們意識到自己真正的成功率。這種反饋機制至關(guān)重要,因為它是系統(tǒng)1學(xué)習(xí)和改進的原理。正如卡尼曼和心理學(xué)家加里·克萊恩(GaryKlein)所寫:“你不該相信自己的本能。你要把自己的直覺看作一個重要的數(shù)據(jù)點,但你必須有意識地、深思熟慮地評估它,看看它在此環(huán)境下是否有意義?!碧岣呦到y(tǒng)1的準(zhǔn)確性并減少偏見的最好辦法是舉出很多例子,然后對系統(tǒng)1的準(zhǔn)確性給出頻繁快速的反饋。翻轉(zhuǎn)決策一些公司開始使用另一種有價值的方法,那就是把人機分工的標(biāo)準(zhǔn)安排顛倒過來。人類做判斷時不再使用機器提供的數(shù)據(jù)作為輸入,相反,人類的判斷被用作算法的輸入。谷歌率先將這一方法用于招聘工作,這是公司的關(guān)鍵領(lǐng)域,有分析表明,以往的標(biāo)準(zhǔn)安排在該領(lǐng)域效果不佳。拉茲洛·伯克(LaszloBock)擔(dān)任谷歌人事部負(fù)責(zé)人時就意識到,多數(shù)用于選擇新員工的技術(shù)幾乎無濟于事。在考察公司員工在職表現(xiàn)差異的實際影響因素時,他的團隊發(fā)現(xiàn),招聘前的簡歷檢查僅解釋了約7%的差異,之前工作經(jīng)歷的年份解釋了3%,非結(jié)構(gòu)化的工作面試仍然是最常見的情形,它始于“你的最大優(yōu)勢是什么”或“請做自我介紹”等問題,但是只能解釋14%的差異。伯克說,這些面試存在的問題是:它們創(chuàng)造了一個情景,在面試中試圖確認(rèn)我們對某些人的看法,而不是真正評估他們。心理學(xué)家把這情況稱為證實性偏見。我們基于輕度交流,做出了草率的、無意識的判斷,此判斷深受我們現(xiàn)有偏見和信念的影響。我們沒有意識到這一點,于是把評估申請人的工作變成尋找證據(jù)來證實我們的初步印象。在這里,系統(tǒng)1又一次運行了,然后把它的偏見和缺陷引入一個重要的決定。那么,更好的招聘方法是什么?谷歌決定更加依賴結(jié)構(gòu)化面試,它解釋了25%以上的在職表現(xiàn)。結(jié)構(gòu)化面試包括一組預(yù)定義的問題,旨在評估一個人的一般認(rèn)知能力等方面。該公司采用了一種招聘流程,在其中,所有面試官都進行結(jié)構(gòu)化面試,提出的問題也基本相同。伯克解釋說,“然后我們用一致的量表對面試進行評分……面試官必須指出申請人是怎么做的,每種表現(xiàn)水平都是明確的……一張簡潔的招聘量表……將凌亂、模糊和復(fù)雜的工作情況變成可衡量、可比較的結(jié)果”。在這種方法中,面試官的個人判斷仍然有價值,但它們被量化了,用于為求職者打分。伯克認(rèn)為,這種方法并非把面試過程平淡化、非人性化,而是恰恰相反。申請者本人喜歡受到客觀公正的對待,80%被重新設(shè)計后的面試過程拒絕的申請人表示,他們會把在谷歌的求職經(jīng)驗推薦給朋友,招聘決策也變得更加容易。正如伯克所說,“你會看到優(yōu)異和普通之間的清晰界限”。決策太重要對人機分工的標(biāo)準(zhǔn)安排做出重大改變,有時甚至推翻這種安排的想法使許多人感到不適。大多數(shù)人對人類的直覺、判斷和決策能力抱有很大信心,對于自己尤其如此。我們和很多人討論過這個話題,幾乎從未聽過有人承認(rèn)其直覺或判斷力低于平均水平。然而,關(guān)于這個問題的證據(jù)是如此清楚,不容置疑:在大多數(shù)情況下,如果可以選擇,那么數(shù)據(jù)驅(qū)動的系統(tǒng)2的決策要優(yōu)于我們大腦產(chǎn)生的、融合了系統(tǒng)1和系統(tǒng)2的決策。這并不是說我們的決策和判斷毫無價值,只是說它們可以改進。我們所看到的多種方法——讓算法和電腦系統(tǒng)做決策,有時用人的判斷作為輸入,讓人們在適當(dāng)?shù)臅r候推翻電腦決策——就是這樣的一些改進方法。我們聽過有人把這說成非人性化的方法。有些人覺得讓電腦主導(dǎo)決策會把人推到邊緣,趨于式微。我們知道,失去曾經(jīng)擁有的決策權(quán)很不舒服,\h[13]也沒人喜歡做電腦仆人的感覺。但是,這是否意味著我們可以將錯就錯,固守陳規(guī)呢?僅僅為了讓醫(yī)生和心理學(xué)家保住飯碗,誤診率就必須虛高嗎?僅僅為了讓面試官感覺良好,企業(yè)就應(yīng)該用錯人嗎?我們認(rèn)為,這些問題的答案是否定的。良好的決策對于社會的良好運作至關(guān)重要,它們幫助把車流、職位、醫(yī)療保健等恰當(dāng)?shù)馁Y源在恰當(dāng)?shù)臅r候、恰當(dāng)?shù)牡胤揭蚯‘?dāng)?shù)娜巳?。實現(xiàn)以上目標(biāo)的最佳方法,通常不是哈默和錢皮所倡導(dǎo)的標(biāo)準(zhǔn)伙伴關(guān)系——由電腦做記錄,由HiPPO人士行使判斷力并做出決策。講到這里,讀者可能對人類不善于預(yù)測未來不太驚訝了。畢竟,預(yù)測和決策是幾乎不可分割的活動。要做一個好的決策,我們通常要對未來某些方面有準(zhǔn)確的預(yù)測,具體說,如果我們決定了某種方式,那么可能會發(fā)生些什么?所以如果我們做不好兩件事中的一件,那么另一件也做不好。確實,系統(tǒng)1的許多捷徑和錯誤使我們做不了好的預(yù)測。從1984年開始,政治學(xué)家菲利普·泰洛克(PhilipTetlock)和他的同事開展一個長達數(shù)十年的項目,對政治、經(jīng)濟和國際事務(wù)等許多領(lǐng)域的預(yù)測準(zhǔn)確性進行評估。其研究結(jié)論一如既往地清晰、引人關(guān)注。在一項涉及超過8.2萬次預(yù)測的測試中,泰洛克發(fā)現(xiàn),就預(yù)測結(jié)果的準(zhǔn)確性而言,“人類只是險勝黑猩猩而已”。商業(yè)世界充斥著對未來的預(yù)測,因此以上發(fā)現(xiàn)應(yīng)該引起重視。許多預(yù)測是直接清晰表現(xiàn)出來的:如某只股票的走勢,利率的未來移動方向和幅度,某國明年出售的智能手機數(shù)量,等等。在許多其他情況下,預(yù)測則隱含在擬議的行動計劃中。例如,網(wǎng)站的重新設(shè)計包含了一種隱性預(yù)測——訪客會更喜歡它,銀行分支機構(gòu)的重新設(shè)計也是如此。一種吸引眼球的產(chǎn)品上市是建立在“顧客會喜歡它”這么一種高風(fēng)險的預(yù)測基礎(chǔ)之上,與之配合的營銷活動則包含一個如何塑造顧客偏好的預(yù)測。狐貍、刺猬與實驗當(dāng)然,所有這些預(yù)測并不都是錯的。泰洛克發(fā)現(xiàn)了一些“超級預(yù)測者”,\h[14]他們真的能夠比常人更準(zhǔn)確地給出預(yù)測。這些人傾向于從多個來源獲取信息,也許更重要的是,他們在看待事物時有一種采用多方觀點的能力。相比之下,不太準(zhǔn)確的預(yù)測者傾向于在分析中固守一個視角,例如,熱心的保守派和頑固的自由派往往會做出糟糕的政治預(yù)測。泰洛克把前一組人稱為“狐貍”,他們是更成功的、多視角的預(yù)測者,然后把后一組人稱為“刺猬”。他的這些標(biāo)簽來自古希臘詩人阿基羅庫斯(Archilochus)的格言:“狐貍知道很多東西,但刺猬只知道一件重要的事情?!盶h[15]因此,我們的一個建議就是盡可能依靠“狐貍”而不是“刺猬”?!昂偂笨梢酝ㄟ^其提出的多維度、多視角推理分析而發(fā)現(xiàn),也可以通過一直以來的記錄查出。具有可查證的準(zhǔn)確預(yù)測記錄的人可能就是“狐貍”。少預(yù)測,多實驗撇開“超級預(yù)測者”不談,我們對預(yù)測的最根本建議是少做預(yù)測。我們的世界越來越復(fù)雜,常處于混沌狀態(tài),又總是快速流動。這使得預(yù)測事情變得要么極其困難,要么不可能實現(xiàn),時間跨度越大,預(yù)測就越不準(zhǔn)確。在優(yōu)秀企業(yè)中間正在發(fā)生根本轉(zhuǎn)變:遠離長期預(yù)測、長期計劃和大膽設(shè)想,開展持續(xù)的短期迭代、實驗和測試。這些組織采納計算機科學(xué)家艾倫·凱(AlanKay)的重要建議:預(yù)測未來的最佳方式就是創(chuàng)造未來。它們從小處著手,步步為營,獲取反饋,在必要時進行調(diào)整,而不是根據(jù)自以為是的預(yù)測結(jié)果,對遙遠的事物自行其是。相對來說,通過網(wǎng)站把這種方法落到實處比較直截了當(dāng)。網(wǎng)站搜集了用戶活動的豐富數(shù)據(jù),因此容易看出某項改變是否更好。一些電子商務(wù)網(wǎng)站對于與時俱進、革新求變是非常謹(jǐn)慎的。在20世紀(jì)90年代末的第一波網(wǎng)絡(luò)熱潮中,旅游網(wǎng)站Priceline如日中天。像當(dāng)時其他許多高調(diào)的同行一樣,它在世紀(jì)之交轟然墜地,究其原因,主要是用戶對該公司原創(chuàng)的自主定價方式產(chǎn)生不滿。大約10年前,該公司將自己重新改造為一組更為傳統(tǒng)的旅游網(wǎng)站。然而,令它重獲生機的是持續(xù)不斷的數(shù)據(jù)驅(qū)動型實驗。正如VentureBeat(互聯(lián)網(wǎng)行業(yè)新聞博客)的記者馬特·馬歇爾(MattMarshall)所說:“導(dǎo)致增長井噴的通常是小創(chuàng)意,例如調(diào)整網(wǎng)頁上的顏色、措辭和數(shù)據(jù)安排,只求逐步提升,通過這些小小的努力來改善現(xiàn)有體驗……Priceline發(fā)現(xiàn),將描述某個屬性的措辭從‘停車’改為‘免費停車’,就增加了2%的轉(zhuǎn)換率,即使這個描述放在頁面的不起眼處——一般讀者很難注意到它?!边@樣的好處俯拾皆是。A/B測試是一種常見的在線實驗協(xié)議,其中一半的訪問者在訪問網(wǎng)站時看到選項A,而另一半訪問者則看到選項B。在一次嚴(yán)格的測試中,內(nèi)衣公司AdoreMe發(fā)現(xiàn),讓模特擺造型時把手放在頭發(fā)中,而不是放在臀部,就可以使一些品類的銷售翻番。在通常情況下,又快又準(zhǔn)的方法是在線測試選項,而不是花費幾個小時、幾天乃至幾周,請專家對變革計劃進行分析和辯論。在線測試的結(jié)果通常也會令人驚訝。實驗當(dāng)然不局限于在線形式。它在實體環(huán)境的應(yīng)用也會有成效。商學(xué)院教授戴維·加文(DavidGarvin)把許多大公司稱為“多單元企業(yè)”。這些組織占有許多面向客戶的區(qū)位,所有區(qū)位看起來都差不多,運營方式也大致相同。許多商業(yè)銀行、連鎖餐廳、零售商和服務(wù)商都是多單元企業(yè)。根據(jù)對《財富》100強企業(yè)的一項估計,其中的20%在某種程度上屬于多單元企業(yè)。多單元企業(yè)的多區(qū)位特點提供了絕佳的實驗機會。據(jù)創(chuàng)新學(xué)者史蒂芬·湯姆克(StefanThomke)和企業(yè)實驗家吉姆·曼茲(JimManzi)稱,科爾士百貨公司進行了一項涉及100家商店的實驗,以此了解工作日推遲開店一小時是否對銷售有害。結(jié)果表明,營業(yè)時間縮短不會使銷售額顯著降低,這對零售商而言是個好消息。不好的消息來自另一項實驗的結(jié)果。該項實驗涉及70家科爾士商店,它測試了首次出售家具的影響。實驗發(fā)現(xiàn),由于家具占用太多遠離其他產(chǎn)品的空間,因此商店的整體銷售額和客戶流量實際上是下降了。雖然許多高管對推出的新品持樂觀態(tài)度,但公司決定以實驗結(jié)果為依據(jù),不再提供家具。通常情況下,在多單元企業(yè)的每個區(qū)位同步推行一種新舉措是不可行的,因此分階段實施就為實驗創(chuàng)造了一個自然的機會。通過一些規(guī)劃,企業(yè)可以從這樣的分階段實施中了解很多事情,從而將實施新舉措的區(qū)位與仍然用老辦法做事的區(qū)位仔細比對。預(yù)測和實驗不像決策一樣易于自動化,但它們?nèi)匀环浅_m合嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)分析。這些都是系統(tǒng)2的主要工具,也是第二次機器革命時代的主要工具。與此同時,系統(tǒng)1及其直覺、判斷和個人經(jīng)驗累積等元素則需要給制定準(zhǔn)確預(yù)測的手段讓路,這樣才會盡可能制定好的決策。簡而言之,HiPPO人士必然成為組織內(nèi)的“瀕危物種”。本章總結(jié)?歷時20年的人機標(biāo)準(zhǔn)伙伴關(guān)系往往過于重視人的判斷、直覺和本能。?為什么人類的判斷經(jīng)常如此糟糕呢?因為快速、不動腦筋的“系統(tǒng)1”式推理方式受制于許多不同種類的偏見。更糟糕的是,它出錯時不能自知,而且它劫持理性的系統(tǒng)2,為其草率的判斷提供令人信服的理由。?很明顯,如果可以選擇的話,與依靠有經(jīng)驗的人類專家的判斷相比,單純依靠數(shù)據(jù)和算法通常會得到更好的決策和預(yù)測。?現(xiàn)在由人類做出的許多決策、判斷和預(yù)測都應(yīng)該轉(zhuǎn)交給算法。在某些情況下,人應(yīng)該留在決策過程中,提供常識方面的檢查。在其他情況下,他們應(yīng)該完全退出決策過程。?在其他情況下,人的主觀判斷仍會被用到,若用在翻轉(zhuǎn)的標(biāo)準(zhǔn)伙伴關(guān)系中:判斷應(yīng)該被量化,并被納入定量分析。?決策流程應(yīng)該基于正確的目標(biāo)和明確的指標(biāo),為做出最佳決策而建立,而不應(yīng)因決策者自我感覺良好而定。?算法遠非完美。如果基于不準(zhǔn)確或有偏差的數(shù)據(jù),那么它們就會做出不準(zhǔn)確或偏倚的決策。這些偏見可能是微妙的、無意的。算法的應(yīng)用標(biāo)準(zhǔn)不在于其是否完美,而在于它們是否優(yōu)于相關(guān)度量上的可替代方案,以及它們能否隨時間而改進。?隨著技術(shù)的普及,我們有機會超越標(biāo)準(zhǔn)伙伴關(guān)系,以及使其擺脫對HiPPO人士的過度依賴并朝著更受數(shù)據(jù)驅(qū)動的決策發(fā)展。數(shù)據(jù)顯示,這樣做的公司通常比不諳此道者具有重大的優(yōu)勢。?能夠從多個角度來看待問題的人,能夠有效迭代和實驗的公司,都是時代的佼佼者。問題A你是否系統(tǒng)地、嚴(yán)謹(jǐn)?shù)刈粉櫵诮M織中由人和算法所做出的決策、判斷和預(yù)測的表現(xiàn)?你知道哪些方面做得好嗎?B在你的組織中,HiPPO人士最常見的決策在哪里?為什么是這樣?C你在什么地方有過這樣的機會:將標(biāo)準(zhǔn)合作伙伴關(guān)系掉轉(zhuǎn)過來,從而將人的主觀評估納入數(shù)據(jù)驅(qū)動的分析,而不是與之相反?D一般來說,你認(rèn)為算法和人哪一個更易產(chǎn)生偏見?E你覺得更有說服力的是“狐貍”還是“刺猬”?F你所在的組織是傾向于開展少數(shù)長期的高風(fēng)險項目,還是開展大量更具迭代性的短期項目?\h[1]1英尺=0.3048米。——編者注\h[2]企業(yè)信息系統(tǒng)很快因其多種應(yīng)用(名稱為三個英文單詞的首字母組合)而廣為人知,包括ERP(企業(yè)資源規(guī)劃)、SCM(供應(yīng)鏈管理)、CRM(客戶關(guān)系管理)和HRM(人力資源管理)等。\h[3]或者更準(zhǔn)確地說,是幾種軟件。即使是最自信的企業(yè)軟件供應(yīng)商,也不會說單一的系統(tǒng)足以滿足一家公司要做的一切。\h[4]英國伊麗莎白女王于2004年授予伯納斯–李大英帝國爵級司令勛章,以表彰他實質(zhì)上發(fā)明萬維網(wǎng)。安德森是2013年首屆伊麗莎白女王工程獎獲獎?wù)咧?。\h[5]卡尼曼是第一位被授予諾貝爾經(jīng)濟學(xué)獎的非經(jīng)濟學(xué)者,以此表彰他的工作。\h[6]“系統(tǒng)1”和“系統(tǒng)2”是特意挑選的中性、平淡的標(biāo)識,以免引發(fā)長期存在的圍繞其他術(shù)語的分歧和辯論。\h[7]本森在休陪產(chǎn)假時研究了維基百科的認(rèn)知偏見清單,然后提出了這一分類方法,并將其發(fā)表在“生活黑客”博客BetterHumans上()。這是源自在線大眾的洞察力,我們將在本書第三部分詳細討論這一現(xiàn)象。\h[8]它有一個奇怪的名字叫“apophenia”。統(tǒng)計和機器學(xué)習(xí)的模型可能會犯同樣的錯誤,通常被稱為數(shù)據(jù)的“過度耦合”。\h[9]正如喬納森·海德特在他所著的《象與騎象人:幸福的假設(shè)》中所說,“人們很容易編造理由來解釋自己的行為,這一發(fā)現(xiàn)被稱為‘虛構(gòu)’。虛構(gòu)常常伴隨著裂腦患者和其他腦損傷人士,心理學(xué)家邁克爾·加扎尼加用‘解釋模塊’表示大腦左側(cè)的語言中心,其工作是當(dāng)場解釋自我所做的事情,當(dāng)然它無法得知自我行為的真正原因或動機。舉例來說,如果‘走’字在大腦的右半球閃現(xiàn),患者就可能站起來走開。當(dāng)被問到為什么站起來時,他可能會說:‘我要去拿一杯可口可樂?!忉屇K善于編造理由,但它自己都不知道已經(jīng)編出來了”。JonathanHaidt.TheHappinessHypothesis:FindingModernTruthinAncientWisdom(NewYork:BasicBooks,2006),8.\h[10]這些信息來自人們同意安裝在家中的機頂盒。\h[11]由第三方處理匹配過程以保護隱私,奧巴馬競選團隊和評級公司不會看到彼此的名冊。\h[12]關(guān)于Uber在巴黎恐怖襲擊期間繼續(xù)高峰定價的謠言四處傳播。\h[13]實際上,在一項實驗中,心理學(xué)家塞巴斯蒂安·博巴蒂拉–蘇阿雷茲(SebastianBobadilla-Suarez)及其同事發(fā)現(xiàn):即使人們得知自動化決策能使他們在整體上掙得更多,他們還是愿意為了保住資金分配的決策權(quán)而付出代價。人們喜歡決策的權(quán)力。SebastianBobadilla-Suarez,CassR.Sunstein,andTaliSharot,“TheIntrinsicValueofControl:ThePropensitytoUnder-delegateintheFaceofPotentialGainsandLosses.”SSRN,February17,2016./sol3/papers2.cfm?abstract_id=2733142.\h[14]菲利普·泰洛克在該領(lǐng)域撰寫的作品《超預(yù)測:預(yù)見未來的藝術(shù)和科學(xué)》由中信出版社于2016年7月出版?!幷咦h[15]“狐貍和刺猬”也是哲學(xué)家以賽亞·柏林(IsaiahBerlin)的一篇文章的標(biāo)題,該文將歷史上的思想家分為兩類:在整個職業(yè)生涯中孜孜以求一種大思想的人,以及那些探索許多不同想法的人。02

最像人腦的機器我相信到20世紀(jì)末,詞匯的用法和一般教育理念會發(fā)生很大改變,因此那時將可以談?wù)摍C器思維而不再怕造成矛盾了。艾倫·圖靈(AlanTuring),1950年我們剛剛開發(fā)數(shù)字化電腦時,就嘗試讓它們像我們一樣思考。從一開始就顯而易見的是,電腦對于進行常規(guī)數(shù)學(xué)計算非常有用,但這并不稀罕。畢竟,人類一直在開發(fā)計算的機器,遠在公元元年之前,就有了日本和巴比倫的算盤,以及神秘的希臘安提凱希拉機械裝置。\h[1]令人耳目一新的是新式數(shù)字化電腦的編程能力,也就是讓它們執(zhí)行任意復(fù)雜的指令。\h[2]正如我們在前一章所看到的那樣,電腦程序是執(zhí)行算法的理想選擇,它們是用于完成任務(wù)的精確的、按部就班的指令。但許多學(xué)科領(lǐng)域中的卓越思想家很快就開始嘗試讓這種新機器做更多事情,而不僅僅是“蕭規(guī)曹隨”。這些先驅(qū)想要創(chuàng)建一個自主的軟硬件組合,換句話說,它可以和人類一樣進行推理,從而變成人工智能。分叉的人工智能達特茅斯學(xué)院的數(shù)學(xué)教授約翰·麥卡錫(JohnMcCarthy)將人工智能定義為“制造智能機器的科學(xué)與工程”。他于1956年在校園舉辦了第一次專題研討會。幾年之后,該領(lǐng)域最大、最為持久的爭論開始了。要了解它本身及其重要性,我們可以考慮小孩子學(xué)習(xí)語言的方式與大多數(shù)成年人學(xué)習(xí)第二種語言的方式之間的區(qū)別。本質(zhì)上,孩子們通過傾聽學(xué)習(xí)一門語言。他們聽周圍的人說話,吸收一些組成語言的詞語和規(guī)則,然后在某個時間開始說出自己的話。他們說錯時得到反饋和糾正,最終,他們變得善于處理用人的口吻說話這么一件困難的事情。成人學(xué)習(xí)者則知道這件事有多難。當(dāng)他們開始掌握第二種語言時,馬上會面對一堆規(guī)則:把代詞放在句子的什么地方,用什么介詞,動詞如何變化,名詞是否有性別之分,如果是的話,又有多少,如何區(qū)分主體和對象,以便我們知道是狗咬人還是人咬狗,等等。記憶詞匯很難,而使大多數(shù)成人語言學(xué)習(xí)者咬牙切齒的,是諸多復(fù)雜的、偶爾不一致的規(guī)則。幼兒牙牙學(xué)語不需要明確的規(guī)則指導(dǎo)。\h[3]大多數(shù)成年人不能在沒有規(guī)則的情況下學(xué)習(xí)。當(dāng)然,這兩種方法有一些重疊,很多孩子最終會修語言課,而大人們也會耳熟能詳,但兩者畢竟截然不同。幼兒的大腦專門用來學(xué)習(xí)語言:他們用統(tǒng)計原理來辨別語言模式。\h[4]例如當(dāng)媽媽談?wù)撟约簳r,她用“I”作為主語,并把它放在一句話的開頭,她用“me”作為賓語并放在后面。大人的大腦是不同的,因此他們在學(xué)習(xí)新的語言時通常明確地學(xué)習(xí)規(guī)則。與以上對比類似,早期的人工智能社區(qū)分為兩個陣營。一個追求所謂基于規(guī)則的,或者說符號型人工智能,\h[5]另一個則建立模式識別的統(tǒng)計系統(tǒng)。前者試圖以成人學(xué)習(xí)第二語言的方式發(fā)展人工智能,后者試圖使人工智能的發(fā)展與兒童學(xué)習(xí)第一語言的方式大致相同。一開始,符號型的方法似乎占主導(dǎo)地位。例如,在1956年達特茅斯會議上,艾倫·紐維爾(AllenNewell)、J.C.肖(J.C.Shaw)和未來的諾貝爾獎得主赫伯特·西蒙(HerbertSimon)演示了他們的“邏輯理論家”程序,它使用形式邏輯的規(guī)則自動地證明數(shù)學(xué)定理。該程序證明了阿爾弗雷德·諾斯·懷特海(AlfredNorthWhitehead)和伯特蘭·羅素(BertrandRussell)在數(shù)學(xué)基礎(chǔ)方面的里程碑之作《數(shù)學(xué)原理》(PrincipiaMathematica)第二章中的38個定理。事實上,關(guān)于“邏輯理論家”的一個證明比原書優(yōu)美很多,引來了羅素本人的“愉快回應(yīng)”。西蒙宣稱他和同事“發(fā)明了一臺思維機器”。然而,其他的挑戰(zhàn)使基于規(guī)則的方法捉襟見肘。語音識別、圖像分類、語言翻譯等領(lǐng)域的數(shù)十年研究結(jié)果并不令人滿意。這些領(lǐng)域取得的最好結(jié)果與人類的表現(xiàn)仍相距甚遠,最糟糕的結(jié)果則給人留下了很壞的印象。例如,據(jù)一本1979年的逸事集記載,研究人員對“英譯俄”翻譯程序輸入“心有余而力不足”這句話。程序給出的俄語翻譯卻意為“威士忌不錯,但肉壞了”。也許這故事是杜撰的,但它并不夸張。作為一個群體,符號型人工智能產(chǎn)生的結(jié)果使人傷感困惑,以至20世紀(jì)80年代末,主要的企業(yè)和政府的研究資助來源枯竭,“人工智能的冬季”降臨在這一領(lǐng)域。無解的規(guī)則是什么使符號型人工智能敗績累累呢?有兩個主要障礙。其中一個對這一領(lǐng)域構(gòu)成了嚴(yán)重挑戰(zhàn),而另一個顯然是無法逾越的。首先,簡單地說,如成人語言學(xué)習(xí)者所知,世上有很多規(guī)則,了解大多數(shù)規(guī)則并按規(guī)則行事通常是不夠的。相反,人必須掌握幾乎所有規(guī)則,才能有好的表現(xiàn)。一個語法正確率為80%的句子可能很可笑,甚至讓人完全無法理解。規(guī)則中還有規(guī)則。例如在英文句子中,知道形容詞通常放在名詞之前是不夠的。正如馬克·福賽思(MarkForsyth)在其《口才元素》(TheElementsofEloquence)一書中所言:“英文的形容詞絕對必須按照這個順序:意見—大小—年代—形狀—顏色—來源—材料—目的,再跟著名詞。因此,你可以有一把可愛的小的老式的長方形的綠色的法國白銀刀,但是,如果你稍稍弄錯用詞順序,聽起來就會很怪。每個說英語的人都使用這個規(guī)則,但幾乎沒人把它寫出來,這真是一件奇怪的事情。”此外,我們所處的物質(zhì)世界和精神世界做不到只服從一種規(guī)則。椅子有腿,但當(dāng)它有底座或軟座,又或者它掛在天花板時則是例外。在2002年,兩名男子不能在美國結(jié)婚,但2015年他們就可以這樣做了。松鼠不能高飛,但那些滑翔飛行的除外。在英語中,否定加否定可以變成肯定,比如說“她從未不開朗”,但肯定加肯定永遠不會變成否定。是的,就是這樣。為語言、家具等復(fù)雜事物的所有相關(guān)規(guī)則編碼,輸入電腦系統(tǒng),然后讓系統(tǒng)做些有用的事,這類嘗試大多不成功。電腦科學(xué)家恩內(nèi)斯特·戴維斯(ErnestDavis)和神經(jīng)科學(xué)家加里·馬庫斯寫道:“截至2014年,很少有商業(yè)化的系統(tǒng)在自動化常識推理方面有重大應(yīng)用……還沒人造出一個令人滿意的常識推理器?!比缟弦徽滤?,常識有偏見、有錯漏,但即便如此,對于絕大多數(shù)人來說它已經(jīng)做得很棒了,它引領(lǐng)我們通過了世上紛繁復(fù)雜的考驗。我們還沒有設(shè)計出可以了解世界如何實際運行、人類自己的生物系統(tǒng)1又如何工作的符號型數(shù)字化系統(tǒng)。我們的系統(tǒng)越來越精于狹義的人工智能,如圍棋、圖像識別等特定領(lǐng)域,但是我們還遠未實現(xiàn)DeepMind共同創(chuàng)始人謝恩·萊格(ShaneLegg)所說的通用人工智能,即未能將智能應(yīng)用于各種意想不到的問題。又見波蘭尼悖論戴維斯和馬庫斯討論了建立以上系統(tǒng)的最大障礙:“進行常識推理時,人們……借鑒的是……基本上無法自省的推理過程?!睋Q句話說,人類經(jīng)由多如牛毛的規(guī)則而駕馭自如的認(rèn)知工作,其實不間斷地體現(xiàn)著波蘭尼悖論,也就是“我們所知的多于我們所能說的”。如第一章所述,直到最近,這一悖論使任何人都無法開發(fā)可以像人類頂尖高手一樣下圍棋的軟件。我們必須謹(jǐn)記這一悖論隨處可見。在很多重要的情況下,我們根本就不知道,也無法知道自己正在用什么規(guī)則來做對某些事。這似乎是任何自動化或人工智能的絕對障礙。如果包括人類本身在內(nèi),地球上沒有實體知道人類成就某事的規(guī)則,那么我們又如何創(chuàng)建一個基于規(guī)則的系統(tǒng),或者說創(chuàng)建任何電腦系統(tǒng),然后用它來模擬這些成就?波蘭尼悖論似乎對可以自動化的人類工作類型設(shè)置了極大限制。正如我們麻省理工學(xué)院的同事、經(jīng)濟學(xué)家戴維·奧托(DavidAutor)所說:“電腦對人的替代范圍是有限的,因為一個人能夠意會很多任務(wù),做起來也毫不費勁兒,電腦程序和其他人卻不能確切表述相關(guān)的規(guī)則或程序。”機器學(xué)習(xí)人工智能研究者的另一個主要陣營——避開符號型方法的陣營,自20世紀(jì)50年代末以來一直在嘗試攻克波蘭尼悖論,其方法就是建立用小孩子學(xué)語言的方式學(xué)任務(wù)的系統(tǒng),要點是經(jīng)驗、重復(fù)以及獲取反饋。這些學(xué)者開創(chuàng)了機器學(xué)習(xí)領(lǐng)域,這恰恰體現(xiàn)了該陣營所做的事情。以這種方式學(xué)習(xí)的首批數(shù)字化機器之一,就是美國海軍資助的“感知器”(Perceptron),它是一臺思考和學(xué)習(xí)的機器,由康奈爾航空實驗室的科學(xué)家弗蘭克·羅森布拉特(FrankRosenblatt)領(lǐng)銜開發(fā)?!案兄鳌庇?957年首次亮相,其目標(biāo)是能夠?qū)⒖吹降臇|西分類,例如區(qū)分狗類與貓類。為此,它被設(shè)置成有點兒像縮微版大腦的樣子。我們大腦中的大約1000億個神經(jīng)元并沒有以任何整齊的方式排列。相反,它們是深度關(guān)聯(lián)的:典型的人類神經(jīng)元從多達1萬個的相鄰神經(jīng)元獲取輸入或信息,然后將輸出發(fā)送給數(shù)目大致相等的神經(jīng)元。每當(dāng)足夠的輸入發(fā)出足夠強的電信號時,神經(jīng)元就將自己的信號發(fā)送到其所有的輸出。在這里,“足夠”和“足夠強”的定義隨著時間的推移而變化,它們?nèi)Q于反饋以及重要性,也就是神經(jīng)元給予其每個輸入的權(quán)重。透過這個奇怪、復(fù)雜、不斷展開的過程,產(chǎn)生了記憶、技能、系統(tǒng)1和系統(tǒng)2、思想火花和認(rèn)知偏見,以及其他所有的腦力活動?!案兄鳌辈]有嘗試做這么多的事情。它只想做簡單的圖像分類。這臺機器有400個光電池,它們?yōu)榇碳るs亂的機器大腦而隨機連接到一層人造的神經(jīng)元。通過這個神經(jīng)網(wǎng)絡(luò)的早期演示,以及羅森布拉特的自信預(yù)測,《紐約時報》在1958年報道說:“它是(海軍)所希望的電腦的胚胎,它將會走路、談話、觀看、寫作、復(fù)制自己并意識到自己的存在?!比欢?,說好的突破并沒有很快到來,1969年,馬文·明斯基(MarvinMinsky)和西蒙·派珀特(SeymourPapert)發(fā)表了一篇題為“感知器:計算幾何學(xué)導(dǎo)論”的毀滅性評論。他們以數(shù)學(xué)方式表明,羅森布拉特的設(shè)計不能完成一些基本的分類任務(wù)。對于人工智能領(lǐng)域的多數(shù)人來說,這足以讓他們不僅疏遠“感知器”,而且疏遠神經(jīng)網(wǎng)絡(luò)和一般意義上的機器學(xué)習(xí)等廣義概念。對于兩個陣營的研究人員來說,人工智能的嚴(yán)冬降臨了。堅持總有回報有幾個團隊繼續(xù)研究機器學(xué)習(xí),他們?nèi)匀幌嘈?,讓電腦像人類一樣思考的正確方法,就是建立可以通過實例學(xué)習(xí)的腦啟發(fā)神經(jīng)網(wǎng)絡(luò)。這些研究人員終于了解并克服了“感知器”的局限性。他們的做法結(jié)合了高深的數(shù)學(xué)、功能更強大的電腦硬件和一種實用的方法,此舉從大腦的工作方式獲得啟發(fā),但又不受其約束。例如,電信號只能沿著大腦神經(jīng)元的一個方向流動,而由保羅·沃伯斯(PaulWerbos)、杰夫·辛頓(GeoffHinton)和揚·樂坤(YannLeCun)等人在20世紀(jì)80年代建立的成功的機器學(xué)習(xí)系統(tǒng)則允許信息通過網(wǎng)絡(luò)向前及向后傳播。這種“反向傳播”帶來了更好的表現(xiàn),但進展仍然非常緩慢。到20世紀(jì)90年代,揚·樂坤開發(fā)的用于識別數(shù)字的機器學(xué)習(xí)系統(tǒng)閱讀了美國20%的所有手寫支票,但是幾乎沒有其他的現(xiàn)實應(yīng)用。阿爾法狗最近的勝利表明,現(xiàn)在的情況已經(jīng)大不相同。誠然,阿爾法狗包含了對大量可能性的高效搜索,這是基于規(guī)則的人工智能系統(tǒng)的典型元素,但它的核心是機器學(xué)習(xí)系統(tǒng)。如其創(chuàng)建者所述,它是“一種新的電腦圍棋方法,它使用深層神經(jīng)網(wǎng)絡(luò),其訓(xùn)練融合了與人類專家對弈的監(jiān)督式學(xué)習(xí)和自我對弈的強化式學(xué)習(xí)”。阿爾法狗遠不是一個孤立的例子。過去幾年,神經(jīng)網(wǎng)絡(luò)處于蓬勃發(fā)展之中。它們現(xiàn)在是人工智能的主要類型,而且似乎有可能保持一段時間。由此,人工智能領(lǐng)域終于兌現(xiàn)了其早期的一些承諾。為什么有人工智能這個蓬勃發(fā)展的局面是如何發(fā)生的?為什么它來得如此之快,如此出人意料?通常情況下,這樣的進步匯聚了一些因素,它既是恒力所致,也是機緣使然。許多業(yè)內(nèi)人士認(rèn)為,其中最重要的因素是摩爾定律。神經(jīng)網(wǎng)絡(luò)隨著規(guī)模的增加而變得更加強大、多能,而且直到最近,規(guī)模足夠大的神經(jīng)網(wǎng)絡(luò)才變得足夠便宜,可供許多研究人員之用。云計算幫助預(yù)算較小的項目開啟了人工智能研究之路。技術(shù)企業(yè)家埃利奧特·特納(ElliotTurner)估計,到2016年秋天,開展前沿性機器學(xué)習(xí)項目所需的計算能力可從亞馬遜云服務(wù)(AWS)等云計算提供商那里租用,成本約為1.3萬美元。奇怪的是,現(xiàn)代視頻游戲的普及也大大推動了機器學(xué)習(xí)。驅(qū)動流行游戲機的專用圖形處理器(GPU)非常適合神經(jīng)網(wǎng)絡(luò)所需的各種計算,因此被用于大量的相關(guān)任務(wù)。人工智能研究者吳恩達(AndrewNg)告訴我們:“前沿的研究團隊用圖形處理器做了我兩三年前無法想象的超級復(fù)雜的事情?!睂C器學(xué)習(xí)來說,與摩爾定律同等重要的是大數(shù)據(jù),即數(shù)字化的文本、圖片、聲音、視頻、傳感器讀數(shù)等在近期的大爆發(fā)。像幼童需要聽很多詞語和句子來學(xué)習(xí)語言一樣,機器學(xué)習(xí)系統(tǒng)需要接觸許多實例,以便改進語音識別、圖像分類和其他任務(wù)。\h[6]我們現(xiàn)在有了有效的、源源不斷的數(shù)據(jù),而且隨時都在生成更多的數(shù)據(jù)。辛頓、揚·樂坤和吳恩達等人建立的系統(tǒng)具有非常理想的性能,其性能隨著接觸越來越多的實例而日趨改善。關(guān)于這個美妙的現(xiàn)象,辛頓淡定地說:“回想起來,(機器學(xué)習(xí)的成功)只是數(shù)據(jù)量和計算量的問題。”辛頓可能過謙了。他對神經(jīng)網(wǎng)絡(luò)的多項進展都有貢獻,其中一項甚至使研究領(lǐng)域改名。2006年,他與西蒙·奧辛德羅(SimonOsindero)和鄭懷宇(Yee-WhyeTeh)合作發(fā)表論文《一種深度信念網(wǎng)絡(luò)的快速學(xué)習(xí)算法》,表明足夠強大并適當(dāng)配置的神經(jīng)網(wǎng)絡(luò)本質(zhì)上可以自己學(xué)習(xí),無須人類的培訓(xùn)或監(jiān)督。例如,如果閱讀了大量的手寫數(shù)字,這些網(wǎng)絡(luò)就可以正確地推斷10個不同的數(shù)據(jù)類型(對應(yīng)于數(shù)字0到9),然后還可以準(zhǔn)確地對其讀到的任何新的手寫數(shù)字分類,歸入其所確定的10個類別。在機器學(xué)習(xí)領(lǐng)域,這種無人監(jiān)督的學(xué)習(xí)仍相對少見。最成功的系統(tǒng)依賴于監(jiān)督式學(xué)習(xí),在其中,系統(tǒng)被輸入一組問題和配對的正確答案,然后被要求自己回答任何新的問題。例如,某個機器學(xué)習(xí)系統(tǒng)可能被輸入一大組人類演講的語音文件和相應(yīng)的書面文本文件。該系統(tǒng)使用這組配對數(shù)據(jù)來建立神經(jīng)網(wǎng)絡(luò)的內(nèi)部關(guān)聯(lián),使其能夠解釋新的錄音實例。由于監(jiān)督和無監(jiān)督的機器學(xué)習(xí)方法都使用辛頓及其同事在2006年論文中描述的算法,所以它們現(xiàn)在通常被統(tǒng)稱為深度學(xué)習(xí)系統(tǒng)。演示和部署除了揚·樂坤建立的用于識別支票上手寫數(shù)字的系統(tǒng)等少量案例,深度學(xué)習(xí)的商業(yè)應(yīng)用其實只有幾年,但是這種技術(shù)正在以超常的速度傳播。谷歌負(fù)責(zé)該項技術(shù)的軟件工程師杰夫·迪恩(JeffDean)\h[7]指出,截至2012年,該公司還壓根兒沒有用它來改進搜索、Gmail、YouTube及GoogleMaps等產(chǎn)品。然而到了2015年第三季度,深度學(xué)習(xí)已經(jīng)用于公司大約1200個項目之中,超過了其他方法的表現(xiàn)。DeepMind在深度學(xué)習(xí)與另一種被稱為“強化學(xué)習(xí)”的技術(shù)相結(jié)合方面特

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論