人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第1頁
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第2頁
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第3頁
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第4頁
人工智能技術(shù)導(dǎo)論-課件 第5、6章 人工智能關(guān)鍵技術(shù)、人工智能產(chǎn)品形態(tài)_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第5章人工智能關(guān)鍵技術(shù)目錄5.1計算機視覺技術(shù)5.2智能語音技術(shù)5.3自然語言處理技術(shù)5.4知識圖譜技術(shù)學習目標本章主要從人工智能系統(tǒng)的技術(shù)視角,圍繞人工智能中的計算機視覺技術(shù)、智能語音技術(shù)、自然語言處理技術(shù)、知識圖譜等核心技術(shù)進行討論,希望帶領(lǐng)讀者正確理解人工智能關(guān)鍵技術(shù)的概念,初步認識人工智能系統(tǒng)的“看、聽、說、做”實現(xiàn)方法。理解計算機視覺關(guān)鍵技術(shù)理解智能語音關(guān)鍵技術(shù)理解自然語言處理關(guān)鍵技術(shù)理解知識圖譜關(guān)鍵技術(shù)目錄5.1計算機視覺技術(shù)概述

人工智能的本質(zhì)工作是研究、開發(fā)用于模擬和延展人類的智能的應(yīng)用系統(tǒng),具體來說就是通過人工智能技術(shù)來模仿人類的“視物”、“聽聲”、“說話”、“理解”及“推理”等人類智能能力。人類智能與人工智能概述計算機視覺(CompuerVision,CV)是研究使用計算機實現(xiàn)或模擬人類“視物”功能的技術(shù),使用計算機模仿人類視覺系統(tǒng)的科學,讓計算機擁有類似人類提取、處理、理解和分析圖像以及圖像序列的能力。確切地說,計算機視覺技術(shù)就是利用了攝像機以及電腦替代人類眼睛,使得計算機擁有人類眼睛所具有的分類、識別、分割、跟蹤、判別決策等功能。概述

通過圖像獲取技術(shù)提取二維圖像、三維圖組、圖像序列等原始數(shù)據(jù)。

下面所示展示了人類看到的“冰墩墩”圖像和機器獲取到的“冰墩墩”數(shù)據(jù)(右圖為了清晰呈現(xiàn),只截取了部分數(shù)據(jù))。人類看到的“冰墩墩”圖像機器“看到”的“冰墩墩”圖像概述

計算機視覺系統(tǒng)就是創(chuàng)建了能夠在二維平面圖像或者三維立體圖像的數(shù)據(jù)中,以獲取所需要的“信息”的一個完整的人工智能系統(tǒng),例如自動駕駛、智能機器人等領(lǐng)域均需要通過計算機視覺技術(shù)從視覺信號中提取并處理信息。自動駕駛系統(tǒng)智能機器人圖像處理基礎(chǔ)

圖像是人類視覺的基礎(chǔ),是自然景物的客觀反映,是人類認識世界和人類自身的重要源泉。計算機視覺是讓機器具有智慧的“眼睛”,圖像處理是其重要的研究內(nèi)容。對于圖像,有一個重要的概念-圖像分辨率。圖像分辨率又分為空間分辨率和灰度分辨率。圖像處理基礎(chǔ)分辨率高

空間分辨率是每英寸圖像內(nèi)有多少個像素點被采樣,分辨率的單位為PPI(PixelsPerInch,像素每英寸)。采樣過程實質(zhì)上對一幅圖像等間距劃分成多個網(wǎng)格,每一個網(wǎng)格表示一個像素點。采樣間隔越大,所得圖像像素數(shù)越少,空間分辨率越低,圖像質(zhì)量差,嚴重時出現(xiàn)馬賽克效應(yīng);采樣間隔越小,所得圖像像素數(shù)越多,空間分辨率越高,圖像質(zhì)量好,但數(shù)據(jù)量大。

分辨率低圖像處理基礎(chǔ)

灰度分辨率是用于量化灰度的比特數(shù),通常用2的整數(shù)次冪來表示,例如8bit,它表示的灰度范圍是0到255。量化實質(zhì)上是顏色值數(shù)字化的過程。根據(jù)圖像的灰度級數(shù),可將圖像分為黑白圖像(二值圖像,用0和1表達)、灰度圖像和彩色圖像。彩色圖像黑白圖像灰度圖像計算機視覺技術(shù)的主要任務(wù)

計算機視覺是一種讓計算機學會“視物”并“識物”的技術(shù),跟人類觀察世界一樣,從粗粒度的“歸類”到精細粒度的“理解”,計算機視覺技術(shù)的主要任務(wù)有圖像分類(What)、目標檢測(What&Where)、圖像分割(What&Where),其中圖像分割不但能檢測位置,還能夠精細地將位置輪廓勾勒出來。計算機視覺技術(shù)的主要任務(wù)圖像分類體驗網(wǎng)址:/tech/imagerecognition/ingredient圖片分類(ImageClassification),顧名思義,就是通過算法對其中的對象進行分類,圖像分類一直是計算機視覺中非?;A(chǔ)且重要的一個任務(wù),也是幾乎所有的深度學習網(wǎng)絡(luò)模型進行評價測試的方向。計算機視覺技術(shù)的主要任務(wù)目標檢測(ObjectDetection)主要從圖像中分離出感興趣的目標,不僅要用算法判斷圖片目標對象的類別,還要對圖像目標對象進行定位,即在圖像中確定其位置,并用矩形框把檢測目標對象標識出來。目標檢測體驗網(wǎng)址:/tech/vehicle/detect計算機視覺技術(shù)的主要任務(wù)

圖像分割用于預(yù)測圖像中每個像素點所屬的類別或者實體,是計算機視覺中非常重要的任務(wù)。按照分割任務(wù)不同,主要分為兩類:(1)語義分割(SemanticSegmentation):是對圖像中的每個像素都劃分出對應(yīng)的類別,即實現(xiàn)像素級別的分類,對比目標檢測,圖像分割支持用多邊形標注訓練數(shù)據(jù),模型可像素級識別目標,它的目標是為圖像中的每個像素分類;(2)實例分割(InstanceSegmentation):不但要進行像素級別的分類,還需在具體的類別基礎(chǔ)上區(qū)分不同的實例,一般用不同的顏色標識。目錄5.2智能語音技術(shù)智能語音系統(tǒng)構(gòu)成智能語音的識別過程

智能語音把語音作為研究對象,是語音信號處理的一個重要研究方向,涉及心理學、語言學、計算機科學以及信號處理等諸多領(lǐng)域,甚至還涉及到人的體態(tài)語言,最終目標是實現(xiàn)人與機器進行自然語言對話。智能語音技術(shù),也被稱為自動語音識別自動語音識別(AutomaticSpeechRecognition,ASR),就是讓機器通過識別和理解,把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。智能語音系統(tǒng)構(gòu)成智能語音識別系統(tǒng)構(gòu)成

為了實現(xiàn)機器與人類的正常對話、交流,智能語音系統(tǒng)需要完成“識別”、“聽清”、“理解”、“行動”以及“播報”這一連貫的任務(wù)。因此,智能語音系統(tǒng)至少包含了5個基本的子模塊:語音喚醒、語音增強、聲紋識別、語種識別和語音合成等。智能語音系統(tǒng)構(gòu)成語音喚醒

語音喚醒的目標就是讓機器“能聽”?!昂?,siri”、“小愛同學”,在使用智能語音助手時,常常會叫到人們呼喚這些名字,讓它們來幫助完成一些指令。而這個叫名字的過程,就是指的語音喚醒。智能語音系統(tǒng)構(gòu)成語音增強

語音增強的目標是讓機器“聽得清”,是指當語音信號被各種各樣的噪聲干擾、甚至淹沒后,從噪聲背景中提取有用的語音信號,抑制、降低噪聲干擾的技術(shù)??偨Y(jié)起來,語音增強就是指從含噪聲的語音中提取盡可能純凈的原始語音。智能語音系統(tǒng)構(gòu)成聲紋識別

聲紋識別的目標是讓機器“聽出說話的對象”,它是生物識別技術(shù)的一種,也稱為說話人識別。聲紋識別能夠提取每個人獨一無二的語音特征,實現(xiàn)“聽音辨人”,在涉及說話人身份識別的場景中具有重要應(yīng)用價值。智能語音系統(tǒng)構(gòu)成語種識別

語種識別的目標是讓機器“聽出是哪種語言”,即讓機器判斷某段音頻是英語、中語還是法語,又稱判斷音頻的語種。致力于智能語音研究的科大訊飛,推出了方言識別功能,目前訊飛輸入法支持23種方言,其中粵語、閩南語、湖南話、四川話、東北話、河南話等方言的識別率均已超過90%。智能語音系統(tǒng)構(gòu)成語音合成

語音合成又稱文本轉(zhuǎn)語音技術(shù)(TexttoSpeech,TTS),目標是讓機器“能說”,指通過機械的、電子的方法產(chǎn)生人造語音,將任意文字信息轉(zhuǎn)化為標準流暢的語音朗讀出來。通俗的講,語音合成技術(shù)就是賦予計算機“像人一樣開口說話”的能力。智能語音的應(yīng)用智能語音硬件產(chǎn)品

隨著人工智能技術(shù)的不斷發(fā)展,人工智能的各種應(yīng)用及產(chǎn)品在社會地各個方面都有滲透,人們已經(jīng)接觸過越來越多的人臉識別產(chǎn)品、智能語音產(chǎn)品等。這些智能語音產(chǎn)品分為硬件產(chǎn)品和軟件產(chǎn)品兩類。智能語音軟件產(chǎn)品目錄5.3自然語言處理技術(shù)自然語言處理任務(wù)層級

自然語言處理(NaturalLanguageProcessing,NLP),是研究人與計算機交互語言問題的一門學科,是計算機科學和人工智能結(jié)合的一個子領(lǐng)域。自然語言處理的主要任務(wù)是將機器學習算法應(yīng)用于處理文本,將自然語言(主要是以文本形式呈現(xiàn)的語言)作為計算機程序的輸入和(或)輸出,它的關(guān)鍵任務(wù)是使計算機“理解”人類語言,代替人類執(zhí)行語言翻譯和問題回答等任務(wù)。

自然語言處理技術(shù)按任務(wù)層級分為底層資源建設(shè)、基礎(chǔ)任務(wù)、中層應(yīng)用任務(wù)和上層應(yīng)用系統(tǒng)。自然語言處理技術(shù)體系

實現(xiàn)人類與計算機之間自然語言的通信,意味著要使計算機既能理解自然語言文本的意義,也能以自然語言文本來表達給定的意圖、思想等。前者稱為自然語言理解(NLU,NaturalLanguageUnderstanding),后者稱為自然語言生成(NLG,NaturalLanguagegeneration)。因此,自然語言處理技術(shù)體系大體包括了自然語言理解和自然語言生成兩大方向。自然語言處理技術(shù)體系語音合成

自然語言理解(NLU),顧名思義,就是讓機器“理解”人類語言,是所有支持機器理解文本內(nèi)容的方法模型或任務(wù)的總稱。自然語言理解在文本信息處理系統(tǒng)中扮演著非常重要的角色,是推薦、問答、搜索等系統(tǒng)的必備模塊。

自然語言生成(NLG),就像寫文章創(chuàng)作一樣,涉及構(gòu)詞、構(gòu)句、構(gòu)造上下文、構(gòu)造意境等,整體上相比自然語言理解難度更大,成熟度更低。目前比較多自然語言生成的應(yīng)用主要關(guān)注于垂直領(lǐng)域,比如文本摘要,古詩詞生成,機器翻譯,新聞通稿生成等,文本格式相對單一。自然語言處理應(yīng)用文本分類的應(yīng)用和文本情感分析應(yīng)用

自然語言處理相當于機器語言和人類語言之間的翻譯,通過搭建溝通的橋梁,以實現(xiàn)人與機器交流的目的。自然語言處理的研究內(nèi)容包括機器翻譯、信息檢索、實體抽取、文本分類、智能問答、情感分析、自動摘要、輿情分析等。有道自動語種識別及翻譯目錄5.4知識圖譜技術(shù)知識圖譜技術(shù)概述知識圖譜概念演化

2012年Google公司提出“知識圖譜(KnowledgeGraph,,KG)”,最初特指Google公司為了支撐其語義搜索而建立的知識庫。隨著知識圖譜技術(shù)應(yīng)用的深化,知識圖譜已經(jīng)成為大數(shù)據(jù)時代最重要的知識表示形式,以開發(fā)專家系統(tǒng)(ExpertSystem,又稱為Knowledge-basedSystem)為主要內(nèi)容,以讓機器使用專家知識以及推理能力解決實際問題為主要目標的人工智能子領(lǐng)域,主要模擬人類“推理”功能。知識圖譜的認知微博轉(zhuǎn)發(fā)關(guān)系知識圖譜示例體驗網(wǎng)址:/#/Graph/graph_weibo

知識圖譜(KnowledgeGraph),在圖書情報界稱為知識域可視化或知識領(lǐng)域映射地圖,是顯示知識發(fā)展進程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系。現(xiàn)實世界中,知識都是交叉在一起的,組成了一個復(fù)雜的關(guān)系網(wǎng)絡(luò),知識圖譜就是為了表示知識之間結(jié)構(gòu)關(guān)系的一種可視化圖形表示。

知識圖譜由節(jié)點(Point)和邊(Edge)組成,每個節(jié)點表示現(xiàn)實世界的“實體(Entity)”,每條邊為實體與實體之間的“關(guān)系(Relationship)”。實體越多,所產(chǎn)生的關(guān)系就越復(fù)雜,知識圖譜規(guī)模也會越龐大。知識圖譜的認知

2017年,我國學科目錄做了調(diào)整,首次出現(xiàn)了知識圖譜學科方向,教育部對于知識圖譜這一學科的定位是“大規(guī)模知識工程”。需要指出的是,知識圖譜技術(shù)的發(fā)展是一個循序漸進的過程,其學科內(nèi)涵也在不斷發(fā)生變化。知識圖譜的認知

近年來,隨著互聯(lián)網(wǎng)應(yīng)用需求日益增加,越來越多的知識圖譜應(yīng)運而生。知識圖譜按照應(yīng)用的深度主要可以分為兩大類:

一是通用知識圖譜General-purposeKnowledgeGraph,GKG),通俗講就是大眾版,沒有特別深的行業(yè)知識及專業(yè)內(nèi)容,一般是解決科普類、常識類等問題。

二是行業(yè)知識圖譜(Domain-specificKnowledgeGraph,DKG),通俗講就是專業(yè)版,根據(jù)對某個行業(yè)或細分領(lǐng)域的深入研究而定制的版本,主要是解決當前行業(yè)或細分領(lǐng)域的專業(yè)問題。知識圖譜構(gòu)建流程

知識圖譜的構(gòu)建流程主要包括:知識建模、知識獲取、知識融合、知識存儲、知識計算以及知識應(yīng)用。

知識建模,也叫做業(yè)務(wù)建模,是構(gòu)建多層級的知識體系,將知識、屬性、關(guān)聯(lián)關(guān)系等信息轉(zhuǎn)化為數(shù)據(jù)庫。

知識獲取是實現(xiàn)自動化構(gòu)建大規(guī)模知識圖譜的重要技術(shù),其目的在于從不同來源、不同結(jié)構(gòu)的數(shù)據(jù)中進行知識提取并存入知識圖譜中。

知識融合又分為模式層的融合以及數(shù)據(jù)層的融合。

知識存儲主要是根據(jù)業(yè)務(wù)特點以及數(shù)據(jù)規(guī)模選擇合適的存儲方式將融合后的數(shù)據(jù)進行保存。

知識計算主要是指在結(jié)構(gòu)化的知識存儲庫中發(fā)現(xiàn)隱含關(guān)系以及知識,從給定的知識圖譜推導(dǎo)出新的實體跟實體之間的關(guān)系。

知識應(yīng)用主要是指如何將上面環(huán)節(jié)中構(gòu)建的“知識”以最合適的方式呈現(xiàn)給用戶。本章總結(jié)知識速覽AI賦能,讓一切皆有可能,用人工智能建設(shè)美好世界!第6章人工智能產(chǎn)品形態(tài)目錄6.1人臉識別類產(chǎn)品6.2智能機器人產(chǎn)品6.3智能推薦類產(chǎn)品6.4智能語音類產(chǎn)品學習目標本章主要從人工智能應(yīng)用產(chǎn)品的基本形態(tài)視角,圍繞人工智能應(yīng)用系統(tǒng)中人臉識別類產(chǎn)品、智能機器人產(chǎn)品、智能推薦類產(chǎn)品、智能語音類產(chǎn)品等典型的產(chǎn)品進行分析和討論,希望帶領(lǐng)讀者正確認識人工智能產(chǎn)品的基本功能和用途,初步探索智能產(chǎn)品背后的結(jié)構(gòu)邏輯。理解人臉識別系統(tǒng)的構(gòu)成和技術(shù)實現(xiàn)方法理解智能機器人的構(gòu)成和技術(shù)實現(xiàn)方法理解智能推薦系統(tǒng)的基本思想和應(yīng)用方法理解智能語音助手的關(guān)鍵技術(shù)和應(yīng)用領(lǐng)域目錄6.1人臉識別類產(chǎn)品人臉識別類產(chǎn)品傳統(tǒng)身份識別與生物識別

人們希望一種更安全、可靠的技術(shù)來進行身份識別,生物識別技術(shù)正好能滿足這一要求。由于它的內(nèi)在屬性,具有很強的穩(wěn)定性和個體差異性,是理想的身份識別的手段。生物識別技術(shù)是人類所固有的且每個人所特有的一些物理特征(比如人臉、指紋、虹膜、聲紋等),通過模式識別技術(shù)手段來進行身份鑒定的一種方法,包括人臉識別、指紋識別、虹膜識別、聲紋識別等。

傳統(tǒng)的身份識別多為鑰匙、身份證、各類證件、各種卡等識別方式,這些用于標識身份的東西容易遺失、冒名頂替。所以,傳統(tǒng)的身份識別已遠遠不能滿足人類生活的需求。

人臉識別類產(chǎn)品人臉識別測溫閘機

人臉識別:是一項基于人的臉部特征信息來進行身份識別的技術(shù),其通過計算機分析采集到的人臉圖像信息,采用一定的特征提取算法提取出有效的人臉特征信息,最后利用提取到的人臉特征信息進行身份識別。人臉識別發(fā)展現(xiàn)狀人臉識別類產(chǎn)品人臉識別技術(shù)相對于其他生物識別技術(shù)(如指紋識別、虹膜識別、聲紋識別等)具有以下優(yōu)點:①非接觸性:人臉識別可以不接觸人體,直接通過攝像頭在一定距離內(nèi)識別人的面部特征,達到辨別的目的。從而可以實現(xiàn)更大范圍,更多方位的信息采集。②非侵擾性:一方面對人臉的采集無需被采集者配合也無需工作人員干預(yù);另一方面人臉屬于暴露在外的生物特征,對人臉的識別采集更容易被大眾接受。③硬件基礎(chǔ)完善:人臉識別對硬件的需求主要體現(xiàn)在攝像頭上,當前普及的智能手機均帶有高像素的攝像頭,同時伴隨國內(nèi)視頻監(jiān)控體系建立的逐漸完善,因此相比需要特定采集芯片的指紋識別等識別方式,人臉識別的硬件基礎(chǔ)優(yōu)勢明顯。④采集快捷簡便,可擴展性好:對基礎(chǔ)設(shè)施的低要求及非接觸的采集方式很明顯縮短了信息采集時間,提供了方便的采集方式。人臉識別發(fā)展現(xiàn)狀人臉識別類產(chǎn)品人臉識別發(fā)展現(xiàn)狀

人臉識別最初在20世紀60年代已經(jīng)有研究人員開始研究,真正進入初級的應(yīng)用階段是在90年代后期,發(fā)展至今其技術(shù)成熟度已經(jīng)達到較高的程度。整個發(fā)展過程可以分為機械識別、半自動化識別、非接觸式識別及互聯(lián)網(wǎng)應(yīng)用階段。人臉識別關(guān)鍵技術(shù)人群畫像

人臉識別技術(shù)還處于不斷發(fā)展之中,但其商業(yè)化性質(zhì)特別明顯。比如某精準營銷項目中需要通過線下門店的攝像頭采集人臉數(shù)據(jù),同時構(gòu)建該門店的人臉數(shù)據(jù)庫以及該門店的人群畫像。在某人進入該店后進行人臉采集的同時進行人臉識別,在識別出該人后彈出該人的相關(guān)信息,從而達到精準營銷的目的。人臉識別關(guān)鍵技術(shù)人臉識別關(guān)鍵技術(shù)

人臉識別從應(yīng)用過程來看,可將人臉識別技術(shù)劃分為人臉采集錄入、人臉關(guān)鍵點檢測、人臉配準對齊、人臉特征提取、人臉特征比對。

人臉識別技術(shù)的應(yīng)用主要受到光照、拍攝角度、圖像遮擋、年齡等多個因素的影響,在約束條件下人臉識別技術(shù)相對成熟,在自由條件下人臉識別技術(shù)還在不斷改進。人臉識別關(guān)鍵技術(shù)(1)人臉采集錄入(2)人臉關(guān)鍵點檢測(3)人臉配準對齊(4)人臉特征提取人臉識別關(guān)鍵技術(shù)(5)人臉特征比對人臉識別應(yīng)用領(lǐng)域目錄6.2智能機器人產(chǎn)品智能機器人產(chǎn)品

智能機器人是一種自動化的機器,所不同的是這種機器具備一些與人或生物相似的智能能力,如感知能力、規(guī)劃能力、動作能力和協(xié)同能力,是一種具有高度靈活性的自動化機器。

廣義上的機器人指自動完成某種任務(wù)或功能的人造物,手表、電話、汽車、飛機。

狹義上的機器人是整合材料、機械、電子、控制、計算機與人工智能等技術(shù)的自動機器。

所以,智能機器人也可以概括為:智能機器人=機械+人工智能機器人按照應(yīng)用可以劃分為三大領(lǐng)域:工業(yè)機器人、服務(wù)機器人(個人/家用、公共)和特種機器人。智能機器人產(chǎn)品工業(yè)機器人智能機器人產(chǎn)品服務(wù)機器人智能機器人產(chǎn)品特種機器人智能機器人產(chǎn)品智能機器人是人工智能技術(shù)的綜合試驗場,可以全面檢驗考察人工智能各個研究領(lǐng)域的技術(shù)發(fā)展狀況。智能機器人的內(nèi)涵和外延也會隨著技術(shù)的更新而發(fā)生變化。智能機器人主要技術(shù)智能感知系統(tǒng)感知系統(tǒng)構(gòu)成

智能機器人的感知系統(tǒng)相當于人的五官和神經(jīng)系統(tǒng),是機器人獲取內(nèi)部狀態(tài)或外部環(huán)境信息,用于內(nèi)部反饋控制的工具。感知系統(tǒng)本質(zhì)是傳感器系統(tǒng),將機器人各種內(nèi)部狀態(tài)信息和外部環(huán)境信息,轉(zhuǎn)變?yōu)闄C器人自身或者機器人之間能夠理解和應(yīng)用的數(shù)據(jù)、信號甚至知識。智能機器人產(chǎn)品智能決策系統(tǒng)無人駕駛決策系統(tǒng)

智能決策相當于人的大腦,通過對感知信息的分析和推理,規(guī)劃和確定機器人的任務(wù),而且應(yīng)該具有學習能力,能夠?qū)崿F(xiàn)姿態(tài)控制、路徑規(guī)劃、躲避障礙、力度控制、各種優(yōu)化與控制算法。智能機器人產(chǎn)品智能執(zhí)行系統(tǒng)智能執(zhí)行系統(tǒng)

智能執(zhí)行系統(tǒng)及機器人本體,其臂部一般采用空間開鏈連桿機構(gòu),其中的運動副(轉(zhuǎn)動副或移動副)常稱為關(guān)節(jié),關(guān)節(jié)個數(shù)通常即為機器人的自由度數(shù)。

出于擬人化的考慮,常將機器人本體的有關(guān)部位分別稱為基座、腰部、臂部、腕部、手部(夾持器或末端執(zhí)行器)和行走部(對于移動機器人)等。智能執(zhí)行系統(tǒng)一般分為兩部分:自身移動或者變形;外部操作相應(yīng)的對象。智能機器人產(chǎn)品智能交互系統(tǒng)

智能交互系統(tǒng)主要實現(xiàn)人與機器人之間相互溝通、相互理解,可以分為:(1)直接交互:鍵盤、鼠標、手機、有線遙控器、無線遙控器等。(2)自然交互:聲音、姿勢、肌電、意識等。(3)AR、VR、全息等。智能機器人產(chǎn)品

總體來說,“智能化”、“擬人化”將成為機器人產(chǎn)業(yè)未來的發(fā)展方向。智能機器人具有感知、思維的能力。智能機器人可獲取、處理并識別多種信息,自主地完成較為復(fù)雜的操作任務(wù)。相比一般的工業(yè)機器人,智能機器人具有更大的靈活性、機動性和更廣泛的應(yīng)用領(lǐng)域。目錄6.3智能推薦類產(chǎn)品智能推薦類產(chǎn)品啤酒與紙尿褲的啟示

上世紀90年代,美國的沃爾瑪超市收銀員發(fā)現(xiàn)了一個奇怪的現(xiàn)象,結(jié)賬時乘客的購物車里,啤酒和紙尿褲總是擺在一起。收銀員把情況報告給了超市管理員,管理員也感到大惑不解,于是找到了學者艾格拉沃。

艾格拉沃經(jīng)過調(diào)查發(fā)現(xiàn),原因出自“奶爸”這一群體。首先,從時間上,周末比工作日購買紙尿褲喝啤酒的頻率更多;其次,從年齡上看,這一群體的孩子不超過兩歲;再次,他們喜歡看體育節(jié)目,而且邊喝啤酒邊看;最后,美國的體育節(jié)目多在周末扎堆。所以,當周末年輕的母親需要給孩子換紙尿褲時,通常會讓正在看球的奶爸去買。奶爸出去買紙尿褲,會順便帶一件啤酒回來。發(fā)現(xiàn)這個秘密后,沃爾瑪大膽地把紙尿褲擺放在啤酒旁邊,方便奶爸們購買。結(jié)果,二者的銷量雙雙上升。智能推薦類產(chǎn)品

推薦系統(tǒng)就是通過分析用戶的個人信息以及用戶的歷史行為數(shù)據(jù),從而給用戶推薦其可能感興趣的物品。智能推薦基本思想

推薦系統(tǒng)可以看成是搜索的排序系統(tǒng),或者是一個信息過濾系統(tǒng)。用戶通過信息輸入,推薦系統(tǒng)自動返回一個結(jié)果序列。推薦系統(tǒng)具有以下兩個最顯著的特性:(1)主動化。而推薦系統(tǒng)不需要用戶提供明確的需求,而是通過分析用戶和物品的數(shù)據(jù),對用戶和物品進行建模,從而主動為用戶推薦他們感興趣的信息。(2)個性化。推薦系統(tǒng)能夠更好地發(fā)掘長尾信息,即將冷門物品推薦給對其感興趣的用戶。在電商平臺火熱的時代,由冷門物品帶來的營業(yè)額甚至超過熱門物品,發(fā)掘長尾信息是推薦系統(tǒng)的重要研究方向。智能推薦類產(chǎn)品

推薦系統(tǒng)的基本思想可概括為“物以類聚”、“人以群分”、“知你所想”。

“物以類聚”式的推薦思想,認為用戶可能會喜歡與他之前曾經(jīng)喜歡的物品相似的物品。利用用戶曾經(jīng)喜歡過的物品信息(內(nèi)容信息、標簽、關(guān)鍵字),給用戶推薦與他以前喜歡過的物品相似的其他物品。

“人以群分”式的推薦思想,利用用戶及其與之興趣愛好相似的其他用戶信息,給用戶推薦這些相似用戶喜歡的物品。

“知你所想”:利用用戶和物品的特征信息(用戶的基本信息及行為數(shù)據(jù),例如點擊、瀏覽、收藏、購買、評論等),給用戶推薦那些具有用戶喜歡特征的物品。智能推薦基本思想智能推薦類產(chǎn)品智能推薦基本思想智能推薦類產(chǎn)品智能推薦系統(tǒng)流程

大數(shù)據(jù)時代,網(wǎng)絡(luò)上充斥著琳瑯滿目并且種類繁雜的商品、電影、歌曲、視頻等各種服務(wù),這就是人們常說的信息過載。推薦系統(tǒng)被證明是一種解決“信息過載”和“長尾物品”問題的有效工具,基于知識發(fā)現(xiàn)的相關(guān)技術(shù)來解決人們選擇商品、信息或者服務(wù)問題。推薦系統(tǒng)具體的工作流程包括:數(shù)據(jù)預(yù)處理、用戶行為建模、物品特征建模、生成推薦結(jié)果。智能推薦類產(chǎn)品智能推薦系統(tǒng)實例

海倫女士一直使用在線約會網(wǎng)站尋找適合自己的約會對象。盡管約會網(wǎng)站會向她推薦不同的人選,但她并不是喜歡每一個推薦對象。經(jīng)過一番總結(jié),她發(fā)現(xiàn)自己交往過的對象可以進行如下分類:不喜歡型、有些喜歡型、非常喜歡型。

為了給她成功推薦約會對象,相親網(wǎng)站需要了解海倫女士對約會對象的偏好特征,約會網(wǎng)站收集了三個影響相親結(jié)果的特征:每年獲得的飛行常客里程數(shù)、玩視頻游戲所消耗時間百分比、每周消費的冰淇淋公升數(shù)。接下來,根據(jù)海倫曾經(jīng)的約會數(shù)據(jù)以及對約會對象的評價結(jié)果,相親網(wǎng)站對以上數(shù)據(jù)進行分析。智能推薦類產(chǎn)品智能推薦系統(tǒng)實例每年獲得的飛行??屠锍虜?shù)與玩視頻游戲所消耗時間占比的關(guān)系圖每年獲得的飛行??屠锍虜?shù)與每周消費的冰淇淋公升數(shù)的關(guān)系圖玩視頻游戲所消耗時間占比與每周消費的冰淇淋公升數(shù)的關(guān)系圖智能推薦類產(chǎn)品智能推薦系統(tǒng)應(yīng)用領(lǐng)域

推薦系統(tǒng)本質(zhì)上可以說是一個搜索排名系統(tǒng),或者是一個信息過濾系統(tǒng),旨在從紛繁復(fù)雜的數(shù)據(jù)中,找到于用戶個人有利的信息??傮w來說,一個完整的推薦系統(tǒng)一般存在三個參與方:用戶、內(nèi)容提供者和提供推薦系統(tǒng)的網(wǎng)站。

首先,推薦系統(tǒng)要滿足用戶的需求,給用戶推薦那些讓他們感興趣的內(nèi)容;其次,推薦系統(tǒng)要讓內(nèi)容提供者的內(nèi)容能被推薦給對其感興趣的用戶;最后,好的推薦系統(tǒng)設(shè)計,能夠讓推薦系統(tǒng)本身收獲到高質(zhì)量的用戶反饋,不斷提高推薦的質(zhì)量,提高推薦系統(tǒng)的效益。推薦系統(tǒng)是以提升用戶體驗感和提高商業(yè)利潤為目的技術(shù),它的應(yīng)用領(lǐng)域主要有:電子商務(wù)、電影和視頻網(wǎng)站、個性化音樂網(wǎng)絡(luò)電臺、社交網(wǎng)絡(luò)。目錄6.4智能語音類產(chǎn)品智能語音類產(chǎn)品

智能語音技術(shù)作為人工智能的關(guān)鍵技術(shù)之一,其目標是是實現(xiàn)人機語言的通信,具體包括語音識別技術(shù)(ASR)和語音合成技術(shù)(TTS)。智能語音技術(shù)的研究是以語音識別技術(shù)為開端,可以追溯到20世紀50年代。隨著信息技術(shù)的發(fā)展,智能語音技術(shù)已經(jīng)成為人們信息獲取和溝通最便捷、最有效的手段。智能語音助手作為智能語音技術(shù)的應(yīng)用落地產(chǎn)品,近年來備受用戶關(guān)注和喜愛。智能語音助手根據(jù)其依托的載體不同可分為手機智能語音助手、智能音箱等。知名的智能音箱有天貓精靈、小米AI音箱等,常見的手機智能語音助手有蘋果的Siri、華為的小藝和百度的小度等。智能語音助手通過提供智能化的語音識別技術(shù)來實現(xiàn)智能化操作,例如,熟知的語音助手像小米AI音箱不僅可以播放音樂、講故事、設(shè)置鬧鐘,還可以控制智能家居,為用戶提供更加全面的服務(wù)。智能語音類產(chǎn)品

智能語音技術(shù)作為人工智能的關(guān)鍵技術(shù)之一,其目標是是實現(xiàn)人機語言的通信,具體包括語音識別技術(shù)(ASR)和語音合成技術(shù)(TTS)。智能語音技術(shù)的研究是以語音識別技術(shù)為開端,可以追溯到20世紀50年代。隨著信息技術(shù)的發(fā)展,智能語音技術(shù)已經(jīng)成為人們信息獲取和溝通最便捷、最有效的手段。智能語音助手作為智能語音技術(shù)的應(yīng)用落地產(chǎn)品,近年來備受用戶關(guān)注和喜愛。智能語音助手根據(jù)其依托的載體不同可分為手機智能語音助手、智能音箱等。知名的智能音箱有天貓精靈、小米AI音箱等,常見的手機智能語音助手有蘋果的Siri、華為的小藝和百度的小度等。智能語音助手通過提供智能化的語音識別技術(shù)來實現(xiàn)智能化操作,例如,熟知的語音助手像小米AI音箱不僅可以播放音樂、講故事、設(shè)置鬧鐘,還可以控制智能家居,為用戶提供更加全面的服務(wù)。智能語音助手發(fā)展歷程智能語音類產(chǎn)品智能語音技術(shù)的研究可追溯到20世紀50年代,發(fā)展過程從未間斷,其代表性發(fā)展歷程可分為四個階段:萌芽期、突破期、產(chǎn)業(yè)化期以及快速應(yīng)用期。萌芽期:1952年,貝爾實驗室(BellLabs)制造一臺6英尺高自動數(shù)字識別機“Audrey”,它可以識別數(shù)字0~9的發(fā)音,且準確度高達90%以上。突破期:1988年,卡耐基梅隆大學結(jié)合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論