




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第7章信息獲取的通用工具數(shù)字素養(yǎng)與技能導論科技改變未來搜索引擎7.27.1社交媒體7.3生成式人工智能工具7.1?搜索引擎搜索引擎是PC互聯(lián)網時代應用最廣泛的一種應用程序。它的工作原理可以簡單總結為3步:利用爬蟲程序去網絡上抓取網頁數(shù)據;對抓取到的網頁數(shù)據建立索引;根據一定的算法對網頁進行搜索排序。根據不同的分類標準,搜索引擎可以分為很多類型。比如,按照信息內容的組織方式劃分,可以分為目錄式搜索引擎與機器人搜索引擎;按照檢索功能劃分,可以分為獨立搜索引擎和元搜索引擎;按照專業(yè)范疇劃分,可以分為綜合性搜索引擎與專業(yè)性搜索引擎。綜合性搜索引擎收集的內容涵蓋社會生活的方方面面,可檢索資源類型包括網頁、音頻、圖片、視頻、地圖、學術信息等。值得一提的是,綜合性搜索引擎也不是萬能的,其能搜索到的資源甚至不到整個互聯(lián)網資源總量的5%。如果把整個互聯(lián)網的信息資源形象地比喻成一座冰山,搜索引擎所能搜索到的資源也就是冰山露出水面的部分,我們稱之為表層網,而互聯(lián)網中95%以上的資源都集中在深網中,也就是冰山在水面之下的部分。7.1?搜索引擎表
國內外重要的綜合性搜索引擎7.1.1?什么都能搜的“綜合性搜索引擎”中國搜索全稱是中國搜索信息科技股份有限公司(以下簡稱“中國搜索”),是新華社主管主辦的國家搜索平臺、“國字號”搜索引擎,于2014年3月由人民日報、新華社、中央電視臺、光明日報、經濟日報、中國日報、中國新聞社七大主要新聞單位聯(lián)合設立。中國搜索提供的服務主要是國內新聞搜索,其擁有的資源類型分為以下幾類:新聞、社科、圖片、視頻、好故事和ChinaStory。中國搜索由于主要提供的是新聞搜索服務,所以沒有各類商業(yè)廣告信息。因此,用戶通過中國搜索獲得的信息相對于其他綜合性搜索引擎來說更加權威。此外,中國搜索的搜索結果呈現(xiàn)界面相對來說也比較簡潔。在搜索方法上,中國搜索支持簡單搜索,沒有高級搜索框,支持部分搜索語法,包括“site”站內搜索、“intitle”限定標題搜索、“-”布爾邏輯“非”搜索等。在搜索結果排序上,中國搜索支持來源篩選、時間篩選、按相關性排序、按時間排序。其中,來源篩選分為央媒、地方媒體、商業(yè)媒體、電子報。時間篩選分為一天內、一周內、一月內、一年內。中國搜索017.1.1?什么都能搜的“綜合性搜索引擎”百度公司于2000年1月1日在北京中關村創(chuàng)立,創(chuàng)始人是李彥宏。作為國內互聯(lián)網巨頭之一的百度公司,其產品種類豐富多樣,大致分為以下幾大類別:搜索服務、導航服務、社區(qū)服務、游戲娛樂、移動服務、站長與開發(fā)者服務、軟件工具、新上線產品服務。百度搜索02搜狗搜索是北京搜狐互聯(lián)網信息服務有限公司(以下簡稱“搜狐公司”)在2004年8月3日推出的全球首個第三代互動式中文搜索引擎。搜狗搜索與百度搜索提供的搜索服務基本一致,可以提供對網頁、新聞、視頻、地圖、音樂、百科等資源的搜索。搜狗搜索的具體使用方法與百度搜索基本相同,可以使用簡單搜索和高級搜索。高級搜索框在頁面右上角的“設置”按鈕中可以打開。需要注意的是,搜狗搜索的首頁右上角沒有“設置”按鈕,在搜索結果呈現(xiàn)的界面右上角才會出現(xiàn)“設置”按鈕。其高級搜索功能包括搜索關鍵詞是否拆分、站內搜索、限定搜索詞位置、限定搜索文件的格式等,如圖所示。高級搜索的具體用法與搜索語法可以參考百度搜索。搜狗搜索037.1.1?什么都能搜的“綜合性搜索引擎”圖
搜狗搜索的高級搜索設置界面7.1.1?什么都能搜的“綜合性搜索引擎”谷歌的英文名稱是Google、詞源為googol,而googol指的是10的100次冪,用googol一詞來形容互聯(lián)網上的海量資源再合適不過。谷歌公司旗下的谷歌搜索是目前全球最大的綜合性搜索引擎,其搜索業(yè)務在全球范圍內的市場份額中占據絕對統(tǒng)治地位。谷歌公司成立初期,創(chuàng)始人提出的PageRank算法極大地提高了搜索結果的相關度,使得谷歌搜索一經推出就備受市場歡迎。PageRank算法是一種鏈接分析算法,這種算法給予網頁間的鏈接很高的排序權重。谷歌搜索的使用技巧與百度搜索、搜狗搜索、必應搜索等類似,同樣支持布爾邏輯檢索、精確檢索、高級檢索語法等。同時,搜索結果也可以按照時間、文件類型等進行篩選過濾。谷歌搜索04必應搜索是微軟公司在2009年5月推出的綜合性搜索引擎,必應是其英文名Bing的音譯中文名。必應搜索分為國內版和國際版,搜索中文信息使用國內版,搜索英文信息使用國際版。必應搜索提供網頁、圖片、視頻、學術、詞典、地圖搜索服務。在搜索技巧上,必應與百度類似,支持布爾邏輯檢索、精確檢索與高級搜索語法。必應搜索057.1.1?什么都能搜的“綜合性搜索引擎”具體用法為:布爾邏輯“且”用“AND或&”,布爾邏輯“或”用“OR或|”,布爾邏輯“非”用“NOT或-”,精確檢索用“”將搜索關鍵詞引起來。高級搜索語法支持contains、ext、filetype、inanchor、inbody、intitle、ip、language、loc、site、feed、hasfeed、url,如表所示。7.1.1?什么都能搜的“綜合性搜索引擎”續(xù)表7.1.1?什么都能搜的“綜合性搜索引擎”Yandex公司于1993年創(chuàng)建,其創(chuàng)始人是阿爾卡季·沃羅茲(ArkadyVolozh)和伊亞·塞加洛維奇(IIyaSegalovich)。Yandex是一個創(chuàng)造出來的詞,它是“YetAnotherIndexer”(另一個索引)的縮寫。Yandex作為俄羅斯的一款綜合性搜索引擎,于1997年正式上線。其提供的搜索服務包括網頁搜索、圖片搜索、視頻搜索與地圖搜索。另外,Yandex還提供翻譯、郵件、天氣、游戲等服務。在搜索結果的篩選上,Yandex提供時間篩選和語言篩選,時間篩選分為Alltime、Lastday、Last2weeks和Lastmonth,語言篩選提供包括俄語、英語、法語、德語等在內的10種語言。Yandex的圖片搜索功能非常強大,國內用戶可以通過Yandex的反向圖片搜索功能來查找圖片出處。在搜索技巧上,Yandex同樣支持布爾邏輯檢索、精確搜索、高級搜索語法等。Yandex067.1.1?什么都能搜的“綜合性搜索引擎”DuckDuckGo創(chuàng)立于2008年,創(chuàng)始人是畢業(yè)于麻省理工學院的加布里埃爾·溫伯格(GabrielWeinberg)。DuckDuckGo的特點是安全、快速、簡潔,并且不追蹤、不記錄用戶隱私信息。在搜索功能上,DuckDuckGo與其他搜索引擎沒有區(qū)別,同樣支持布爾邏輯檢索、精確檢索、站內搜索、限定搜索詞位置、限定文件格式等搜索語法,搜索結果也支持時間過濾和語言過濾。DuckDuckGo最大的優(yōu)點就是隱私保護,這也是它相比其他搜索引擎所具備的獨特優(yōu)勢。DuckDuckGo對用戶承諾既不會記錄用戶的UserAgent(用戶識別符)、IP地址、搜索關鍵詞等信息,也不會通過Cookies機制識別用戶的身份。為了避免暴露用戶的搜索行為,DuckDuckGo會對用戶的請求進行處理,使網站無法知曉用戶的搜索結果頁面。此外,DuckDuckGo還允許用戶通過POST方法而非GET方法發(fā)送搜索請求。啟用POST方法發(fā)送搜索請求后,第三方將無法從瀏覽器地址欄的URL中識別到用戶輸入的搜索關鍵詞,搜索歷史也不會出現(xiàn)在歷史記錄中,進一步加強了對用戶的隱私保護。DuckDuckGo077.1.1?什么都能搜的“綜合性搜索引擎”WebCrawler創(chuàng)建于1994年,其創(chuàng)始人是美國加州大學伯克利分校的布賴恩·平克頓(BrianPinkerton)。WebCrawler是全球第一個全文檢索式搜索引擎,其數(shù)據庫非常龐大,擁有海量信息資源,資源類型包括網頁、新聞、圖片、視頻等。在搜索響應速度上,WebCrawler憑借強大的服務器集群,為用戶提供快速高效的搜索。在搜索結果的準確度上,WebCrawler的表現(xiàn)同樣出色,通過運用自然語言處理技術與機器學習技術,WebCrawler能很好地理解用戶的真實需求,進而為用戶提供非常精準的搜索結果。WebCrawler087.1.2?按圖索驥的“目錄式搜索引擎”(1)搜狐中國首家大型分類查詢搜索引擎搜狐于1998年推出,開啟了中國網民通往互聯(lián)網世界的大門。搜狐屬于目錄式搜索引擎,是中國四大門戶網站之一。與全文搜索引擎不同,搜狐采用手工方式收錄網址,分類專家層層細分類目,組成龐大的樹狀目錄結構。與雅虎相同,搜狐采用的人工采集與處理的方式使得它在信息準確性、相關性、可靠性等方面具有優(yōu)勢,但也要面臨信息維護量較大、更新不及時等問題。(2)LookSmartLookSmart成立于1995年,由麥肯錫公司高管埃萬·索恩利(EvanThornley)和其夫人特雷西·埃勒里(TracyEllery)在澳大利亞墨爾本創(chuàng)立。LookSmart有兩層含義,既指由編輯編寫的精選目錄,也指對“看起來很聰明”的用戶的贊美。LookSmart曾是全球訪問量第十二大的網站。進入21世紀初,微軟公司于2003年宣布不再與LookSmart續(xù)約,轉而發(fā)展自己的MSN搜索引擎。目前,LookSmart仍提供檢索服務,但其業(yè)務重心轉向了搜索廣告領域。7.1.3?專注特定領域的“垂直式搜索引擎”不同于通用的綜合性搜索引擎,垂直搜索引擎是應用于某一個具體行業(yè)和專業(yè)的搜索引擎,能夠提供更加精準、深入的信息,滿足用戶在特定領域的獨特需求。馬蜂窩于2010年正式開始運營,是一個專注于旅游行業(yè)的垂直搜索引擎。01獵云網成立于2013年,是獲取科技信息的重要平臺。在2014年至2015年間被評為“國內十大新銳科技媒體”之一。獵云網的主要服務如下。①科技信息②快訊③企業(yè)服務02Ask原名AskJeeves,是由加州大學伯克利分校的加勒特·格魯納(GarrettGruener)和戴維·沃森(DavidWarthen)在1996年6月創(chuàng)辦的。Ask支持自然語言提問;2001年AskJeeves收購了全文搜索引擎Teoma;2006年AskJeeves改名為Ask;Ask于2010年從綜合性搜索引擎轉移到垂直搜索;03Wolfram|Alpha于2009年5月正式上線,創(chuàng)始人是斯蒂芬·沃爾弗拉姆(StephenWolfram)。從Wolfram|Alpha的官網我們可以看到,Wolfram|Alpha為獲取知識和答案定義了一個全新的范式——不是通過搜索網絡,而是通過基于大量內置數(shù)據、算法和方法的動態(tài)計算。04馬蜂窩獵云網AskWolfram|Alpha7.1.4?一鍵遍覽各平臺的“元搜索引擎”元搜索引擎是一種特殊的搜索引擎,它不會直接存儲或生成網頁內容,而是將用戶的搜索請求同時發(fā)給多個其他搜索引擎,然后收集這些搜索引擎的檢索結果,最后將這些結果去重、排序并呈現(xiàn)給用戶。Dogpile就是一個誕生于1996年的元搜索引擎,由AaronFlin設計并推出。它的主要功能就是將用戶的搜索請求同時提交給多個搜索引擎。2006年和2007年,Dogpile因其出色的服務連續(xù)兩年獲得了美國市場信息公司君迪(J.D.PowerandAssociates)授予的最佳住宅在線搜索服務獎。Dogpile目前提供簡單檢索,支持包括布爾邏輯運算符、優(yōu)先運算符、短語搜索符號等在內的搜索操作,這些符號能夠幫助用戶更加精確地搜索。Dogpile還支持多種內容類型的搜索,包括網頁、圖片、視頻、新聞等,用戶在檢索時,可以單擊搜索框上方的“web”(網頁)“images”(圖像)“videos”(視頻)“news”(新聞)等按鈕指定檢索結果的類型。(1)Dogpile7.1.4?一鍵遍覽各平臺的“元搜索引擎”MetaCrawler是世界上最早出現(xiàn)的元搜索引擎之一,最早由華盛頓大學碩士生埃里克·塞爾伯格(EricSelberg)和副教授奧倫·埃齊奧尼(OrenEtzioni)于1994年開發(fā),旨在通過調用多個搜索引擎的結果來改善信息獲取的效率。(2)MetaCrawlerVivisimo是一款曾經非常有特色的元搜索引擎,由3位來自卡內基梅隆大學的計算機科學研究人員克里斯·帕爾默(ChrisPalmer)、杰羅姆·佩森蒂(JeromePesenti)和勞爾·瓦爾德斯-佩雷斯(RaulValdes-Perez)于2000年創(chuàng)立。Vivisimo的核心功能是其先進的聚類和分類技術。與傳統(tǒng)的搜索引擎不同,當用戶在Vivisimo中進行搜索時,Vivisimo不僅僅是簡單地呈現(xiàn)搜索結果列表,而是會將搜索結果自動分成不同的類別。(3)Vivisimo7.1.4?一鍵遍覽各平臺的“元搜索引擎”Mamma是一個早期重要的元搜索引擎,最初于1996年推出。它通過從多個主要的搜索引擎和目錄中檢索結果來工作,但其性能并不如其他一些元搜索引擎(如Dogpile)那樣出色。Mamma的特點在于它能夠將用戶查詢發(fā)送給多個異構搜索引擎并收集答案,然后向用戶呈現(xiàn)統(tǒng)一的結果,允許用戶根據屬性(如主機、關鍵詞、日期和受歡迎程度)對結果進行排序。Mamma的一個顯著問題是其搜索結果中包含大量的“贊助”或付費列表項,這可能會干擾用戶的搜索體驗。(4)Mamma搜索引擎社交媒體7.3生成式人工智能工具7.27.17.2.1?親朋好友聯(lián)絡站微信是騰訊公司于2011年1月推出的一款即時通信App。微信可以為用戶提供快速免費的文本、語音與視頻通信服務,并且這種通信服務是可以跨運營商、跨操作系統(tǒng)的。憑借著出色的語音對講功能,微信在發(fā)展初期就成功吸引了大量用戶。經過十多年的發(fā)展,微信已不再是一款單純的即時通信App,它的功能從通信逐步延伸到了社會生活的諸多方面,包括社交、購物、出行、娛樂等。微信01可以查看用戶關注的公眾號發(fā)布的信息,公眾號目前已成為企業(yè)、機關、事業(yè)單位及個人發(fā)布信息、分享經驗的重要平臺。點開“公眾號”可以看到微信提供的服務包括四大類:金融理財、生活服務、交通出行、購物消費。每一大類服務下,列出了具體的服務內容。點開“服務”界面登錄微信7.2.1?親朋好友聯(lián)絡站為了與“抖音”等短視頻平臺競爭,微信還推出了“視頻號”服務,因此,微信同時也是一個重要的短視頻平臺。社交媒體獲取信息有兩種方式:被動獲取被動獲取就是通過關注微信公眾號來獲取信息。這里我們主要介紹微信的搜索功能。主動獲取主動獲取就是利用微信的搜索功能來獲取信息;進入微信,點擊屏幕右上方的“放大鏡”即可進入微信搜索界面,在搜索框中直接輸入搜索詞即可進行搜索。微信的搜索結果可以通過搜索欄左下方的過濾器進行過濾篩選,支持排序、類型、時間、范圍等篩選方式。7.2.1?親朋好友聯(lián)絡站QQ是我國最早、最成功的即時通信軟件之一,由騰訊公司于1999年推出。作為一款基于互聯(lián)網的即時通信工具,QQ為用戶提供了豐富的社交、通信、娛樂、交易等功能。從最早的文字聊天到如今的視頻/語音通話、文件傳輸、游戲中心、頻道、短視頻等功能,QQ不僅是許多人日常溝通的工具,更承載了大量用戶的青春記憶和情感交流。QQ02QQ的核心功能是在線聊天。用戶可以通過文字、語音、視頻等多種方式與好友進行溝通。長期文件共享功能也是QQ的一大亮點。用戶可以輕松發(fā)送和接收文檔、圖片、音樂、視頻等文件,傳輸速度快,且支持點對點斷點續(xù)傳,也就是說即使在傳輸過程中網絡中斷,也能確保在恢復網絡后繼續(xù)傳輸。QQ群中的文件共享功能允許用戶上傳文件到群文件夾,群成員可以隨時訪問和下載,文件在群內可以長期保存,不會像微信那樣在一定時間后自動失效。群應用和群機器人、QQ空間、遠程控制、修改在線狀態(tài)、等級系統(tǒng)等也是QQ區(qū)別于微信而獨有的特色功能。7.2.1?親朋好友聯(lián)絡站Facebook創(chuàng)立于2004年,目前是美國科技集團MetaPlatforms旗下的社交媒體平臺。Facebook是由馬克·扎克伯格(MarkZuckerberg)與另外4名哈佛大學學生愛德華多·薩維林(EduardoSaverin)、安德魯·麥科勒姆(AndrewMcCollum)、達斯汀·莫斯科維茨(DustinMoskovitz)和克里斯·休斯(ChrisHughes)共同創(chuàng)建的。Facebook創(chuàng)立之初,其會員僅限于哈佛大學的學生,后來逐漸擴展到美國的其他大學。Facebook(臉書)03用戶通過個人電腦、平板電腦和智能手機都可以使用Facebook。Facebook允許用戶發(fā)布文本、照片和視頻,并與同意成為其朋友的用戶共享,或者通過不同的隱私設置公開共享。用戶注冊賬號后,即可搜索自己感興趣的內容。比如用戶對美國的國會圖書館感興趣,那么可以在頁面左上角的搜索框中直接輸入“TheLibraryofCongress”,進入國會圖書館的主頁后,可以查看國會圖書館發(fā)布的文本、照片和視頻。7.2.1?親朋好友聯(lián)絡站WhatsApp是WhatsAppMessenger的簡稱,是MetaPlatforms公司旗下一款用于智能手機的跨平臺加密即時通信應用程序。它由布萊恩·阿克頓(BrianActon)和揚·庫姆(JanKoum)于2009年共同創(chuàng)立,初衷是解決傳統(tǒng)短信費用高昂的問題,提供一種更加便捷且免費的通信方式。WhatsApp04WhatsApp憑借簡潔直觀的設計廣受歡迎。它沒有復雜的菜單和廣告,界面清晰,核心功能如發(fā)送文本、語音通話、視頻通話一目了然。WhatsApp的端到端加密技術(End-to-EndEncryption,E2EE)是一種保護用戶通信安全的重要機制。正因為這種高度加密的方式,一些不法分子利用hatsApp進行詐騙活動。7.2.2?與領域專家面對面微博,原名新浪微博,是2009年8月上線的一款信息交流共享類社交媒體,個人用戶和機構用戶可以通過微博發(fā)布信息,實現(xiàn)與其他用戶的信息交流共享(點贊、收藏、轉發(fā)、評論)。微博支持用戶以文字、圖片和視頻等多媒體形式實現(xiàn)信息的即時分享。(1)微博通過微博發(fā)布信息的門檻很低,相比新浪博客的長篇大論,發(fā)布微博只需要短短一行字即可,任何注冊了微博的用戶都可以通過微博在網絡上暢所欲言一是通過微博發(fā)布信息十分便捷,用戶可以隨時將自己的想法編輯成文字通過微博進行發(fā)布,并且微博也不限制用戶每日信息發(fā)布的次數(shù)二是微博的互動性很強,任何兩個彼此不認識的用戶都可以進行互動,既可以進行公開互動,也可以通過私信功能進行私密互動三是利用名人效應,邀請明星等名人注冊賬戶,吸引其粉絲一同注冊。四是微博受歡迎的
主要原因7.2.2?與領域專家面對面微博廣大的用戶群體和海量的信息使其成為了重要的信息獲取平臺。與微信類似,用戶既可以通過關注個人和機構的微博賬號來及時獲取個人和機構發(fā)布的重要信息,也可以通過微博的搜索功能來獲取信息。登錄微博,點擊屏幕底部中間的“放大鏡”即可進入微博的搜索界面。在搜索界面,用戶在搜索框中輸入搜索詞即可完成搜索。除此之外,用戶還可以通過話題標簽和微博熱搜兩種方式主動獲取信息。微博熱搜則可以反映當下其他用戶正在關注的內容,為了方便用戶查找信息,微博熱搜也細分了很多熱搜榜包括品牌熱榜、視頻熱榜、校園熱榜、體育熱榜、游戲熱榜、時尚熱榜、美妝熱榜、汽車熱榜、旅游熱榜、科技數(shù)碼熱榜、母嬰熱榜、健康熱榜等。話題標簽可以將有關某一話題或事件的所有討論內容聚合到一起,便于用戶討論、交流。7.2.2?與領域專家面對面知乎于2011年正式上線,創(chuàng)始人是周源。知乎作為中文互聯(lián)網領域的一個知識問答社區(qū),深受中國網民歡迎。2013年知乎開放注冊后,不到一年時間,注冊用戶數(shù)量就從40萬暴漲到400萬。知乎的口號是“有問題,就會有答案”,用戶有任何問題都可以在知乎提出,并邀請其他用戶進行回答,我們日常生活中的大多數(shù)問題在知乎中都能找到類似的問題和相應的答案。(2)知乎與其他信息獲取工具不同的是,用戶可以把自己的信息需求在知乎中提出,讓其他用戶來滿足自己的信息需求,當然這種方式并不能讓用戶的信息需求立即得到滿足。為了鼓勵用戶創(chuàng)作,知乎開發(fā)了徽章體系和知識付費功能。通過知乎獲取信息的方式也比較簡單,登錄知乎的網頁版或者手機App,在搜索框中輸入想要查找的問題,就可以在搜索結果列表中尋找類似的問題和相應的答案,如果沒有類似的問題則可以提問,然后邀請其他用戶回答。7.2.2?與領域專家面對面今日頭條是抖音公司于2012年推出的一款通用信息平臺,致力于為用戶提供高質量的信息,讓用戶看見更大的世界。今日頭條目前擁有推薦引擎、搜索引擎、關注訂閱和內容運營等多種分發(fā)方式,囊括圖文、視頻、問答、微頭條、專欄、小說、直播、音頻和小程序等多種內容體裁,并涵蓋科技、體育、健康、美食、教育、“三農”、國風等超過100個內容領域。(3)今日頭條目前,主流媒體幾乎都擁有自己的頭條號,如光明日報、光明網、人民日報、人民網、新華網、長江日報等。司法機構與政府部門,如最高人民檢察院(以下簡稱“最高檢”)、最高人民法院、司法部、外交部、國防部、公安部等,也都注冊了頭條號。如前所述,用戶通過今日頭條獲取信息主要有推薦引擎、關注訂閱和搜索引擎等方式,推薦引擎和關注訂閱都是被動獲取信息的一種方式。用戶在今日頭條首頁上方的搜索框中直接輸入想要搜索的內容即可進行搜索。比如,用戶在搜索框中輸入“數(shù)字素養(yǎng)”進行搜索,即可得到大量關于“數(shù)字素養(yǎng)”的內容。7.2.2?與領域專家面對面Twitter是美國的一家社交媒體平臺,創(chuàng)立于2006年,由比茲·斯通(BizStone)、杰克·多西(JackDorsey)和埃文·威廉姆斯(EvanWilliams)3人聯(lián)合創(chuàng)辦。作為一個全球性的社交媒體平臺,Twitter擁有龐大的用戶群體。Twitter的首席執(zhí)行官琳達·亞卡里諾(LindaYaccarino)在VoxMedia的Code2023技術會議上表示,Twitter目前擁有2.25億日活躍用戶。2022年10月,埃隆·馬斯克(ElonMusk)完成對Twitter的收購交易,并于2023年7月23日發(fā)布推文,宣布將Twitter的“藍鳥”圖標更換為“X”圖標。隨后,Twitter的域名也由變?yōu)閄.com。(4)Twitter(現(xiàn)稱X)用戶可以在Twitter上發(fā)布短消息,關注其他用戶,通過評論、點贊和轉發(fā)等方式與其他用戶進行互動。如果用戶想查找某個具體用戶發(fā)布的信息,可以直接在Twitter上搜索該用戶或者信息內容,也可以通過關注該用戶讓系統(tǒng)自動推送該用戶發(fā)布的信息。7.2.2?與領域專家面對面Reddit是一個基于社區(qū)的社交新聞和討論平臺,由史蒂夫·霍夫曼(SteveHuffman)和亞歷克西斯·奧哈尼安(AlexisOhanian)于2005年創(chuàng)立,其創(chuàng)建目標是為用戶提供一個可以分享和討論各種主題的平臺。(5)RedditReddit的核心功能包括各種子板塊(Subreddits),每個子板塊專注于特定的主題,如科技、新聞、游戲等,用戶可以根據興趣加入討論。Reddit在一眾社交媒體中具有獨特的文化氛圍,其開放的討論環(huán)境吸引了大量用戶,包括公眾人物、行業(yè)專家以及普通用戶。r/AMA是Reddit上專門用于AMA(AskMeAnything)活動的子板塊,創(chuàng)建于2009年。Reddit定位為全球最大的社區(qū)交流平臺之一,涵蓋廣泛的興趣和話題,從小眾愛好到全球新聞皆可討論。在Reddit中,可以在主頁瀏覽熱門內容,也可以直接在搜索框中輸入“r/+主題名稱”找到相關主題的子板塊,在子板塊內進一步找到感興趣的信息。7.2.3?以“圖”會友小紅書于2013年6月在上海被創(chuàng)立,創(chuàng)始人是毛文超和瞿芳。小紅書的定位是用戶的生活指南,為用戶提供生活方式指導和消費決策,用戶在小紅書上可以找到很多實用的生活經驗分享內容。01百家號成立于2016年,是由百度公司創(chuàng)始人李彥宏領導團隊創(chuàng)立的一個內容創(chuàng)作平臺。百家號的創(chuàng)建目標是為用戶提供優(yōu)質、多樣化的圖文和視頻內容,同時為內容創(chuàng)作者提供變現(xiàn)機會。平臺功能包括內容創(chuàng)作、分發(fā)、粉絲互動、數(shù)據分析和廣告變現(xiàn)等。02Instagram由凱文·斯特羅姆(KevinSystrom)和邁克·克里格(MikeKrieger)聯(lián)合創(chuàng)辦,于2010年10月正式登錄AppStore。隨后Instagram用戶迅速增長,上線僅一周就有10萬用戶注冊。2012年9月,Instagram被Facebook以7.15億美元的價格收購。03Tumblr是一個輕博客和社交網絡平臺,由大衛(wèi)·卡普(DavidKarp)于2007年創(chuàng)立。Tumblr的創(chuàng)建目標是為用戶提供一個簡單、靈活的博客發(fā)布工具,使用戶能夠方便地分享文字、圖片、視頻、鏈接和音樂等多媒體內容。04小紅書百家號Instagram(照片墻,簡稱Ins或IG)Tumblr7.2.4?(短)視頻社交新潮流01抖音抖音于2016年9月上線,是抖音公司旗下的一個短視頻社交平臺?!吨袊桃曨l發(fā)展研究報告(2023)》顯示,抖音作為國內頭部短視頻平臺,日活數(shù)穩(wěn)定在6億以上。從日活數(shù)可以看出,抖音已經成為名副其實的國民級應用程序,是網民手機裝機必備軟件之一。隨著抖音用戶的爆發(fā)式增長,抖音的商業(yè)潛能和社會效應也逐漸彰顯,越來越多的政府部門、事業(yè)單位、企業(yè)和各類知識博主入駐抖音,抖音也成為權威信息的發(fā)布平臺和知識分享平臺。由于抖音、今日頭條和西瓜視頻都是抖音公司旗下的產品,用戶通過抖音可以實現(xiàn)跨平臺搜索。02快手快手是中國的一款短視頻分享平臺,最早于2011年由程一笑創(chuàng)立,最初定位為一款制作和分享GIF圖的工具。2013年,在宿華加入后,快手轉型為短視頻平臺,致力于讓用戶通過簡單的方式記錄和分享日常生活??焓值膭?chuàng)建目標是為普通用戶提供一個展示自我的平臺,讓每個人都能表達自己和發(fā)現(xiàn)他人。平臺功能包括短視頻拍攝、編輯、分享,以及直播互動,用戶可以輕松發(fā)布視頻、與觀眾互動、進行電商直播等。快手的名字意在體現(xiàn)其操作簡便、快速上手的特點,反映出其想要幫助用戶輕松記錄生活的初衷。7.2.4?(短)視頻社交新潮流03B站嗶哩嗶哩(bilibili),簡稱B站,于2009年創(chuàng)建,是一款內容創(chuàng)作與分享的在線視頻平臺。在B站上上傳視頻的創(chuàng)作者被稱為UP主。B站的彈幕功能允許用戶在觀看視頻的同時將自己的觀點或想法發(fā)送到屏幕上,實現(xiàn)與視頻的其他觀看者進行互動交流。B站發(fā)展至今已有近15年的歷程,15年間UP主們在B站中上傳了海量視頻。04YouTube(油管)YouTube是一個視頻分享平臺,允許用戶上傳、分享和觀看視頻內容。該平臺于2005年上線,最初由查德·赫利(ChadHurley)、陳士駿(SteveChen)、賈維德·卡里姆(JawedKarim)3名前PayPal員工創(chuàng)建,在2006年被谷歌收購。YouTube目前已經成為全球最大的視頻分享平臺之一,擁有龐大的用戶群體和豐富的視頻內容。YouTube的用戶可以上傳各種類型的視頻,包括音樂、教育、娛樂、游戲等多種主題。用戶可以在YouTube上創(chuàng)建自己的頻道或訂閱其他用戶的頻道,也可以點贊、評論和分享視頻。7.2.4?(短)視頻社交新潮流YouTube作為全球最大的視頻分享網站之一,既有短視頻資源,也有長視頻資源,用戶可以通過訂閱服務和搜索功能來獲取這些資源。用戶可以在主題分類列表中查找自己感興趣的其他用戶,找到感興趣的其他用戶后,點擊“訂閱”按鈕,YouTube會在用戶的首頁推送訂閱的視頻。點擊屏幕右上方的“放大鏡”即可打開YouTube的搜索框,用戶在搜索框中輸入想要搜索的內容即可得到大量相應的視頻資源。對于搜索結果,YouTube允許用戶通過過濾器來進行篩選,篩選條件包括排序依據、類型、上傳日期、時長等,如圖所示。搜索引擎7.2社交媒體7.3生成式人工智能工具7.17.3?生成式人工智能工具大語言模型是指通過海量文本數(shù)據訓練,擁有數(shù)百億甚至數(shù)千億個參數(shù)的語言模型。大語言模型通常使用深度學習技術,特別是使用深度神經網絡來學習和理解自然語言的規(guī)律。目前,大語言模型在處理文本生成、機器翻譯、文本分類等任務上表現(xiàn)出色。比如,OpenAI開發(fā)的著名大語言模型GPT(GenerativePre-trainedTransformer)系列,其中包括GPT-3(OpenAI的第三代大語言模型)、GPT-4。GPT-3擁有大約1750億個參數(shù),通過在大規(guī)模文本數(shù)據上進行預訓練,GPT-3有了強大的語言理解和生成能力,可以生成自然、連貫的文本,同時還能夠理解和執(zhí)行特定的自然語言任務,包括回答問題、寫文章、作詩、寫歌詞、生成計算機語言代碼等。7.3?生成式人工智能工具大語言模型的上述表現(xiàn)得益于近幾年相關技術上取得的突破式進展,大語言模型的參數(shù)量在短短幾年時間內呈指數(shù)增長趨勢。谷歌公司和OpenAI于2018年分別提出了BERT和GPT-1,其中GPT-1參數(shù)量僅為1.175億。早期探索階段030102OpenAI發(fā)布的GPT-2參數(shù)量達到了15億。2019年OpenAI發(fā)布了GPT-3,參數(shù)量達到了驚人的1750億,此時大語言模型已達到能力飛躍階段。到2020年7.3?生成式人工智能工具隨著大語言模型的參數(shù)量達到百億甚至千億級別,大語言模型也表現(xiàn)出了參數(shù)量小的模型中不存在的能力,稱為涌現(xiàn)能力,包括上下文學習(in-contextlearning)、指令遵循(instructionfollowing)和逐步推理(step-by_x0002_stepreasoning)。圖
大語言模型時間線7.3.1?具有代表性的大語言模型生成式預訓練模型系列是由OpenAI推出的一個大語言模型系列,采用了Transformer架構,其發(fā)展時間線如圖所示。GPT系列主要包括以下幾個模型。GPT系列大語言模型01是GPT的第一個版本,于2018年發(fā)布。GPT-1在生成文本方面表現(xiàn)出色,但相對于后續(xù)版本而言,其參數(shù)規(guī)模太小。GPT-1是GPT的第三個版本,于2020年發(fā)布。GPT-3是當時規(guī)模最大的語言模型,包含了1750億個參數(shù)。它在多個自然語言處理任務上展現(xiàn)了驚人的性能,包括文本生成、問答、翻譯等。GPT-32024年1月10日,隨著GPTStore的推出,用戶可以根據需要在GPTStore中選擇合適的應用安裝到GPT中,進一步擴展GPT的功能,定制專屬的、個性化的GPT。GPTStore是GPT的第二個版本,于2019年發(fā)布。GPT-2的規(guī)模比GPT-1的規(guī)模大得多,GPT-2模型參數(shù)量最高達到了15億。GPT-22023年發(fā)布的GPT-4在GPT-3的基礎上更進一步,作為一個多模態(tài)模型,用戶在使用GPT-4時,除了輸入文字外,還可以輸入圖片和視頻,GPT-4可以識別圖片與視頻中的內容并進行處理。GPT-47.3.1?具有代表性的大語言模型圖GPT系列大語言模型的發(fā)展時間線7.3.1?具有代表性的大語言模型作為人工智能研究領域的先行者,早在2017年,谷歌公司的團隊就發(fā)表了在人工智能發(fā)展史上具有里程碑意義的論文《注意力就是一切》(AttentionisAllYouNeed)。從2018年至今,基于不同的技術路線、目標和應用場景,谷歌陸續(xù)推出了多款大語言模型,包括BERT、T5、LaMDA、PaLM、PaLM2、Med-PaLM2以及Gemini等。谷歌大語言模型系列02LLaMA是MetaPlatforms于2023年2月推出的開源大語言模型,擁有650億個參數(shù)。盡管LLaMA的參數(shù)量沒有達到千億級別,但是其性能完全不遜色于千億級別的大語言模型。作為一個先進的軟件平臺,LLaMA允許用戶在大型數(shù)據集上訓練和部署模型,以縮短投放市場的時間并提高預測模型的準確性。LLaMA有多種版本,參數(shù)規(guī)模從70億到650億不等。這些模型在公開數(shù)據集上訓練,不使用任何定制數(shù)據集,保證了其工作可與開源兼容和可復現(xiàn)。LLaMA(LargeLanguageModelMetaAI)037.3.1?具有代表性的大語言模型文心一言(ERNIEBot)是百度公司研發(fā)的人工智能大語言模型。2023年8月31日,文心一言向全社會全面開放。文心一言不但支持人機對話、問題回答與創(chuàng)作協(xié)助,還能幫助用戶高效便捷地獲取信息。文心一言具備理解、生成、邏輯和記憶四大能力,主要表現(xiàn)為能聽懂潛臺詞、復雜句式、專業(yè)術語,能快速生成文本、代碼、圖片與視頻,能完成復雜的邏輯推理和數(shù)學計算,能記住用戶的指令,強大的功能使得文心一言擁有廣闊的應用前景。文心一言04圖
文心一言的五大應用場景7.3.1?具有代表性的大語言模型文心一言作為國內的大語言模型,國內用戶均可免費使用文心大模型3.5版本。具體用法如下:打開百度,單擊百度首頁左上角的“更多”,進入百度產品列表頁面,在新上線類別中即可找到文心一言。文心一言的使用很簡單,用戶只需要在屏幕底部的輸入框中輸入問題或者指令,文心一言就能將答案返回給用戶。對于前述GPT-3.5能完成的事項,包括回答問題、寫詩和寫代碼,文心一言都可以做到。7.3.2?人工智能搜索引擎從傳統(tǒng)的信息檢索來看,為了使檢索的過程順利,即文獻標識和信息提問者的問題對比進行得順利,兩者都需要用一定的語言(即檢索語言)來表達。檢索語言的主要作用就是把信息的存儲與檢索聯(lián)系起來,把標引人員與用戶聯(lián)系起來,以便共同理解、實現(xiàn)交流。信息檢索語言是人們在加工、存儲和檢索信息時用來描述信息內容和信息需求的詞匯、符號及使用規(guī)則構成的供標引和檢索的工具。7.3.2?人工智能搜索引擎Copilot是由微軟公司開發(fā)的基于MicrosoftPrometheus模型的生成式人工智能聊天機器人,于2023年作為必應搜索引擎和Edge瀏覽器的內置功能推出(原名BingChat)。應用廣泛的Copilot01BraveSearch是以保護隱私、索引獨立、自定義功能為特色的熱門AI搜索引擎。其優(yōu)勢有3點。擁有獨立索引的私密搜索引擎BraveSearch02提供了強大的個性化功能?!白o目鏡”(Goggles)功能允許用戶選擇個性化的檢索規(guī)則,如用戶可以根據自身需求編輯、提交新的檢索規(guī)則。其三構建了獨立的搜索索引。不依賴于谷歌公司、微軟公司等大型網絡公司,而是基于更多以“私密”“中立”著稱的搜索引擎,以此淡化數(shù)據源的偏見與受審查的風險。其二保護用戶隱私。承諾遵守隱私至上的核心原則,決不會收集用戶搜索和點擊的內容。其一7.3.2?人工智能搜索引擎PerplexityAI是一款新興的人工智能搜索引擎,由OpenAI前研究科學家阿拉文德·斯里尼瓦斯(AravindSrinivas)和幾位合伙人共同創(chuàng)辦。PerplexityAI的功能與Copilot類似,同樣是問答式的AI搜索引擎,其可以從各大網絡平臺檢索用戶問題的答案??梢灾付〝?shù)據源的PerplexityAI03Y是一款新興AI搜索引擎,其創(chuàng)始人理查德·索赫爾(RichardSocher)和布賴恩·麥卡恩(BryanMcCann)均是美國Salesforce公司的前首席科學家,其中,前者是自然語言處理領域排名全球第四的高被引學者,2023年被全球知名的《時代》(TIME)雜志評為“人工智能領域最具影響力的100位人物”(TIME100AI)。關注用戶隱私的Y047.3.2?人工智能搜索引擎除了能夠實時訪問互聯(lián)網外,Y的最大特色在于承諾保障個人隱私,認為“隱私是技術和人工智能未來的基礎”,承諾比著名的私密搜索引擎DuckDuckGo更私密。為此,Y實施了系列保障措施。在公司運營過程中阻斷合作伙伴或廣告商與用戶之間的數(shù)據流通。第三開發(fā)私人和個人兩種互補的操作模式。期待個性化搜索體驗的用戶選擇個人模式,平臺則僅收集少量、必要的數(shù)據以改進產品個性化功能,并承諾不會與其他人共享數(shù)據;期待私密搜索體驗的用戶選擇私人模式,平臺則不收集和共享任何數(shù)據。第一提供零跟蹤私密模式。即不存儲查詢數(shù)據、不記錄網站互動,用戶查詢均來自平臺服務器的IP地址,禁用需要用戶IP地址或位置的應用程序。第二與其他行業(yè)組織共同簽署“寶騰隱私承諾”(Proton’sPrivacyPledge),遵循系列隱私保護原則第四7.3.2?人工智能搜索引擎Consensus是基于SemanticScholar數(shù)據庫所有研究領域的2000多萬篇論文構建的人工智能驅動的學術搜索引擎,且每月更新一次數(shù)據集。它摒棄了傳統(tǒng)學術數(shù)據庫的煩瑣檢索步驟,允許用戶使用自然語言檢索問題,降低了普通用戶獲取學術信息資源的專業(yè)門檻。檢索結果嚴謹可靠是Consensus的顯著特色。人工智能學術搜索引擎Consensus05其一數(shù)據來源可靠。與綜合性AI搜索引擎不同,Consensus的數(shù)據來源是依據可靠、結論可信的科學文獻,有效地避免了人工智能“幻覺”(Hallucination)產生的概率。其二全面展示檢索結果。用戶在輸入框中輸入問題后,Consensus在生成總結性結論的同時,還會提供支持、中立、反對該結論的論文占比,并提供相應的文獻來源及其期刊影響力、論文被引量、發(fā)表時間等系列信息,幫助用戶判斷檢索結果的可靠性。其三用戶可以通過限制文獻的出版時間、開放獲取、被引量、研究方法、期刊分區(qū)、研究領域來進一步提升檢索結果與問題的相關程度。7.3.2?人工智能搜索引擎GlobeExplorer是一款結合AI技術、搜索引擎功能、百科全書式展示的信息檢索工具。其顯著特色是使用大語言模型對用戶檢索需求進行廣泛主題的詳盡回應;以思維導圖可視化形式展示檢索結果,邏輯性強、便于用戶瀏覽。思維導圖式檢索GlobeExplorer06正如RewindAI的名字“倒帶AI”,該工具記錄用戶在計算機或手機上所做的一切操作,并提供參與會議、瀏覽網站、輸入信息、點擊按鈕……所有內容的時間表。RewindAI即可幫助用戶快速檢索任何在手機或電腦上聽到和看到過的內容,并進行跨平臺的梳理與整合。該工具幫助用戶應對信息過載的挑戰(zhàn)、快速整理個人檔案、利用數(shù)字技術增強記憶力;同時,它強調用戶的屏幕和音頻信息均存儲在本地,用戶可以控制系統(tǒng)權限、加密或刪除信息。個人信息搜索助手RewindAI077.3.3?人工智能圖像工具人工智能圖像工具則借助機器學習、深度學習和計算機視覺技術,使圖像的生成、編輯、修復、識別和分析變得更加智能和自動化。這些工具能夠理解和解析圖像中的內容,進行圖像識別、圖像修復、風格轉換、對象檢測、圖像增強等多種復雜任務,甚至能夠自動生成逼真的圖像或視頻內容。人工智能圖像工具的應用已經滲透到多個行業(yè)領域,如廣告設計、醫(yī)療影像、自動駕駛、娛樂等,這些工具不僅降低了用戶操作的門檻,還大幅增加了圖像應用的可能性。例如,OpenAI推出的DALL·E圖像生成模型可以根據文本描述生成逼真的圖像,百度公司、阿里巴巴集團控股有限公司(以下簡稱“阿里巴巴集團”)等公司也紛紛推出自己的AI圖像工具,推動了圖像處理的智能化升級。7.3.3?人工智能圖像工具
文心一格是百度公司于2023年推出的AI圖像生成工具,由李彥宏團隊開發(fā)。它可以通過用戶輸入的文字生成高質量圖像,幫助內容創(chuàng)作者和設計師高效完成視覺創(chuàng)作。文心一格名稱的寓意是通過文字生成獨特風格的藝術作品,定位于智能圖像生成和創(chuàng)意設計輔助,旨在為用戶提供便捷的創(chuàng)作解決方案。文心一格的獨特之處在于它基于百度公司自研的文心大模型,能夠結合中文語境,且獲取和使用過程都較為簡單方便,具有較強的易用性以及對中文用戶的友好度高。文心一格支持AI圖片創(chuàng)作和AI圖片編輯。在“AI創(chuàng)作”板塊,用戶可選擇生成商品圖、藝術字、海報等圖片類型,也可以自定義提示詞,選擇畫風、圖像比例、生成數(shù)量和上傳參考圖等。(1)簡單易用的文心一格7.3.3?人工智能圖像工具在“AI編輯”板塊,我們可以進行圖片擴展、調整圖片的尺寸和清晰度、涂抹消除、智能摳圖、圖片疊加等操作,如圖所示。7.3.3?人工智能圖像工具
即夢AI是由抖音公司旗下的剪映團隊推出的一款生成式人工智能圖片創(chuàng)作和繪畫工具,旨在幫助用戶快速將創(chuàng)意和想法轉化為圖像。該工具特別適合抖音的圖文和短視頻創(chuàng)作者進行內容創(chuàng)作,并且支持多種風格的圖像生成,包括動漫、寫實、攝影和插畫等。即夢AI提供的豐富素材庫有多種類型,這些素材庫能夠幫助用戶提高創(chuàng)作效率,如圖所示。(2)風格多變的即夢AI7.3.3?人工智能圖像工具7.3.3?人工智能圖像工具
Midjourney是一個充滿創(chuàng)意和可能性的AI繪畫工具,它操作簡單,卻擁有強大的功能。無論你是藝術家、設計師,還是僅僅喜歡創(chuàng)造視覺內容的普通用戶,Midjourney都能幫助你輕松生成驚艷的圖像。與傳統(tǒng)的圖像生成軟件不同,Midjourney并不需要下載安裝到本地,它是通過Discord這個平臺來進行操作的。用戶只需在Discord中與Midjourney的AI機器人進行互動,就可以快速生成各種風格的圖片。用戶注冊Discord賬號后即可訪問Midjourney官網,為了更方便管理和生成圖像,用戶可以先單擊左側欄的“+”按鈕創(chuàng)建一個屬于自己的服務器,這個服務器是用戶私人使用的空間,所有生成的圖片都不會被其他用戶看到。Midjourney不僅支持文圖的互相轉換,還可以通過上傳圖片生成新的圖片。用戶可以上傳一張圖片,讓Midjourney根據該圖片重新繪制或者添加風格。(3)性能極強且無須本地部署的Midjourney7.3.3?人工智能圖像工具(4)免費開源的StableDiffusionStableDiffusion的優(yōu)點在于其開源性和高自由度,用戶可以自行下載和定制模型,支持本地運行,生成圖像的效果也相當精細,尤其適合對圖像創(chuàng)作有較高要求的用戶。缺點則在于它的學習曲線較陡,對于初學者來說,其界面和功能較為復雜,需要一定的時間掌握。同時,它對硬件要求較高,特別是在生成高分辨率和精細圖像時,可能會消耗大量的計算資源。StableDiffusion是StabilityAI開發(fā)的開源圖像生成模型,它通過深度學習和擴散模型技術,能夠根據文本描述生成高質量的圖像。StableDiffusion的核心功能包括圖像生成、風格轉換、圖像修復等,支持用戶輸入簡單的文本提示,能快速生成逼真的圖像或藝術作品。它的最大特色在于開源特性,使得開發(fā)者和用戶可以自由下載、修改和部署該模型,并且能夠在本地運行,打破了對云端平臺的依賴。7.3.3?人工智能圖像工具(5)自然語言精準生成的DALL·E3DALL·E3是由OpenAI開發(fā)的最新一代文本生成圖像模型,其核心功能是通過輸入自然語言描述來生成圖像。相比前代版本,DALL·E3在理解文本提示方面更加精準,生成的圖像在細節(jié)和美學上更加逼真、更加生動,尤其在人臉、手部等細節(jié)上表現(xiàn)出色。BingChat和ChatGPT均提供了簡單的用戶界面,我們只需要輸入提示詞即可開始生成圖像,不需要復雜的硬件和指令。7.3.4?人工智能語音處理人工智能語音工具則通過機器學習、深度學習和自然語言處理技術,使語音的識別、合成、轉換、分析等任務變得更加智能化和自動化。這些工具能夠理解和解析語音內容,完成語音識別、語音合成、語音翻譯、情感分析等多項復雜任務,甚至可以根據文本自動生成自然流暢的語音內容。人工智能語音工具的應用已經廣泛滲透到多個行業(yè)領域,如智能助手、教育、醫(yī)療、娛樂等,不僅降低了操作門檻,還極大地擴展了語音技術的應用范圍。7.3.4?人工智能語音處理AudioGPT是一個突破性的多模態(tài)人工智能系統(tǒng),專注于音頻處理,由浙江大學、北京大學、卡內基梅隆大學和中國人民大學的研究人員共同開發(fā)。AudioGPT的核心特色在于其多模態(tài)處理能力和強大的語音生成與理解功能。該系統(tǒng)的架構分為4個階段:模態(tài)轉換、任務分析、模型分配和響應生成。AudioGPT還支持音頻修復、語音識別、語音分離、語音增強、歌聲合成、音頻字幕生成等任務,使得其在語音和音頻處理上表現(xiàn)得極為多樣和靈活。AudioGPT還可以生成音頻的描述,識別音頻中的事件并標注時間點。這些強大的功能使AudioGPT在音頻生成與處理領域展現(xiàn)出極強的實用性和靈活性。AudioGPT的一個突出優(yōu)勢在于其與ChatGPT的結合,依托ChatGPT強大的語言理解和生成能力,AudioGPT能夠在復雜音頻任務的處理過程中,保持對話的連貫性和對上下文的理解,這使得用戶在進行多輪音頻交互時能夠得到更加一致和穩(wěn)定的反饋。(1)GPT音頻專家AudioGPT7.3.4?人工智能語音處理ChatTTS是一款由2noise團隊開發(fā)的創(chuàng)新型文本轉語音工具,專為應對對話場景中的語音合成需求而設計。它基于大規(guī)模的中文和英文語料庫進行深度學習訓練,結合最先進的自然語言處理技術,能夠生成接近人類自然語音的合成語音,具備極高的流暢度和極強的情感表現(xiàn)力。ChatTTS的核心特色主要集中在3個方面。(2)自然流暢的“情感大師”ChatTTS首先,它的語音自然度極高,得益于數(shù)十萬小時的中英文數(shù)據訓練,hatTTS可以準確生成帶有豐富情感和韻律的語音,而不像傳統(tǒng)的TTS(TextToSpeech,從文本到語音)系統(tǒng)那樣單調和生硬。其次,它在多語言支持方面表現(xiàn)突出,能夠在中文和英文之間無縫切換,并且在使用這兩種語言時的表現(xiàn)都非常出色。最后,ChatTTS強大的對話能力使其特別適合與大語言模型結合,能夠支持智能對話、語音導航、語音對話生成等復雜應用場景。2.1.9?算法時代的算法素養(yǎng)Descript是一款基于AI技術的音視頻編輯工具,它大大降低了音視頻創(chuàng)作的復雜性,使得用戶可以像編輯文本文檔一樣輕松地編輯音頻和視頻。這款工具由安德魯·梅森(AndrewMason)于2017年創(chuàng)立。梅森之前是Groupon的聯(lián)合創(chuàng)始人和首席執(zhí)行官,在離開Groupon后,梅森創(chuàng)立了一家語音導游應用公司Detour,Descript最初作為Detour的內部工具,用于簡化音頻編輯過程,后來被獨立出來,成立了一家新的公司。Descript的最大特點是它獨特的音視頻編輯方式。傳統(tǒng)的音視頻編輯軟件需要用戶通過復雜的時間線和多軌道來進行編輯,而Descript則將這一過程簡化為類似于文本文檔的編輯方式。Descript的主要功能包括轉錄、屏幕錄制以及音視頻編輯。Descript還能夠自動識別和分離不同的說話人,幫助用戶有效處理多方對話內容。Descript還支持自動檢測并刪除語氣詞以及一鍵縮短句間的停頓時間,這些功能使音視頻編輯變得更加簡捷流暢,極大地提高了工作效率。(3)用“文檔”編輯音視頻的Descript2.1.9?算法時代的算法素養(yǎng)ElevenLabs是一家專注于語音合成技術的AI初創(chuàng)公司,成立于2022年,由皮奧特·達布科夫斯基(PiotrDabkowski)和馬蒂·斯坦尼謝夫斯基(MatiStaniszewski)創(chuàng)立。這家公司致力于通過AI技術開發(fā)逼真的語音生成工具,消除語言障礙,增強內容的可訪問性和提高用戶體驗。ElevenLabs的產品自推出以來迅速獲得了市場關注,特別是在視頻配音、音頻生成,以及多語言支持等領域表現(xiàn)突出。ElevenLabs的特色功能之一是語
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 智能家居系統(tǒng)物聯(lián)網集成技術發(fā)展趨勢與市場前景分析報告2025
- 城市軌道交通站點調整對2025年周邊社區(qū)交通擁堵風險分析報告
- 家庭教育指導服務行業(yè)供需結構優(yōu)化與市場競爭力分析報告:2025年市場洞察
- 滌綸彈力布項目投資可行性研究分析報告(2024-2030版)
- 杭州尚藝智能家具有限公司介紹企業(yè)發(fā)展分析報告
- 中國清洗保潔服務行業(yè)市場前景預測及投資價值評估分析報告
- 遼寧租賃合同(6篇)
- 有關二手房買賣合同范文匯編(16篇)
- 貸款合同樣本
- 專利技術合同模板集錦(20篇)
- 加裝電梯項目安全、文明施工措施
- 《健康體檢介紹》課件
- 項目驗收意見書
- 交通運輸?shù)墓?jié)能與環(huán)保措施
- 游艇會服務流程
- 高壓帶電顯示器說明書全解
- 數(shù)據中心基礎設施管理系統(tǒng)DCIM技術方案
- 企業(yè)網絡安全與數(shù)據保護策略
- 2024屆高考英語語法填空專項課件
- 第五課滴答滴答下雨了課件
- 新教師崗前培訓講座中小學教學常規(guī)PPT
評論
0/150
提交評論