




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
新媒體篇第十章機器新聞寫作第十章機器新聞寫作新媒體篇本章學(xué)習(xí)要點數(shù)據(jù)新聞的概念及特點數(shù)據(jù)新聞興起的背景數(shù)據(jù)新聞的制作技巧數(shù)據(jù)新聞制作的一般流程第十章機器新聞寫作第一節(jié)機器新聞寫作概述一、機器新聞寫作的界定二、機器新聞寫作的發(fā)展歷程新媒體篇第一節(jié)機器新聞寫作概述一、機器新聞寫作的界定“機器新聞寫作”作為人工智能技術(shù)運用于新聞實踐領(lǐng)域的代表性產(chǎn)物,又稱算法新聞、計算新聞、自動化新聞等。最早誕生于美國,指“運用算法對輸入或收集的數(shù)據(jù)進行加工處理,從而自動生成新聞稿件的計算機程序,其最大的特征就是新聞生產(chǎn)的自動化”。第十章第一節(jié)機器新聞寫作概述二、機器新聞寫作的發(fā)展歷程2001年,谷歌推出個性化新聞推薦,開啟了機器選編新聞的歷史,也成為了機器新聞寫作的起點。2006年3月,美國信息供應(yīng)商湯姆森公司運用電腦程序?qū)崿F(xiàn)了經(jīng)濟和金融方面新聞稿件的自動生成。2007年,美聯(lián)社應(yīng)用新聞編寫軟件Wordsmith,輸入數(shù)據(jù)后自動生成報道。2009年,美國西北大學(xué)智能信息實驗室研發(fā)并推出了一款名為“統(tǒng)計猴”(StatsMonkey)的軟件。作為世界上最早操作新聞的人工智能軟件,該軟件能對棒球比賽中選手、比賽得分和獲勝率等數(shù)據(jù)進行抓取和篩選,并在12秒內(nèi)自動生成一篇完整的報道。第十章第一節(jié)機器新聞寫作概述二、機器新聞寫作的發(fā)展歷程2010年,位于美國芝加哥的“敘事科學(xué)”公司開發(fā)出一款名為Quill的自動寫作軟件,它可以將數(shù)字轉(zhuǎn)化為有結(jié)構(gòu)的描述性文字。Quill的工作從早期的自行生成新聞標題,到編寫體育賽事新聞以及撰寫基金業(yè)績報告,不僅受到諸如《福布斯》、《財富》、瑞士信貸、USAA等知名企業(yè)客戶的肯定,更獲得美國情報機構(gòu)的青睞,為其生成大量的文字報告。第十章第一節(jié)機器新聞寫作概述二、機器新聞寫作的發(fā)展歷程第十章2014年7月,美聯(lián)社與AutomatedInsights(AI)公司共同研發(fā)出Wordsmith自動寫作程序,Wordsmith主要被用來撰寫企業(yè)財報新聞,其AI系統(tǒng)在上市公司公布業(yè)績后僅0.3秒就可以發(fā)布一篇盈利報道。2015年,除了美聯(lián)社的Wordsmith,《紐約時報》Blossom、《華盛頓郵報》TruthTeller、《洛杉磯時報》智能內(nèi)嵌模版、英國《衛(wèi)報》Open001、路透社的OpenCalais等國際頂級媒體都分別擁有了各自的機器人服務(wù)系統(tǒng)。美國時間2014年3月17日早上6時25分,洛杉磯發(fā)生地震,《洛杉磯時報》在地震發(fā)生3分鐘后在其網(wǎng)站上發(fā)布了第一條新聞,是所有新聞媒體中最先發(fā)布的突發(fā)新聞報道,而這條新聞是新聞寫作機器人Quakebot撰寫的。該條機器新聞的文本如下:根據(jù)美國地質(zhì)勘探局的消息,星期一早上,在距加州韋斯特伍德約5英里地區(qū),發(fā)生了震級為4.7級的淺表地震。地震發(fā)生時間是太平洋時間早上6時25分,震中約深5英里。據(jù)地質(zhì)勘探局的數(shù)據(jù),本次地震震中距離加州貝弗利山莊約6英里,距離加州環(huán)球影城約7英里,距離加州SantaMonica約7英里,距離加州Sacramento約348英里。在過去10天,在該地區(qū)附近,并無監(jiān)測到任何震級達到或超過3.0級的地震。
第一節(jié)機器新聞寫作概述二、機器新聞寫作的發(fā)展歷程2015年8月,騰訊率先推出了寫作機器人“Dreamwriter”。這位由騰訊財經(jīng)研發(fā)的新聞寫作機器人,能夠根據(jù)算法在第一時間自動生成稿件,瞬時輸出分析和研判。2015年11月7日,新華社的第一位機器人記者“快筆小新”正式上線?!翱旃P小新”可以勝任中英文體育賽事稿件和財經(jīng)信息稿件的撰寫工作,從簡單的報盤信息到較為復(fù)雜的公司財報,再到行情快訊,“快筆小新”都能得心應(yīng)手。2016年里約奧運會期間,今日頭條研發(fā)的新聞寫作機器人Xiaomingbot在奧運賽事報道中大放異彩,在比賽結(jié)束2秒內(nèi)就完成了賽事報道的創(chuàng)作、審核和分發(fā),幾乎與電視直播保持了同步。整個里約奧運會期間,Xiaomingbot撰寫了四百多篇新聞稿,贏得了一百多萬的閱讀量。第十章第十章機器新聞寫作第二節(jié)機器新聞寫作優(yōu)勢一、全時段極速出稿二、報道更加準確客觀三、內(nèi)容可實現(xiàn)私人定制新媒體篇第二節(jié)機器新聞寫作優(yōu)勢一、全時段極速出稿在大數(shù)據(jù)時代,大量信息經(jīng)由網(wǎng)絡(luò)分發(fā),媒體獲取信息更加便捷的同時操作難度反而增加了,媒體間的競爭轉(zhuǎn)變?yōu)楦咝У匕l(fā)現(xiàn)數(shù)據(jù)、處理分析數(shù)據(jù)、撰寫稿件和實時分發(fā)。2017年8月8日21時19分,四川九寨溝縣發(fā)生7.0級地震,21時37分中國地震臺網(wǎng)機器人迅速自動編寫了稿件《四川阿壩州九寨溝縣發(fā)生7.0級地震》。這篇報道全文540字并配發(fā)4張圖片,內(nèi)容包括速報參數(shù)、震中地形、熱力人口、周邊村鎮(zhèn)、周邊縣區(qū)、歷史地震、震中簡介、震中天氣八大項,成稿時間只用了25秒,展現(xiàn)了機器人極速出稿的特點。第十章第二節(jié)機器新聞寫作優(yōu)勢第十章第二節(jié)機器新聞寫作優(yōu)勢二、報道更加準確客觀大數(shù)據(jù)技術(shù)的應(yīng)用幫助機器新聞寫作能夠在海量信息中快速捕捉到新聞線索,并根據(jù)預(yù)設(shè)精準地抓取報道所需數(shù)據(jù),最后通過預(yù)設(shè)程序?qū)λ@數(shù)據(jù)進行處理并生成文本。機器新聞寫作有效避免了個人因素、環(huán)節(jié)復(fù)雜等問題,在不出現(xiàn)預(yù)設(shè)程序、網(wǎng)絡(luò)數(shù)據(jù)錯誤以及人為干擾的情況下,其準確性遠遠高于一般記者。機器本身不具備感情,在寫作過程所考慮的因素簡單而純粹,即新聞事件是否符合預(yù)設(shè)條件和所收集數(shù)據(jù)能否按照預(yù)設(shè)輸出文本,因此,在預(yù)設(shè)程序設(shè)定后,機器能最大限度地避免外界因素的干擾,確保了對新聞準確性、客觀性的追求。第十章第二節(jié)機器新聞寫作優(yōu)勢巴特勒37分,森林狼艱難戰(zhàn)勝開拓者北京時間2017年12月19日09:00,森林狼主場迎來開拓者的挑戰(zhàn)。最終,開拓者以107比108無奈敗給森林狼。巴特勒37分6籃板4助攻,利拉德17分8籃板13助攻6失誤。比賽開始,雙方一直緊咬比分,首節(jié)結(jié)束雙方仍難分勝負。第二節(jié),森林狼不敵開拓者,單節(jié)落后3分。半場結(jié)束,開拓者以54-51領(lǐng)先。易邊再戰(zhàn),開拓者戰(zhàn)勝,單節(jié)取得6分的優(yōu)勢。三節(jié)結(jié)束時,開拓者領(lǐng)先森林狼9分。最后一節(jié),森林狼逆轉(zhuǎn)頹勢,獲得勝利。本場比賽十分精彩,森林狼5人得分上雙,開拓者6人得分上雙。利拉德在比賽中狀況頻發(fā),失誤6次。森林狼數(shù)據(jù):巴特勒:37分6籃板4助攻;克勞福德:23分1籃板2助攻1失誤;唐斯:16分8籃板4助攻4失誤;蒂格:13分3籃板5助攻3失誤;吉布森:10分4籃板1助攻2失誤。開拓者數(shù)據(jù):利拉德:17分8籃板13助攻6失誤;努爾基奇:20分7籃板1助攻2失誤;麥科勒姆:20分2籃板4助攻2失誤;納皮爾:15分1籃板1失誤;阿米努:13分6籃板1失誤??梢园l(fā)現(xiàn),文稿中Xiaomingbot站位中立,未曾偏向任何一方,很好地保證了新聞的客觀性。此外,這篇報道語言簡明扼要,在總結(jié)概括比賽過程的同時,更注意將讀者所關(guān)心的球員和數(shù)據(jù)呈現(xiàn)了出來,可謂準確、簡潔且直觀。第十章第二節(jié)機器新聞寫作優(yōu)勢三、內(nèi)容可實現(xiàn)私人定制機器新聞寫作24小時極速出稿的工作模式使它能夠生產(chǎn)全面、海量的新聞報道。這就使得機器新聞寫作生產(chǎn)的稿件具備了實現(xiàn)精準完備的個性化定制服務(wù)的可能。騰訊公司Dreamwriter財經(jīng)+科技應(yīng)用的發(fā)稿量超過2000篇/天,體育稿量500篇/天,包括每天行情報盤、上市公司公告精要報道,以及體育賽事每輪每場的消息。奧運會期間,Dreamwriter產(chǎn)出內(nèi)容達3600余篇,其中第一塊金牌的新聞就是機器人寫的。第十章第十章機器新聞寫作第三節(jié)機器新聞寫作流程分解一、人工設(shè)計環(huán)節(jié)二、機器運行環(huán)節(jié)新媒體篇第三節(jié)機器新聞寫作流程分解一、人工設(shè)計環(huán)節(jié)(一)人工設(shè)計的五個步驟人工設(shè)計,顧名思義,就是媒體從業(yè)人員和技術(shù)人員根據(jù)自身的知識儲備對機器新聞寫作程序進行設(shè)計并實現(xiàn)的過程。一般來說可以大體分解為“初設(shè)-試運行-調(diào)試-正式運行-修復(fù)和升級”五個步驟。在實際操作過程中,各個環(huán)節(jié)可能出現(xiàn)一次甚至多次反復(fù),但基本遵循這樣的先后順序進行。第十章第三節(jié)機器新聞寫作流程分解(二)人工設(shè)計的基本思路一是利用結(jié)構(gòu)化數(shù)據(jù)生成稿件。在掌握大量整合好、便于計算機讀取的結(jié)構(gòu)化數(shù)據(jù)的基礎(chǔ)上,參照行業(yè)專家提供的計算公式、判別規(guī)則,在預(yù)先設(shè)置的新聞模板中生成新聞稿件,這種方式主要用于財經(jīng)報道、體育報道和醫(yī)療衛(wèi)生報道等。二是在挖掘用戶數(shù)據(jù)的基礎(chǔ)上生成個性化稿件。對用戶的閱讀內(nèi)容、閱讀習(xí)慣等進行分析、挖掘,或者根據(jù)受眾自定義的標簽,將同一內(nèi)容的信息整合成多篇角度不同、風(fēng)格迥異的稿件,為用戶推送個性化產(chǎn)品,增強用戶黏性。三是利用記者數(shù)據(jù)模型智能化生成稿件。將采集到的文字、圖片、語音、視頻等素材以及其他背景資料,與某個記者的數(shù)據(jù)模型相結(jié)合,通過軟件運算自動生成符合該記者風(fēng)格的稿件。目前使用較為廣泛是第一種思路,也是最具意義和高效的新聞稿件生成思路。第十章第三節(jié)機器新聞寫作流程分解二、機器運行環(huán)節(jié)在程序預(yù)設(shè)完成后,機器新聞寫作的基本流程數(shù)據(jù)搜集和整理新聞評定報道輸出審核推送第十章本章小結(jié)機器新聞寫作作為智媒時代下計算機技術(shù)與自動化技術(shù)應(yīng)用于新聞生產(chǎn)領(lǐng)域的產(chǎn)物,具有全時段極速出稿、報道更加準確客觀、內(nèi)容可實現(xiàn)私人定制等優(yōu)勢。其工作流程可以分為人工設(shè)計和機器運行兩個環(huán)節(jié),其中,人工設(shè)計環(huán)節(jié)又可分為“初設(shè)-試運行-調(diào)試-正式運行-修復(fù)和升級”五個步驟;而機器運行環(huán)節(jié)可分為“數(shù)據(jù)搜集和整理、新聞評定、報道輸出、審核推送”四個步驟。對機器新聞寫作一般工作流程的了解,有利于我們理解它是如何實現(xiàn)“成稿速度快、寫作樣式豐富、自動調(diào)整稿件語氣、自行完
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大連醫(yī)科大學(xué)《皮革整飾化學(xué)與工藝學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 浙江藥科職業(yè)大學(xué)《學(xué)前兒童衛(wèi)生學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 天津醫(yī)學(xué)高等??茖W(xué)校《中醫(yī)基礎(chǔ)理論》2023-2024學(xué)年第二學(xué)期期末試卷
- 衡陽師范學(xué)院南岳學(xué)院《信號與系統(tǒng)綜合實踐》2023-2024學(xué)年第二學(xué)期期末試卷
- 工程竣工驗收報告防腐涂料質(zhì)量評估
- 針對進口商品各種情況調(diào)查
- 2025年中國醫(yī)藥市場分析:規(guī)模突破4萬億元 基因藥物增速領(lǐng)跑行業(yè)
- 深溝槽專項施工方案
- 湖南省株洲市淥口區(qū)第三中學(xué)、株洲健坤瀟湘高級中學(xué)2024-2025學(xué)年高二上學(xué)期1月期末聯(lián)考數(shù)學(xué)試題(解析版)
- 成渝經(jīng)濟圈名校聯(lián)盟2024-2025學(xué)年高三上學(xué)期第一次聯(lián)考數(shù)學(xué)試題(解析版)
- 中小學(xué)勞動教育實踐指導(dǎo)手冊
- 基于語文核心素養(yǎng)的初中語文綜合性學(xué)習(xí)教學(xué)策略研究
- 高血壓員工免責(zé)協(xié)議范本
- 工藝部述職報告
- 供貨交貨進度計劃及保證措施
- 第17課《學(xué)習(xí)中的煩心事》課件
- 規(guī)劃選址及用地預(yù)審流程
- 關(guān)于衛(wèi)健系統(tǒng)工作調(diào)研報告
- 烯烴習(xí)題參考答案
- 2023-2024學(xué)年山東省淄博市高青縣七年級下學(xué)期期中考試英語試題 (含答案)
- 各國鋼材牌號對照大全
評論
0/150
提交評論