基于«中國(guó)日?qǐng)?bào)»(2019~2021)的安徽形象語(yǔ)料庫(kù)建設(shè)_第1頁(yè)
基于«中國(guó)日?qǐng)?bào)»(2019~2021)的安徽形象語(yǔ)料庫(kù)建設(shè)_第2頁(yè)
基于«中國(guó)日?qǐng)?bào)»(2019~2021)的安徽形象語(yǔ)料庫(kù)建設(shè)_第3頁(yè)
基于«中國(guó)日?qǐng)?bào)»(2019~2021)的安徽形象語(yǔ)料庫(kù)建設(shè)_第4頁(yè)
基于«中國(guó)日?qǐng)?bào)»(2019~2021)的安徽形象語(yǔ)料庫(kù)建設(shè)_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

一、引言(一)研究背景改革開(kāi)放以來(lái),中國(guó)各省迅速發(fā)展,區(qū)域形象的塑造與推廣成為軟實(shí)力的主要表現(xiàn),如何調(diào)動(dòng)各方力量塑造區(qū)域形象成為發(fā)展的題中要義。軟實(shí)力愈來(lái)愈多地被用于吸引投資和人才,優(yōu)良的區(qū)域形象在經(jīng)濟(jì)發(fā)展和區(qū)域?qū)ν饨涣髦腥找骊P(guān)鍵。安徽具備南北特性,由于其特殊的區(qū)域位置,安徽在全國(guó)發(fā)展中起到承前啟后、承東啟西的功效。此外,隨著社會(huì)經(jīng)濟(jì)的迅速發(fā)展,智能化和城市化的快速推進(jìn),以及中部崛起等有關(guān)規(guī)劃的適用,安徽經(jīng)濟(jì)慢慢踏入快車(chē)道。但是,因?yàn)橘Y源等因素的限定,安徽社會(huì)經(jīng)濟(jì)發(fā)展面臨一些問(wèn)題,與東部地區(qū)尤其是附近省份的差別持續(xù)拉大。要引進(jìn)外資,得到發(fā)展機(jī)會(huì),區(qū)域形象建設(shè)至關(guān)重要。掌握安徽形象的現(xiàn)況,找到安徽形象存在的不足,明確其形象定位,對(duì)安徽的發(fā)展具有重要的意義。本研究即以此為背景,探討基于?中國(guó)日?qǐng)?bào)?的安徽形象語(yǔ)料庫(kù)建設(shè),通過(guò)對(duì)新媒體信息的整理,實(shí)現(xiàn)對(duì)信息資源的歷時(shí)呈現(xiàn),不僅可以用于話語(yǔ)分析,更是對(duì)語(yǔ)言學(xué)和傳播學(xué)信息資源的重要補(bǔ)充。(二)研究方法本研究將采用文獻(xiàn)法、語(yǔ)料庫(kù)方法和人工輔助法。其一,文獻(xiàn)研究法:通過(guò)閱讀大量有關(guān)參考文獻(xiàn),全方位準(zhǔn)確地掌握海外語(yǔ)料庫(kù)的發(fā)展趨勢(shì)和中國(guó)語(yǔ)料庫(kù)的成效,參照諸多學(xué)者的研究成果,包含基本思路、研究思路和研究成果,將適合語(yǔ)料庫(kù)基本建設(shè)的一部分消化吸收,運(yùn)用到本文章的創(chuàng)作中。其二,語(yǔ)料庫(kù)方法:收集2019~2021年度?中國(guó)日?qǐng)?bào)?有關(guān)安徽的新聞文本,通過(guò)Python根據(jù)關(guān)鍵詞“安徽”搜集網(wǎng)站上相關(guān)語(yǔ)料,然后進(jìn)行語(yǔ)料清洗,從而構(gòu)建單語(yǔ)語(yǔ)料庫(kù)。其三,人工輔助方法:在語(yǔ)料清洗過(guò)程中,需要清洗相應(yīng)圖片、多余的標(biāo)點(diǎn)符號(hào)等,從而確保語(yǔ)料庫(kù)的質(zhì)量。二、文獻(xiàn)綜述與本選題有關(guān)的研究主要包括安徽形象研究、語(yǔ)料庫(kù)語(yǔ)言學(xué)研究及基于語(yǔ)料庫(kù)的安徽形象研究,下文分別對(duì)這三方面展開(kāi)概述。(一)安徽形象研究形象就是指“對(duì)某事情的意志、觀念和印象”。并不是事物自身,只是對(duì)物體的感知或觀點(diǎn)。這是一種主觀性印象,由傳播學(xué)、交往經(jīng)歷、成長(zhǎng)經(jīng)歷、自然環(huán)境等要素建立[1]。因而,安徽品牌形象可被理解為中國(guó)群眾對(duì)安徽的印象,是對(duì)安徽本質(zhì)整體實(shí)力、外在魅力和未來(lái)發(fā)展前景的實(shí)際感知、整體觀點(diǎn)和綜合考核[2]。隨著安徽經(jīng)濟(jì)逐步發(fā)展,越來(lái)越多的學(xué)者對(duì)安徽形象進(jìn)行了研究。錢(qián)智和徐俊結(jié)合思維科學(xué)、行為科學(xué)、區(qū)域規(guī)劃等學(xué)科的相關(guān)理論,以安徽形象設(shè)計(jì)為例,提出了區(qū)域形象設(shè)計(jì)概念、基本思想以及操作框架[3];楊杰、吳克明運(yùn)用“安徽形象評(píng)價(jià)量表”進(jìn)行調(diào)查,針對(duì)安徽形象就人口素養(yǎng)、自然環(huán)境及政府治理提出改進(jìn)措施[4];李彥迪、劉葉青、鄒菲菲等就安徽省外宣文本,在語(yǔ)域理論視角下對(duì)安徽形象進(jìn)行建構(gòu)[5]。(二)語(yǔ)料庫(kù)語(yǔ)言學(xué)研究自20世紀(jì)60年代初以來(lái),語(yǔ)料庫(kù)至今已經(jīng)歷60多年的發(fā)展,研究語(yǔ)料庫(kù)的學(xué)者也越來(lái)越多。語(yǔ)料庫(kù)的出現(xiàn),也對(duì)語(yǔ)言研究產(chǎn)生了巨大的影響,拓寬了研究的角度與視野,完成了從定性到定性與定量相結(jié)合的轉(zhuǎn)變。隨著計(jì)算機(jī)技術(shù)的發(fā)展,1993年,MonaBaker提出,可以根據(jù)語(yǔ)料庫(kù)對(duì)大量翻譯文本進(jìn)行描寫(xiě)和分析,從而證實(shí)了翻譯可作為溝通媒介這一現(xiàn)象[6]。SaraLaviosa介紹了不同類(lèi)型的語(yǔ)料庫(kù)在翻譯教學(xué)中的應(yīng)用[7]。相較而言,國(guó)內(nèi)語(yǔ)料庫(kù)語(yǔ)言學(xué)起步較晚,從成果來(lái)看,語(yǔ)料庫(kù)被廣泛應(yīng)用于教學(xué)、翻譯、詞匯、語(yǔ)義、詞典和語(yǔ)法等語(yǔ)言研究領(lǐng)域。如王克非就雙語(yǔ)語(yǔ)料庫(kù)設(shè)計(jì)構(gòu)建提出一系列想法[8],張威提出口譯語(yǔ)料庫(kù)的開(kāi)發(fā)與建設(shè)[9],胡開(kāi)寶也就語(yǔ)料庫(kù)基礎(chǔ)特性、研究領(lǐng)域進(jìn)行了系統(tǒng)梳理[10]。但語(yǔ)料庫(kù)就話語(yǔ)分析方面的研究仍處于初期階段,還需要進(jìn)一步補(bǔ)充與探究。(三)基于語(yǔ)料庫(kù)的安徽形象研究筆者通過(guò)中國(guó)知網(wǎng)(CNKI)檢索“安徽形象+語(yǔ)料庫(kù)”,發(fā)現(xiàn)與之相關(guān)的研究成果數(shù)量不多。左言娜以安徽省人民政府網(wǎng)站和安徽省旅游局網(wǎng)站文本為語(yǔ)料庫(kù),搭建語(yǔ)料庫(kù),以系統(tǒng)功能應(yīng)用語(yǔ)言學(xué)為理論框架,選用批評(píng)性話語(yǔ)分析方式,探討互聯(lián)網(wǎng)媒體語(yǔ)句里的安徽旅游國(guó)際地位[11]。同年,左言娜還依據(jù)此語(yǔ)料庫(kù)對(duì)新媒體話語(yǔ)中的安徽外宣形象進(jìn)行探究。鐘紫薇利用語(yǔ)料庫(kù)檢索軟件等自建小型語(yǔ)料庫(kù),通過(guò)收集、整理和分類(lèi)2016年ChinaDaily網(wǎng)站中關(guān)于安徽的英語(yǔ)新聞報(bào)道,運(yùn)用語(yǔ)料庫(kù)語(yǔ)言學(xué)理論對(duì)不同類(lèi)別的新聞報(bào)道展開(kāi)話語(yǔ)分析[12]。以上研究已將語(yǔ)料庫(kù)引入安徽形象研究中,為提升安徽區(qū)域形象做出了較大貢獻(xiàn)。三、語(yǔ)料庫(kù)建設(shè)(一)安徽形象語(yǔ)料庫(kù)建設(shè)簡(jiǎn)介語(yǔ)料庫(kù)主要有四種形式:單語(yǔ)種語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)、多語(yǔ)種語(yǔ)料庫(kù)和可比語(yǔ)料庫(kù)。其中單語(yǔ)種語(yǔ)料庫(kù)僅包含一種語(yǔ)言的文本;平行語(yǔ)料庫(kù)包含兩個(gè)單語(yǔ)種語(yǔ)料庫(kù),一個(gè)語(yǔ)料庫(kù)是另一個(gè)語(yǔ)料庫(kù)的翻譯;多語(yǔ)種語(yǔ)料庫(kù)包含多種語(yǔ)言的文本,且都是相同文本的翻譯,存在與平行語(yǔ)料庫(kù)相同的方式對(duì)齊;可比語(yǔ)料庫(kù)是一組兩個(gè)或兩個(gè)以上的單語(yǔ)語(yǔ)料庫(kù),其文本涉及同一主題,但它們不是彼此的翻譯,因此沒(méi)有對(duì)齊。就文章研究需要而言,要建設(shè)的語(yǔ)料庫(kù)為單語(yǔ)種語(yǔ)料庫(kù)。此部分主要探索語(yǔ)料庫(kù)設(shè)計(jì)、語(yǔ)料收集等。(二)語(yǔ)料庫(kù)設(shè)計(jì)王克非認(rèn)為語(yǔ)料庫(kù)的總體設(shè)計(jì)是與建庫(kù)目的密切相關(guān)的,需要考慮如下十點(diǎn):設(shè)計(jì)目的、語(yǔ)言規(guī)模、語(yǔ)料范圍、代表性與均衡性、雙語(yǔ)比例、共時(shí)/歷時(shí)性、語(yǔ)言類(lèi)型、語(yǔ)言質(zhì)量、取樣策略和標(biāo)注加工[8]。據(jù)此標(biāo)準(zhǔn),建設(shè)語(yǔ)料庫(kù)的參數(shù)和特點(diǎn)如表1所示。表1語(yǔ)料庫(kù)設(shè)計(jì)參數(shù)表(三)語(yǔ)料采集與清洗由于文本信息量較大,本次研究使用Python軟件,基于詞義相關(guān)度進(jìn)行語(yǔ)料收集,首先打開(kāi)Python,設(shè)定關(guān)鍵詞為“安徽”,后設(shè)置程序運(yùn)行。爬取基本操作步驟包括:①尋找文本數(shù)據(jù)量大的網(wǎng)站URL,形成爬蟲(chóng)的初始URL隊(duì)列;②訪問(wèn)網(wǎng)頁(yè)鏈接,獲得網(wǎng)頁(yè)數(shù)據(jù);③通過(guò)下載器對(duì)網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行下載;④根據(jù)頁(yè)面的HTML格式進(jìn)行解析,編寫(xiě)Xpath表達(dá)式篩選出需要保留的文本信息;⑤再對(duì)文本信息分詞,存為詞匯素材列表,并完成后續(xù)的URL跳轉(zhuǎn)動(dòng)作使得爬蟲(chóng)持續(xù)運(yùn)行。研究共收集語(yǔ)料2475篇,合計(jì)80余萬(wàn)字。胡開(kāi)寶提到:語(yǔ)料采集是指將書(shū)面語(yǔ)料和口語(yǔ)語(yǔ)料輸入電腦,并以電子文本形式儲(chǔ)存[10]。在廣泛收集的大量語(yǔ)料素材數(shù)據(jù)中,部分?jǐn)?shù)據(jù)的格式并不符合預(yù)期要求,其中存在大量的無(wú)效信息,例如夾帶著多種的符號(hào)、標(biāo)記,文字間殘留大量空格等。這與預(yù)期格式存在差異,為了讓計(jì)算機(jī)可以識(shí)別并方便后續(xù)的處理,必然要對(duì)收集的數(shù)據(jù)信息進(jìn)行預(yù)處理。所以語(yǔ)料庫(kù)構(gòu)建的首個(gè)步驟就是對(duì)語(yǔ)料素材信息進(jìn)行規(guī)范化處理。先使用正則表達(dá)式對(duì)大部分符號(hào)進(jìn)行刪除操作,少部分情況特殊處理。經(jīng)過(guò)對(duì)符號(hào)的處理可以使絕大部分的文本數(shù)據(jù)符合格式要求。再對(duì)文本內(nèi)容的格式進(jìn)行處理,針對(duì)一些特殊格式數(shù)據(jù)例如小說(shuō)、詩(shī)歌,其中存在非文本數(shù)據(jù)和無(wú)意義文本。非文本數(shù)據(jù)指不是文本中主要內(nèi)容,主要起定義格式、裝飾文本作用,例如HTML標(biāo)簽、URL地址、亂碼等;無(wú)意義文本指文本數(shù)據(jù)中常出現(xiàn)但無(wú)實(shí)際意義的內(nèi)容,例如作者附加的內(nèi)容、廣告內(nèi)容、版權(quán)信息和個(gè)性簽名的部分內(nèi)容等。(四)語(yǔ)料庫(kù)建成在進(jìn)行篩選后,導(dǎo)出四個(gè)版本文件,為tmx格式、Word格式、Excel格式以及txt格式。這四種格式滿(mǎn)足不同的需求:tmx格式作為翻譯記憶庫(kù),主要適用于計(jì)算機(jī)輔助翻譯軟件;Word格式用于日常查閱,確定表達(dá);Excel格式便于檢索;txt格式適用于文本轉(zhuǎn)換。自建小型語(yǔ)料庫(kù)(圖2)包含2475篇新聞,其中經(jīng)濟(jì)類(lèi)578篇、政治類(lèi)634篇、市民生活類(lèi)704篇以及社會(huì)文化類(lèi)559篇,共計(jì)1026876字符,按照經(jīng)濟(jì)、政治、文化等方面進(jìn)行分類(lèi)。后續(xù)使用語(yǔ)料檢索軟件AntConc4.1.2w,通過(guò)詞頻統(tǒng)計(jì)、高頻詞索引行等路徑,并結(jié)合批評(píng)話語(yǔ)分析、評(píng)價(jià)理論和議程設(shè)置理論,對(duì)檢索結(jié)果進(jìn)行定性、定量分析,通過(guò)有理、有力、有節(jié)地傳遞自身聲音,構(gòu)建安徽形象話語(yǔ)體系,讓更多人了解安徽、熟悉安徽、親近安徽。圖2單

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論