Web as corpus短學(xué)期講座2012年(keys)_第1頁
Web as corpus短學(xué)期講座2012年(keys)_第2頁
Web as corpus短學(xué)期講座2012年(keys)_第3頁
Web as corpus短學(xué)期講座2012年(keys)_第4頁
Web as corpus短學(xué)期講座2012年(keys)_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

Webascorpus網(wǎng)絡(luò)語料庫賀文照2012年7月IGreatpotentialofWebasCorpus網(wǎng)絡(luò)語料的巨大潛力從一道選擇題開始:網(wǎng)友提問(2009-04-0314:08:46)梧桐樹下(553575272)

各位C友請幫忙看看Asmyexamsarecomingnextweek,I’lltakeadvantageoftheweekendto_____onsomereading.

Acatchup

Bclearup

Cmakeup

Dpickup

Whatwouldyoudo?

我的方法

1.設(shè)計google檢索表達(dá)式:

“takeadvantageof**to*upon*reading”

2結(jié)果請見:"takeadvantageof**to*upon*reading"II.Whywebascorpus?Whatiscorpus?Asimpledefinition:Collectionoftexts.簡答說文本集合就叫做語料庫。Webpagesaremainlycollectionoftexts,sowebcanberegardedasakindofcorpus.語言的用法往往遵循“有很多其它人(nativespeaker)這么用,我也可以這么用”Whatdoesacorpuscontain?Conventionalusageofalanguage.語料庫中蘊(yùn)含了一種語言的習(xí)慣用法Howtoaccessastructureinacorpus?如何從語料庫中查找一個特定的結(jié)構(gòu)呢?Throughacomputer-basedtool.Sogooglecanberegardedasthatkindoftoolforsearchingacertainlanguagestructurefromtheweb.只有通過計算機(jī)工具來實(shí)現(xiàn)。google本來是一個信息搜索工具,我們將它作為從網(wǎng)絡(luò)上獲取特定語言結(jié)構(gòu)的搜索工具。SearchforcollocationofEnglishwords通過google檢索英語詞項(xiàng)的搭配。搭配是外語學(xué)習(xí)中一個非常重要的內(nèi)容。比如上面例中的Asmyexamsarecomingnextweek,I’lltakeadvantageoftheweekendto_____onsomereading.

Acatchup

Bclearup

Cmakeup

Dpickup

常量[takeadvantageof]變量[theweekend變量都用*代替]常量[to]變量[*]常量[up]常量[on]some常量[reading].

在google中整個當(dāng)作一個短語(phraseasagoogleoperator)來搜索,用*替換所有變量,用半角雙引號括起來:"takeadvantageof**to*upon*reading"

作為短語搜索和不作為短語搜索的區(qū)別比如Englishgrammar和"thegrammarofEnglish"

是“biggervariance”還是“l(fā)argervariance”?統(tǒng)計學(xué)中的“更大的方差”是”interestedon”還是”interestedin”“interestedto”?請比較各自的頻率優(yōu)勢,一般頻率高者為首選Manytranslatorshavemadestudiesontheidiomstranslation.

conductedstudiesSiterestrictsearch限定網(wǎng)絡(luò)語料來源。Whydoweneedsiterestrictsearch?網(wǎng)絡(luò)資源千差萬別,質(zhì)量良莠不齊。site:限定搜索某個特定網(wǎng)站如:ChinesetwitterSite:edu限定某一類網(wǎng)站:請比較校訓(xùn)的說法schoolmetto和universitymetto美國大學(xué)網(wǎng)站上的用法;比較中國大學(xué)網(wǎng)站上的用法:schoolmetto和universitymettoIII.PartialParallelTextsofEnglishandChinese英漢局部對應(yīng)語料1.漢英詞匯對照表...動遷戶householdstoberelocated.·東突"恐怖分子EastTurkistanterrorist.·豆腐渣"工程jerry-builtproject.·渡假外交holiday-makingdiplomacy.2.漢語文本中的英語夾注他認(rèn)為教學(xué)活動(padagogicaction)是一種運(yùn)用符號暴力(symbolicviolence)進(jìn)行教學(xué)溝通的過程,孩子的學(xué)業(yè)成績?nèi)绾危饕催@個溝通過程的效果如何,而決定溝通效果的主要是受業(yè)者與溝通過程相關(guān)聯(lián)的社會特征和學(xué)業(yè)特征(文化資本)。所有教育過程的特殊產(chǎn)品是造成與孩子在家庭中獲得的文化習(xí)念(habitus)相區(qū)隔的、由主文化之任意專橫(culturalarbitrary)所支配的新習(xí)念。網(wǎng)絡(luò)英漢混合雙語語料覆蓋面作一個大致的分類。1)專業(yè)術(shù)語,有心理學(xué),法律,教育,語言學(xué)等多方面的專業(yè)詞匯。如,心理分析(psycho-analysis),潛意識(Sub-Conscious),程序法(procedurelaw),侵權(quán)責(zé)任(rightinfringementresponsibility),以學(xué)生為中心(student-centred),寬銀幕版(WideScreen),納米技術(shù)(NanoTechnology),音位(phoneme),機(jī)器翻譯(machinetranslation),語料庫(corpus)等;2)漢語時尚新詞英譯,如,跨世紀(jì)人才(thecross-centurytalent),下崗職工(Laid-offWorkers),打白條(issueIOU),擦邊球(edgeball,touchball),小康社會(well-offsociety),下崗工人(laidoffworkers),以德治國(togovernthecountrywithmoral)等等;3)新引進(jìn)的文化內(nèi)容,如電影名稱,游戲,計算機(jī)產(chǎn)品、技術(shù)等外來名稱。如,ColorsOfTheWind《風(fēng)中奇緣》(電影),AClockworkOrange發(fā)條橙(電影),F(xiàn)inalFantasyIII《最終幻想III》(游戲),Bowling(保齡),Stream(流媒體),BroadBand(寬帶),ScreenShot(屏幕抓取程序),Scanner(掃描儀),Digitalsignatureandidentityauthentication(數(shù)字簽名與身份認(rèn)證技術(shù)研究)。4)外來專有名詞,包括地名和人名等。中途島(MidwayIslands),歐盟(EuropeanUnion),獨(dú)聯(lián)體(CommonwealthofIndependentStates),貝多芬(Beethoven),尼克松(Nixson),貝克漢姆(DavidBeckham),邁克·爾.杰克遜(MichaelJackson)。)“ProliferationSecurityInitiative”是一個什么樣的機(jī)構(gòu),還是組織?其中有一個security,常用詞義為“安全”,就用<ProliferationSecurityInitiative安全>進(jìn)行搜索,結(jié)果為“防擴(kuò)散安全倡議”。八榮八恥,使用<八榮八恥eight>和諧社會,使用<和諧社會harmonious>總結(jié)FurtherReading語料庫空間/hwz/

GoogleasaToolforAcademicWriting/~efs/google/index.htm

局部對應(yīng)英漢網(wǎng)絡(luò)語料及其輔助翻譯功能/trans_studies/jubu_duiying_yuliao.htm

二、google用于輔助英語學(xué)習(xí)

1)利用google龐大的英語網(wǎng)頁數(shù)據(jù),很多人這樣用,我們也可以這樣用:詞匯,語法,搭配

2)注意語料來源,解決之道,針對特定網(wǎng)站的檢索

/hwz/readblog.asp?id=11.uk/live/index.jsp結(jié)語。1網(wǎng)絡(luò)語料庫對于英語學(xué)習(xí)具有巨大的潛力。2使用網(wǎng)絡(luò)搜索一般難以直接查到答案,需要查詢者仔細(xì)分析,甚至需要一定的鑒別能力。3需要注意網(wǎng)絡(luò)語料庫的質(zhì)量,搜搜需要區(qū)別來源練習(xí)1用google來完成一下練習(xí),并且制定結(jié)果必須來源于NewYorkTimes()Medicalresearchhasshownthatthewidespreaduseofcigarettescontributes________thei

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論