第五章信息產品開發(fā)_第1頁
第五章信息產品開發(fā)_第2頁
第五章信息產品開發(fā)_第3頁
第五章信息產品開發(fā)_第4頁
第五章信息產品開發(fā)_第5頁
已閱讀5頁,還剩216頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

本章第一次課由信息及物質載體構成,凝結著一定數(shù)量的人類勞動的信息成果均可視為信息產品。“信息”通過“信息技術”在“信息組織”中被加工成“信息產品”。信息有物理載體,如書、報刊等,稱為物理信息產品;在網絡上傳輸?shù)男畔a品,稱之為數(shù)字信息產品。以商業(yè)為目的將信息按社會需求生產、制造成可供市場銷售的信息產品,這些投入市場的信息產品就成為了信息商品。

1.信息產品信息產品及其特征信息產品的特征易傳遞性與非消耗性信息產品的流通快捷方便。信息商品不可被人直接消費掉。人們只是消費了信息所代表的內容、思想、功能等。效用滯后性與價值差異性信息產品的效用往往是用戶獲得該項信息后運用于決策或生產實踐活動中逐漸顯露或間接表現(xiàn)出來的,一般很難用數(shù)量明確表示。同一信息對不同人具有不同的價值,信息產品總是面對不同信息需求者對信息的不同的評價。唯一獨創(chuàng)性與可重復性如科研成果、專利發(fā)明等具有唯一性和獨創(chuàng)性;具有批量可重復性的信息產品,如書籍、報刊等;數(shù)據(jù)庫、計算機軟件等既有批量重復的一面,又有開發(fā)更新的一面。價值的時效性和累積性價值時效性信息,如新聞性信息、股票信息等。價值具有累積性的信息,如股票信息經一年累積,可以形成一年股市走勢的信息價值。歷史資料的珍貴性就來自此特性。經驗產品性及成本的獨特性信息產品是“經驗產品”。所以,在營銷上也發(fā)展出許多不同的策略,免費試用、預告、標題、簡要等,讓客戶了解信息產品的概貌。信息的生產成本高,復制成本低。

第一節(jié)信息采集1.信息源的概念UNESCO的定義:“個人為滿足其信息需要而獲得信息的來源,稱為信息源”。任何運動著的事物都可以產生信息,都可以成為信息源。5.1.1信息源及其分類信息從信息源發(fā)出,以物質和能量為媒介,超越空間和時間傳送到接收者那里,這就是信息傳遞。傳播者起著決定性的作用。信息傳播者具有強烈的主體意識,才能針對性地把信息傳遞給信息接收者。信息接收者是信息的使用者和傳播對象,可以是人或團體、機構等。

2.信息源的分類根據(jù)時間標準來區(qū)分:根據(jù)信息的運動形式:一次信息源(由現(xiàn)場直接采得的信息)二次信息源(各種文件和數(shù)據(jù)庫中存儲的信息)靜態(tài)信息源指具有相對穩(wěn)定性的信息;動態(tài)信息源是反映實際進程和實際狀態(tài)的信息。信息源還可以分為:科技信息源,經濟信息源,文化信息源,政治信息源;記錄性信息源,實物型信息源,思維性信息源等等。3.個人信息源的特點參與社會信息交流活動的每個人都是一個獨立的信息源。4.實物信息源的特點自然物,人工制品,事物發(fā)生的現(xiàn)場,可視為實物信息源。(1)直觀性。直觀、生動、全面、形象,能提供全方位、多角度的信息。(2)真實性。實物是實實在在存在的,人們可獲取第一手完整可靠的信息。(3)隱蔽性。實物信息源中包含的信息往往是潛在的、隱蔽的。往往要經過仔細觀察和分析才能剖析出實物隱蔽的本質屬性。(4)零散性。時空分布廣泛、散亂、混雜,無一定規(guī)律可循,這給加工整理帶來了一定的困難。5.文獻信息源的特點儲存在紙張、膠片、磁介質和光盤等載體上的信息源。按載體形式,可以把文獻劃分為:印刷型文獻、縮微型文獻、聲像型文獻和機讀型文獻。文獻具有存儲信息和傳播信息的基本功能。文獻是社會文明發(fā)展歷史的客觀記錄,是人類思想成果的存在形式,也是科學與文化傳播的主要手段,是現(xiàn)代社會最常用的、最重要的信息源。

特點:(1)系統(tǒng)性。信息內容經過選擇、比較、評價、分析、歸納、概括等加工,系統(tǒng)性較強,更能反映事物的本質和規(guī)律。(2)穩(wěn)定性。固化在物質載體上,穩(wěn)定性較強,可提供準確可靠的信息。(3)易用性。人們可隨意選擇內容,決定利用文獻的時間、地點和方式。(4)可控性。文獻信息,很容易對其進行加工整理,控制其數(shù)量和質量、流速和流向,達到有序流動的目的。(5)時滯性。文獻生產需要花費一定的時間,因而出現(xiàn)了文獻時滯問題。時滯過長將喪失其使用價值。6.數(shù)據(jù)庫信息源的特點大量的數(shù)據(jù)組織成數(shù)據(jù)庫,既可以提高用戶的信息檢索效率,也有利于實現(xiàn)信息資源共享。其特點如下:多用性數(shù)據(jù)庫充分考慮了多種應用的需求。動態(tài)管理性便于擴充修改,更新速度快,能隨時進行建庫、檢索、統(tǒng)計、備份和恢復等多種數(shù)據(jù)管理。技術依賴性依賴計算機的運算能力和容量存儲能力,其發(fā)展也與數(shù)據(jù)庫系統(tǒng)開發(fā)和管理技術的進步相關。7.組織機構信息源及其特點組織機構是社會信息的集散地,是發(fā)布各種專業(yè)信息的主要源泉。有以下特點:

5.1.2信息收集的原則與途徑1.信息的收集原則(1)針對性這是指信息收集目的要明確,要有現(xiàn)實意義。應從本地區(qū),本部門實際需要出發(fā),結合實際情況和出現(xiàn)的問題來收集。(2)及時性大多數(shù)信息具有很強的實效。一旦過時,他的效用就會降低,甚至完全喪失效用。即使在信息的生命周期內,由于信息擴散,大家均可分享,也會失去信息的優(yōu)先權。(3)準確性準確性是指信息要正確無誤,文字表達要明確,原始數(shù)據(jù)要可靠,數(shù)據(jù)計算要準確。(4)預見性預見性原則要求收集信息時,要以發(fā)展觀念,超前眼光,預見信息被利用的前景,分析信息多方面的用途。(5)適用性1)用戶2)時間3)地區(qū)。受經濟發(fā)展水平、自然資源、環(huán)境條件、人口狀況等影響,信息需要不同。(6)系統(tǒng)性是指收集的信息不能是片面的、零碎的,必須是全面的、且內在聯(lián)系的。(7)計劃性主要包括明確收集目的、確定收集內容、選擇收集方法、選擇信息源、做好信息收集工作的經費預算等。2.信息收集的主要途徑(1)按照信息的表現(xiàn)形式記錄型信息收集渠道包括:購買、交換、接收、征集、復制、租借、接受捐贈、現(xiàn)場收集、索取等。其中購買是最常見、最主要的途徑。實物型信息收集渠道包括:展覽、觀摩、觀看、參觀等。展覽又可細分為實物展覽、定貨會、展銷會、交易會等;參觀主要指參觀同行的實驗室、試驗站等。思維型信息收集渠道包括:交談、采訪、報告、培訓、錄音、各種社交活動以及進行現(xiàn)場調查、實地考察、技術交流等。思維型信息資源越來越受重視。(2)按照信息的來源(以企業(yè)為例)1)內部途徑①管理監(jiān)督部門。獲取內部信息的主要途徑②咨詢與政策研究部門③內部信息部門。檔案、資料、圖書部門、局域網等。④研究開發(fā)部門2)外部途徑

①大眾傳播媒介 ②文獻部門③社會團體組織 ④各種會議⑤政府部門 ⑥個人社交關系⑦用戶與消費者⑧外部信息網絡—Internet。

5.1.3信息收集的步驟與方法1.信息收集的基本程序明確目標需求,制定收集計劃

1)確定收集信息的內容。2)選擇信息的來源。

3)明確信息的收集方法。

設計數(shù)據(jù)結構

按照信息收集的目的和要求設計。包括兩個方面:①分類,如商品名稱,是消費資料還是生產資料,是工業(yè)品還是農產品等;②數(shù)據(jù)項,也就是指標,如產值、產量、品種、規(guī)格等。3.信息收集的過程(1)按照信息收集計劃的要求去收集信息。(2)在信息收集過程中,應進行補充性的收集或追蹤收集。(3)在采用對事物活動現(xiàn)場進行直接調查時,還要間接地從文獻資料中收集歷史的和現(xiàn)實的有關信息資料,保證信息的完整性和系統(tǒng)性。(4)對收集好的信息進行分析和分類,避免信息收集中可能發(fā)生的遺漏。4.提供信息資料

整理成如調查報告、資料匯編、統(tǒng)計報表等。2.信息收集基本方法1.業(yè)務法根據(jù)信息業(yè)務工作的需要,確定信息的收集計劃、設計數(shù)據(jù)結構和收集信息的方法。特點:只需把與某項業(yè)務有關的信息收集整理并能最后提供出所需的信息資料即可;收集的主要環(huán)節(jié)只有調查和校驗。缺陷:不容易保證信息系統(tǒng)性,難以避免信息多次重復收集或重要信息被遺漏等。2.系統(tǒng)法信息的收集不僅僅滿足某項業(yè)務工作的需要,而且是從整個系統(tǒng)的目標出發(fā),來確定信息的收集內容、收集計劃、數(shù)據(jù)結構和收集信息的方法。優(yōu)點:所獲得的信息不僅能滿足某項業(yè)務的需要,而且能滿足整個系統(tǒng)的需要,它能反映系統(tǒng)內部的有機聯(lián)系,建立信息產品網絡。缺點:在現(xiàn)實中,特別是在社會分工復雜、信息總量大的情況下,系統(tǒng)法信息收集的內容和數(shù)據(jù)結構設計不易確定。進行信息收集的具體方法:(1)原始記錄。按照一定的要求,用數(shù)字和文字的形式,對業(yè)務活動的過程和結果比較詳細地記載下來的資料。原始記錄不僅是信息收集的重要手段,也是信息收集的重要內容。(2)信息收集卡。通過簡明的書面方式,不僅能取得真實的信息,而且還能得到數(shù)值化的信息。(3)調查研究。是收集信息的重要方法。是對客觀事物活動過程進行觀察了解,詳細占有材料,并加以綜合分析研究,從中得到新的信息。(4)統(tǒng)計方法。是指具有某種相同性質的個別事物的綜合體,從總體數(shù)量方面來表現(xiàn)經濟活動的功能、水平、速度、比例等。通過統(tǒng)計,可以獲得更具體、更準確的定量信息。5.2基于人工系統(tǒng)的信息采集方法

5.2.1直接觀察法

直接觀察法指的是在信息源現(xiàn)場,信息采集者對客觀對象不加任何干預,一般不直接向被調查對象提問,只是憑視覺、聽覺和基于上述感知的思維,以及借助于錄音機、攝像機客觀地記錄信息源所生信息的行為過程。

5.2基于人工系統(tǒng)的信息采集方法5.2.2社會調查法的調查對象范圍和手段

根據(jù)確定社會調查對象范圍的不同方法,可以將社會調查分為四種:普遍調查、典型調查和抽樣調查及個別訪談。

概率抽樣可以分為:1.簡單隨機抽樣2.系統(tǒng)抽樣3.分層抽樣4.群體抽樣5.多段類集抽樣非概率抽樣主要方法有1.方便抽樣2.判斷抽樣3.定額抽樣訪問法交談采集信息分成三個階段一、準備階段1.選擇訪談對象1.選擇關鍵人物2.利用人際關系網絡2.擬定訪談提綱4.攜帶必要證件和有關資料,以便在需要時展示。3.盡量提前與被采訪者取得聯(lián)系,確認訪談時間、地點、人物等。訪問法交談采集信息分成三個階段二、實施階段1.接近技巧1.稱呼2.自然接近,求同接近,友好接近,正面接近,隱蔽接近2.溝通技巧4.引導技巧3.提問技巧5.追問技巧6.記錄技巧三整理階段5.2基于人工系統(tǒng)的信息采集方法5.2.3查閱資料

檢索思路就是4個尋找: 尋找專業(yè)對口的報刊, 尋找相關的論文, 尋找相關的圖書, 尋找相關的國外文獻。 檢索引擎是當今信息高速公路的開路先鋒。

5.3基于計算機系統(tǒng)的信息采集方法

5.3.1信息的數(shù)字化過程

數(shù)字化是計算機處理模擬信號的前提。模擬信號的數(shù)字化需要三個步驟:采樣、量化和編碼。

5.3基于計算機系統(tǒng)的信息采集方法采樣是指用每隔一定時間的信號樣值序列來代替原來在時間上連續(xù)的信號,也就是在時間上將模擬信號離散化。量化是用有限個幅度值近似原來連續(xù)變化的幅度值,把模擬信號的連續(xù)幅度變?yōu)橛邢迶?shù)量的有一定間隔的離散值。編碼規(guī)則是按照一定的規(guī)律,把量化后的值用二進制數(shù)字表示。

5.3基于計算機系統(tǒng)的信息采集方法模擬信號的數(shù)字化過程也稱為模擬/數(shù)字轉換的過程,也就是說將模擬信號轉換為數(shù)字信號,這個過程稱之為模數(shù)轉換,常用A/D表示。5.3基于計算機系統(tǒng)的信息采集方法5.3.2語音信息的采集與數(shù)字化

采樣量化

編碼

5.3基于計算機系統(tǒng)的信息采集方法聲卡的工作原理:數(shù)字聲音處理器DSP

混合信號處理器

音樂合成器

總線接口和控制器

5.4圖像信息的采集與處理

5.4.1色彩與色彩模型色彩的亮度、色調及飽和度色彩模式:RGB模式、CMYK模式分辨率:圖像分辨率、顯示器分辨率

5.4圖像信息的采集與處理5.4.2圖像的數(shù)字化處理過程圖像的采樣圖像量化

5.4圖像信息的采集與處理5.4.3圖形和圖像的概念區(qū)別

圖形是由計算機軟件生成的。圖像信息是一種模擬信號。

5.5視頻信息的采集及處理視頻信息對人類是尤為重要的:首先,人類接受的信息70%來自于視覺,周圍景物在視網膜上的映像是人類最有效和最重要的信息獲取形式;其次,視頻信息具有其他形式信息所不能比擬的優(yōu)點:確切、直觀、具體、生動;第三,視頻信息容量大,通過視覺獲得的視頻信息往往比通過其他感覺器官所獲取的信息量更大,下面我們將介紹一些有關數(shù)字視頻處理的一些知識。

5.5視頻信息的采集及處理5.5.1視頻基礎

所謂視頻,嚴格地講,是既包括靜止圖像又包括運動圖像,但我們一般所說的“視頻”,是指運動圖像。視頻通??梢苑譃槟M視頻和數(shù)字視頻兩種。模擬視頻信號必須轉化成數(shù)字視頻信號。5.5視頻信息的采集及處理5.5.2

YUV顏色空間

YUV顏色空間顯示器如何顯示顏色 YUV與RGB彩色空間變換

5.5視頻信息的采集及處理5.5.3視頻圖像的數(shù)字化處理過程

數(shù)字視頻的采樣

量化

視頻信號的編碼

5.5視頻信息的采集及處理5.5.4視頻卡的組成及其主要功能

在多媒體計算機系統(tǒng)中,視頻采集卡將模擬信號轉換成數(shù)字信號,由視頻信號采集模塊、音頻信號采集模塊和總線接口模塊3個主要功能模塊組成。

5.5視頻信息的采集及處理視頻信號采集模塊的任務是將模擬視頻信號轉換成數(shù)字視頻信號,并將其送入計算機系統(tǒng)。主要步驟如下:

視頻信號的捕捉

A/D轉換將得到的數(shù)字視頻存儲到幀存儲器

D/A轉換及彩色空間轉換

本章第二次課2.1.5文獻信息的一般檢索步驟

1.分析研究課題,明確檢索要求搞清楚本課題屬于什么學科,所需情報的文獻類型及語種,查找文獻的年代,所需文獻的最佳篇數(shù),允許支配的檢索費用。2.1.5文獻信息的一般檢索步驟2.選擇檢索工具或檢索系統(tǒng)按照課題的檢索要求和目的,選擇收錄文獻種類、專業(yè)覆蓋面、年代跨度對口的數(shù)據(jù)庫;當需要查找最新文獻信息時,選擇數(shù)據(jù)更新周期短的數(shù)據(jù)庫;當還需要獲取原文時,選取原文獲取較容易的數(shù)據(jù)庫;2.1.5文獻信息的一般檢索步驟

2.選擇檢索工具或檢索系統(tǒng)2.1.5文獻信息的一般檢索步驟

2.數(shù)據(jù)庫的選擇-自然科學常用的文獻數(shù)據(jù)庫中文類自然科學常用數(shù)據(jù)庫:中國期刊網--全文數(shù)據(jù)庫,文理各科維普期刊網--全文數(shù)據(jù)庫,文理各科萬方數(shù)據(jù)資源系統(tǒng)——全文數(shù)據(jù)庫,理工科超星讀秀、方正Apabi數(shù)字圖書館、外文類自然科學常用數(shù)據(jù)庫:SpringerLink數(shù)據(jù)庫

EBSCO--文摘/全文數(shù)據(jù)庫,文科為主

2.1.5文獻信息的一般檢索步驟3.確定檢索途徑4.記錄和閱讀文獻線索5.索取原始文獻2.1.6檢索效果評價1、檢索效果的有效性評價信息檢索的效果評價是指運用科學的方法,按照設定的指標體系,對信息檢索效果進行評價的過程。目前主要從三個方面進行評價。1)查全率和查準率

是由美國的佩里和肯特于20世紀50年代中期提出來的,后經過不斷改進和完善,至今已成為評價檢索效果最常用的兩項關鍵指標。確定查全率和查準率最常用的方法是有名的2-3表:

查全率指檢出的相關文獻量與檢索系統(tǒng)中相關文獻信息總量的比率,它反映出信息檢索系統(tǒng)檢出相關文獻信息的能力。

查全率(R)=(檢出相關文獻信息量/檢索系統(tǒng)中相關文獻信息總量)×100%=(a/a+c)×100%

查準率是指檢出相關文獻信息量與檢出文獻信息總量的比率,它反映出信息檢索系統(tǒng)的精確度,說明系統(tǒng)排除干擾,減少噪音的能力。查準率(P)=(檢出相關文獻總量/檢出文獻信息總量)×100%=(a/a+b)×100%2)漏檢率與誤檢率漏檢率指漏檢相關文獻信息量與檢索系統(tǒng)中相關文獻信息總量的比率,它與查全率相對應。漏檢率=(漏檢相關文獻信息量/檢索系統(tǒng)中相關文獻信息總量的比率)×100%=(c/a+c)×100%誤檢率是指誤檢(檢出不相關)文獻信息總量與檢出文獻信息總量的比率,它與查準率相對應。誤檢率=(誤檢文獻信息量/檢出文獻信息總量)×100%=(b/a+b)×100%2、檢索系統(tǒng)實用性評價。包括系統(tǒng)對用戶是否需要,是否實用,有多大實用效果,即檢索的社會效果的評價。3、檢索費用—效率評價,即檢索的經濟效果評價,包括檢索系統(tǒng)完成檢索服務的成本及時間消耗。影響檢索效果的因素1、標引的質量2、檢索語言的性能3、檢索途徑的數(shù)量4、檢索策略的優(yōu)劣

5、檢索人員的素質2.2檢索概念的分析和檢索語言的應用2.2.1概念分析準備1.課題分析方法探索研究型課題調查研究型課題面向應用型課題2.課題背景知識的獲取方法課題的背景知識包括課題研究的對象、研究對象所屬的學科和主要涉及內容(包括研究對象、使用方法、主要研究單位和人員等)網上搜索引擎、專著、手冊、百科全書等2.2.2檢索概念的切分、提取和擴展方法

1.概念的切分。以詞為單位進行劃分,切分需要徹底,做到“到詞為止”,但又必須是表達一件事物的完整名稱。例如:“計算機管理系統(tǒng)”應切分成“計算機、管理系統(tǒng)”,而不能切分成“計算、機、管理、系統(tǒng)”。切分后,所要檢索的課題就轉換成詞的集合,但必用的核心詞往往很少,多數(shù)的是限定詞。2.主要檢索詞、輔助檢索詞和禁用詞。主要檢索詞:與課題所研究的對象、方法有關的特指性事物名詞。輔助檢索詞:泛指性名詞,它們只在檢索結果過多需要限制時使用。禁用詞:介詞、連詞等虛詞。(3)尋找同一事物名稱的近義詞和反義詞如:教學與培訓、教育,研究與分析、比較、理論、變化,翻譯與直譯、意譯,美術與藝術,英漢與漢英,否定與肯定(4)如果是英語,尋找同一事物名詞的單復數(shù)、不同詞性、英美語的不同形式如:cheque與check,colour和color,stock和share等

基于內容分析的概念擴展法(1)上位概念擴展法,分析檢索對象的學科歸屬。如:英語與外語,美術與藝術,上海圖書館與公共圖書館,詞法與語法,專利與知識產權、繼承法與民法、唐詩與古詩、詞法與語法等(2)下位概念擴展法,又稱概念分析的樹形展開法。如:

英語外貿

應用文

英漢科技

翻譯

書信

函電

公文

化學

機械

通信

口譯

筆譯

(3)隱含概念擴展法如:“投資管理”的顯見主題是“投資管理”,隱含主題還有“投資法規(guī)”、“投資法律”。又如,“作家筆下的主人公特征比較”,隱含主題還有“文學作品”和“小說”。

基于檢索結果的概念擴展法對初步檢索結果進行分析,往往能夠得到與課題相關的新的檢索概念,將這些概念經過重新組合,就可以達到擴展檢索結果的目的。思考題1、StudyonthemarketmanagementinChina中哪些詞宜選做主要檢索詞,哪些詞宜選做輔助檢索詞,哪些詞屬于禁用詞?2、就“外語”使用同物異名方法、上位概念方法和下位概念方法,各擴展一個檢索詞。3、“大學語文課程現(xiàn)狀調查與問題分析”檢索詞的選取。2.2.3文獻信息的內外部特征和檢索語言的定義1.文獻信息的內外部特征信息的外部特征:題名、責任者、出版機構、ISBN、專利號、標準號、報告號等,將其按一定的方法進行組織、排列。形成檢索途徑。信息的內容特征:按信息的學科屬性或主題按照一定的方法進行排列。形成檢索途徑。2.定義和類型

信息檢索語言是用來表達信息概念的一種人工語言,它是根據(jù)信息組織和檢索的需要所編制的特殊標識。檢索語言由基本詞匯和語法規(guī)則組成。

類型:

1、按結構原理劃分:等級體系分類法和組配分類法

2、按包括的專業(yè)范圍劃分:綜合性、專業(yè)性

3、按標識的組合使用方法劃分:先組式和后組式

4、按描述語言的選詞特征來劃分,可以分為單元詞、敘詞、關鍵詞、主題詞、代碼、引證5、按規(guī)范形式來劃分:可分為規(guī)范檢索語言和自然語言。6、按描述文獻的特征劃分:外部特征表標識和內容特征標識。

2.2.4分類檢索語言

分類檢索語言又稱分類法,是用分類號來表達信息中所含有的主題概念。它一般包括類目表和分類規(guī)則。我國近代三大分類法分別是:《中國圖書館分類法》(簡稱中圖法)、《中國科學院圖書館圖書分類法》(簡稱科圖法,主要在科學院系統(tǒng)使用)、《中國人民大學圖書館圖書分類法》(簡稱人大法)

《中國圖書館分類法》

《中圖法》在結構上主要有類目表、標記符號、說明和注釋、類目索引等四部分組成。類目表是在基本大類的基礎上,由基本大類、簡表、詳表、復分表四部分組成。類目之間的關系有從屬關系、并列關系、交替關系、相關關系四種。

《中國圖書館圖書分類法》1999年推出了第四版,共分5大部類22個基本大類。22個基本大類是在5在部類的基礎上第一次劃分得到的,稱為一級類目,分別對應一個英文字母;從基本大類起,再連續(xù)劃分3次,得到二級、三級、四級類目。采用漢語拼音字母和數(shù)字相結合的方式對圖書進行分類,是目前國內各公共圖書館和高校圖書館普遍使用的圖書分類法,我館藏書也是按照該分類法進行排架。中圖法簡表其中文學類部分類目展開情況如下:I文學I2中國文學I24小說I247建國后作品I247.4章回小說I247.5新體長篇、中篇小說I247.7新體短篇小說I247.8故事、微型小說I25報告文學I3/7外國文學分類標引方法:崔文風著1)心理與人生-發(fā)展心理教子成長2)心理與人生-完善心理事事成功3)心理與人生-調節(jié)心理強身治病分別分入:G78、B848.4和R395.6-49,其索書號分別是G78/CWF、B848.4/CWF和R395.6-49/CWF2.2.5主題檢索語言

主題檢索語言是以自然語言中語詞文字為基礎,以反映特定事物為中心,以主題詞字順為基本結構的一種檢索語言。將主題詞作為信息主題標引和檢索標識的編排方法稱為主題法。主題語言表達的概念比較準確,具有專指性,不同的專業(yè)領域或不同的數(shù)據(jù)庫(一般為外文數(shù)據(jù)庫)有自己的主題詞表。1、主題檢索語言的主要類型主題檢索語言根據(jù)其結構原理可分為:標題詞:事先組配好的主題詞,是一種先組式的語言。單元詞:代表文獻實質意義、可以獨立存在的最小概念單元。是一種后組式的語言。敘詞:經規(guī)范化的可以獨立表達主題概念的詞語。關鍵詞:直接使用的基本上不加規(guī)范的自然詞語。

2、《漢語主題詞表》:也稱為敘詞表。由主表、附表和輔助索引組成。

3、分類—主題法檢索語言4、自然語言

2.3檢索算符與檢索策略2.3.1檢索算符檢索運算符號,常用的有:布爾邏輯算符、截詞算符、位置算符、優(yōu)先處理算符、字段限制、詞組算符1.布爾邏輯算符邏輯或(OR)運算符(+)

S11834companyS22022enterpriseS33647companyORenterprise使用于具有基本相同或近似概念的同義詞、同族詞之間現(xiàn)代漢語教學與寫作現(xiàn)代漢語教學+現(xiàn)代漢語寫作

enterprisecompany在布爾邏輯算法中,“AORB”或“A+B”表示查找出()。A.含有A、B之一或同時包含AB兩詞的文獻B.含有這兩個詞的文獻集合C.含有檢索詞A而不含檢索詞B的文獻D.含有檢索詞B而不含檢索詞A的文獻。1.布爾邏輯算符與(AND)運算符(*)WTOChinaS112940WTOS22173ChinaS3842WTOANDChinaWTOANDChina使用于需要組配不同概念的檢索詞之間用漢語寫作的藏族人漢語寫作*藏族人1.布爾邏輯算符非(NOT)運算符(—)S1110PATENTS2325GERMANS3108PATENTNOTGERMANPATENTNOTGERMAN使用于需要從某個概念中剔除另一個概念的場合高中語文教學中學語文教學—初中語文教學大學四級英語四級英語—研究生英語國外漢語教學漢語教學—中國

patentGerman2.優(yōu)先處理算符?SAORB(集合號為S1)?SCORD(集合號為S2)?SS1ANDS2?S(AORB)AND(CORD)使用優(yōu)先處理算符“()”(信息檢索OR文獻檢索)AND計算機布爾邏輯符號如果混合運算,其順序通常是NOT、AND、OR3.截詞算符(p.38)

當某些英語檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(多數(shù)英語單詞的單復數(shù)變化和英美不同拼寫形式),可以采用截詞符,或稱通配符擴展檢索詞。

無限截詞:以任意詞尾變化為特征例如:manag*work?有限截詞和屏蔽符:以單個字母變化為特征。例如:m?nmoderni?ation3.截詞算符(p.38)

一是截詞符要緊接在詞干后面,截詞符和詞干之間不能有空格。二是避免將檢索詞的詞干截得過短,一般應在三個字母以上。三是截詞應該使用得合理。一般不可能出現(xiàn)詞尾變化的單詞,例如management,protection等,其后不必再使用截詞。四是從希望出現(xiàn)的單詞中取盡可能多的公共字母作為詞干,以提高查準率,比如在對manage,managing,managed,management和manager作截詞運算時,詞干應使用“manag*”,而不應使用“man*”。

4.位置算符指定檢索詞之間的距離和出現(xiàn)的順序的算符(W)—with算符兩側的檢索詞次序不能顛倒,兩詞之間不允許有其他的詞或字母,但允許有空格或“,”或“-”號。如:information(w)retrieval可檢索出informationretrieval,information-retrieval等(Wn或nW)—nWords算符兩側的檢索詞之間最多允許插入n個詞,兩個檢索詞詞序不允許顛倒。

如:electronic(1W)resources,可檢索出:electronicresources,electronicinformationresources等等。4.位置算符(N)—Near算符兩側的檢索詞必須緊密相連,即查找兩個連在一起的單詞,兩詞之間不允許有其他的詞或字母,但詞之間次序可以顛倒。如:Junior(N)high可檢索出:Juniorhigh,highJunior等

(Nn或nN)—nNear算符兩側的檢索詞之間最多可插入n個單詞,且這兩個檢索詞的詞序任意如:information(3N)retrieval就是說兩個單詞之間最多可插入3個單詞(F)—Field表示算符兩側的檢索詞必須出現(xiàn)在文獻記錄的同一個字段中,詞序沒有限制,中間可插入任意檢索詞。(S)—Sentence表示算符兩側的檢索詞必須出現(xiàn)在文獻記錄的同一個句子中,詞序沒有限制,中間可插入任意檢索詞。思考:檢索表達式“information(3N)retrieval”,除空格和標點符號外,檢出的結果有()個A.2B.4C.6D.85.字段限制字段限制適用于在已有一定數(shù)量輸出記錄的基礎上,通過指定字段的方法,減少輸出篇數(shù),提高檢索結果的查準率的場合。篇名作者刊名主題詞如在DIALOG系統(tǒng)中,前綴限制符有:AU=限查特定作者JN=限查特定刊名LA=限查特定語種PN=限查特定專利號PY=限查特定年代后綴限制符如:/TI限在題目中查/AB限在文摘中查/DE限在敘詞標引中查目前大多數(shù)檢索系統(tǒng)都提供菜單式檢索,只需選擇字段,不需要記住及輸入字段代碼。6

詞組算符詞組算符為“”“中國社會科學院社會學研究所”“三明學院物理與機電工程學院”“信息檢索”2.3.2檢索策略構成和調整方法(p.40)1、概念組面和檢索策略的構成方法運用各種方法得到的檢索詞,首先加以選擇,注意選用本專業(yè)的專用術語,然后以概念為單位,分成不同的組面。2、調整檢索策略的方法輸出篇數(shù)過多,原因可能是:①選用了多義性的檢索詞;②截詞截得過短;③輸入的檢索詞太少;④應該使用“與(AND)”的使用了“或(OR)”;⑤優(yōu)先運算符“()”使用錯誤。輸出篇數(shù)過少,原因可能是:①檢索詞拼寫錯誤;②遺漏重要的同義詞或隱含概念;③檢索詞過于冷僻具體;④沒有使用截詞算符;⑤位置算符和字段算符使用的過多;⑥使用過多的“與(AND)”算符。需要擴大檢索范圍,提高檢索結果查全率的,調整策略的方法有:①減少“與(AND)”算符,增加同義詞或同族相關詞用邏輯或(OR)將它們連接起來;②在詞干相同的單詞后使用截詞符(?);③去除已有的字段限制、位置算符限制(或者改用限制程度較小的位置算符)。如果需要縮小檢索范圍,提高檢索結果查準率的,調整策略的方法有:①減少同義詞或同族相關詞;②增加限制概念,用邏輯與(AND)將它們連接起來;③使用字段限制,或者限制檢索詞在指定的基本字段出現(xiàn),或者指定輔助字段,限制結果的文獻類型、語種、出版國家;④使用適當?shù)奈恢盟惴?;⑤使用“?NOT)”算符,排除無關概念。

2.4課題概念分析和檢索策略構成案例2.4.1獲取課題背景知識和歸納概念課題“經濟一體化”1.網上搜索(百度百科)2.專著\手冊\百科全書方正阿帕比:輸入“經濟一體化”中國大百科全書期刊論文CNKI:TI=“經濟一體化”(在核心期刊中檢索)4.課題概念的內涵歸納經濟一體化是兩個或兩個以上的國家或地區(qū)按協(xié)定在生產、貿易或貨幣金融等領域實行長期、穩(wěn)定的經濟聯(lián)合和政策協(xié)調,并逐步向統(tǒng)一的經濟實體發(fā)展的過程。它的基礎是市場經濟在所有成員體內的充分發(fā)展;核心是各成員體內部社會再生產過程的交叉滲透形成各成員體整體上的社會再生產;主要手段是生產、資本和交換的一體化;內容不僅涉及生產領域,還包括流通、金融、科技和文化領域;決定力量是市場機制;主導力量是各成員體的跨國公司;推動力量則是以信息技術為主導的技術進步;根源是各成員體博弈和磨合的制度創(chuàng)新。

2.4.2查找確定課題相關的主題詞和分類號1.查找和確定相關的主題詞2.查找和確定《中圖法》分類號2.4.3構建檢索策略(全球經濟一體化)1.主要概念的歸納2.檢索策略的構建2.4.4案例分析檢索詞:經濟一體化、全球擴展檢索詞:經濟合作、經濟協(xié)作、國際、世界檢索式:(全球+國際+世界)*(經濟一體化+經濟合作+經濟協(xié)作)+表示邏輯“或”,*表示邏輯“與”本章第三次課Standontheshouldersofgiants許多學術研究都建立在他人發(fā)現(xiàn)的基礎上80-20準則理查德·科克80%的收獲來自20%的時間

80%的時間創(chuàng)造了20%的成果一般信息和學術信息例:開題報告開題報告是在課題方向確定后,課題負責人在前期研究和充分思考的基礎上,將研究課題論證、設計、計劃付諸于文字的研究文件,是研究的初步方案。撰寫開題報告是科學研究者必須具備的能力。研究問題的提出碩士、博士、博士后,科研或專業(yè)人員問題分析、文獻復習、專家咨詢了解前人工作、確定研究的必要性、合理性和可行性(專業(yè)背景、人力、設施、經費、研究數(shù)據(jù)和研究方法的可及性)研究問題的修改和確定問題和意義要明確文獻綜述(定性、定量)Meta分析對研究問題的研究現(xiàn)狀做系統(tǒng)整理,進一步明確細化所開課題要回答的問題.知識發(fā)現(xiàn)(KnowledgeDiscovery)基于信息過濾、內容析取、數(shù)據(jù)挖掘、可視化技術,深入分析大規(guī)模數(shù)據(jù)和文獻中的關系和規(guī)律,揭示尚未發(fā)現(xiàn)的知識實際上,科學研究就是信息集聚過程,對信息內容進行廣泛深入的分析和挖掘,發(fā)現(xiàn)知識、找出規(guī)律、揭示未知、不斷引導R&D例:現(xiàn)代科學研究的變革信息獲取方式的環(huán)境在變化各類資源在不斷的整合…..信息采集---是信息的選擇過程,根據(jù)不斷變化的用戶需求從已確定的信息源體系中選擇、提取和搜求的過程SecondarysourcesPrimarySources1、網絡信息采集的基本思路

確定自己的任務解決何問題?時間期限?對課題已知的知識是什么?需要查找的知識是什么?最終產品是什么?從已知信息里形成“關鍵詞”

采集網絡有效信息的基本思路通用詞特殊詞

采集網絡有效信息的基本思路

形成信息查詢策略:---教科書(教科書獲取總覽)---百科全書(充實教科書的不足)重組自己的研究內容:再次弄清研究內容——擴大關鍵詞列表(盡可能全)目錄書、檢索書、期刊網絡學術數(shù)據(jù)庫、電子預印本系統(tǒng)圖書館信息專家已匯集的專題資源網絡上的專業(yè)導航通用資源特殊資源采集網絡有效信息的基本思路

咨詢專業(yè)圖書館員圖書館聯(lián)機書目查詢(OPAC)虛擬圖書館網絡學術數(shù)據(jù)庫、電子預印本系統(tǒng)組織優(yōu)良的webDirectory搜索引擎搜索Web站點(相關優(yōu)秀個人主頁、學會主頁、機構主頁、興趣組主頁等上的各類文件。。。)

所需的資源在哪里?如何查找不同類型的資源?2、影響網絡信息檢索因素影響網絡信息檢索因素影響網絡信息檢索的因素可歸為三類:信息資源質量、檢索軟件、用戶水平。1)信息資源質量對檢索的影響——信息資源收集不完整、不系統(tǒng)、不科學?!畔①Y源加工處理不規(guī)范、不標準?!畔①Y源分散無序,更換、消亡無法預測?!畔①Y源由于版權和知識產權問題容易引起知識產權、版權和信息的真?zhèn)蔚葐栴}?!畔⒌恼Z言障礙。影響網絡信息檢索因素2)檢索軟件對信息檢索的影響因特網是一個沒有統(tǒng)一管理、分散的、可以相互交流的巨大信息庫。人們必須掌握各種網絡信息檢索工具,才能檢索到所需信息。——各種檢索工具給予相應的數(shù)據(jù)庫——基于一個較廣義的檢索項,會獲得數(shù)以萬計的檢索結果——各種檢索工具的信息資源出現(xiàn)交叉影響網絡信息檢索因素3)用戶水平對信息檢索的影響——用戶對信息檢索需求的理解和檢索策略的制定——用戶的計算機操作能力及網絡相關知識的掌握程度——用戶對網絡信息檢索工具的應用熟練程度——用戶的外語水平3、提高網絡信息檢索效果的方法提高網絡信息檢索效果的方法1)更新知識,培養(yǎng)“信息素養(yǎng)”信息素養(yǎng):使用計算機和信息技術高效獲取、正確評價和善于利用信息的能力如何培養(yǎng)信息素養(yǎng)?——掌握計算機一般操作知識和基本術語——了解網絡的基本知識——提高英語水平——學會收集信息、篩選信息、利用信息——掌握信息檢索工具的使用方法和技巧提高網絡信息檢索效果的方法2)不斷積累經驗,提高信息獲取能力——使用傳統(tǒng)的信息資源,如專業(yè)書刊、百科全書等,獲取專業(yè)主題詞、關鍵詞,供查詢時使用?!C合使用因特網按專題搜索、按地區(qū)搜索、按關鍵詞搜索的方法進行信息查找。——隨時將發(fā)現(xiàn)的、有價值的信息資源URL地址保存在“收藏夾”中?!嗪屯薪涣餍畔z索語言學基礎例:規(guī)范化語言(artificiallanguage):采用規(guī)范詞(controlledterm),是人工控制語言。規(guī)范詞采用特定的詞匯來專指或網絡相應概念,這些詞稱為規(guī)范詞。它能較好地對同義詞、近義詞、相關詞、多義詞及縮略詞進行規(guī)范。例如:飛機:plane、airplane、aeroplaneaircraft用aircraft來表示所有“飛機”概念,以此作為規(guī)范詞.使用aircraft一詞的檢索結果將包括全部有飛機概念的文獻.信息檢索步驟分析研究課題,確定檢索目標選擇檢索工具使用適當?shù)臋z索語言,構造檢索表達式實際進行查找整理檢索結果索取文獻原文1、主題詞的確定主題詞的確定研究領域關鍵詞;研究方向關鍵詞;技術點和研究方法關鍵詞;參考文獻的選擇則與上述關鍵詞選擇順序相反,及技術點和研究方法→研究方向→研究領域。主題詞的確定來源:規(guī)范主題詞+自由詞專業(yè)技術詞典詞表學術數(shù)據(jù)庫例:課題:飛機機翼結冰

飛機在中、低空某些氣候條件下易結冰,尤其是著陸狀態(tài),它將對飛行安全造成極大威脅。1993年11月13日,中國北方航空公司的2141號MD-82客機在進行航班飛行時在烏魯木齊機場墜毀,造成12名機上人員死亡。該機是在結冰氣候條件下著陸時墜毀的。有分析表明,該機的防冰系統(tǒng)設計在防冰能力、防冰控制的多功能控制活門等問題上存在明顯不足中國學術期刊網(全文)得到主題詞AircrafticingAerospcepropulsionsystemAnti-icingAnti-icerDe-icingAnti/de-icing得到主題詞AircrafticingDeicingDeicersIcepreventionAntiicingadditives2、科技查新科技查新1、定義科技查新是以文獻檢索為基礎,以手工檢索和計算機檢索為手段,采用綜合分析對比的方法,為科研項目的立項、鑒定、申報成果等科研活動提供事實依據(jù)的一種信息服務方式。2、科技查新的性質A.查新是對項目的新穎性作出結論B.查新有別于文獻檢索C.查新有別于專家評審3、進行什么工作需要查新?

立項查新成果鑒定查新技術開發(fā)查新技術轉讓查新專利申請查新專利糾紛查新談判、銷售、關鍵技術查新標準資料等查新4、一般查新步驟查得的相關文獻進行對比分析文獻中的研究與查新人的研究異同之處,查新人的研究是否國內無相同或相似研究報道,是否國際上無相關研究報道.最終從查得結果作出國內或國際領先,具有新穎性的結論.3、圖書館書目數(shù)據(jù)庫圖書館書目數(shù)據(jù)庫

網上圖書館書目數(shù)據(jù)庫的利用

借助Internet,可以方便地查出各個圖書館的書刊收藏選擇文獻類型選擇查詢類型Javaweb2005webDirectoryVirtualLibrary網上百科全書電子預印本系統(tǒng)學科網站導航看不見的網站webDirectory網絡目錄(WebDirectory)——因特網上的目錄型檢索工具,又稱分類站點目錄、專題目錄或主題指南、站點導航系統(tǒng)等。以某種分類法進行組織整理,并和檢索法集成。網絡目錄一般是通過引導網絡用戶的查詢概念(而不是確切的詞條)來幫助用戶找到所需的網絡信息。網絡目錄一般采用人工方式采集和存儲網絡信息。但是,部分網絡目錄并不全是人工方式采集和組織信息,而是利用自動功能或者由用戶遞交的方式來豐富和補充資源。webDirectoryYahoo!目錄(最高層目錄)二級目錄三級目錄四級目錄SiteListing5學科網站導航SubjectInformationGateway(SIG)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論