版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、泓域咨詢/纖維素纖維公司工程項目數(shù)據采集分析與知識管理纖維素纖維公司工程項目數(shù)據采集分析與知識管理一、 時間數(shù)據分析方法(一)時間數(shù)據時間數(shù)據也稱時間序列(Timeseries)或動態(tài)數(shù)據,是按時序排列的一組來自同一現(xiàn)象的觀察值。時間序列可按日、月、季度、年等收集,有些呈現(xiàn)很強的季節(jié)性,建模時應給予反映。氣象、水文、生態(tài)環(huán)境、經濟及社會活動都能觀察到周期性時間序列。實際觀測并記錄的時間序列,實際上是隨機過程的樣本,即,在產生時間序列的實際過程的每一時點上,人們看到的只是該時點隨機變量的樣本,并不能觀察到母體。時間序列可分為平穩(wěn)和非平穩(wěn)序列,還可以分成線性和非線性時間序列。(二)時間序列分析1概
2、述時間序列分析是根據隨機過程理論,研究時間序列的統(tǒng)計規(guī)律。時間序列分析廣泛應用于信息壓縮、利用衛(wèi)星照片識別地球資源、石油勘探、經營管理、預測(氣象、水文、地震、地下水位、農作物病蟲災害)、控制(環(huán)境污染、生態(tài)平衡)(天文學和海洋學)等方面。時間序列預測的基本依據是:(1)客觀過程是連續(xù)的,有慣性,現(xiàn)在是過去的繼續(xù),過去的信息會傳遞到現(xiàn)在與未來,利用過去的數(shù)據或信息能推測未來。(2)偶然因素會影響到客觀過程,使其行為與模式有隨機性。預測要利用時間序列各時點隨機量的相關關系。時間序列的趨勢與波動稱為“模式”,時間序列分析首要要識別其模式,然后用適當?shù)那€擬合。擬合模式的各種參數(shù)根據按“最優(yōu)預測”原
3、則估算出的時間序列數(shù)字特征(期望值、方差、協(xié)方差、自相關函數(shù))等確定。2.時間序列成分時間序列常含有4種成分:趨勢、季節(jié)變動、規(guī)則波動和不規(guī)則波動。所謂趨勢,是長期持續(xù)向上或持續(xù)向下的傾向。季節(jié)變動,是實際過程受氣候、市場狀況、節(jié)假日或風俗習慣等影響而呈現(xiàn)的周期性波動。規(guī)則波動,是周期不等的變動,呈漲落交替之狀。波動的周期可能很長,但與趨勢不同。不規(guī)則波動,是時間序列除去趨勢、季節(jié)變動和周期波動之后的波動。不規(guī)則波動總是夾雜在時間序列中,致使時間序列產生一種波浪形或震蕩式的變動。時間序列經常是各種周期成分的疊加,例如地震或人工地震波的記錄。這樣的序列要做頻域分析。頻域分析確定時間序列各周期成分
4、稱為“譜”或“功率譜”的能量分布形態(tài)。頻域分析又稱譜分析。譜分析的重要內容就是通過序列的周期圖()的極值點尋找各種分量的周期。3時間序列建模時間序列建模一般有如下幾個步驟(1)取得時間序列樣本。(2)將樣本點畫成圖,進行相關分析。時間序列圖形可顯示出變化趨勢和周期,并發(fā)現(xiàn)離群點和轉折點。若離群點確實為觀測值,建模時應加以考慮,若非,應加以調整。轉折點指時間序列趨勢突變的點。如果發(fā)現(xiàn)轉折拐點,則在建模時須分段用不同的模型擬合時間序列,例如用門限回歸模型。(3)模式識別與擬合。時間序列模式眾多。小樣本可用趨勢模型、季節(jié)模型加上隨機誤差擬合。對于樣本容量(即觀測值個數(shù))大于50的平穩(wěn)時間序列,可用A
5、RMA(自回歸移動平均)模型擬合。非平穩(wěn)時間序列可經差分化為平穩(wěn)時間序列,再用ARMA模型擬合。(4)預測未來。利用建成的模型預測時間序列未來值。4時間序列常用模型(1)ARMA模型(2)回歸模型二、 大數(shù)據系統(tǒng)和數(shù)據挖掘技術(一)數(shù)據挖掘概述1大數(shù)據大數(shù)據是指超過既往數(shù)據庫系統(tǒng)規(guī)模、傳輸速度和處理能力,或者既往數(shù)據庫系統(tǒng)結構無法容納的數(shù)據。大數(shù)據常以萬億或EB衡量,且種類多、實時性強,蘊藏的商業(yè)價值大。很多現(xiàn)有的新或舊的信息基礎設施、工具和技術可用來開發(fā)和利用大數(shù)據中蘊藏的價值。大數(shù)據有各種各樣的來源:傳感器、氣候信息、公開的信息、如雜志、報紙、文章、買賣記錄、網絡日志、病歷、事監(jiān)控、視頻和
6、圖像檔案,及大型電子商務。大數(shù)據是數(shù)據挖掘產生與生存發(fā)展的土壤。如今數(shù)據每五年翻一番,面對前所未有的海量數(shù)據,為了從中發(fā)現(xiàn)有用的信息必須進行數(shù)據挖掘。此外,計算機存儲、處理大量數(shù)據,以及運算的能力大為增強,為數(shù)據挖掘創(chuàng)造了條件,使其成為一門獨特的學科和技術。2數(shù)據挖掘與數(shù)據分析的區(qū)別數(shù)據挖掘與數(shù)據分析的主要區(qū)別在于:(1)處理工作量。數(shù)據分析的數(shù)據量可能并不大,而數(shù)據挖掘的數(shù)據量極大。(2)制約條件。數(shù)據分析是從某些假設出發(fā),建立方程或模型,而數(shù)據挖掘不作假設,可以自動建立方程。(3)處理對象。數(shù)據分析往往是針對數(shù)字型數(shù)據,而數(shù)據挖掘對象類型繁多,例如圖像、聲音、文本等。(4)處理結果。數(shù)據分
7、析可以解釋結果的含義;數(shù)據挖掘的結果不易解釋,著眼于預測未來,并提出決策建議。想要從數(shù)據中發(fā)現(xiàn)規(guī)律(即認知),往往需將數(shù)據分析和數(shù)據挖掘結合起來。(二)數(shù)據挖掘步驟按挖掘對象,數(shù)據挖掘分為數(shù)據庫與數(shù)據倉庫挖掘和網絡挖掘兩種,各自步驟分述如下。1數(shù)據庫與數(shù)據倉庫挖掘數(shù)據挖掘一般有信息收集、數(shù)據集成、數(shù)據規(guī)約、數(shù)據清理、數(shù)據變換、數(shù)據挖掘、模式評估和知識表示8個步驟。(1)信息收集。從確定的挖掘對象中提取特征,然后選擇合適的收集方法,將收集到的信息存入數(shù)據庫。對于海量數(shù)據,必須選擇合適的數(shù)據倉庫。(2)數(shù)據集成。把來源、格式、特點、性質不同的數(shù)據按邏輯或物理屬性加以編排,以便以后使用。(3)數(shù)據規(guī)
8、約。多數(shù)數(shù)據挖掘算法耗時很長,商業(yè)數(shù)據往往較多,數(shù)據挖掘更耗時間。數(shù)據規(guī)約就是簡化已有可用數(shù)據集的表示,規(guī)約后數(shù)量大減,但仍能保持原數(shù)據的完整性,對規(guī)約數(shù)據的挖掘結果,與對規(guī)約前數(shù)據的挖掘結果相同或幾乎相同。(4)數(shù)據清理。有些數(shù)據不完整(屬性缺少屬性值)、含噪聲(屬性值錯誤),不一致(同一信息有多種表示),需要清理,使其完整、正確、一致后存入數(shù)據倉庫。(5)數(shù)據變換。將數(shù)據變換成適合數(shù)據挖掘的形式。實數(shù)型數(shù)據,可將其分層和離散化。(6)數(shù)據挖掘。根據數(shù)據格式、屬性與特點,選擇合適的處理工具,例如統(tǒng)計方法、事例推理、決策樹、規(guī)則推理、模糊集,甚至神經網絡,取得有用的信息。(7)模式評估。由行業(yè)
9、專家核實數(shù)據挖掘結果是否合理、是否可用。(8)知識表示。將數(shù)據挖掘得到的信息以可視方式交給用戶,或作為新的知識存人知識庫,供其他應用程序使用。并非所有的數(shù)據挖掘都要走上述的每一步。若只有一個數(shù)據源,則可以省略數(shù)據集成。數(shù)據規(guī)約、數(shù)據清理、數(shù)據變換合稱數(shù)據預處理。數(shù)據挖掘至少60%的費用要花在信息收集階段,而至少60%以上的精力和時間要花在數(shù)據預處理上。數(shù)據挖掘是一個反復多次的過程,若一次未滿足要求或未得到有用結果,則需回到前面,經過調整后重新開始。2,網絡挖掘網絡挖掘可分為網絡用戶行為挖掘與網絡信息挖掘。前者基本不在工程咨詢人員關心之列。后者可理解為“從WWW中發(fā)現(xiàn)和分析有用的信息”。網絡信息
10、挖掘是在已知數(shù)據樣本的基礎上,通過歸納學習、機器學習、統(tǒng)計分析等發(fā)現(xiàn)挖掘對象間的內在關系與特性,進而在網絡中提取用戶感興趣的信息,獲得更高層次的知識和規(guī)律。網絡信息挖掘沿用了Robot,全文檢索、人工智能的模式識別、神經網絡等技術。現(xiàn)在的搜索引擎使用了這些技術,能夠在網頁或網站數(shù)據庫中為用戶搜尋有用信息。網絡信息挖掘具體步驟如下:(1)確立目標樣本。由用戶選擇目標文本,提取特征信息。(2)提取特征信息。根據目標樣本的詞頻分布,從統(tǒng)計詞典中提取挖掘目標的特征向量并計算出相應的權值。(3)網絡信息獲取。先利用搜索引擎站點選擇待采集站點,再利用Robot程序采集靜態(tài)Web頁面,最后獲取被訪問站點網絡
11、數(shù)據庫中的動態(tài)信息,生成WWW資源索引庫。(4)信息特征匹配。提取索引庫中的源信息特征向量,并與目標樣本的特征向量對照,將符合要求的信息交給用戶。三、 項目背景分析纖維素纖維產業(yè)是化纖行業(yè)的重要分支,但與其他化學纖維不同,粘膠纖維以天然棉短絨為原料的一種優(yōu)良再生纖維素纖維,除了保留棉纖維的吸濕、透氣等優(yōu)良性能外,粘膠纖維在染色性、抗皺性和后道可紡性等方面優(yōu)于棉纖維,是棉纖維的一個良好替代品種。由于城市化進程加快,土地資源的稀缺、糧棉爭地的矛盾,決定了化纖仍將長期作為最主要的紡織原料在紡織加工鏈中占有較大比重,國內需求的持續(xù)增長仍是化纖工業(yè)發(fā)展的主要動力。具體來看,每年全國紗線產量的不斷提高增加
12、了粘膠短纖的剛性需求,同時近年來技術的進步提升了粘膠短纖產品的性能、擴大了粘膠短纖產品的應用范圍,在棉紡織原材料中的用粘比不斷提高。由于粘膠纖維的生產對于技術、資金的要求都比較高,小規(guī)模企業(yè)原料自給程度不高,小規(guī)模生產企業(yè)在激烈的市場競爭中很難取得優(yōu)勢。盡管國內粘膠纖維生產企業(yè)較多,但原料供應難度也影響了企業(yè)規(guī)模的擴張。近年來,行業(yè)市場競爭較為激烈,在小型企業(yè)虧損并無力進行技術改造的情況下,優(yōu)勢企業(yè)因成本優(yōu)勢依然可以獲取較高利潤并在行業(yè)內進一步擴張。而優(yōu)勢企業(yè)的擴張進一步強化了其規(guī)模優(yōu)勢,生產成本會進一步降低,競爭力將進一步增強。國家“十二五”規(guī)劃提出大力發(fā)展高新技術纖維、生物質纖維以及高性能
13、差別化、功能化纖維。粘膠纖維屬天然纖維素再生纖維,具有比合成纖維更加優(yōu)越的產品性能、可自然降解、環(huán)保可再生等優(yōu)點,發(fā)展前景相當廣闊。粘膠纖維向差別化、功能化、保健型方向發(fā)展,完全符合行業(yè)政策導向,且順應了世界化纖行業(yè)的發(fā)展趨勢。隨著粘膠纖維差別化率的不斷提高,傳統(tǒng)的1.5D粘膠短纖市場正在逐步分化成以1.5D產品市場為主,竹纖維、高白纖維、細旦纖維、阻燃纖維等產品為輔的多元化市場。四、 項目名稱及投資人(一)項目名稱纖維素纖維公司工程項目(二)項目投資人xxx(集團)有限公司(三)建設地點本期項目選址位于xxx(以最終選址方案為準)。五、 結論分析(一)項目選址本期項目選址位于xxx(以最終選
14、址方案為準),占地面積約43.00畝。(二)項目實施進度本期項目建設期限規(guī)劃12個月。(三)投資估算本期項目總投資包括建設投資、建設期利息和流動資金。根據謹慎財務估算,項目總投資18163.18萬元,其中:建設投資14426.65萬元,占項目總投資的79.43%;建設期利息186.29萬元,占項目總投資的1.03%;流動資金3550.24萬元,占項目總投資的19.55%。(四)資金籌措項目總投資18163.18萬元,根據資金籌措方案,xxx(集團)有限公司計劃自籌資金(資本金)10559.32萬元。根據謹慎財務測算,本期工程項目申請銀行借款總額7603.86萬元。(五)經濟評價1、項目達產年預
15、期營業(yè)收入(SP):32400.00萬元。2、年綜合總成本費用(TC):27096.00萬元。3、項目達產年凈利潤(NP):3874.14萬元。4、財務內部收益率(FIRR):15.12%。5、全部投資回收期(Pt):6.36年(含建設期12個月)。6、達產年盈虧平衡點(BEP):13226.37萬元(產值)。(六)主要經濟技術指標主要經濟指標一覽表序號項目單位指標備注1占地面積28667.00約43.00畝1.1總建筑面積57187.28容積率1.991.2基底面積17486.87建筑系數(shù)61.00%1.3投資強度萬元/畝316.342總投資萬元18163.182.1建設投資萬元14426.
16、652.1.1工程費用萬元12223.782.1.2工程建設其他費用萬元1810.362.1.3預備費萬元392.512.2建設期利息萬元186.292.3流動資金萬元3550.243資金籌措萬元18163.183.1自籌資金萬元10559.323.2銀行貸款萬元7603.864營業(yè)收入萬元32400.00正常運營年份5總成本費用萬元27096.006利潤總額萬元5165.527凈利潤萬元3874.148所得稅萬元1291.389增值稅萬元1153.9810稅金及附加萬元138.4811納稅總額萬元2583.8412工業(yè)增加值萬元9063.4513盈虧平衡點萬元13226.37產值14回收期年
17、6.36含建設期12個月15財務內部收益率15.12%所得稅后16財務凈現(xiàn)值萬元2365.05所得稅后六、 工程咨詢知識及其特點(一)工程咨詢知識工程咨詢需要多方面知識與技能。知識,有哲學、工程學、經濟學、社會學、管理學、財務會計、法律等方面的知識;技能,有專業(yè)知識、項目管理、公共關系、野外考察、外國語、信息處理等方面的技能。(二)工程咨詢知識的特點1數(shù)量多,種類龐雜工程咨詢行業(yè)涉及國民經濟眾多部門,專業(yè)門類多,大小不一,跨地區(qū)、跨國界。即便是行業(yè)工程咨詢,也涉及多種專業(yè)。例如對校舍工程的咨詢,就涉及國民經濟、統(tǒng)計、消防、建筑、結構、給排水、暖通、電氣、技術經濟、法律等十多個專業(yè)。2隱性知識難
18、以提煉隱性知識,特別是經驗,在工程咨詢中有重要作用。經驗需要積累,且常難以提煉和恰當表達。正因為如此,長期積累的經驗最容易隨著這些經驗的載體人離去而散失。3保密要求高咨詢企業(yè)在咨詢過程中獲得了客戶大量信息,有些很敏感,客戶不希望透漏給第三方。在本企業(yè)內部共享由此而獲得的信息、經驗與知識時,或將來為其他客戶服務時,應確保不透漏給第三方。七、 工程咨詢企業(yè)知識管理(一)知識管理及知識管理的組織1知識管理的概念日益激烈的競爭以及其他眾多因素對工程咨詢企業(yè)知識的數(shù)量與質量提出了更高的要求。從某種意義上說,知識管理是咨詢企業(yè)最重要的能力。經常有人將知識管理與信息管理混為一談。信息是知識的來源,但不一定成
19、為知識。要想從信息中提煉知識,需要有意識地開展必要的活動,使信息經過大腦的處理、加工與提煉。知識管理,是建立一套制度,開展一系列活動,獲取、記錄、整合、存取、更新和創(chuàng)新知識,以適當?shù)男问綖樽稍兤髽I(yè)所掌握,成為企業(yè)知識積累中的一部分,用來為客戶、社會創(chuàng)造價值,不至隨著企業(yè)活動的結束或停止或因當事人的離開而流失。知識管理可以延伸到人在知識方面的行為、企業(yè)管理制度與企業(yè)文化等方面。簡而言之,知識管理就是對知識提煉、創(chuàng)造、共享和積累,以及應用等過程進行規(guī)劃、實施和控制的活動。2,知識管理的必要性知識管理能夠減少重復勞動,增強企業(yè)的記憶,豐富咨詢企業(yè)的智慧。知識管理在全球迅猛發(fā)展的原因在于:(1)競爭。
20、市場競爭日益激烈,創(chuàng)新速度加快。咨詢企業(yè)必須不斷獲得新知識,利用知識為企業(yè)和社會創(chuàng)造價值。要走向世界,就必須掌握與世界交流,以及獲取、創(chuàng)造與轉換知識的能力。企業(yè)文化對企業(yè)學習能力影響極大,必須擺脫封閉、保守、不思進取的陳舊文化,轉變成學習型企業(yè),才能在競爭中立于不敗之地。(2)以客戶為中心。企業(yè)要為客戶創(chuàng)造價值。(3)員工流動。如果企業(yè)不能及時妥善地處理,就會喪失員工在本企業(yè)工作期間獲得的知識。很多咨詢企業(yè),當某專業(yè)骨干離職后,在相當長一段時間內,無法正常開展該專業(yè)的業(yè)務,給企業(yè)和客戶造成了損失。(4)不確定性。咨詢企業(yè)內外不確定因素眾多,市場競爭使咨詢企業(yè)不能確??蛻羯祥T。當前的世界,新技術
21、頻出,更新加快,咨詢企業(yè)不能確信自己為客戶提出的技術方案一定成功。企業(yè)及其成員獲取和使用知識的能力成為企業(yè)生存與發(fā)展的決定性因素,知識已成為企業(yè)獲取競爭優(yōu)勢的基礎與稀缺資產。3知識管理的組織工程咨詢企業(yè)必須建立知識管理需要的組織,明確必要的角色及其職責、權限和相互關系,并分派給適當人員。必須制訂管理方針、目標以及實現(xiàn)這些目標所需要的規(guī)章制度。此外,還要設立必要的知識庫、多渠道知識收集系統(tǒng)等。知識管理需要長期堅持并且努力使其成為企業(yè)文化的一部分。知識管理體系應當具備如下特征:(1)以人為本。知識管理要以人為本,咨詢企業(yè)應充分發(fā)動每個部門、每一員工,貢獻自己掌握的信息與知識,使之成為企業(yè)的知識與智
22、慧。(2)以無形資產為主要對象。知識管理比以往任何管理形式都更重視知識資產。(3)無間斷的循環(huán)。在企業(yè)存續(xù)期間,知識管理是一個不間斷的“積累一創(chuàng)造一應用一再積累一再創(chuàng)造一再應用”的循環(huán)過程(4)以提煉隱性知識為主。知識管理對象有顯性和隱性知識,但以提煉隱性知識為重點,設法將隱性知識轉換為易于企業(yè)內共享的知識。研究表明,大多數(shù)企業(yè),有序、關系清楚,可供員工參考的信息與知識只占自身擁有總量的10%,其他90%存在員工個人大腦之中,且難于用語言、文字或圖形清楚地表達出來供企業(yè)使用。一旦這些人流失,企業(yè)將蒙受巨大損失。(5)以創(chuàng)新為目標。知識管理以創(chuàng)新,以建立創(chuàng)造新知識平臺為目標,創(chuàng)新和孕育新智慧是知
23、識管理的標志。(6)建立學習型組織。便于知識管理的組織與疊床架屋的層級組織不同,只有中間層次簡單的“扁平”、開放學習型組織,才有利于知識管理。知識管理必須利用先進的信息技術與工具。有些咨詢企業(yè)已按自身的發(fā)展戰(zhàn)略及管理體制建立了獨特的知識管理系統(tǒng)。與信息管理一樣,知識管理也應具備安全管理功能,保護本企業(yè)掌握的知識不受損害。(二)知識管理原則與功能1知識管理原則(1)積累原則。知識積累是實施知識管理的基礎(2)共享原則。咨詢企業(yè)應使每一員工都能接觸和使用公司的知識和信息。(3)交流原則。知識管理的核心是要在企業(yè)內部建立有利于交流的結構和文化,消除員工之間的交流的障礙。知識交流在上述原則中處于最高層
24、次。2知識管理功能知識管理要獲得成功,需要有完整的知識管理制度。該制度應具備的主要功能如下:(1)能夠清楚地了解企業(yè)已有何種知識,還需要何種知識;(2)要能夠及時將知識傳遞給真正需要的人;(3)一定要使需要知識的人能夠獲取;不斷生產新知識,并使整個企業(yè)的人能夠使用;(4)確保進入企業(yè)的知識可靠、有生命力;(5)定期檢查企業(yè)的知識是否仍然有效;(6)改造企業(yè)文化,建立激勵機制,為知識管理創(chuàng)造便利條件。(三)內部交流與共享咨詢企業(yè)內部的知識交流一方面可以讓不同項目組之間交流咨詢方法和經驗,促進隱性知識的提煉;另一方面也便于彼此加深了解和信任,促進合作,促進知識的創(chuàng)新與共享。知識共享有多種方式,例如
25、即時通信、培訓與及時交流會等。知識共享將分散于各部門和各員工頭腦中的知識匯集起來,將知識孤島連成大陸,產生孤島無法產生的價值。交流可以最大限度地使知識和經驗得到融合和升華,也是使舊知識得以發(fā)展、新知識得以產生的催化劑。咨詢企業(yè)應當成為學習型組織,內部的知識交流是員工學習與組織學習的重要方式。咨詢單位應當建立適當?shù)募钪贫龋龠M知識共享,在共享中充實。企業(yè)的知識管理規(guī)章和制度,應當全面鼓勵各部門奉獻自己的知識,與他人共享。只有這樣,才有利于企業(yè)的知識積累。四)知識管理成效的評估咨詢企業(yè)知識管理的好壞與成效,可從以下幾個方面評估:1人力資源:培訓費用、員工向心力與經驗;2創(chuàng)新成果:研發(fā)費用、員工創(chuàng)
26、新態(tài)度與比率、咨詢業(yè)務的更新、知識產權;3客戶態(tài)度:服務質量、合作時間、咨詢次數(shù)、銷售額等。八、 網絡信息搜索和提取方法(一)概過現(xiàn)在,雖然不能說人類所有文獻與其他信息都上了互聯(lián)網,但是網上的信息極為豐富,許多都可用于咨詢。但是,許多咨詢人員還不善于甚至不知道如何從網上快速、安全、有效地獲得自己需要的信息和知識。咨詢工程師應當知曉網上有何利信息,應掌握從網上獲取信息的方法與基本技巧。對于網上的信息,可利用瀏覽器和搜索引擎獲取。瀏覽器是供用戶閱讀網頁內容的軟件;而搜索引擎,指從互聯(lián)網上搜集信息的特定電腦程序。早期的搜索引擎是收集互聯(lián)網中服務器的地址,按這些服務器擁有的資源類型將其編成不同的目錄,
27、各個目錄再逐層分類。搜索引擎則沿著此類層級向下搜索,找到用戶想要的信息。這種方式只適用于互聯(lián)網信息不多的時代。隨著互聯(lián)網上信息的迅猛增長,出現(xiàn)了新式搜索引擎,性能大為改進,能夠找到網站每一頁的起始地址,隨后搜索網上所有超級鏈接,把代表超級鏈接的所有詞匯放入一個數(shù)據庫。搜索引擎的功能不再限于搜索,已經添加了電子商務、新聞信息服務、個人免費電子信箱服務等。(二)搜索引擎工作原理搜索引擎有信息搜集、信息整理和接受用戶查詢三部分,各自工作原理大致如下:1搜集信息:搜索引擎利用稱為網絡蜘蛛(spider)的自動搜索機器人程序,從少數(shù)幾個網頁開始,將各個網頁的超鏈接連結在一起,只要網頁上有適當?shù)某溄樱瑱C
28、器人便可以遍歷絕大部分網頁。2整理信息:這個過程稱為“建立索引”。搜索引擎不僅要保存搜集到的信息,還要按照一定規(guī)則編排之。這樣,搜索引擎無須重新翻查已保存的所有信息,便能迅速找到所要的資料,從而能夠大大加快搜索速度。3接受查詢:對于每時每刻都會接到的大量用戶幾乎同時發(fā)出的查詢請求,搜索引擎按照各個用戶的要求檢查自己的索引,能在極短時間內找到用戶需要的資料,并交給用戶。目前,搜索引擎交給用戶的主要是網頁鏈接,用戶按照這些鏈接便能找到含有自己所需資料的網頁。搜索引擎一般會在這些鏈接下加一段有關這些網頁的摘要,以便用戶判斷此網頁是否含有自己需要的內容。(三)搜索引擎種類現(xiàn)在,搜索引擎有很多種,可以從
29、不同的角度分類。按搜索方法,分全文索引、目錄索引、元搜索、垂直搜索、集合式搜索、門戶搜索、個性搜索、專家型搜索與免費鏈接列表等。按搜索對象,分購物、自然語言、新聞、MP3、圖片等搜索引擎。按搜索范圍,分桌面、地址欄、本地等搜索引擎。按出現(xiàn)的時間,分第三代、第四代搜索引擎等?,F(xiàn)在,用的較多的搜索引擎有Google,百度、Yahoo、MSNSearch,Webcrawler,Lycos,CNetSearch,LookSmart等。(四)搜索方法與技巧要想使搜索引擎能在網上快速找到有關咨詢的資料,首先要明確查詢目的。目的不同,查詢策略與方法不同。在明確目的之后,還應了解查詢的種類與技巧,學會恰當?shù)厥褂藐P鍵詞。搜索方法的選擇取決于搜索的內容。不同搜索引擎的復雜
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 關于尋找贊助的咨詢服務行業(yè)經營分析報告
- 腳踏車踏板項目營銷計劃書
- 醫(yī)用恒溫箱產業(yè)鏈招商引資的調研報告
- 電話答錄機市場分析及投資價值研究報告
- 廢物氣化技術行業(yè)市場調研分析報告
- 外科醫(yī)生用鏡產品供應鏈分析
- 蠟紙成品項目運營指導方案
- 卸妝用薄紙產品供應鏈分析
- 商業(yè)戰(zhàn)略計劃服務行業(yè)經營分析報告
- 個人私有云服務行業(yè)營銷策略方案
- 2024-2030年中國新型電力系統(tǒng)行業(yè)發(fā)展展望及投資前景預測研究報告
- 2024自動導引車AGV技術規(guī)范
- 鹽池縣再生水廠、德勝墩水資源綜合利用特許經營項目實施方案
- 廣東某辦公樓改造裝飾工程施工組織設計方案
- 制動能量回收系統(tǒng)故障診斷與排除說課課件
- 《20世紀的科學偉人愛因斯坦》參考課件2
- 八年級道德與法治上冊 第一單元 走進社會生活 單元復習課件
- 中職心理健康課程設計
- 設計師會議管理制度
- 人教版英語九年級Unit 13《Were trying to save the earth》全單元教學設計
- 三年級上冊數(shù)學說課稿《5.筆算多位數(shù)乘一位數(shù)(連續(xù)進位)》人教新課標
評論
0/150
提交評論