




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、泓域咨詢/增值肥料項目數(shù)據(jù)采集分析與知識管理增值肥料項目數(shù)據(jù)采集分析與知識管理xxx(集團)有限公司一、 工程咨詢信息及其管理概述(一)工程咨詢信息的內(nèi)涵信息資源是工程咨詢行業(yè)的核心資源,通過獲取海量有效的信息,依靠信息、知識和智慧、先進(jìn)科技手段進(jìn)行服務(wù)。信息爆炸的社會要求工程咨詢行業(yè)服務(wù)機構(gòu)擁有獲取信息、處理信息的能力和手段。工程咨詢項目管理信息化是結(jié)合行業(yè)業(yè)務(wù)特點,以信息資源開發(fā)利用為核心,利用現(xiàn)代信息技術(shù)、網(wǎng)絡(luò)技術(shù)等現(xiàn)代科技,強化信息技術(shù)在業(yè)務(wù)中的滲透,在工程咨詢項目各環(huán)節(jié)中推廣應(yīng)用信息技術(shù),以提高工程咨詢機構(gòu)管理決策能力,提升咨詢工作效率,增強機構(gòu)行業(yè)競爭力。工程咨詢需要的信息,涉及自
2、然、資源、氣候、水文、地質(zhì)、人口、人文、項目投入產(chǎn)出、市場(商品、勞動力、金融)、財政及政策、貨幣政策、法規(guī)、標(biāo)準(zhǔn)與規(guī)范、發(fā)展規(guī)劃等。(二)工程咨詢信息管理的必要性我國經(jīng)濟進(jìn)入新常態(tài),全球化、綠色發(fā)展、結(jié)構(gòu)調(diào)整、新技術(shù)應(yīng)用等成為發(fā)展主基調(diào),這不僅需要規(guī)模巨大的投資,而且更加注重發(fā)展質(zhì)量,這就給工程咨詢業(yè)帶來了極大的發(fā)展機遇,也對工程咨詢信息管理提出了新的需求。未來工程咨詢將更多的應(yīng)用建筑信息模型技術(shù)(bim)、大數(shù)據(jù)、物聯(lián)網(wǎng)、地理信息系統(tǒng)(gis)無人機應(yīng)用、ar仿真模擬、人工智能輔助查詢與分析系統(tǒng)等,也迫切要求工程咨詢業(yè)能夠盡快改變傳統(tǒng)咨詢手段,必須針對新技術(shù)、新產(chǎn)業(yè)進(jìn)行調(diào)整,建立完善的數(shù)據(jù)
3、分析與知識管理方法。傳統(tǒng)的信息管理模式工作流程繁瑣,耗費人力物力,亟待向智能管理模式邁進(jìn)。工程咨詢信息管理以豐富的信息資源為管理重點,利用“互聯(lián)網(wǎng)+”、數(shù)據(jù)庫管理系統(tǒng)等先進(jìn)的信息管理手段,協(xié)助工程咨詢?nèi)藛T能夠從海量的業(yè)務(wù)數(shù)據(jù)中提供有用的信息,進(jìn)而做出科學(xué)的判斷以及正確的決策,從而實現(xiàn)為工程咨詢的決策提供更加全面及時的信息支出,使工作更加便捷,回復(fù)也更加及時,大幅減少出現(xiàn)錯誤的概率,安全性更高。二、 “互聯(lián)網(wǎng)+”背景下的工程咨詢信息管理“互聯(lián)網(wǎng)+”模式能充分發(fā)揮互聯(lián)網(wǎng)在社會資源配置中的優(yōu)化和集成作用,將互聯(lián)網(wǎng)的創(chuàng)新成果深度融合于各領(lǐng)域之中。工程咨詢行業(yè)本身就具有數(shù)據(jù)化的天然屬性,對“互聯(lián)網(wǎng)+”模
4、式有著接納和融合的先天優(yōu)勢?!盎ヂ?lián)網(wǎng)+”模式的到來給工程咨詢行業(yè)的發(fā)展帶來了新的催化劑和生產(chǎn)力,也帶來新思維模式和發(fā)展空間。隨著計算機與通信技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)不斷擴展和普及,網(wǎng)絡(luò)技術(shù)的發(fā)展使工程咨詢機構(gòu)能夠以快捷、低成本的方式獲取更多的信息資源?!盎ヂ?lián)網(wǎng)+工程咨詢”系統(tǒng)是建設(shè)基于互聯(lián)網(wǎng)的工程咨詢機構(gòu)系統(tǒng),以豐富的信息資源為管理重心,同時全面集成客戶、咨詢、銷售等業(yè)務(wù)處理系統(tǒng)及業(yè)務(wù)信息,支持工程咨詢機構(gòu)內(nèi)部各層級間及工程咨詢機構(gòu)與外部環(huán)境有效溝通的信息管理系統(tǒng)。(一)“互聯(lián)網(wǎng)+”對工程咨詢數(shù)據(jù)分析的作用工程咨詢的工作與互聯(lián)網(wǎng)連接,使工程咨詢可與無限的知識、專家、信息等實現(xiàn)即時對接。一個項目可
5、通過互聯(lián)網(wǎng)連接強大數(shù)據(jù)信息庫,提供大量相關(guān)理論知識與概念,然后通過線上咨詢與更多專家進(jìn)行溝通、研討,最后可自動與全球其他類似案例進(jìn)行匹配,提供建設(shè)性的意見與建議?!盎ヂ?lián)網(wǎng)+工程咨詢”系統(tǒng)突破傳統(tǒng)局限,利用互聯(lián)網(wǎng)信息化技術(shù)將信息流、數(shù)據(jù)流、工作流和資金流集成,形成強大的集聚效應(yīng),使工程咨詢行業(yè)在未來的市場競爭中不斷發(fā)展,呈現(xiàn)一種無限制發(fā)展的態(tài)勢。是提高工程咨詢服務(wù)效率和水平。應(yīng)用互聯(lián)網(wǎng)有利于工程咨詢?nèi)藛T掌握和有效利用相關(guān)數(shù)據(jù)信息,及時跟蹤新政策、新技術(shù)的變化,增強決策者信息處理能力,提高工程咨詢的服務(wù)效率。二是提高信息的準(zhǔn)確性和及時性。及時、準(zhǔn)確的獲取信息是工程咨詢的基礎(chǔ),信息技術(shù)改變了工程咨詢
6、人員獲取信息、搜集信息和傳遞信息的方式,工程咨詢數(shù)據(jù)的存儲、整理、分析、查詢、統(tǒng)計和傳遞可通過專業(yè)的信息系統(tǒng)實現(xiàn),縮短了信息傳遞周期。三是有效控制工程咨詢項目成本。將工程咨詢項目執(zhí)行成本納入管理范圍,通過統(tǒng)計分析發(fā)現(xiàn)項目管理中的問題,找出制約效益的瓶頸,從而降低項目成本,提高工程咨詢單位的效益。(二)信息管理目的與任務(wù)工程咨詢企業(yè)自己擁有大量信息,使用方便、可靠、費用低。因此,只有當(dāng)本企業(yè)缺乏所需信息時,才考慮其他來源。工程咨詢企業(yè)在長期為客戶服務(wù)中產(chǎn)生很多成果與文件,如客戶資料、產(chǎn)品配方、生產(chǎn)工藝、設(shè)計圖紙、貨源資料、營銷方案、財務(wù)報告等,往往使工程咨詢企業(yè)形成競爭優(yōu)勢。這些寶貴資源若管理不
7、善則不但無法得到有效利用,還會危及工程咨詢企業(yè)的競爭地位和安全。目前,上述信息十分龐雜,有些企業(yè)不善于管理,仍然依靠資料室、圖書館等傳統(tǒng)手段保存和管理上述信息,未設(shè)立有效的信息管理系統(tǒng),致使員工在查找所需信息時耗費了大量不必要的時間,甚至找不到本企業(yè)實際上有的數(shù)據(jù)、信息、文件或其他資料,造成了資源的極大浪費;即使使用數(shù)據(jù)庫,能力也很有限。另一方面,一些企業(yè)內(nèi)的某些部門囿于自身利益,不愿意將自己掌握的信息與其他部門共事。落后的信息管理已經(jīng)嚴(yán)重妨礙了咨詢業(yè)務(wù)的發(fā)展,工程咨詢企業(yè)應(yīng)當(dāng)了解信息管理的重要性及緊迫性,迅速改變現(xiàn)狀。信息管理是指將分散、無序、龐雜的數(shù)據(jù)信息按照一定規(guī)則加以識別、編排并記載各
8、種信息之間的聯(lián)系,進(jìn)而保存、添加、檢索、共享和利用。為了使信息管理行之有效,應(yīng)當(dāng)建立有效的制度,促使企業(yè)內(nèi)各部門之間共享各自掌握的數(shù)據(jù)與信息,盡可能地減少因重復(fù)收集數(shù)據(jù)與信息而浪費的資源,增加企業(yè)的整體收益。信息管理的任務(wù)是了解信息使用者的具體需要,對信息進(jìn)行全面的收集、適當(dāng)?shù)暮Y選、正確的分析、恰當(dāng)?shù)恼砗蛢Υ?,并將適合需要的信息及時、準(zhǔn)確、經(jīng)濟地交給各級工程咨詢和決策人員。咨詢企業(yè)應(yīng)當(dāng)利用先進(jìn)的信息管理手段,建立適合本企業(yè)需要的數(shù)據(jù)庫管理系統(tǒng),加強對本企業(yè)內(nèi)外信息的全面管理,為本企業(yè)咨詢業(yè)務(wù)及時提供全面、準(zhǔn)確、最新的信息。(三)信息管理技術(shù)與方法1信息管理基本做法對于數(shù)量巨大、種類繁多的數(shù)據(jù)
9、、信息或其他資料,有一些基本辦法,不僅適用于以往的圖書室、圖書館、檔案館、博物館等,也適用于計算機數(shù)據(jù)庫系統(tǒng)。例如,分類與編目方法,現(xiàn)在微軟公司的windows文件系統(tǒng)所依據(jù)的就是歷史悠久的分類與編目原則。2信息分類與編目對于工程咨詢企業(yè)掌握的信息,有多種分類與編目方式。例如,按企業(yè)管理層次分類編目,大企業(yè),目錄第一層按企業(yè)總體組織劃分,如公司總部、子(分)公司;第二層可按企業(yè)各級的職能部門劃分,如人力資源部、財務(wù)資產(chǎn)部、綜合管理部、技術(shù)質(zhì)量部、經(jīng)營計劃部等職能部門,以及規(guī)劃部門、設(shè)計部門等業(yè)務(wù)部門;第三層可按各業(yè)務(wù)部門的行政科室或者項目團隊來劃分。分類方法的選擇,既要考慮企業(yè)擁有的信息內(nèi)容、
10、形式與性質(zhì),也要考慮企業(yè)為客戶提供咨詢服務(wù)的方式與特點,或者將兩方面結(jié)合起來,使各種類別的信息便于查詢。例如,公司新聞、企業(yè)規(guī)章制度、會議紀(jì)要等,可以歸為一類,供一般用戶查詢。而對于圖檔,可以按項目名稱、時間、業(yè)務(wù)部門、版本、關(guān)鍵字、文字說明、關(guān)聯(lián)信息等逐層分類。為了便于企業(yè)員工更好地利用企業(yè)擁有的信息資源,可以信息地圖導(dǎo)航的方式編制目錄。信息地圖可按照上述分類方法編制,使用戶能夠快速找到他們需要的信息與資料。3檢索功能與權(quán)限信息管理系統(tǒng)必須有完善的查詢功能,允許使用者以多種方式查詢。查詢系統(tǒng)應(yīng)當(dāng)靈活、具有模糊查詢功能,以滿足不同人員的查詢習(xí)慣與偏好。查詢結(jié)果能夠以多種方式顯示或交給用戶。當(dāng)然
11、,為了信息的安全,查詢系統(tǒng)應(yīng)當(dāng)具備權(quán)限管理功能。(四)現(xiàn)代信息管理技術(shù)信息管理人員應(yīng)確保將必要的原始信息收集齊全,加工成可用信息。還要確保企業(yè)內(nèi)部人員在合適的時間以合適的形式取得并利用。信息管理要確保企業(yè)的信息準(zhǔn)確、及時、安全,確保滿足所有與工程咨詢有關(guān)的信息要求。對于非數(shù)字信息,可參考圖書館藏書、文獻(xiàn)分類與編目規(guī)則加以編排,購置相應(yīng)設(shè)施存放此類信息。對于數(shù)字信息,可以保存在計算機數(shù)據(jù)庫中并備份。1建立數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)是根據(jù)數(shù)據(jù)模型研制的描述、建立和管理數(shù)據(jù)庫的專用軟件,一般由數(shù)據(jù)庫語言、數(shù)據(jù)庫管理程序和數(shù)據(jù)庫使用程序三部分組成。數(shù)據(jù)庫語言主要用于建立數(shù)據(jù)庫、使用數(shù)據(jù)庫和對數(shù)據(jù)庫進(jìn)
12、行維護(hù)。數(shù)據(jù)庫管理程序是對數(shù)據(jù)庫的運行進(jìn)行管理、調(diào)度和控制的例行程序。數(shù)據(jù)庫使用程序是對數(shù)據(jù)進(jìn)行維護(hù)使其處于運行狀態(tài)而使用的各種數(shù)據(jù)庫服務(wù)程序。數(shù)據(jù)庫管理系統(tǒng)的功能因系統(tǒng)不同而有所差異,一般包括:定義數(shù)據(jù)庫、裝人數(shù)據(jù)庫、操作數(shù)據(jù)庫、維護(hù)數(shù)據(jù)庫、數(shù)據(jù)通信等。數(shù)據(jù)庫管理系統(tǒng)可分為小型和大中型數(shù)據(jù)庫;亦可分為關(guān)系數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、工程數(shù)據(jù)庫、多媒體數(shù)據(jù)庫等。關(guān)系數(shù)據(jù)庫在一般信息系統(tǒng)中發(fā)揮著巨大作用,是面向?qū)ο髷?shù)據(jù)庫、工程數(shù)據(jù)庫和多媒體數(shù)據(jù)庫的基礎(chǔ)。2信息安全管理信息安全一般指信息的完整和用途是否得到了有效保護(hù)。信息安全分為信息系統(tǒng)、數(shù)據(jù)庫、個人隱私、商用信息、國家機密的保護(hù)等方面。保密技術(shù)的缺
13、陷、網(wǎng)絡(luò)無限制傳播、計算機病毒、網(wǎng)上犯罪等都威脅到信息的安全。工程咨詢企業(yè)向委托人提出的方案和技術(shù),以及委托人提供的信息容易為競爭對手取得,從而損害自己的競爭力,損害委托人的利益。目前某些項目的可行性研究報告未刪除客戶的敏感信息就上傳到很多網(wǎng)站,不同程度地泄漏了本應(yīng)為客戶保密的內(nèi)容。對此,應(yīng)當(dāng)給予充分重視,配備必要的設(shè)備,安裝可靠的防護(hù)軟件。企業(yè)若不能及時有效地采取措施,信息一旦泄漏會造成不可估量的損失和損害。企業(yè)必須防止委托人和自身因泄密而受到損害。良好的信息安全管理可以降低運營風(fēng)險、保持企業(yè)競爭力。保密有多種方式,主要有:1)咨詢業(yè)務(wù)當(dāng)事人事先簽訂保密協(xié)議,并嚴(yán)格執(zhí)行;2)對信息庫設(shè)置使用
14、權(quán)限。一般可根據(jù)信息的重要性和敏感程度分為若干密級,為各級信息設(shè)置相應(yīng)的使用權(quán)限。橫向權(quán)限用來控制查詢和使用??v向權(quán)限可考慮信息屬性和用戶兩方面,為各種信息設(shè)置相應(yīng)的安全級別。普通知識,如企業(yè)文化、常用規(guī)章制度等,安全級別較低,可在企業(yè)內(nèi)部充分共享。而諸如合同、經(jīng)驗、涉密圖檔等,只能在小范圍內(nèi)交流,安全級別要高。各種用戶也應(yīng)設(shè)置權(quán)限級別,并將其與信息的安全級別對應(yīng)起來。橫向與縱向的保護(hù)辦法結(jié)合起來,可構(gòu)成比較嚴(yán)密、完善的安全體系,既能保證信息得到充分利用,又能減少泄露的機會。三、 時間數(shù)據(jù)分析方法(一)時間數(shù)據(jù)時間數(shù)據(jù)也稱時間序列(timeseries)或動態(tài)數(shù)據(jù),是按時序排列的一組來自同一現(xiàn)
15、象的觀察值。時間序列可按日、月、季度、年等收集,有些呈現(xiàn)很強的季節(jié)性,建模時應(yīng)給予反映。氣象、水文、生態(tài)環(huán)境、經(jīng)濟及社會活動都能觀察到周期性時間序列。實際觀測并記錄的時間序列,實際上是隨機過程的樣本,即,在產(chǎn)生時間序列的實際過程的每一時點上,人們看到的只是該時點隨機變量的樣本,并不能觀察到母體。時間序列可分為平穩(wěn)和非平穩(wěn)序列,還可以分成線性和非線性時間序列。(二)時間序列分析1概述時間序列分析是根據(jù)隨機過程理論,研究時間序列的統(tǒng)計規(guī)律。時間序列分析廣泛應(yīng)用于信息壓縮、利用衛(wèi)星照片識別地球資源、石油勘探、經(jīng)營管理、預(yù)測(氣象、水文、地震、地下水位、農(nóng)作物病蟲災(zāi)害)、控制(環(huán)境污染、生態(tài)平衡)(天
16、文學(xué)和海洋學(xué))等方面。時間序列預(yù)測的基本依據(jù)是:(1)客觀過程是連續(xù)的,有慣性,現(xiàn)在是過去的繼續(xù),過去的信息會傳遞到現(xiàn)在與未來,利用過去的數(shù)據(jù)或信息能推測未來。(2)偶然因素會影響到客觀過程,使其行為與模式有隨機性。預(yù)測要利用時間序列各時點隨機量的相關(guān)關(guān)系。時間序列的趨勢與波動稱為“模式”,時間序列分析首要要識別其模式,然后用適當(dāng)?shù)那€擬合。擬合模式的各種參數(shù)根據(jù)按“最優(yōu)預(yù)測”原則估算出的時間序列數(shù)字特征(期望值、方差、協(xié)方差、自相關(guān)函數(shù))等確定。2.時間序列成分時間序列常含有4種成分:趨勢、季節(jié)變動、規(guī)則波動和不規(guī)則波動。所謂趨勢,是長期持續(xù)向上或持續(xù)向下的傾向。季節(jié)變動,是實際過程受氣候、
17、市場狀況、節(jié)假日或風(fēng)俗習(xí)慣等影響而呈現(xiàn)的周期性波動。規(guī)則波動,是周期不等的變動,呈漲落交替之狀。波動的周期可能很長,但與趨勢不同。不規(guī)則波動,是時間序列除去趨勢、季節(jié)變動和周期波動之后的波動。不規(guī)則波動總是夾雜在時間序列中,致使時間序列產(chǎn)生一種波浪形或震蕩式的變動。時間序列經(jīng)常是各種周期成分的疊加,例如地震或人工地震波的記錄。這樣的序列要做頻域分析。頻域分析確定時間序列各周期成分稱為“譜”或“功率譜”的能量分布形態(tài)。頻域分析又稱譜分析。譜分析的重要內(nèi)容就是通過序列的周期圖()的極值點尋找各種分量的周期。3時間序列建模時間序列建模一般有如下幾個步驟(1)取得時間序列樣本。(2)將樣本點畫成圖,進(jìn)
18、行相關(guān)分析。時間序列圖形可顯示出變化趨勢和周期,并發(fā)現(xiàn)離群點和轉(zhuǎn)折點。若離群點確實為觀測值,建模時應(yīng)加以考慮,若非,應(yīng)加以調(diào)整。轉(zhuǎn)折點指時間序列趨勢突變的點。如果發(fā)現(xiàn)轉(zhuǎn)折拐點,則在建模時須分段用不同的模型擬合時間序列,例如用門限回歸模型。(3)模式識別與擬合。時間序列模式眾多。小樣本可用趨勢模型、季節(jié)模型加上隨機誤差擬合。對于樣本容量(即觀測值個數(shù))大于50的平穩(wěn)時間序列,可用arma(自回歸移動平均)模型擬合。非平穩(wěn)時間序列可經(jīng)差分化為平穩(wěn)時間序列,再用arma模型擬合。(4)預(yù)測未來。利用建成的模型預(yù)測時間序列未來值。4時間序列常用模型(1)arma模型(2)回歸模型四、 大數(shù)據(jù)系統(tǒng)和數(shù)據(jù)
19、挖掘技術(shù)(一)數(shù)據(jù)挖掘概述1大數(shù)據(jù)大數(shù)據(jù)是指超過既往數(shù)據(jù)庫系統(tǒng)規(guī)模、傳輸速度和處理能力,或者既往數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)無法容納的數(shù)據(jù)。大數(shù)據(jù)常以萬億或eb衡量,且種類多、實時性強,蘊藏的商業(yè)價值大。很多現(xiàn)有的新或舊的信息基礎(chǔ)設(shè)施、工具和技術(shù)可用來開發(fā)和利用大數(shù)據(jù)中蘊藏的價值。大數(shù)據(jù)有各種各樣的來源:傳感器、氣候信息、公開的信息、如雜志、報紙、文章、買賣記錄、網(wǎng)絡(luò)日志、病歷、事監(jiān)控、視頻和圖像檔案,及大型電子商務(wù)。大數(shù)據(jù)是數(shù)據(jù)挖掘產(chǎn)生與生存發(fā)展的土壤。如今數(shù)據(jù)每五年翻一番,面對前所未有的海量數(shù)據(jù),為了從中發(fā)現(xiàn)有用的信息必須進(jìn)行數(shù)據(jù)挖掘。此外,計算機存儲、處理大量數(shù)據(jù),以及運算的能力大為增強,為數(shù)據(jù)挖掘創(chuàng)
20、造了條件,使其成為一門獨特的學(xué)科和技術(shù)。2數(shù)據(jù)挖掘與數(shù)據(jù)分析的區(qū)別數(shù)據(jù)挖掘與數(shù)據(jù)分析的主要區(qū)別在于:(1)處理工作量。數(shù)據(jù)分析的數(shù)據(jù)量可能并不大,而數(shù)據(jù)挖掘的數(shù)據(jù)量極大。(2)制約條件。數(shù)據(jù)分析是從某些假設(shè)出發(fā),建立方程或模型,而數(shù)據(jù)挖掘不作假設(shè),可以自動建立方程。(3)處理對象。數(shù)據(jù)分析往往是針對數(shù)字型數(shù)據(jù),而數(shù)據(jù)挖掘?qū)ο箢愋头倍?,例如圖像、聲音、文本等。(4)處理結(jié)果。數(shù)據(jù)分析可以解釋結(jié)果的含義;數(shù)據(jù)挖掘的結(jié)果不易解釋,著眼于預(yù)測未來,并提出決策建議。想要從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律(即認(rèn)知),往往需將數(shù)據(jù)分析和數(shù)據(jù)挖掘結(jié)合起來。(二)數(shù)據(jù)挖掘步驟按挖掘?qū)ο?,?shù)據(jù)挖掘分為數(shù)據(jù)庫與數(shù)據(jù)倉庫挖掘和網(wǎng)絡(luò)挖掘
21、兩種,各自步驟分述如下。1數(shù)據(jù)庫與數(shù)據(jù)倉庫挖掘數(shù)據(jù)挖掘一般有信息收集、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)清理、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估和知識表示8個步驟。(1)信息收集。從確定的挖掘?qū)ο笾刑崛√卣?,然后選擇合適的收集方法,將收集到的信息存入數(shù)據(jù)庫。對于海量數(shù)據(jù),必須選擇合適的數(shù)據(jù)倉庫。(2)數(shù)據(jù)集成。把來源、格式、特點、性質(zhì)不同的數(shù)據(jù)按邏輯或物理屬性加以編排,以便以后使用。(3)數(shù)據(jù)規(guī)約。多數(shù)數(shù)據(jù)挖掘算法耗時很長,商業(yè)數(shù)據(jù)往往較多,數(shù)據(jù)挖掘更耗時間。數(shù)據(jù)規(guī)約就是簡化已有可用數(shù)據(jù)集的表示,規(guī)約后數(shù)量大減,但仍能保持原數(shù)據(jù)的完整性,對規(guī)約數(shù)據(jù)的挖掘結(jié)果,與對規(guī)約前數(shù)據(jù)的挖掘結(jié)果相同或幾乎相同。(4)數(shù)據(jù)
22、清理。有些數(shù)據(jù)不完整(屬性缺少屬性值)、含噪聲(屬性值錯誤),不一致(同一信息有多種表示),需要清理,使其完整、正確、一致后存入數(shù)據(jù)倉庫。(5)數(shù)據(jù)變換。將數(shù)據(jù)變換成適合數(shù)據(jù)挖掘的形式。實數(shù)型數(shù)據(jù),可將其分層和離散化。(6)數(shù)據(jù)挖掘。根據(jù)數(shù)據(jù)格式、屬性與特點,選擇合適的處理工具,例如統(tǒng)計方法、事例推理、決策樹、規(guī)則推理、模糊集,甚至神經(jīng)網(wǎng)絡(luò),取得有用的信息。(7)模式評估。由行業(yè)專家核實數(shù)據(jù)挖掘結(jié)果是否合理、是否可用。(8)知識表示。將數(shù)據(jù)挖掘得到的信息以可視方式交給用戶,或作為新的知識存人知識庫,供其他應(yīng)用程序使用。并非所有的數(shù)據(jù)挖掘都要走上述的每一步。若只有一個數(shù)據(jù)源,則可以省略數(shù)據(jù)集成。
23、數(shù)據(jù)規(guī)約、數(shù)據(jù)清理、數(shù)據(jù)變換合稱數(shù)據(jù)預(yù)處理。數(shù)據(jù)挖掘至少60%的費用要花在信息收集階段,而至少60%以上的精力和時間要花在數(shù)據(jù)預(yù)處理上。數(shù)據(jù)挖掘是一個反復(fù)多次的過程,若一次未滿足要求或未得到有用結(jié)果,則需回到前面,經(jīng)過調(diào)整后重新開始。2,網(wǎng)絡(luò)挖掘網(wǎng)絡(luò)挖掘可分為網(wǎng)絡(luò)用戶行為挖掘與網(wǎng)絡(luò)信息挖掘。前者基本不在工程咨詢?nèi)藛T關(guān)心之列。后者可理解為“從www中發(fā)現(xiàn)和分析有用的信息”。網(wǎng)絡(luò)信息挖掘是在已知數(shù)據(jù)樣本的基礎(chǔ)上,通過歸納學(xué)習(xí)、機器學(xué)習(xí)、統(tǒng)計分析等發(fā)現(xiàn)挖掘?qū)ο箝g的內(nèi)在關(guān)系與特性,進(jìn)而在網(wǎng)絡(luò)中提取用戶感興趣的信息,獲得更高層次的知識和規(guī)律。網(wǎng)絡(luò)信息挖掘沿用了robot,全文檢索、人工智能的模式識別、神
24、經(jīng)網(wǎng)絡(luò)等技術(shù)?,F(xiàn)在的搜索引擎使用了這些技術(shù),能夠在網(wǎng)頁或網(wǎng)站數(shù)據(jù)庫中為用戶搜尋有用信息。網(wǎng)絡(luò)信息挖掘具體步驟如下:(1)確立目標(biāo)樣本。由用戶選擇目標(biāo)文本,提取特征信息。(2)提取特征信息。根據(jù)目標(biāo)樣本的詞頻分布,從統(tǒng)計詞典中提取挖掘目標(biāo)的特征向量并計算出相應(yīng)的權(quán)值。(3)網(wǎng)絡(luò)信息獲取。先利用搜索引擎站點選擇待采集站點,再利用robot程序采集靜態(tài)web頁面,最后獲取被訪問站點網(wǎng)絡(luò)數(shù)據(jù)庫中的動態(tài)信息,生成www資源索引庫。(4)信息特征匹配。提取索引庫中的源信息特征向量,并與目標(biāo)樣本的特征向量對照,將符合要求的信息交給用戶。五、 項目名稱及建設(shè)性質(zhì)(一)項目名稱增值肥料項目(二)項目建設(shè)性質(zhì)本項
25、目屬于擴建項目六、 項目承辦單位(一)項目承辦單位名稱xxx(集團)有限公司(二)項目聯(lián)系人許xx(三)項目建設(shè)單位概況公司不斷推動企業(yè)品牌建設(shè),實施品牌戰(zhàn)略,增強品牌意識,提升品牌管理能力,實現(xiàn)從產(chǎn)品服務(wù)經(jīng)營向品牌經(jīng)營轉(zhuǎn)變。公司積極申報注冊國家及本區(qū)域著名商標(biāo)等,加強品牌策劃與設(shè)計,豐富品牌內(nèi)涵,不斷提高自主品牌產(chǎn)品和服務(wù)市場份額。推進(jìn)區(qū)域品牌建設(shè),提高區(qū)域內(nèi)企業(yè)影響力。公司堅持提升企業(yè)素質(zhì),即“企業(yè)管理水平進(jìn)一步提高,人力資源結(jié)構(gòu)進(jìn)一步優(yōu)化,人員素質(zhì)進(jìn)一步提升,安全生產(chǎn)意識和社會責(zé)任意識進(jìn)一步增強,誠信經(jīng)營水平進(jìn)一步提高”,培育一批具有工匠精神的高素質(zhì)企業(yè)員工,企業(yè)品牌影響力不斷提升。經(jīng)過
26、多年的發(fā)展,公司擁有雄厚的技術(shù)實力,豐富的生產(chǎn)經(jīng)營管理經(jīng)驗和可靠的產(chǎn)品質(zhì)量保證體系,綜合實力進(jìn)一步增強。公司將繼續(xù)提升供應(yīng)鏈構(gòu)建與管理、新技術(shù)新工藝新材料應(yīng)用研發(fā)。集團成立至今,始終堅持以人為本、質(zhì)量第一、自主創(chuàng)新、持續(xù)改進(jìn),以技術(shù)領(lǐng)先求發(fā)展的方針。公司秉承“以人為本、品質(zhì)為本”的發(fā)展理念,倡導(dǎo)“誠信尊重”的企業(yè)情懷;堅持“品質(zhì)營造未來,細(xì)節(jié)決定成敗”為質(zhì)量方針;以“真誠服務(wù)贏得市場,以優(yōu)質(zhì)品質(zhì)謀求發(fā)展”的營銷思路;以科學(xué)發(fā)展觀縱觀全局,爭取實現(xiàn)行業(yè)領(lǐng)軍、技術(shù)領(lǐng)先、產(chǎn)品領(lǐng)跑的發(fā)展目標(biāo)。 七、 項目實施的可行性(一)符合我國相關(guān)產(chǎn)業(yè)政策和發(fā)展規(guī)劃近年來,我國為推進(jìn)產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型升級,先后出臺了多項
27、發(fā)展規(guī)劃或產(chǎn)業(yè)政策支持行業(yè)發(fā)展。政策的出臺鼓勵行業(yè)開展新材料、新工藝、新產(chǎn)品的研發(fā),促進(jìn)行業(yè)加快結(jié)構(gòu)調(diào)整和轉(zhuǎn)型升級,有利于本行業(yè)健康快速發(fā)展。(二)項目產(chǎn)品市場前景廣闊廣闊的終端消費市場及逐步升級的消費需求都將促進(jìn)行業(yè)持續(xù)增長。(三)公司具備成熟的生產(chǎn)技術(shù)及管理經(jīng)驗公司經(jīng)過多年的技術(shù)改造和工藝研發(fā),公司已經(jīng)建立了豐富完整的產(chǎn)品生產(chǎn)線,配備了行業(yè)先進(jìn)的染整設(shè)備,形成了門類齊全、品種豐富的工藝,可為客戶提供一體化染整綜合服務(wù)。公司通過自主培養(yǎng)和外部引進(jìn)等方式,建立了一支團結(jié)進(jìn)取的核心管理團隊,形成了穩(wěn)定高效的核心管理架構(gòu)。公司管理團隊對行業(yè)的品牌建設(shè)、營銷網(wǎng)絡(luò)管理、人才管理等均有深入的理解,能夠及
28、時根據(jù)客戶需求和市場變化對公司戰(zhàn)略和業(yè)務(wù)進(jìn)行調(diào)整,為公司穩(wěn)健、快速發(fā)展提供了有力保障。(四)建設(shè)條件良好本項目主要基于公司現(xiàn)有研發(fā)條件與基礎(chǔ),根據(jù)公司發(fā)展戰(zhàn)略的要求,通過對研發(fā)測試環(huán)境的提升改造,形成集科研、開發(fā)、檢測試驗、新產(chǎn)品測試于一體的研發(fā)中心,項目各項建設(shè)條件已落實,工程技術(shù)方案切實可行,本項目的實施有利于全面提高公司的技術(shù)研發(fā)能力,具備實施的可行性。八、 項目建設(shè)選址本期項目選址位于xx(以最終選址方案為準(zhǔn)),占地面積約73.00畝。項目擬定建設(shè)區(qū)域地理位置優(yōu)越,交通便利,規(guī)劃電力、給排水、通訊等公用設(shè)施條件完備,非常適宜本期項目建設(shè)。九、 建筑物建設(shè)規(guī)模本期項目建筑面積78032.
29、35,其中:主體工程48801.32,倉儲工程16702.50,行政辦公及生活服務(wù)設(shè)施7255.47,公共工程5273.06。十、 項目總投資及資金構(gòu)成(一)項目總投資構(gòu)成分析本期項目總投資包括建設(shè)投資、建設(shè)期利息和流動資金。根據(jù)謹(jǐn)慎財務(wù)估算,項目總投資31861.57萬元,其中:建設(shè)投資25727.81萬元,占項目總投資的80.75%;建設(shè)期利息257.99萬元,占項目總投資的0.81%;流動資金5875.77萬元,占項目總投資的18.44%。(二)建設(shè)投資構(gòu)成本期項目建設(shè)投資25727.81萬元,包括工程費用、工程建設(shè)其他費用和預(yù)備費,其中:工程費用21791.15萬元,工程建設(shè)其他費用3
30、158.07萬元,預(yù)備費778.59萬元。十一、 資金籌措方案本期項目總投資31861.57萬元,其中申請銀行長期貸款10530.27萬元,其余部分由企業(yè)自籌。十二、 項目預(yù)期經(jīng)濟效益規(guī)劃目標(biāo)(一)經(jīng)濟效益目標(biāo)值(正常經(jīng)營年份)1、營業(yè)收入(sp):64600.00萬元。2、綜合總成本費用(tc):52505.57萬元。3、凈利潤(np):8841.12萬元。(二)經(jīng)濟效益評價目標(biāo)1、全部投資回收期(pt):5.59年。2、財務(wù)內(nèi)部收益率:20.80%。3、財務(wù)凈現(xiàn)值:12517.64萬元。十三、 項目建設(shè)進(jìn)度規(guī)劃本期項目按照國家基本建設(shè)程序的有關(guān)法規(guī)和實施指南要求進(jìn)行建設(shè),本期項目建設(shè)期限規(guī)
31、劃12個月。十四、項目綜合評價主要經(jīng)濟指標(biāo)一覽表序號項目單位指標(biāo)備注1占地面積48667.00約73.00畝1.1總建筑面積78032.35容積率1.601.2基底面積26766.85建筑系數(shù)55.00%1.3投資強度萬元/畝331.962總投資萬元31861.572.1建設(shè)投資萬元25727.812.1.1工程費用萬元217工程建設(shè)其他費用萬元3158.072.1.3預(yù)備費萬元778.592.2建設(shè)期利息萬元257.992.3流動資金萬元5875.773資金籌措萬元31861.573.1自籌資金萬元21331.303.2銀行貸款萬元10530.274營業(yè)收入萬元64600
32、.00正常運營年份5總成本費用萬元52505.57""6利潤總額萬元11788.16""7凈利潤萬元8841.12""8所得稅萬元2947.04""9增值稅萬元2552.22""10稅金及附加萬元306.27""11納稅總額萬元5805.53""12工業(yè)增加值萬元19686.93""13盈虧平衡點萬元25567.95產(chǎn)值14回收期年5.59含建設(shè)期12個月15財務(wù)內(nèi)部收益率20.80%所得稅后16財務(wù)凈現(xiàn)值萬元12517.64所得稅后十
33、四、 信息鑒別常用方法(一)溯源法對到手信息涉及的問題應(yīng)追根溯源,及時核對。例如,盡量找到現(xiàn)場和掌握第一手資料的人;核對原始資料,并查對主要參考文獻(xiàn);按其中敘述的方法、步驟,重做實驗或演算,以便從來源上找到鑒別依據(jù)。鑒別和篩選在手信息,判斷是否完整、適用與可靠,是咨詢?nèi)藛T的重要工作。工程咨詢所需信息十分廣泛,不可能也不必均由咨詢?nèi)藛T鑒別。為了確保信息可靠,應(yīng)盡可能選用權(quán)威機構(gòu)發(fā)布或已鑒定、批準(zhǔn)的信息。例如,地質(zhì)儲量選用儲量委員會批準(zhǔn)的儲量報告;地震帶的分布用國家地震局的數(shù)據(jù);歷史數(shù)據(jù)用國家統(tǒng)計局的數(shù)據(jù)。一般來說,專業(yè)技術(shù)力量強的單位提供的信息較可靠。例如,國際金融組織的國際金融信息較可靠;來自
34、從事鋼鐵、汽車行業(yè)研究的機構(gòu)的鋼鐵、汽車業(yè)信息較可靠。(二)比較法有些信息受主客觀條件限制難以溯源,對此,可用比較法,即比較不同人、不同時間和其他方面的材料;對于某一事實,說法、結(jié)論是否一致。如果一致,則基本可辨真?zhèn)?。若否,就需進(jìn)一步核查。(三)佐證法任何事物都與其他事物有一定聯(lián)系,并相互制約。找到這些聯(lián)系和制約因素,便可判斷事物的真?zhèn)?。一般說來,口頭材料不如文字材料可靠,文字不如實物可靠。分析信息產(chǎn)生的過程也是尋求信息佐證的辦法。1普查數(shù)據(jù)一般比抽查數(shù)據(jù)全面、準(zhǔn)確。2監(jiān)測數(shù)據(jù),長期比短期全面,監(jiān)測范圍大的數(shù)據(jù)比監(jiān)測范圍小的數(shù)據(jù)代表性強;勘探密度大的數(shù)據(jù)比勘探密度小的數(shù)據(jù)準(zhǔn)確,科學(xué)實驗和仿真模
35、擬計算的數(shù)據(jù)比一般推理的數(shù)據(jù)準(zhǔn)確。3核對來源不同,收集方法不同的數(shù)據(jù)。如衛(wèi)星圖片、航測數(shù)據(jù)可用地面實測數(shù)據(jù)驗證;了解來的市場需求量與行業(yè)協(xié)會、主要企業(yè)、國家統(tǒng)計局的數(shù)據(jù)對比。4對比不同時期、不同來源的數(shù)據(jù),并適當(dāng)修正其間的差距。同一對象的數(shù)據(jù),在不同國家、不同歷史時期,由于范圍不同,計算的標(biāo)準(zhǔn)和口徑可能有所不同,造成數(shù)據(jù)之間有很大的差異。在對比這些數(shù)據(jù)時,必須查明統(tǒng)計口徑,否則就會出錯。5由專家集體辨別信息是否準(zhǔn)確,是否可靠。對于來自不同渠道的信息,可能因角度不同、口徑不一、方法各異等而不一致,甚至矛盾。這時,可請專家集體討論,弄清差異和矛盾的原因,去偽存真,取得一致意見。(四)邏輯法鑒別信息
36、,邏輯判斷必不可少。不經(jīng)縝密的邏輯思考容易出錯。有些基本差錯,例如語言或文字的前后矛盾,夸大其詞,有悖情理,以及某些虛構(gòu),禁不起邏輯的推敲。當(dāng)然,邏輯合理并不總能證明事物為真,從虛假的前提出發(fā),經(jīng)過合理的邏輯推斷得出的結(jié)果不會真實。因此,鑒別信息,既要充分利用經(jīng)驗、認(rèn)識和判斷力,也要借助其他手段。十五、 信息的綜合信息綜合是信息工作的重要內(nèi)容。采集來的信息經(jīng)常是零散、無序,甚至殘缺不全,無法直接使用。對于這樣的信息,須進(jìn)行分析、聯(lián)系、推斷、整理和組合,使之成為有用信息,然后確定其特征,如精度、類型、長度、保密度、保留時間、用途等。信息綜合有兩種方式:一是對已有信息挖掘、延伸,引發(fā)創(chuàng)新需求的新信
37、息,達(dá)到信息的“增值”,二是通過設(shè)計和試驗創(chuàng)造新的信息。有價值的信息往往是反復(fù)推理分析和猜想后的結(jié)果,這個過程要求咨詢工程師具備很強的分析、聯(lián)想、綜合與創(chuàng)造能力。十六、 網(wǎng)絡(luò)信息搜索和提取方法(一)概過現(xiàn)在,雖然不能說人類所有文獻(xiàn)與其他信息都上了互聯(lián)網(wǎng),但是網(wǎng)上的信息極為豐富,許多都可用于咨詢。但是,許多咨詢?nèi)藛T還不善于甚至不知道如何從網(wǎng)上快速、安全、有效地獲得自己需要的信息和知識。咨詢工程師應(yīng)當(dāng)知曉網(wǎng)上有何利信息,應(yīng)掌握從網(wǎng)上獲取信息的方法與基本技巧。對于網(wǎng)上的信息,可利用瀏覽器和搜索引擎獲取。瀏覽器是供用戶閱讀網(wǎng)頁內(nèi)容的軟件;而搜索引擎,指從互聯(lián)網(wǎng)上搜集信息的特定電腦程序。早期的搜索引擎是
38、收集互聯(lián)網(wǎng)中服務(wù)器的地址,按這些服務(wù)器擁有的資源類型將其編成不同的目錄,各個目錄再逐層分類。搜索引擎則沿著此類層級向下搜索,找到用戶想要的信息。這種方式只適用于互聯(lián)網(wǎng)信息不多的時代。隨著互聯(lián)網(wǎng)上信息的迅猛增長,出現(xiàn)了新式搜索引擎,性能大為改進(jìn),能夠找到網(wǎng)站每一頁的起始地址,隨后搜索網(wǎng)上所有超級鏈接,把代表超級鏈接的所有詞匯放入一個數(shù)據(jù)庫。搜索引擎的功能不再限于搜索,已經(jīng)添加了電子商務(wù)、新聞信息服務(wù)、個人免費電子信箱服務(wù)等。(二)搜索引擎工作原理搜索引擎有信息搜集、信息整理和接受用戶查詢?nèi)糠?,各自工作原理大致如下?搜集信息:搜索引擎利用稱為網(wǎng)絡(luò)蜘蛛(spider)的自動搜索機器人程序,從少數(shù)
39、幾個網(wǎng)頁開始,將各個網(wǎng)頁的超鏈接連結(jié)在一起,只要網(wǎng)頁上有適當(dāng)?shù)某溄?,機器人便可以遍歷絕大部分網(wǎng)頁。2整理信息:這個過程稱為“建立索引”。搜索引擎不僅要保存搜集到的信息,還要按照一定規(guī)則編排之。這樣,搜索引擎無須重新翻查已保存的所有信息,便能迅速找到所要的資料,從而能夠大大加快搜索速度。3接受查詢:對于每時每刻都會接到的大量用戶幾乎同時發(fā)出的查詢請求,搜索引擎按照各個用戶的要求檢查自己的索引,能在極短時間內(nèi)找到用戶需要的資料,并交給用戶。目前,搜索引擎交給用戶的主要是網(wǎng)頁鏈接,用戶按照這些鏈接便能找到含有自己所需資料的網(wǎng)頁。搜索引擎一般會在這些鏈接下加一段有關(guān)這些網(wǎng)頁的摘要,以便用戶判斷此網(wǎng)頁是否含有自己需要的內(nèi)容。(三)搜索引擎種類現(xiàn)在,搜索引擎有很多種,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 智能教室合同范本
- 物業(yè)財務(wù)合同范本
- 2025年01月2024內(nèi)蒙古呼倫貝爾市新巴爾虎左旗事業(yè)單位引進(jìn)人才8人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解-1
- 2024年12月漯河市市場監(jiān)督管理局所屬事業(yè)單位引進(jìn)人才公開招聘5名筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解-1
- 臨沂五層家用電梯施工方案
- 頂樓地下室防水施工方案
- 科技創(chuàng)新在紡織行業(yè)的應(yīng)用分析
- 2025年幼兒園活動主題設(shè)計標(biāo)準(zhǔn)教案
- 交通安全基礎(chǔ)設(shè)施施工方案
- 東營二層家用電梯施工方案
- 電氣設(shè)備安裝調(diào)試工詳細(xì)上崗崗前培訓(xùn)制度培訓(xùn)
- 《系統(tǒng)集成項目管理工程師》必背100題
- 中國特色社會主義思想概論 課件 第四章 堅持以人民為中心
- 湘少版3-6年級詞匯表帶音標(biāo)
- 采購部組織結(jié)構(gòu)圖
- 土力學(xué)與地基基礎(chǔ)(課件)
- 股票入門-k線圖基礎(chǔ)知識
- 全國大全身份證前六位、區(qū)號、郵編-編碼
- 種植林業(yè)可行性研究報告
- 金和物業(yè)公司簡介
- 廣東省五年一貫制考試英語真題
評論
0/150
提交評論