版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、銀行業(yè)CRRM軟件技技術本章對涉及及建設銀行行CRM系統(tǒng)統(tǒng)的核心軟軟件技術進進行慨要講講解,并對對一些功能能進行了比比較分析,有有助于銀行行進行軟件件選型。XML技術術 XML技術術作為互聯(lián)聯(lián)網(wǎng)的種子子技術是建建設CRMM的一個重重要支撐技技術。XML介紹紹 XML是EExtennsiblle Maarkupp Lannguagge的簡稱稱,即“可可擴展標記記語言”,是是由 W3C組織于于19988年 2月制定定的一種通通用語言規(guī)規(guī)范,是專專為Webb應用而設設計的 SSGML 2 (Stanndardd Gennerallizedd Marrkup Langguagee)的一個個優(yōu)化子集集。
2、同SGMLL類似, XXML是一一種元標記記語言,使使用者可按按需創(chuàng)建新新的標記, XML的可擴展性就在于此。這些標記通過 XML DTD(Document Type Defi n ition,文擋類型定義)來加以定義。DTD是一系列關于元素類型(Element Type),屬性(Attributes), 實體(Entities)和符號(Notations)的定義。它定義了文檔所需的標記,比如可在文檔里使用的元素類型,這些元素之間的可能的聯(lián)系,還可能聲明元素的屬性,屬性是元素的“元數(shù)據(jù)”,而不是元素包含的內(nèi)容。另外,一個實體就像是一個縮寫,被當做一些文本或一些數(shù)據(jù)的縮寫來使用。而符號描述某一類
3、事物(例如圖像)的數(shù)據(jù)內(nèi)容,它定義怎樣翻譯某類對像的比特流。XML文檔可以在它的文檔類型聲明(Document Type Oeclaration)里聲明該文檔遵循某個XMLDTD。XML語法法 XML文檔檔的組成 XML文檔檔包含由XXML標記記和字符數(shù)數(shù)據(jù)組成的的文本。它它是一個有有固定長度度的有序字字節(jié)的集合合,并遵守守特定的約約束。它可可能是或者者不是一個個文件。例例如,XMML文檔可可能。存儲在數(shù)據(jù)據(jù)庫中由CGI程程序在內(nèi)存存中瞬間創(chuàng)創(chuàng)建由幾個相互互嵌套的不不同文件組組合而成不存在于自自身的文件件中但是如果把把一個XMML文檔看看做一個文文件也是可可以的,只只要記住它它可能并不不是存在
4、于于硬盤上的的真實文件件。XMLL由稱為“實體”的的存儲單元元組成,每每個實體包包含文本或或者二進制制數(shù)據(jù),但但不能同時時存在。文文本數(shù)據(jù)由由字符組成成,二進制制數(shù)據(jù)用于于圖片和小小程序等類類內(nèi)容。用用一個具體體的示例說說明就是,一一個含有標記的原原始HTMML文件是是一個實體體而不是文文擋。一個個HTM文件件加上所有有使用標標記嵌入的的圖片就組組成一個文文檔。在本本章和后續(xù)續(xù)幾章中我我們只針對對由一個實實體構成的的簡單的XXML文檔檔,即文檔檔本身。而而且這些文文檔只包含含文本數(shù)據(jù)據(jù),不包含含諸如圖片片小程序一一類的二進進制數(shù)據(jù)。這些文檔檔能夠完全全獨立被, 理解而而無須讀取取其他文件件。換
5、句話話說,它們們是獨立存存在的。這這種文檔通通常在它的的XML標頭頭中含有一一個值為yyes的stanndaloone屬性性,如下所所示。? xmll verrsionn =“1.0” staandallone=“yes”? 外部實體和和實體引用用用于組合合多個文件件和其他數(shù)數(shù)據(jù)源以創(chuàng)創(chuàng)建一個獨獨立的XMML文擋。這樣的文文擋如果不不引用其他他文件就不不能進行句句法分析。這些文檔檔通常在XXML聲明明中含有一一個屬性值值為no的stanndaloone屬性性。? xmll verrsionn =“1.0” staandallone=“no”? 實體引用實體引用是是指分析文文檔時會被被字符數(shù)據(jù)據(jù)
6、取代的置置標。XMML預先定定義了5個實體引引用,列在在表 6-1中。實實體引用用用于XMLL文檔中的的特殊字符符,否則這這些字符將將被解釋為為置標的組組成部分。例如,實實體引用<;代代表小于號號(),否則則會被解釋釋為一個標標記的起始始部分。表 6-11 XMLL預定義的的實體引用用實體引用所代表字符符&;<;"t;“&qposs;XML中的的實體引用用與 HTTML中不不同,必須須以一個分分號結束。因此 >;是是正確的實實體引用寫寫法, >是不不正確的。未經(jīng)處理的的小予號()同表示“和”的符號(&)在一般的 XML文本中往往被分別解釋為起始標記和實體引用(特殊
7、文本是指 CDATA段,將在后面討論)。因此,小于號同“和”號必須分別編碼為 <;和 &;。例如,短語語“Benn & erryy s NNew YYork Supeer Fuudge Chunnk Icce Crream”應當寫成成 Benn &ammp;errry s New Yorkk Supper FFudgee Chuunk IIce CCreamm。大于號號、雙引號號和撇號在在它們可能能會被解釋釋成為置標標的一部分分時也必須須編碼。但但是,養(yǎng)成成全部編碼碼的習慣要要比努力推推測一個特特定的應用用是否會被被解釋為置置標容易得得多。實體引用也也能用于屬屬性值中。例如。 CDA
8、TAA 在大多數(shù)情情況下,出出現(xiàn)在一對對尖括號()中的是置標,不在尖括號中的是字符數(shù)據(jù)。但是有一種情況例外,在 CDATA段中所有文本都是純字符數(shù)據(jù)??雌饋砼c標記或者實體相似的僅僅是它們各自相應的文本。XML處理器無論如何是不會解釋它們的。CDATAA段用于需需要把整個個文本解釋釋為純字符符數(shù)據(jù)而并并不是置標標的情況。當有一個個包含許多多、&或”字符而非非置標的龐龐大文本時時,這是非非常有用的的。對于大大部分C和Javaa源代碼,正正是這種情情況。如果想使用用 XMLL寫有關 XXML的簡簡介, CCDATAA段同樣非非常有效。例如,在在一個文本本中包含許許多小的 XML代代碼塊,而而正在使用
9、用的字處理理器又不能能顧及這些些情況。但但是如果把把本書轉換換為 XMML,用戶戶將不得不不很辛苦地地用 &llt;代替替全部小于于號, &;代替所有有“和”字字符。如下下所示。<;?xml verssion = “1.0” staandallone = “yes”? >t;<;GGREETTING>;Helloo XMLL! <;/ GREEETINNG>t;為了避免這這種麻煩,可可以使用一一個CDAATA段表表示一個不不需要翻譯譯的文本塊塊。CDAATA段以以結束,例例如。! CCDATAA “ Helloo XMLL! 惟一不許出出現(xiàn)在CDDATA段段中的文
10、本本是CDAATA的結結束界定符符 。注釋可可能會出現(xiàn)現(xiàn)在CDAATA段中中,但不再再扮演注釋釋的角色。也就是說說兩個注釋釋標記和包包含在它們們之間的全全部文本都都將顯示出出來。因為不能出現(xiàn)現(xiàn)在CDAATA段中中,所以CCDATAA段不能嵌嵌套。這使使得使用XXML寫有有關的CDDATA段段相對困難難些。如果果需要的話話,必須去去掉項目符符號,并使使用 &llt;、&ammp;和實實體引用。CDATAA段不常需需要,一旦旦需要時,它它是非常有有用的。標己標記能夠區(qū)區(qū)分XMLL文件與無無格式文本本文件。標標記在XMML文檔中中以結束,而而且不包含含在注釋或或者CDAATA段中中。因此, XML標
11、記有與HTML標記相同的形式。開始或打開標記?1t;開始,后面跟有標記名。終止或結束標記以該標記結束。1.標記名名每個標記都都有一個名名稱。標記記名必須以以字母或下下劃線 CC)開始,名名稱中后續(xù)續(xù)字符可以以包含字母母、數(shù)字、下劃線、連字符和和句號。其其中不能含含有空格(經(jīng)經(jīng)常用下劃劃線替代空空格)。下下面是一些些合法的XXML標記記。 以下是句法法不正確的的XML標記記。 結束標記與與起始標記記同名,只只是在起始始尖括號后后加了一個個/。例如,如如果起始標標記是,那那么結束標標記是。下面是是前面所提提到的合法法起始標記記所對應的的結束標記記。 XML名稱稱是大小寫寫敏感的。在HTMML中的和
12、是同同一個標記記,可以結結束一個標記記,但在XXML中卻卻不行。下下面所示的的并不是我我們討論過過的合法起起始標記所所對應的結結束標記。 2.空標記記許多不含數(shù)數(shù)據(jù)的HTTML標記記沒有結束束標記。例例如,有、或標記。一些頁面面作者在所所列的項目目后面確實實會包含標記,一一些HTMML工具也也使用標標記。但是是HTMLL4.0標標準特別否否認了這一一點的必要要性。同HHTML中中所有沒有有被公認的的標記一樣樣,一個不不必要的的出現(xiàn)對對交付的輸輸出沒有任任何影響。這在XMLL中不是問問題。XMML的總體體觀點就是是在分析文文檔時允許許發(fā)現(xiàn)新的的標記。因因此沒有識識別的標記記就不會被被簡單地忽忽略
13、。而且且XML處理理器一定能能夠判明以以前從沒出出現(xiàn)過的一一個標記有有沒有結束束標記。XML區(qū)分分帶有結束束標記的標標記,而不不帶結束標標記的標記記稱為空標標記??諛藰擞浺孕备芨芎鸵粋€結結束尖括號號(/)結束束。例如,或。目前的Web瀏覽器處理這種標記的方法不一致,如果希望保持向后的兼容性,可以用結束標記來代替,只要在兩個標記之間不包含任何文本。例如。 屬性在前面內(nèi)容容中討論過過,起始標標記和空標標記可以隨隨意地包含含屬性。屬屬性是用等等號(=)分隔開開的名稱一一數(shù)值對。例如。Helloo XMLL!在此標標記有一個個LANGGUAGEE屬性,其其屬性值是是Engllish。標標記有一個個SR
14、C屬性性,其屬性性值為WaavinggHandd.movv。1.屬性名名屬性名是宇宇符串,遵遵循與標記記名同樣的的規(guī)則。這這就是,屬屬性名必須須以字母或或下劃線(_)開始,名稱中后續(xù)字符可以包含字母、數(shù)字、下劃線、連字符和句號。其中不能含有空格(經(jīng)常用下劃線替代空格)。同一個標記記不能有兩兩個同名的的屬性。例例如,下面面的例子是是不合法的的。 屬性名是區(qū)區(qū)分大小寫寫的。SIIDE屬性性與sidde或Sidee屬性不是是同一個屬屬性,因此此以下例子子是合法的的。 2.屬性值值屬性值也是是字符串。如下面所所示的 LLENGTTH屬性,即即使字符串串表示的是是一個數(shù),但但還是兩個個宇符7和2,不是十
15、十進制數(shù)的的72。 如果編寫處處理XMLL的代碼,在在對字符串串執(zhí)行算術術運算之前前必須把它它們轉換為為一個數(shù)。與屬性名不不同,對屬屬性值包含含的內(nèi)容沒沒有任何限限制。屬性性值可以包包含空格,可可以以一個個數(shù)字或任任何標點符符號(有時時單括號和和雙括號除除外)開頭頭。XML 屬屬性值由引引號界定。與HTMML 屬性性不同, XML 屬性值必必須加引號號。大多數(shù)數(shù)情況下使使用雙引號號,但是如如果屬性值值本身含有有個引號號,就需要要使用單引引號。例如如:如果屬性值值中含有兩兩種引號,那那么其中不不用于界定定字符串的的一個必須須用合適的的實體引用用代替。通通常替換兩兩個,這種種方法很管管用。例如如:
16、XML 文文檔規(guī)則盡管可以根根據(jù)需要編編寫標記,但但XML 文檔為了了保持結構構完整必須須遵循定定的規(guī)則。如果一個個文擋不是是結構完整整的,大部部分讀取和和顯示操作作都會失敗敗。事實上,XXML規(guī)范范嚴格禁止止XML句法法分析器分分析和解釋釋結構欠妥妥的文檔。正在執(zhí)行行操作的分分析器惟能做的是是報告出錯錯。它不會會修改錯誤誤,不會做做最大的努努力顯示作作者想要的的東西,也也不會忽略略不當?shù)慕Y結構欠妥的的標記。它它所能做的的是報告錯錯誤和退出出。這樣做的目目的是為了了避免對錯錯誤的兼容容性的競爭爭。這種競爭爭已使得編編寫HTMML 語法分析程程序和顯示示程序變得得非常困難難。因為WWe瀏覽器器承
17、認畸形形的HTMML,而Webb頁面設計計者不會特特別盡力確確保他們的的HTMLL正確無誤誤。事實上上,他們甚甚至利用個個別瀏覽器器中的錯誤誤達到特殊殊的效果。為了正確確顯示被大大量安裝的的HTMLL頁面,每每個新的 Web瀏瀏覽器必須須支持已有有的 Weeb瀏覽器器的每一個個細微差別別和各自的的屬性。用用戶將放棄棄任何一種種嚴格執(zhí)行行 HTMML標準的的瀏覽器。正是為了了避免這種種遺憾,XXML處理理器才只接接受結構完完整的XMML。為了使一個個文檔結構構完整,XXML文檔檔中的所有有置標和字字符數(shù)據(jù)必必須遵守前前幾節(jié)中給給出的規(guī)則則。而且有有幾條關于于如何把置置標和字符符數(shù)據(jù)相互互聯(lián)系起來
18、來的規(guī)則。這些規(guī)則則總結如下下:(1)文擋擋的開始必必須是XMML聲明。(2)含有有數(shù)據(jù)的元元素必須有有起始標記記和結束標標記。(3)不含含數(shù)據(jù)并且且僅使用一一個標記的的元素必須須以/結束。(4)文檔檔只能包含含一個能夠夠包含全部部其他元素素的元素。(5)元素素只能嵌套套不能重疊疊。(6)屬性性值必須加加引號。(7)字符符和&只能用于于起始標記記和實體引引用。(8)出現(xiàn)現(xiàn)的實體引引用只有&;、<t;、>t;、&appos;和和&quoot;。這 8條規(guī)規(guī)則稍加調調整就能適適用于含有有一個DTTD的文檔檔,現(xiàn)在請請仔細看這這些用于沒沒有 DTTD文擋的的規(guī)則。1文檔必必須以 XXM
19、L聲明明開始下面是 XXML1.0中獨立立文檔的 XML聲聲明。如果聲明出出現(xiàn),它絕絕對是該文文件最開頭頭部分,因因為 XMML處理器器會讀取文文件最先的的幾個字節(jié)節(jié)并將它與與字符串? XMLL的不同編編碼做比較較來確定正正在使用的的字符串集集( UTTF-8、大頭(高高字節(jié)先傳傳格式)或或者小頭(低低字節(jié)先傳傳格式 )。除除去看不見見的字節(jié)順順序記號,在在它之前不不能有任何何東西,包包括空格。例如,下下面一行用用于 XMML的開始始是不能接接受的,因因為在該行行的前面有有多余的空空白。 XML確實實允許完全全省略 XXML聲明明。通常不不推薦這樣樣做,但這這樣做有特特殊的用途途。例如,省省略
20、 XMML聲明,通通過連接其其他結構完完整的XMML文檔有有助于重新新建立一個個結構完整整的 XMML文檔。2.在非空空標記中使使用起始和和結束標記記如果忘了結結束 HTTML的標標記,Weeb瀏覽器器并不嚴格格追究。例例如,如果果文檔包含含一個標記卻卻沒有相應應的 標記記,在標記之之后的全部部文檔將變變?yōu)榇煮w。但文檔仍仍然能顯示示。XML不會會如此寬松松,每個起起始標記必必須以相應應的結束標標記結束。如果一個個文檔未能能結束一個個標記,瀏瀏覽器或移移交器將報報告一個錯錯誤信息,并并且不會以以任何形式式顯示任何何文檔的內(nèi)內(nèi)容。3.用”/“結束束空標記不包含數(shù)據(jù)據(jù)的標記,例例如 HTTML的、和
21、,不不需要結束束標記。但但是 XMML空標記記必須由 /結束束,而不是是。例如、和的XML等價價物是、和。當前的 WWeb瀏覽覽器處理這這種標記的的方法不一一致。但是是如果想保保持向后的的兼容性,可可以使用結結束標記來來代替,而而且不能在在其間包含含任何文本本。例如。 即使這樣,Netscape處理 也有困難(它把這兩個標記解釋為行間距,而不是前面所講的)。因此,在HTML中包含結構完整的空標記也并非總是可行的。4.讓一個個元素完全全包含其他他所有元素素一個 XMML文檔包包含一個根根元素,它它完全包含含了文檔中中其他所有有元素。有有時候這種種元素被稱稱做文檔元元素。假設設根元素是是非空的(通
22、通常都是如如此),它它肯定有起起始標記和和結束標記記。這些標標記可能使使用但不是是必須使用用roott或DOCUUMENTT命名。例例如,在下下面的文檔檔中根元素素是 GRREETIING: Helloo XMLL! XML聲明明不是一個個元素,它它更像是一一個處理指指令,因此此不必包含含在根元素素中。類似似地,在一一個 XMML文檔中中的其他非非元素數(shù)據(jù)據(jù),諸如其其他處理指指令、DTTD和注釋釋也不必包包含在根元元素中。但但是所有實實際的元素素(除根元元素本身)必必須包含在在根元素中中。5.不能重重疊元素元素可以包包含別的元元素(大多多數(shù)情況下下),但是是元素不能能重疊。事事實上是指指,如果
23、一一個元素含含有一個起起始標記,則則必須同時時含有相應應的結束標標記。同樣樣,一個元元素不能只只含有一個個結束標記記而沒有相相應的起始始標記。例例如,下面面的 XMML是允許許的: nn =n +1; 下面所示的的 XMLL是非法的的,因為結結束標記 放在在了結束標標記之前。 n = n +11; 大部分HTTML瀏覽覽器容易處處理這種情情況,但是是XML瀏覽覽器會因為為這種結構構而報告出出錯??諛藰擞浛呻S處處出現(xiàn)。例例如。 Osccar WWildeeJJoe OOrtonn 本規(guī)則與規(guī)規(guī)則 4聯(lián)系在在一起有如如下含義 :對于所所有非根元元素,只能能有一個元元素包含某某一非根元元素,但是是元
24、素不能能包含其中中含有非根根元素的元元素。這個個直接含有有者稱為非非根元素的的父元素,非非根元素被被認為是父父元素的子子元素。因因此,每個個非根元素素只有一個個父元素。但是一個個單獨的元元素可以有有任意數(shù)目目的子元素素或不含有有子元素。請分析如下下所示的清清單。根元元素是 DDOCUMMENT元元素,它含含有兩個元元素。第一一個 STTATE元元素含有 4個子元元素。NAAME、TREEE、FLOWWER和 CAPPITOLL。第二個個 STAATE元素素含有 33個子元素素。NAMME、TREEE和 CAPPITOLL。這些里里層的子元元素只包含含字符數(shù)據(jù)據(jù),沒有子子元素。父元素和子子元素
25、Loouisiiana Balld Cyypresss Maggnoliia Batton RRougee Miississsipppi Maagnollia Jaccksonn 6.屬性值值必須加引引號 XML要求求所有的屬屬性值必須須加引號,不不管屬性值值是否包括括空白。例例如。HTML的的要求則不不是這樣。比如,HHTML允允許標記含含有不帶引引號的屬性性。例如,下下面是一個個合法的HHTML標記記。 惟一的要求求是屬性值值不能嵌有有空格。如果一個屬屬性值本身身含有雙引引號,可以以使用屬性性值加單引引號來代替替。例如。如果一個屬屬性值包含含有單引號號和雙引號號,可以使使用實體引引用 &a
26、apos;代替單引引號,&qquot;代替雙引引號。例如如。7只在開開始標記和和實體引用用中使用和&XML假定定最先的是一個標標記的開始始,&是一個實實體引用的的開始(HHTML也也是如此,如如果省略它它們,大部部分瀏覽器器會假定有有一個分號號)。例如如。 A Hoomagee to Ben &Jerrry ssNew YYork Supeer Fuudge Chunnk Icce Crream Web瀏覽覽器會正確確地顯示該該標記,但但是為了最最大限度的的安全,應應當避免使使用&,用 &aamp;來來代替,像像下面這樣樣。 A Hoomagee to Ben &p;Jerrry s N
27、ew Yorkk Supper FFudgee Chuunk Ice CCreamm 開尖括號()的情況也類似。請看下面很普通的一行 Java代碼。 foor(int i = 0;i = arrgs.llengtth;i + +)1XMML與 HTMML都會把把。因此該該行會表示示成。for(iint ii = 00;而不是。for(iint ii =0;i =arggs.eengthh;i+ +)“= arrgs.lenggth;i + +)|”被解釋成成一個不能能識別的標標記的一部部分。把小于號寫寫成 &llt;可以出現(xiàn)現(xiàn)在 XMML和 HTMML文本中中。例如。 foor(int i =
28、 0;i &llt;= arrgs.llengtth;i + +)| 結構完整的的XML要求求把&寫成&ammp;,把把B,A稱為前提提和左部(LHS),B稱為后續(xù)或右部(RHS)。如關聯(lián)規(guī)則“買錘子的人也會買釘子”,左部是“買錘子”,右部是“買釘子”。要計算包含含某個特定定項或幾個個項的事務務在數(shù)據(jù)庫庫中出現(xiàn)的的概率只要要在數(shù)據(jù)庫庫中直接統(tǒng)統(tǒng)計即可。某一特定定關聯(lián)(“錘子和釘釘子”)在在數(shù)據(jù)庫中中出現(xiàn)的頻頻率稱為支支持度。比比如在總共共10000個事務中中有15個事務務同時包含含了“錘子子和釘子”,則此關關聯(lián)的支持持度為1.5 %。非常低的的支持度(比比如1百萬個事事務中只有有一個)可可能意
29、味著著此關聯(lián)不不是很重要要,或出現(xiàn)現(xiàn)了錯誤數(shù)數(shù)據(jù)(如,“男性和懷懷孕”)。要找到有意意義的規(guī)則則,還要考考察規(guī)則中中項及其組組合出現(xiàn)的的相對頻率率。當己有有A時, B發(fā)生的的概率是多多少?也即即概率論中中的條件概概率?;氐降轿覀兊睦?,也就就是問“當當一個人已已經(jīng)買了錘錘子,那他他有多大的的可能也會會買釘子?”這個條條件概率在在數(shù)據(jù)挖掘掘中也稱為為可信度,計計算方法是是求百分比比:(A與B同時出現(xiàn)現(xiàn)的頻率)/(A出現(xiàn)的頻率)。預測型數(shù)據(jù)據(jù)挖據(jù)數(shù)據(jù)挖掘的的目的是生生成可以據(jù)據(jù)其所示的的含義采取取行動的知知識,也就就是建立一一個現(xiàn)實世世界的模型型。建立這這個模型可可能需要各各種各樣的的源數(shù)據(jù),包
30、包括交易記記錄、顧客客歷史數(shù)據(jù)據(jù)、人口統(tǒng)統(tǒng)計信息、進程控制制數(shù)據(jù)和市市場相關的的外部數(shù)據(jù)據(jù)等,比如如:信用卡卡公司提供供的數(shù)據(jù)、天氣數(shù)據(jù)據(jù)等。模型型是模式和和數(shù)據(jù)間相相關性的形形式化描述述。為了防止混混淆,把數(shù)數(shù)據(jù)挖掘概概念劃分為為幾個層次次。(1)商業(yè)業(yè)目標;(2)預言言的種類;(3)模型型的類型;(4)算法法;(5)產(chǎn)品品。最高層是商商業(yè)目標:數(shù)據(jù)挖掘掘的最終目目的是什么么 ?比如:希望用數(shù)數(shù)據(jù)挖掘技技術留住用用戶的有價價值的客戶戶,用戶可可能先要建建立一個模模型來預測測每個客戶戶所能帶來來的利潤,然然后再建立立一個模型型來確定哪哪些客戶可可能會離開開。充分了了解用戶所所在企業(yè)的的需求和目
31、目標有助于于用戶建立立這樣的目目標。下一步是決決定最合適適的預言的的種類。分類:預預測一個特特定的客戶戶或事件屬屬于哪一類類;回歸歸( reegresssionn):預測測一個變量量的值(如如果此變量量隨事件變變化,可成成為時間序序列預測)。在上面的的例子中用用戶可以用用回歸來預預測利潤的的大小,用用分類預測測哪些客戶戶會離開。后面我們們會詳細討討論。現(xiàn)在用戶可可以選擇模模型的類型型:用神經(jīng)經(jīng)網(wǎng)絡來做做回歸,決決策樹做分分類,還是是用統(tǒng)計模模型,如:邏輯回歸歸,偏差分分析,普通通線性模型型等。每種種模型都可可以用不同同的算法來來實現(xiàn),比比如,可以以用回饋函函數(shù)或 rradiaal baasis
32、函函數(shù)來建立立神經(jīng)網(wǎng)絡絡;決策樹樹有巳ARRT,C5.00, QUUEST, CHAAID等。在選擇數(shù)據(jù)據(jù)挖掘軟件件產(chǎn)品時,要要注意這些些軟件所采采用的算法法雖然名稱稱可能完全全一樣,但但他們的實實現(xiàn)方法通通常都是不不一樣的。這些對算算法的不同同實現(xiàn)影響響了軟件對對內(nèi)存、硬硬盤的需求求的不同及及性能上的的差異。大部分的商商業(yè)目標都都可以用各各種不同的的模型及相相異的算法法來解決。通常在用用戶還沒有有試過任何何數(shù)據(jù)挖掘掘算法之前前,很難決決定哪種對對用戶來說說是最好的的。1.一些術術語在預測模型型中,把我我們要預測測的值或所所屬類別稱稱為響應變變量、依賴賴變量或目目標變量 ;用于預預測的輸入入變
33、量是預預測變量或或獨立變量量。一些預測模模型是通過過那些已知知目標變量量值的歷史史數(shù)據(jù)訓練練出來的。這種訓練練有時也稱稱為帶指導導的學習,因因為是通過過給出一些些已知答案案的問題(已已知結果的的數(shù)據(jù))來來讓他“學學習”。相相對應地,還還有不帶指指導的學習習,如上面面提到的描描述型數(shù)據(jù)據(jù)挖掘(在在運行之前前,算法對對數(shù)據(jù)一無無所知)。2.分類分類要解決決的問題是是為一個事事件或對像像歸類。在在使用上,既既可以用此此模型分析析己有的數(shù)數(shù)據(jù),也可可以用它來來預測未來來的數(shù)據(jù)。例如,用用分類來預預測哪些客客戶最傾向向于對直接接郵件推銷銷做出回應應,又有哪哪些客戶可可能會換他他的手機服服務提供商商,或在
34、醫(yī)醫(yī)療領域當當遇到一個個病例時用用分類來判判斷一下從從哪些藥品品著手比較較好。數(shù)據(jù)挖掘算算法的工作作方法是通通過分析已已知分類信信息的歷史史數(shù)據(jù)總結結出一個預預測模型。這里用于于建立模型型的數(shù)據(jù)稱稱為訓練集集,通常是是已經(jīng)掌握握的歷史數(shù)數(shù)據(jù)。如,已已經(jīng)不再接接受服務的的用戶,用用戶很可能能還保存了了他們在接接受服務時時的歷史記記錄。訓練練集也可以以是通過實實際的實驗驗得到的數(shù)數(shù)據(jù)。比如如用戶從包包含公司所所有顧客的的數(shù)據(jù)庫中中取出一部部分數(shù)據(jù)做做實驗,向向他們發(fā)送送介紹新產(chǎn)產(chǎn)品的推銷銷信,然后后搜集對此此做出回應應的客戶名名單,然后后用戶就可可以用這些些推銷回應應記錄建立立一個預測測哪些用戶戶
35、會對新產(chǎn)產(chǎn)品感興趣趣的模型,最最后把這個個模型應用用到公司的的所有客戶戶上。3.回歸回歸是通過過具有已知知值的變量量來預測其其他變量的的值。在最最簡單的情情況下,回回歸采用的的是像線性性回歸這樣樣的標準統(tǒng)統(tǒng)計技術。但在大多多數(shù)現(xiàn)實世世界中的問問題是不能能用簡單的的線性回歸歸所能預測測的。如商商品的銷售售量、股票票價格、產(chǎn)產(chǎn)品合格率率等,很難難找到簡單單有效的方方法來預測測,因為要要描述這些些事件的變變化所需的的變量以上上百計,且且這些變量量本身往往往都是非線線性的。為為此人們又又發(fā)明了許許多新的手手段來試圖圖解決這個個問題,如如邏輯回歸歸、決策樹樹、神經(jīng)網(wǎng)網(wǎng)絡等。一般同一個個模型既可可用于回歸
36、歸也可用于于分類。如如CARTT決策樹算算法既可以以用于建立立分類樹,也也可建立回回歸樹。神神經(jīng)網(wǎng)絡也也一樣。4.時間序序列時間序列是是用變量過過去的值來來預測未來來的值。與與回歸一樣樣,它也是是用已知的的值來預測測未來的值值,只不過過這些值的的區(qū)別是變變量所處時時間的不同同。時間序序列采用的的方法一般般是在連續(xù)續(xù)的時間流流中截取一一個時間窗窗口(一個個時間段),窗窗口內(nèi)的數(shù)數(shù)據(jù)作為一一個數(shù)據(jù)單單元,然后后讓這個時時間窗口在在時間流上上滑動,以以獲得建立立模型所需需要的訓練練集。比如如用戶可以以銀行業(yè)CCRM理論論與實務用用前6天的數(shù)據(jù)據(jù)來預測第第7天的值,這這樣就建立立了一個區(qū)區(qū)間大小為為7
37、的窗口。數(shù)據(jù)挖掘算算法下面主要介介紹在數(shù)據(jù)據(jù)挖掘中最最常見的和和應用最廣廣泛的算法法:神經(jīng)網(wǎng)網(wǎng)絡方法和和決策樹方方法。其他他的一些算算法,例如如 Bayyesiaan方法,遺遺傳算法,粗粗糙集算法法等可以參參照相應的的文獻。應注意的是是大部分算算法都不是是專為解決決某個問題題而特制的的,算法之之間也并不不互相排斥斥。不能說說一個問題題一定要采采用某種算算法,別的的就不行。一般來說說并不存在在所謂的最最好的算法法,在最終終決定選取取哪種模型型或算法之之前,用戶戶可能各種種模型都試試一下,然然后再選取取一個較好好的。神經(jīng)網(wǎng)絡神經(jīng)網(wǎng)絡近近來越來越越受到人們們的關注,因因為它為解解決大復雜雜度問題提提
38、供了一種種相對來說說比較有效效的簡單方方法。神經(jīng)經(jīng)網(wǎng)絡可以以很容易地地解決具有有上百個參參數(shù)的問題題(當然實實際生物體體中存在的的神經(jīng)網(wǎng)絡絡要比我們們這里所說說的程序模模擬的神經(jīng)經(jīng)網(wǎng)絡要復復雜得多)。神經(jīng)網(wǎng)絡絡常用于兩兩類問題:分類和回回歸。圖4-9 一個神經(jīng)經(jīng)元網(wǎng)絡在結構上,可可以把一個個神經(jīng)網(wǎng)絡絡劃分為輸輸入層、輸輸出隱含層層層和隱含含層(見圖圖 4-99)。輸入入層的每個個節(jié)點對應應一個個的的圖 4-9一個神神經(jīng)元網(wǎng)絡絡預測變量量。輸出層層的節(jié)點對對應目標變變量,可有有多個。在在輸入層和和輸出層之之間是隱含含層(對神神經(jīng)網(wǎng)絡使使用者來說說不可見),隱隱含層的層層數(shù)和每層層節(jié)點的個個數(shù)決定
39、了了神經(jīng)網(wǎng)絡絡的復雜度度。除了輸入層層的節(jié)點,神神經(jīng)網(wǎng)絡的的每個節(jié)點點都與很多多它前面的的節(jié)點(稱稱為此節(jié)點點的輸入節(jié)節(jié)點)連接接在一起,每每個連接對對應一個權權重Wxyy,此節(jié)點點的值就是是通過它所所有輸入節(jié)節(jié)點的值與與對應連接接權重乘積積的和作為為一個函數(shù)數(shù)的輸入而而得到的,我我們把這個個函數(shù)稱為為活動函數(shù)數(shù)或擠壓函函數(shù)。如圖圖 4-110中節(jié)點點 4輸出到到節(jié)點 66的值可通通過如下計計算得到。W14 XX節(jié) J點1的值+W224 X節(jié)節(jié)點 2的值圖4-100 權重計計算神經(jīng)網(wǎng)絡的的每個節(jié)點點都可表示示成預測變變量圖4-10權重重計算(節(jié)節(jié)點1,2)的值或或值的組合合(節(jié)點33-6)。注
40、意節(jié)點點6的值已經(jīng)經(jīng)不再是節(jié)節(jié)點1,2的線性組組合,因為為數(shù)據(jù)在隱隱含層中傳傳遞時使用用了活動函函數(shù)。實際際上如果沒沒有活動函函數(shù)的話,神神經(jīng)元網(wǎng)絡絡就等價于于一個線性性回歸函數(shù)數(shù),如果此此活動函數(shù)數(shù)是某種特特定的非線線性函數(shù),那那么神經(jīng)網(wǎng)網(wǎng)絡又等價價于邏輯回回歸。調整節(jié)點間間連接的權權重就是在在建立(也也稱訓練)神神經(jīng)網(wǎng)絡時時要做的工工作。最早早的也是最最基本的權權重調整方方法是錯誤誤回饋法,現(xiàn)現(xiàn)在較新的的有變化坡坡度法、類類牛頓法、Leveen-beerg-MMarquuardtt法和遺傳傳算法等。無論采用用哪種訓練練方法,都都需要有一一些參數(shù)來來控制訓練練的過程,如如防止訓練練過度和控控
41、制訓練的的速度。決定神經(jīng)網(wǎng)網(wǎng)絡拓撲結結構(或體體系結構)的的是隱含層層及其所含含節(jié)點的個個數(shù),以及及節(jié)點之間間的連接方方式。要從從頭開始設設計一個神神經(jīng)網(wǎng)絡,必必須要決定定隱含層和和節(jié)點的數(shù)數(shù)目,活動動函數(shù)的形形式,以及及對權重做做那些限制制等,當然然如果采用用成熟軟件件工具的話話,它會幫幫你決定這這些事情。在諸多類型型的神經(jīng)網(wǎng)網(wǎng)絡中,最最常用的是是前向傳播播式神經(jīng)網(wǎng)網(wǎng)絡,也就就是如圖 4-100中所描繪繪的那種。為討論方方便假定只只含有一層層隱含節(jié)點點??梢哉J為錯錯誤回饋式式訓練法是是變化坡度度法的簡化化,其過程程如下。前向傳播:數(shù)據(jù)從輸輸入到輸出出的過程是是一個從前前向后的傳傳播過程,后后
42、一節(jié)點的的值通過它它前面相連連的節(jié)點傳傳過來,然然后把值按按照各個連連接權重的的大小加權權輸入活動動函數(shù)再得得到新的值值,進一步步傳播到下下一個節(jié)點點。回饋:當節(jié)節(jié)點的輸出出值與預期期的值不同同時,也就就是發(fā)生錯錯誤時,神神經(jīng)網(wǎng)絡就就要“學習習”(從錯錯誤中學習習)。可以以把節(jié)點間間連接的權權重看成后后一節(jié)點對對前一節(jié)點點的“信任任”程度(它它自己向下下一節(jié)點的的輸出更容容易它前面面哪個節(jié)點點輸入的影影響)。學學習的方法法是采用懲懲罰的方法法,過程如如下:如果果一節(jié)點輸輸出發(fā)生錯錯誤,那么么它看它的的錯誤是受受哪個(些些)輸入節(jié)節(jié)點的影響響而造成的的,是不是是它最信任任的節(jié)點(權權重最高的的節(jié)
43、點)陸陸害了它(使使它出錯),如如果是則要要降低它的的信任值(降降低權重),懲懲罰它們,同同時升高那那些做出正正確建議節(jié)節(jié)點的信任任值。對那那些收到懲懲罰的節(jié)點點來說,它它也需要用用同樣的方方法來進一一步懲罰它它前面的節(jié)節(jié)點。就這這樣把懲罰罰一步步向向前傳播直直到輸入節(jié)節(jié)點為止。對訓練集中中的每一條條記錄都要要重復這個個步驟,用用前向傳播播得到輸出出值,如果果發(fā)生錯誤誤,則用回回饋法進行行學習。當當把訓練集集中的每一一條記錄都都運行過一一遍之后,稱稱完成一個個訓練周期期。要完成成神經(jīng)網(wǎng)絡絡的訓練可可能需要很很多個訓練練周期,經(jīng)經(jīng)常是幾百百個。訓練練完成之后后得到的神神經(jīng)網(wǎng)絡就就是在通過過訓練集
44、發(fā)發(fā)現(xiàn)的模型型,描述了了訓練集中中響應變量量受預測變變量影響的的變化規(guī)律律。決策樹決策樹提供供了一種展展示類似在在什么條件件下會得到到什么值這這類規(guī)則的的方法。比比如,在貸貸款申請中中,要對申申請的風險險大小做出出判斷,圖圖 4-111是為了了解決這個個問題而建建立的一棵棵決策樹,從從中我們可可以看到?jīng)Q決策樹的基基本組成部部分:決策策節(jié)點、分分支和葉子子。圖 4-111一棵簡簡單的決策策樹決策樹中最最上面的節(jié)節(jié)點稱為根根節(jié)點,是是整個決策策樹的開始始。本例中中根節(jié)點是是“收入¥400000”,對此問問題的不同同回答產(chǎn)生生了“是”和“否”兩個分支支。決策樹的每每個節(jié)點子子節(jié)點的個個數(shù)與決策策樹所
45、用的的算法有關關。如 CCART算算法得到的的決策樹每每個節(jié)點有有兩個分支支,這種樹樹稱為二叉叉樹。允許許節(jié)點含有有多于兩個個子節(jié)點的的樹稱為多多叉樹。每個分支要要么是一個個新的決策策節(jié)點,要要么是樹的的結尾,稱稱為葉子。在沿著決決策樹從上上到下遍歷歷的過程中中,在每個個節(jié)點都會會遇到一個個問題,對對每個節(jié)點點上問題的的不同回答答導致不同同的分支,最最后會到達達一個葉子子節(jié)點。這這個過程就就是利用決決策樹進行行分類的過過程,利用用幾個變量量(每個變變量對應一一個問題)來來判斷所屬屬的類別(最最后每個葉葉子會對應應一個類別別)。假如負責借借貸的銀行行官員利用用上面這棵棵決策樹來來決定支持持哪些貸
46、款款和拒絕哪哪些貸款,那那么他就可可以用貸款款申請表來來運行這棵棵決策樹,用用決策樹來來判斷風險險的大小?!澳晔杖肴耄?00000”和“高負負債”的用用戶被認為為是“高風風險”,同同時“收入入5年”的的申請,則則被認為“低風險”而建議貸貸款給他/她。數(shù)據(jù)據(jù)挖掘中決決策樹是一一種經(jīng)常要要用到的技技術,可以以用于分析析數(shù)據(jù),同同樣也可以以用來做預預測(就像像上面的銀銀行官員用用它來預測測貸款風險險)。常用用的算法有有 CHAAID、CARTT、Quesst和 C5.0。數(shù)據(jù)挖掘過過程在實施數(shù)據(jù)據(jù)挖掘之前前,先制定定采取什么么樣的步驟驟,每一步步都做什么么,達到什什么樣的目目標是必要要的,有了了好的
47、計劃劃才能保證證數(shù)據(jù)挖掘掘有條不紊紊地實施并并取得成功功。很多軟軟件供應商商和數(shù)據(jù)挖挖掘顧問公公司提供了了一些數(shù)據(jù)據(jù)挖掘過程程模型,來來指導他們們的用戶一一步步地進進行數(shù)據(jù)挖挖掘工作。CRISPP-DM(Crosss Inndusttry SStanddard Proccess for Dataa Minning)是是數(shù)據(jù)挖掘掘界公認的的規(guī)范標準準,是由SSPSS、NCR、DaimmlerCChryssler等等世界知名名公司根據(jù)據(jù)其實際經(jīng)經(jīng)驗與理論論基礎共同同設計的數(shù)數(shù)據(jù)挖掘流流程。它以以企業(yè)(組組織)所面面臨的問題題為出發(fā)點點,以能實實際解決企企業(yè)(組織織)的問題題并找出新新的商機為為終極
48、目標標,所以CCRISPP-DM就就是以數(shù)據(jù)據(jù)為主軸,不不斷地尋找找并有效地地發(fā)掘出隱隱藏模式(Hidden Pattern)以及其內(nèi)涵的整體流程。換言之,如何能在大量數(shù)據(jù)中不斷地尋找出其寶藏即是CRISP-DM的精髓所在,如圖 4-12所示。圖 4-112 CRRISP-DM方法法一個數(shù)據(jù)挖挖掘項目的的生命周期期包括6個階段,上上圖顯示了了該流程的的各個階段段,包括商商業(yè)理解、數(shù)據(jù)理解解、數(shù)據(jù)準準備、建立立模型、模模型評估、模型發(fā)布布,各個階階段的順序序不是僵硬硬不變的,通通常需要在在不同階段段之間向前前和向后移移動,這取取決于每個個階段的結結果和接下下來將要實實施的階段段或者一個個階段的具
49、具體任務。箭頭指出出了各個階階段間最為為重要和頻頻繁的關聯(lián)聯(lián)。CRIISP-DDM通過這這6個階段來來保證完成成一個成功功的數(shù)據(jù)挖挖掘流程。上圖最外面面的循環(huán)表表示數(shù)據(jù)挖挖掘本身的的循環(huán)特征征。數(shù)據(jù)挖挖掘并非是是一旦得到到一個解決決方案就結結束了。在在流程及解解決方案中中得到的教教訓可能引引發(fā)新的、常常是更更為集中的的商業(yè)問題題。后面的的數(shù)據(jù)挖掘掘過程將從從前幾次的的經(jīng)驗中獲獲益。每個階段的的要點如下下。 1.商商業(yè)理解(Business understanding)這一初始階階段集中在在從商業(yè)角角度理解項項目的目標標和要求,然然后把理解解轉化為數(shù)數(shù)據(jù)挖掘問問題,并制制定出一個個旨在實現(xiàn)現(xiàn)目標
50、的初初步計劃。2.數(shù)據(jù)理理解(Daata uunderrstanndingg)數(shù)據(jù)理解階階段開始于于原始數(shù)據(jù)據(jù)的搜集,接接下來進行行的活動是是熟悉數(shù)據(jù)據(jù)、識別數(shù)數(shù)據(jù)質量問問題、探索索對數(shù)據(jù)的的第一認識識,或挖掘掘有深層含含義的數(shù)據(jù)據(jù)子集來形形成對隱藏藏信息的假假設。3.數(shù)據(jù)準準備(Daata pprepaaratiion)數(shù)據(jù)準備階階段包括所所有從原始始未加工的的數(shù)據(jù)構造造最終數(shù)據(jù)據(jù)集的活動動(這些數(shù)數(shù)據(jù)集是指指將要嵌入入建模工具具中的數(shù)據(jù)據(jù))。數(shù)據(jù)據(jù)準備任務務可能實施施多次,而而且不按任任何規(guī)定的的順.序。這些些任務包括括表格、記記錄和屬性性選擇以及及對建模工工具中數(shù)據(jù)據(jù)的轉換和和清理。4.
51、建立模模型( MModelling)在此階段,主主要是選擇擇各種建模模技術,同同時對它們們的參數(shù)進進行校準以以達到最優(yōu)優(yōu)值。通常常對于同一一個數(shù)據(jù)挖挖掘問題類類型,會有有多種方法法。一些方方法在數(shù)據(jù)據(jù)形式上會會有具體的的要求。因因此,常常常必須返回回到數(shù)據(jù)準準備階段。5模型評估估( Evvaluaationn)進入項目中中的這個階階段,你已已經(jīng)建立了了一個模型型(或者多多個),從從數(shù)據(jù)分析析的角度來來看,該模模型似乎有有很高的質質量。在進進行到模型型的最后發(fā)發(fā)布前,有有一點是很很重要的更為徹徹底地評估估模型和檢檢查建立模模型的各個個步驟,從從而確定它它完全地達達到了商業(yè)業(yè)目標。一一個關鍵目目標
52、為決定定是否存在在一些重要要的商業(yè)問問題仍未得得到充分地地考慮。關關于數(shù)據(jù)挖挖掘結果的的使用決定定應該在此此階段結束束時確定下下來。6.模型發(fā)發(fā)布( DDeplooymennt)模型的創(chuàng)建建通常并不不是項目的的結尾。即即使模型的的目的是增增加對數(shù)據(jù)據(jù)的了解,所所獲得的了了解也需要要進行組織織并以一種種客戶能夠夠使用的方方式呈現(xiàn)。這常常包包括在一個個組織的決決策過程中中應用“現(xiàn)現(xiàn)場”模型型,如在網(wǎng)網(wǎng)頁的實時時個人化中中或營銷數(shù)數(shù)據(jù)的重復復得分中。不過,根根據(jù)需要,發(fā)發(fā)布過程可可以簡單到到產(chǎn)生一個個報告,也也可以復雜雜到在整個個企業(yè)中執(zhí)執(zhí)行一個可可重復的數(shù)數(shù)據(jù)挖掘過過程。在大大部分情況況下,是由由
53、客戶來實實施發(fā)布的的,而非數(shù)數(shù)據(jù)分析師師本身。盡盡管如此,即即使分析師師并不執(zhí)行行發(fā)布,這這對客戶也也是十分重重要的提前理解解需要采取取什么行動動來實際利利用產(chǎn)生的的模型。CRISPP-DM有有效管理商商業(yè)問題處處理的生命命周期。如如上圖所示示,生命周周期的6個狀態(tài)存存在很強的的相互依賴賴的關系,其其中任何一一個環(huán)節(jié)的的質量關系系著所有環(huán)環(huán)節(jié)的成敗敗。6個環(huán)節(jié)之之間并無嚴嚴格的順序序關系,可可以根據(jù)需需要從任何何環(huán)節(jié)開始始數(shù)據(jù)挖掘掘過程。深刻理解 CRISSP-DMM方法可以以有助于用用戶更好地地解決商業(yè)業(yè)問題。從從提出一個個粗糙的商商業(yè)問題,歷歷經(jīng)若干個個生命周期期不斷地完完善它,并并提供最
54、佳佳的解決方方案。數(shù)字證書技技術數(shù)字證書技技術提供了了互聯(lián)網(wǎng)通通信的一種種安全技術術。數(shù)字證書介介紹 數(shù)字證書就就是互聯(lián)網(wǎng)網(wǎng)通信中標標志通信各各方身份信信息的一系系列數(shù)據(jù),提提供了一種種在Intterneet上驗證證用戶身份份的方式,其其作用類似似于司機的的駕駛執(zhí)照照或日常生生活中的身身份證。它它是由一個個由權威機機構CCA機構,又又稱為證書書授權(CCertiificaate AAuthoorityy)中心發(fā)發(fā)行的,人人們可以在在網(wǎng)上用它它來識別對對方的身份份。數(shù)字證證書是一個個經(jīng)證書授授權中心數(shù)數(shù)字簽名的的包含公開開密鑰擁有有者信息以以及公開密密鑰的文件件。最簡單單的證書包包含一個公公開密
55、鑰、名稱以及及證書授權權中心的數(shù)數(shù)字簽名。一般情況況下證書中中還包括密密鑰的有效效時間,發(fā)發(fā)證機關(證證書授權中中心)的名名稱,該證證書的序列列號等信息息,證書的的格式遵循循ITUTT X.5509國際際標準。一個標準的的X.5009數(shù)字證證書包含以以下一些內(nèi)內(nèi)容:(1)證書書的序列號號,每個證證書都有一一個惟一的的證書序列列號;(2)證書書所使用的的簽名算法法;(3)證書書的發(fā)行機機構名稱,命命名規(guī)則一一般采用XX.5000格式;(4)證書書的有效期期,現(xiàn)在通通用的證書書一般采用用UTC時間間格式,它它的計時范范圍為19950-22049;(5)證書書所有人的的名稱,命命名規(guī)則一一般采用XX
56、.5000格式;(6)證書書所有人的的公開密鑰鑰;(7)證書書發(fā)行者對對證書的簽簽名。為什么要用用數(shù)字證書書基于因特網(wǎng)網(wǎng)的電子商商務系統(tǒng)技技術使在網(wǎng)網(wǎng)上購物的的顧客能夠夠極其方便便輕松地獲獲得商家和和企業(yè)的信信息,但同同時也增加加了對某些些敏感或有有價值的數(shù)數(shù)據(jù)被濫用用的風險。買方和賣賣方對于在在因特網(wǎng)上上進行的一一切金融交交易運作必必須是真實實可靠的,并并且要使顧顧客、商家家和企業(yè)等等交易各方方都具有絕絕對的信心心,因而因因特網(wǎng)(因因特網(wǎng))電電子商務系系統(tǒng)必須保保證具有十十分可靠的的安全保密密技術,也也就是說,必必須保證網(wǎng)網(wǎng)絡安全的的四大要素素,即信息息傳輸?shù)谋1C苄浴?shù)數(shù)據(jù)交換的的完整性、
57、發(fā)送信息息的不可否否認性、交交易者身份份的確定性性。信息的保密密性交易中的商商務信息均均有保密的的要求。如如信用卡的的賬號和用用戶名被人人知悉,就就可能被盜盜用,訂貨貨和付款的的信息被競競爭對手獲獲悉,就可可能喪失商商機。因此此在電子商商務的信息息傳播中一一般均有加加密的要求求。交易者身份份的確定性性 網(wǎng)上交易的的雙方很可可能素昧平平生,相隔隔千里。要要使交易成成功首先要要能確認對對方的身份份,對商家家要考慮客客戶端不能能是騙子,而而客戶也會會擔心網(wǎng)上上的商店是是不是一個個玩弄欺詐詐的黑店。因此能方方便而可靠靠地確認對對方身份是是交易的前前提。對于于為顧客或或用戶開展展服務的銀銀行、信用用卡公
58、司和和銷售商店店,為了做做到安全、保密、可可靠地開展展服務活動動,都要進進行身份認認證的工作作。對有關關的銷售商商店來說,他他們對顧客客所用的信信用卡的號號碼是不知知道的,商商店只能把把信用卡的的確認工作作完全交給給銀行來完完成。銀行行和信用卡卡公司可以以采用各種種保密與識識別方法,確確認顧客的的身份是否否合法,同同時還要防防止發(fā)生拒拒付款問題題以及確認認訂貨和訂訂貨收據(jù)信信息等。不可否認性性.由于商商情的千變變?nèi)f化,交交易一旦達達成是不能能被否認的的,否則必必然會損害害一方的利利益。例如如訂購黃金金,訂貨時時金價較低低,但收到到訂單后,金金價上漲了了,如收單單方能否認認受到訂單單的實際時時間,甚至至否認收到到訂單的事事實,則訂訂貨方就會會蒙受損失失。因此電電子交易通通信過程的的各個環(huán)節(jié)節(jié)都必須是是不可否認認的。不可修改性性交易的文件件是不可被被修改的,如如上例所舉舉的訂購黃黃金。供貨貨單位在收收到訂單后
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版權許可協(xié)議:電子書出版
- 貴州省中考語文模擬檢測卷三套【附參考答案】
- 2024污水泵銷售、安裝及水質達標驗收服務協(xié)議3篇
- 2024版:某科研機構與某企業(yè)之間關于新材料研發(fā)與應用的產(chǎn)學研合作協(xié)議
- 2025年度綠色能源大棚租賃合同范本全新升級版3篇
- 2024年項目居間與協(xié)助合同
- 2024年版標準個人借款合同樣本3篇
- 2024年航天發(fā)射服務合同具體條款
- 專項全新干掛石材安裝工程勞務服務協(xié)議版A版
- 中醫(yī)針灸老師跟師體驗
- 【數(shù)學】小學四年級口算題大全(10000道)
- SIEMENS西門子SIMATICET200SP分布式I-O系統(tǒng)手冊
- 床旁教學方法
- 果膠與腸道菌群關聯(lián)
- DB11T 356-2017 公共廁所運行管理規(guī)范
- 急診進修護士匯報
- 信息安全意識培訓課件
- 中學食堂食品安全保障機制輿情管理方案
- 江蘇省南京市2025屆高三第一次調研考試(一模)英語試題含解析
- 企業(yè)供應鏈管理軟件使用合同
- 全國英語等級考試三級閱讀真題
評論
0/150
提交評論