Ch自定義字符串處理類_第1頁
Ch自定義字符串處理類_第2頁
Ch自定義字符串處理類_第3頁
Ch自定義字符串處理類_第4頁
Ch自定義字符串處理類_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 第第6章章 自自定義字符串處理類定義字符串處理類1第第6 6章章 定義字符串處理類定義字符串處理類6.1 自定義類的創(chuàng)建自定義類的創(chuàng)建6.2 數(shù)據(jù)與屬性的定義數(shù)據(jù)與屬性的定義6.3 構(gòu)造函數(shù)與銷毀函數(shù)構(gòu)造函數(shù)與銷毀函數(shù)6.4 Web 中文文本分詞相關(guān)函數(shù)中文文本分詞相關(guān)函數(shù)6.5 密碼窮舉相關(guān)函數(shù)密碼窮舉相關(guān)函數(shù)6.6 其它常用函數(shù)其它常用函數(shù)6.7 類的使用與測試類的使用與測試6.8 本章小結(jié)本章小結(jié) 第第6章章 自自定義字符串處理類定義字符串處理類26.1 自定義類的創(chuàng)建圖 6.1 StringProcess 類的創(chuàng)建 第第6章章 自自定義字符串處理類定義字符串處理類3圖 6.2 Str

2、ingProcess 代碼編寫環(huán)境 第第6章章 自自定義字符串處理類定義字符串處理類4nPublic Enum SortOfCharSetn DigitalSet = 0 數(shù)字集合數(shù)字集合n UCaseSet = 1 大寫字母集合大寫字母集合n LCaseSet = 2 小寫字母集合小寫字母集合n AllLetters = 3 所有字母集合所有字母集合n AllChars = 4 所有數(shù)字和字母集合所有數(shù)字和字母集合n UserCharSet = 5 用戶字符集用戶字符集nEnd Enum6.2 數(shù)據(jù)與屬性的定義 第第6章章 自自定義字符串處理類定義字符串處理類5nPrivate Const

3、_strDigits As String = 0123456789nPrivate Const _strUCase As String = ABCDEFGHIJKLMNOPQRSTUVWXYZnPrivate Const _strLCase As String = abcdefghijklmnopqrstuvwxyz“nPrivate _strCharSet As StringnPublic ReadOnly Property CharSet() As Stringn Getn Return _strCharSetn End GetnEnd PropertynPrivate _eCompare

4、 As CompareMethod = CompareMethod.Binary 第第6章章 自自定義字符串處理類定義字符串處理類6nPrivate Sub SetCharSet(ByVal nCharSet As SortOfCharSet, _n Optional ByVal strUser As String = )n設(shè)置字符集設(shè)置字符集6.3 構(gòu)造函數(shù)與銷毀函數(shù) 第第6章章 自自定義字符串處理類定義字符串處理類7nPublic Sub New()n SetCharSet(SortOfCharSet.AllChars)nEnd SubnPublic Sub New(ByVal nChar

5、Set As SortOfCharSet, _n Optional ByVal UserCharSet As String = )n SetCharSet(nCharSet, UserCharSet)nEnd SubnPublic Sub Dispose()n Me.Finalize()nEnd Sub 第第6章章 自自定義字符串處理類定義字符串處理類8n在中文在中文Web信息處理中,如信息檢索、信息抽信息處理中,如信息檢索、信息抽取,以及圖書情報關(guān)鍵詞的建立,都需要對文取,以及圖書情報關(guān)鍵詞的建立,都需要對文本信息進行分詞處理。本信息進行分詞處理。n對于英文文本,單詞用空格分隔,只需要對后對

6、于英文文本,單詞用空格分隔,只需要對后綴進行處理,即可進行統(tǒng)計分析。綴進行處理,即可進行統(tǒng)計分析。n中文句子是以連續(xù)的字符串形式出現(xiàn)的,詞與中文句子是以連續(xù)的字符串形式出現(xiàn)的,詞與詞之間沒有間隔,這就涉及到中文文本的分詞詞之間沒有間隔,這就涉及到中文文本的分詞處理。處理。6.4 Web 中文文本分詞相關(guān)函數(shù) 第第6章章 自自定義字符串處理類定義字符串處理類9n在中文在中文Web信息處理中,如信息檢索、信息抽信息處理中,如信息檢索、信息抽取,以及圖書情報關(guān)鍵詞的建立,都需要對文取,以及圖書情報關(guān)鍵詞的建立,都需要對文本信息進行分詞處理。本信息進行分詞處理。n對于英文文本,單詞用空格分隔,只需要對

7、后對于英文文本,單詞用空格分隔,只需要對后綴進行處理,即可進行統(tǒng)計分析。綴進行處理,即可進行統(tǒng)計分析。n中文句子是以連續(xù)的字符串形式出現(xiàn)的,詞與中文句子是以連續(xù)的字符串形式出現(xiàn)的,詞與詞之間沒有間隔,這就涉及到中文文本的分詞詞之間沒有間隔,這就涉及到中文文本的分詞處理。處理。6.4 Web 中文文本分詞相關(guān)函數(shù) 第第6章章 自自定義字符串處理類定義字符串處理類10nPublic Function NextString(ByVal strSource As String, ByVal strSeg As String) As Stringn 獲取獲取 第一個第一個strSeg 以后的字符串以后的

8、字符串n 以以 abc/de/ff, / 為參數(shù),將返回為參數(shù),將返回 de/ffn Dim I As Integern Dim J As Integern J = strSeg.Lengthn If J = 0 Then Return n I = strSource.IndexOf(strSeg, _eCompare)n If I = -1 Thenn Return n Elsen Return strSource.Substring(I + J)n End IfnEnd Function 第第6章章 自自定義字符串處理類定義字符串處理類11nPublic Function GetLeftS

9、tring(ByVal strSource As String, ByVal strSeg As String) _n As Stringn 獲取獲取 strSeg 左邊的字符串左邊的字符串n 以以 abc/de/ff, / 為參數(shù),將返回為參數(shù),將返回 abcn Dim nLoc As Integern nLoc = strSource.IndexOf(strSeg, _eCompare)n If nLoc = -1 Thenn Return strSourcen Elsen Return strSource.Substring(0, nLoc)n End IfnEnd Function 第

10、第6章章 自自定義字符串處理類定義字符串處理類12nPublic Function GetNumTail(ByVal strSource As String, ByVal strSeg As String, _n ByVal nLocation As Integer) As Stringn 獲取被獲取被 strSeg 分隔的第分隔的第 n 個字符串尾巴,個字符串尾巴,0 將直接返將直接返回整個字符串回整個字符串n 以以 abc/de/ff,/,1 為參數(shù),將返回為參數(shù),將返回 de/ffn Dim I As Integer = 0n Dim strTmp As String = strSour

11、cen If nLocation = 0 Then Return strSourcen Do While I nLocation AndAlso strTmp n strTmp = NextString(strTmp, strSeg)n I = I + 1n Loopn Return strTmpnEnd Function 第第6章章 自自定義字符串處理類定義字符串處理類13nPublic Function GetNumString(ByVal strSource As String, _n ByVal strSeg As String, _n ByVal nLocation As Integ

12、er) As Stringn 獲取獲取 第第 nLocation 個個 strSeg 前面的一段字符串,前面的一段字符串,Start from 0.n 以以 abc/de/ff, /, 1 為參數(shù),將返回為參數(shù),將返回 den Dim strVal(0) As Stringn Dim strResult() As Stringn strVal(0) = strSegn strResult = strSource.Split(strVal, StringSplitOptions.RemoveEmptyEntries)n If nLocation = strResult.Length Thenn

13、Return n Elsen Return strResult(nLocation)n End IfnEnd Function 第第6章章 自自定義字符串處理類定義字符串處理類14nPublic Function GetLastString(ByVal strSource As String, ByVal strSeg As String) _n As Stringn 獲取獲取 strSeg 分隔的最后一段子字符串分隔的最后一段子字符串n 以以 abc/de/ff, / 為參數(shù),將返回為參數(shù),將返回 ffn Dim nLen As Integern Dim nLoc As Integern n

14、Len = strSeg.Lengthn nLoc = strSource.LastIndexOf(strSeg)n If nLoc = -1 Thenn Return n Elsen Return strSource.Substring(nLoc + nLen)n End IfnEnd Function 第第6章章 自自定義字符串處理類定義字符串處理類15nPublic Function GetLastString(ByVal strSource As String, ByVal strSeg As String) _n As Stringn 獲取獲取 strSeg 分隔的最后一段子字符串分

15、隔的最后一段子字符串n 以以 abc/de/ff, / 為參數(shù),將返回為參數(shù),將返回 ffn Dim nLen As Integern Dim nLoc As Integern nLen = strSeg.Lengthn nLoc = strSource.LastIndexOf(strSeg)n If nLoc = -1 Thenn Return n Elsen Return strSource.Substring(nLoc + nLen)n End IfnEnd Function 第第6章章 自自定義字符串處理類定義字符串處理類16nPublic Function GenNextDate(B

16、yVal strPW As String) As Stringn 輸入輸入691231, 輸出輸出700101n Dim strTmp As Stringn Dim dt As Daten If strPW.Length 6 OrElse CheckLegalChars(strPW, _strDigits) = False Then Return n strTmp = strPW.Insert(4, -)n strTmp = strTmp.Insert(2, -)n Tryn dt = DateTime.Parse(strTmp)n dt = dt.AddDays(1)n Return dt.

17、ToString(yyMMdd)n Catch ex As Exceptionn Return n End TrynEnd Function6.5 密碼窮舉相關(guān)函數(shù) 第第6章章 自自定義字符串處理類定義字符串處理類17nPublic Function GenPreviousDate(ByVal strPW As String) As Stringn 輸入輸入700101, 輸出輸出691231n Dim strTmp As Stringn Dim dt As DateTimen If strPW.Length 6 OrElse CheckLegalChars(strPW, _strDigits

18、) = False _n Then Return n strTmp = strPW.Insert(4, -)n strTmp = strTmp.Insert(2, -)n Tryn dt = DateTime.Parse(strTmp)n dt = dt.AddDays(-1)n Return dt.ToString(yyMMdd)n Catch ex As Exceptionn Return n End TrynEnd Function 第第6章章 自自定義字符串處理類定義字符串處理類18nPublic Function ReplaceSubString(ByVal strSource As

19、 String, _n ByVal strOld As String, _n ByVal strNew As String) As Stringn 輸入:輸入:ab*cd*e,*,22 輸出:輸出:ab22cd*e,只替換第一個只替換第一個n If strSource.Contains(strOld) = False OrElse strOld = OrElse strNew = _n Then Return strSourcen Dim nLocation As Integer = strSource.IndexOf(strOld, _eCompare)n Dim nOldLen As In

20、teger = strOld.Lengthn If nLocation = -1 OrElse nOldLen = 0 Thenn Return strSourcen Elsen Return strSource.Substring(0, nLocation) & strNew _n & strSource.Substring(nLocation + nOldLen)n End IfnEnd Function6.6 其它常用函數(shù) 第第6章章 自自定義字符串處理類定義字符串處理類19nPublic oString As StringProcess.StringProcess = New StringProcess.StringProcess6.7 類的使用與測試圖 6.3 StringProcess 對象中的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論