版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
香港中文大學(xué)圖書(shū)館系統(tǒng)UniversityLibrarySystemTheChineseUniversityofHongKong香港Innovative用戶協(xié)會(huì)重訂《單一碼與CCCII/EACC對(duì)應(yīng)表》–第五屆中國(guó)INNOPAC用戶協(xié)會(huì)年會(huì),2004年11月9-10日
––上海華東師范大學(xué)–何以業(yè)2004年11月9日1香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)鳴謝重訂工作由香港Innovative用戶協(xié)會(huì)(HongKongInnovativeUsersGroup)下的單一碼計(jì)劃工作小組(HKIUGWorkingGrouponUnicodeProject)負(fù)責(zé)。 小組成員館的代表為:林紀(jì)達(dá)先生(香港科技大學(xué))黃秉杰先生(香港城市大學(xué))陳偉明先生(香港大學(xué))何以業(yè)(香港中文大學(xué))以下的報(bào)告內(nèi)容取材自黃秉杰先生與我在2003年12月第4屆HongKongInnovativeUsersGroupMeeting中的報(bào)告http://hkiug.ln.edu.hk/meetings/am2003/presentations/philip_ho_yee_ip.ppt2香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)報(bào)告梗概背景難題目標(biāo)與方法工序?qū)nnovatives的要求尚未解決的問(wèn)題用戶注意事項(xiàng)將來(lái)3香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)1.背景漢字編碼字符集多種字符集支援中日韓字(CJK)資料來(lái)源:林紀(jì)達(dá),“OverviewofChineseCharacterEncoding”,http://www.lib.cuhk.edu.hk/seminar/unicode/kt_lam_files/frame.htm字符集名稱(charactersets)流行范圍GB(國(guó)標(biāo))中國(guó)BIG5(大五碼)香港,臺(tái)灣等地CCCII(ChineseCharacterCodeforInformationInterchange中文信息交換碼)圖書(shū)館EACC(EastAsianCharacterCode東亞字碼)美國(guó)國(guó)會(huì)圖書(shū)館字碼標(biāo)準(zhǔn)(MARC21standard)http://www.loc.gov/marc/specifications/specchareacc.htmlUnicode(單一碼)電腦操作系統(tǒng)廣泛采用,e.g.:Windows2000,XP4香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)1.背景字符集支援范圍字符數(shù)碼點(diǎn)版本發(fā)布支援繁簡(jiǎn)連結(jié)特質(zhì)BIG513,05314,7581984繁體無(wú)GB1803027,0001.6百萬(wàn)2000繁簡(jiǎn)無(wú)CCCII75,684830,5841980繁簡(jiǎn)有EACC15,728830,5841983繁簡(jiǎn)有Unicode82,2701.1百萬(wàn)2000(v.3)繁簡(jiǎn)無(wú)5香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)1.背景(代)碼點(diǎn)(codepoint)同一個(gè)字形,在不同字符集會(huì)使用不同的碼點(diǎn)字符集[余]的碼點(diǎn)備考BIG5A745GB180305164CCCII213131276076[餘]216076
後4碼連結(jié):余杭<->餘杭EACC276076[餘]216076
後4碼連結(jié):余杭<->餘杭Unicode4F596香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)1.背景內(nèi)存代碼(internalcode)Innopac以EACC/CCCII形式存儲(chǔ)CJK字符Innopac內(nèi)存代碼不是Unicode1001余秋雨1001{276076}{214f29}{215f51}7香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)1.背景對(duì)應(yīng)表(mappingtable)Innopac用對(duì)應(yīng)表把內(nèi)存代碼在客戶端與系統(tǒng)之間往來(lái)轉(zhuǎn)換接口(界面)客戶端編碼Innopac內(nèi)存代碼TelnetBIG5WebPACBIG5BIG5(大五碼)EACC/CCCIIMilleniumWebPACUTF-8UTF-8(單一碼)EACC/CCCII8香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)2.難題(一)復(fù)數(shù)對(duì)應(yīng)難題1UTF-8對(duì)應(yīng)表(diac.utf8)中,有多個(gè)內(nèi)存代碼對(duì)應(yīng)同一個(gè)客戶端編碼查詢用的代碼不一定是所期望的代碼對(duì)應(yīng)次序各館不同,Z39.50查找結(jié)果不定UTF-8表中[臺(tái)]的復(fù)數(shù)變換EACC-內(nèi)存代碼Unicode--客戶端編碼字義283b7d53F0[檯]的簡(jiǎn)體27605d53F0[颱]的簡(jiǎn)體21353853F0[臺(tái)]本身是正字27542b53F0[臺(tái)]的簡(jiǎn)體9香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)2.難題(二)EACC與CCCII重疊難題2EACC與CCCII用碼不同,各館內(nèi)存不一,資料交換帶來(lái)麻煩。EACC/CCCIIBIG5UTF-8備考余213131(CCCII)A7454F59獨(dú)立代碼,不與[餘]216076連結(jié)276076(EACC)A7454F59與[餘]216076連結(jié)10香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)2.難題(三)錯(cuò)誤與缺漏難題3UTF8(Release2002Phrase3)中有小毛病錯(cuò)誤27615F<>U+53CB [友]該對(duì)應(yīng)U+53D1 [發(fā)]缺漏缺213F30<>U+3007 [〇]11香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)2.難題
(四)選取不一致難題4BIG5和UTF-8產(chǎn)生的復(fù)數(shù)對(duì)應(yīng)不一致,香港Innovative用戶協(xié)會(huì)決定進(jìn)行此單一碼計(jì)劃:BIG5客戶端
對(duì)應(yīng)表選前一個(gè)對(duì)應(yīng)碼UTF8客戶端
對(duì)應(yīng)表選后頭一個(gè)對(duì)應(yīng)碼12香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)2.難題(四)選取不一致(續(xù))[才]的對(duì)應(yīng)BIG5(WebPAC
或Telnet)對(duì)應(yīng)表選前一個(gè)對(duì)應(yīng)碼
內(nèi)存
BIG5
213f7b A47E
BIG5選前一個(gè) 28736d A47EUTF-8(WebPAC或Millennium)對(duì)應(yīng)表選后一個(gè)對(duì)應(yīng)碼
內(nèi)存
UTF-8 213f7b 624D
28736d 624D UTF-8選后一個(gè)13香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)3.目標(biāo)與方法.香港中文大學(xué)于2003年7月舉行了討論會(huì):http://www.lib.cuhk.edu.hk/seminar/unicode/單一碼計(jì)劃工作小組(HKIUGWorkingGrouponUnicodeProject)亦于同年7月成立目標(biāo)解決BIG5和UTF-8選取不一致的難題決定對(duì)應(yīng)表中的那些應(yīng)是‘一對(duì)一’或是‘多對(duì)一’決定對(duì)應(yīng)表應(yīng)否只用‘純粹EACC’或是‘EACC+CCCII’清除錯(cuò)誤與缺漏為將來(lái)‘以單一碼為內(nèi)存的資料庫(kù)’做好準(zhǔn)備14香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)3.目標(biāo)與方法(續(xù))
單一碼計(jì)劃工作小組研究后提出如下方案:不再修訂BIG5對(duì)應(yīng)表(因?yàn)?字符集字量少;只支援繁體字;復(fù)數(shù)對(duì)應(yīng)太多….等等)
建議重訂一張新的UTF-8對(duì)應(yīng)表(diac.utf8)EACC<>Unicode以美國(guó)國(guó)會(huì)圖書(shū)館MARC21為標(biāo)準(zhǔn)尾4碼相同者,容許復(fù)數(shù)對(duì)應(yīng);尾4碼不同者,需決定優(yōu)先選取者;例:[臺(tái)](見(jiàn)2.難題1)EACC與CCCII重疊時(shí),刪除CCCII將館內(nèi)以該CCCII為內(nèi)碼的資料轉(zhuǎn)換為對(duì)應(yīng)的EACC對(duì)應(yīng)表需包括‘純粹CCCII’以照顧不常用字15香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)4.工序建成diac.utf8.hkiug以下部分直接摘用黃秉杰先生在2003年12月第4屆HongKongInnovativeUsersGroupMeeting報(bào)告內(nèi)的Procedures部分
參見(jiàn):http://hkiug.ln.edu.hk/meetings/am2003/presentations/philip_ho_yee_ip.ppt16香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)Proceduresdiac.utf8.hkiugcreateddiac.utf8.hkiugdiac.utf8LCEACC22717EACC/CCCIISubtracted66SubstitutesforMissing(U+3013)15673EACC7044pureCCCII+Remapped287PUASelectedpreferencesinmulti-mappinglinkedandunlinkedcasesCorrectedLCmappingspreparedlistforCCCIItoEACCdataconversionSubtracted955withEACCequivalent15739EACCmerged7999CCCIIextracted17香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)ProceduressourcefromLCMergedtablesfromLC'sEACCtoUCS/UnicodeMappingshttp://www.loc.gov/marc/specifications/specchareacc.html
18香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)ProceduresIncludedpureCCCIIfromUTF-8table(Rel2002Phase3)CCCIIwithnoEACCequivalents(pureCCCII)e.g.217455坓22483E洣7,044AddedtonewtableCCCIIwithEACCequivalentse.g.213131(CCCII)余276076(EACC)余955Excludedfromnewtable.SenttoIIIfordataconversionsourcefromdiac.utf819香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)Proceduresre-mappedPUARe-mapped297PrivateUserArea(PUA)tosuggestedalternates20香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)ProceduresSelectedpreferenceinmultiplemappingEACCMultiplemappingExample#ofcasesEnhancedindexing?LabeledasPreferenceLinkedsamelowerorderbytes4B3178
倩213178倩160(320char)Yes"multi-mappinglinked"notmatterUnlinkeddifferentlowerorderbytes283B7D
臺(tái)27605D
臺(tái)213538臺(tái)27542B
臺(tái)49(108char)No"multi-mappingunlinked"selectedcasebycase(basedonHKUSTstudyonwordfrequency&meaning)selectedpreference21香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)ProceduresLinkedcases:HKIUGpreferenceindicatedselectedpreference(cont)SelectedpreferenceinEACCmultiplemappinglinked22香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)ProceduresUnlinkedcases:HKIUGpreferenceindicatedselectedpreference(cont)SelectedpreferenceinEACCmultiplemappingunlinked23香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)ProceduresUpdatedLCmappingsReferencedfromothersourcesUnihanOCLCUSMARCCharacterSetforChinese,Japanese,Korean(printed)Examples:273C67LCmappedtoU+E9D8RemappedtoU+5E72(干)4B3C2bLCmappedtoU+E9C7RemappedtoU+67C3(柃)updatedLCmapping24香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)ProceduresCCCIIwithEACCEquivalents-fordataconversionCCCIIEACClistforconversionPreparedlistfordataconversion25香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)5.
對(duì)Innovatives的要求.交給Innovatives的付項(xiàng)diac.utf8.hkiug–是HKIUG設(shè)定的EACC/CCCII<>UTF-8對(duì)應(yīng)表EACC 15,673純粹CCCII 7,044合共 22,717 hasEACC.txt–CCCII重疊EACC表(955)單一碼計(jì)劃工作小組的報(bào)告Innovatives可做的工作(IUGCN可參照實(shí)行)為各館的Innopac安裝diac.utf8.hkiug依照hasEACC.txt所示,把圖書(shū)館資料庫(kù)內(nèi)的CCCII轉(zhuǎn)換成對(duì)應(yīng)的EACC(各館可自行轉(zhuǎn)換)26香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)6.
尚未解決的問(wèn)題
LC的錯(cuò)誤美國(guó)國(guó)會(huì)圖書(shū)館(LC)MARC21標(biāo)準(zhǔn)中有一個(gè)錯(cuò)誤:23355C
LCMARC21標(biāo)準(zhǔn)23355C<>U+86C3[蛃]USMARCcharactersetforChinese,Japanese,Korean.Washington,D.C.:LibraryofCongress,1986.23355C[豣]U+8C6327香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)7.用戶注意事項(xiàng)
復(fù)數(shù)對(duì)應(yīng)選字復(fù)數(shù)對(duì)應(yīng):[歷]U+5386請(qǐng)參考香港科技大學(xué)的復(fù)數(shù)對(duì)應(yīng)選擇表:lc-multi-eacc.xls歷21462A歷27462A設(shè)定為優(yōu)先對(duì)應(yīng)歷的簡(jiǎn)體274349設(shè)定為非優(yōu)先對(duì)應(yīng)曆的簡(jiǎn)體曆21434928香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)7.用戶注意事項(xiàng)復(fù)數(shù)對(duì)應(yīng)選字(續(xù)1)數(shù)據(jù)正確性
書(shū)名:歷法…內(nèi)存代碼備考數(shù)據(jù)正確?以字符輸入:歷27462A與[歷]21462A連結(jié)索引錯(cuò)誤若以代碼輸入:274349274349與[曆]214349連結(jié)索引正確*可用附加追尋項(xiàng),以字符輸入:歷27462A與[歷]21462A連結(jié)索引29香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)7.用戶注意事項(xiàng)
復(fù)數(shù)對(duì)應(yīng)選字(續(xù)2)Milleniumeditor暫依UTF-8對(duì)應(yīng)表在儲(chǔ)存目錄時(shí)修改內(nèi)碼。這會(huì)使數(shù)據(jù)不正確。此為Millennium的軟件缺點(diǎn),由于目錄從server交到client,在client重存時(shí),內(nèi)存代碼會(huì)依對(duì)應(yīng)表的優(yōu)先對(duì)應(yīng)的規(guī)定來(lái)改碼。如果只是修改item,checkin,order,globalupdate等,由于不會(huì)在client重存bib目錄,內(nèi)存代碼不會(huì)改變。
內(nèi)存代碼數(shù)據(jù)正確?Telnet以代碼輸入:274349{274349}正確Millennium中,不做任何修改,儲(chǔ)存后,在Telnet中檢看:{27462A}錯(cuò)誤30香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)7.用戶注意事項(xiàng)復(fù)數(shù)對(duì)應(yīng)選字(續(xù)3)Innovatives打算在Sliverversion中修正軟件缺點(diǎn)。非優(yōu)先對(duì)應(yīng)的內(nèi)存代碼,會(huì)在Milleniumeditor以字符顯示,而且不會(huì)在重存目錄時(shí)修改內(nèi)碼。
內(nèi)存代碼數(shù)據(jù)正確?Telnet以代碼輸入:274349{274349}Millennium中,不作任何修改,儲(chǔ)存后還保留並顯示為:{274349}正確31香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)7.用戶注意事項(xiàng)復(fù)數(shù)對(duì)應(yīng)選字(續(xù)4)暫時(shí)可用Anzio-Win作Telnetclient設(shè)定可參考香港中文大學(xué)圖書(shū)館網(wǎng)頁(yè):http://www.lib.cuhk.edu.hk/cataw/Internet/System_DIY.pdf上述網(wǎng)頁(yè)提到的CCCII.UNI,香港中文大學(xué)愿意提供。但ANZIO-Win有缺點(diǎn):CCCII.UNI為1EACC<>1Unicode.
非優(yōu)先對(duì)應(yīng)者,一概不用
32香港Innopac用戶協(xié)會(huì)重訂<單一碼與CCCII/EACC對(duì)應(yīng)表>.2004年11月9日,何以業(yè)7.用戶注意事項(xiàng)復(fù)數(shù)對(duì)應(yīng)選字(續(xù)5)
EACCdiac.utf8.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年全球及中國(guó)乙烯-丙烯酸乙酯共聚物(EEA)行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025醫(yī)療服務(wù)合同有什么特征
- 2025委托經(jīng)營(yíng)管理合同(詳細(xì))
- 提高時(shí)間管理能力的訓(xùn)練
- 提高學(xué)習(xí)效果的方法和技巧
- 2025廣告場(chǎng)地租賃合同樣本版
- 演出合同范文集合
- 續(xù)簽借款簡(jiǎn)單的合同范本
- 建設(shè)工程廉政合同范本年
- 旅游資源開(kāi)發(fā)合同2024
- 選擇性必修一 期末綜合測(cè)試(二)(解析版)2021-2022學(xué)年人教版(2019)高二數(shù)學(xué)選修一
- 學(xué)校制度改進(jìn)
- 各行業(yè)智能客服占比分析報(bào)告
- 年產(chǎn)30萬(wàn)噸高鈦渣生產(chǎn)線技改擴(kuò)建項(xiàng)目環(huán)評(píng)報(bào)告公示
- 民謠酒吧項(xiàng)目創(chuàng)業(yè)計(jì)劃書(shū)
- 2023年珠海市招考合同制職員筆試參考題庫(kù)(共500題)答案詳解版
- 心電監(jiān)護(hù)考核標(biāo)準(zhǔn)
- 特種行業(yè)許可證申請(qǐng)表
- 古典芭蕾:基本技巧和術(shù)語(yǔ)
- 內(nèi)地居民前往香港或者澳門(mén)定居申請(qǐng)表
- DB43-T 2612-2023林下竹蓀栽培技術(shù)規(guī)程
評(píng)論
0/150
提交評(píng)論