輸入法發(fā)展走向_第1頁
輸入法發(fā)展走向_第2頁
輸入法發(fā)展走向_第3頁
輸入法發(fā)展走向_第4頁
輸入法發(fā)展走向_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

..4-.v.〖原創(chuàng)〗未來中文輸入法開展的走向〔聲碼和形碼〕我們都知道,人類一生下來就會哭,眼睛卻是閉著的。這決定了我們的聲音感受力和形象感受力的先導性問題。我們在讀文章的時候都是先感受文字的聲音然后讀出來的,而形象思維文字的形碼拆開需要在腦海中轉換成結果最后形成聲音,如果很多東西我們直接用聲音來表達,似乎比去在腦子中形成一個形象來得快。每個人沒有上學的時候就會發(fā)音了,但是沒有人會寫字。

上學后才能慢慢學會形象過濾、和文字的字形的不同。

從腦反響聲音和反響一個事物的形象來判斷它的打法的過程上看,漢字或是單詞的發(fā)聲的響應速度比五筆的形象拆分要快0.02秒到0.2秒之間〔因人而異〕。

未來輸入法的開展有速錄機、觸摸屏、語音錄入和傳統(tǒng)鍵盤錄入。

我們來分別看一下:①速錄機往往都用于會議記錄,即聽打時多,聲音傳導給大腦,聲音的聲母、韻母,首字的發(fā)聲和尾字的發(fā)聲,會通過對方的發(fā)聲直接傳導給我們的大腦,而形碼那么需要該發(fā)聲后的字的字形是什么,這個字形的構造,然后如何重組才能正確。顯然,形碼弱于音碼。傳導過程需要形碼轉換。②觸摸屏,聲韻母或是全拼的組合雖然外表看沒有形碼快,但是觸摸屏哪種方法都慢,而聲韻母以發(fā)聲為主的構造開展更占主導性,人們習慣了發(fā)聲,發(fā)聲會令我們的言語表達的意思直接吐露出去。分別點選聲韻母即可,如果是觸摸屏,形碼也要分別點很多拆分,這個過程仍然很浪費時間,要點很屢次。有人說形碼在這里確定性好,其實,音碼的輔助碼技術已經開展到一定程度了,像智能ABC的8筆畫碼,自然碼的直接偏旁部首〔以聲母為主的輔助碼〕都能良好的區(qū)分重碼,3碼內的區(qū)分已經根本到達了極少程度上,就別說4碼了。因為是觸摸,所以即使有重碼,3個左右的重碼也是要用電子筆或是手指來觸摸的。故此,形碼在觸摸技術上并沒有任何優(yōu)勢。所以在觸摸屏的技術上拼音仍然是主流。③語音錄入。這點發(fā)聲比形碼更有優(yōu)勢了,就是你讀什么聲音出什么字,而通過現在搜狗輸入法、QQ拼音輸入法、谷歌輸入法具有搜索引擎輸入法能力的語料庫都很準了,那將來的語音識別技術是完全可以超越現在的程度的。因為,我們語音錄入的大多數是公文、口語化資料。像小說的創(chuàng)作、論文的論述,也都是口語化的東西非常多。將來的語音錄入識別必將會和現在的黑馬校對、各個輸入法的語料庫的最強化版本來參與語音的識別。該技術我預計可以在語料上增加聲音確實定性來提高準確度。通過近期微軟win7中的語音和早期IBM的測試都能看出語音技術正在逐漸成熟??葱未a的語音錄入:我們對著電腦說:橫豎撇捺折,耳刀旁、豎心、刀字頭,別人在旁邊都不知道你在說什么,還有反而比拼音和發(fā)聲更麻煩

最可怕的還是腦思維,有人預言說極端開展的結果是輸入法腦思維來控制打字。大家想象一下:我們在念文章的時候要考慮這個文章上的字都是各種偏旁部首和拆分的不規(guī)那么或規(guī)那么的字根嗎?這個腦思維起到先導性作用的必將是“聲音〞。就拿“聲音〞一詞為例,你感受一下你腦海里是反響這個字的發(fā)聲快還是字形快呢?當然了,我們在錄入文章時,腦思維在念這文章就打出來了,而不是一個字拆分再反響出來。

當然了,傳統(tǒng)的鍵盤輸入法,在短期內形碼仍然占一定的市場,因為目前形碼確實定性更高。隨著拼音類輸入法的開展,輔助碼的提高,語料庫的算法的先進化,很快拼音類也會占更多市場。筆者的用自然碼雙拼打字〔用搜狗平臺、加加平臺或是原裝自然碼〕看打的速度有200左右,聽打的速度有300左右。只要努力練習和掌握已經初步可以到達與形碼速度比美的效果了。

綜上所述,未來中文輸入法的開展聲音會占主導地位并最終占領市場。拿計算機語言來比擬的話。字形類輸入法類似計算機語言中的低級語言,需要背誦和記憶的東西特別的多,長期不用甚至會遺忘,很難掌握和編寫程序。而發(fā)聲和人類的自然語言是一樣的,類似高級語言,計算機的高級語言是接近自然語言方式的,所以才高效。

最后,希望我的分析能給開發(fā)輸入法的官方人員以啟迪。

自然碼漢字輸入系統(tǒng)主籌劃加加論壇特邀會員X文宇二〇〇九年一月十六日

聯系方式:QQ14818014輸入法開展史回憶現已進入第三代泡泡網軟件頻道1月14日技術開展周期一般會持續(xù)十年的時間,我們現在已經進入移動互聯網周期的早期階段,這是過去的50年來的第5個開展周期:20世紀60年代,大型機時代;20世紀70年代,小型機時代;20世紀80年代,個人電腦時代;20世紀90年代,桌面互聯網時代;21世紀最初10年,移動互聯網時代。而在這5個開展周期中,中文輸入法那么經歷了3個時代:1983年,五筆輸入法誕生,成為單機時代輸入法的前奏。23年之后,搜狗拼音輸入法面世,輸入法進入了互聯網時代。2009年,一款概念產品——搜狗云輸入法那么展望了云時代輸入法的輪廓。三個時代的輸入法有哪些差異呢?從實際輸入效果來看可見一斑,翻開記事本,切換到任意一款時下流行的第二代拼音輸入法,鍵入如下字符:Zheng’dang’jue’ce’bu’men’wei’mi’he’shou’ru’cha’ju’de’hong’gou’ji’si’guang’yi’shi出現在屏幕上對應的很可能是如下的句子:“正當決策部門萎靡和收入差距的鴻溝集思廣益是〞。但是,當我們切換到搜狗云輸入法,敲擊同樣的字符序列,我們會得到一個通順的句子:“正當決策部門為彌合收入差距的鴻溝集思廣益時〞。搜狗云輸入法是如何做到大幅提高用戶長句輸入準確率的呢?筆者將按照輸入法智能化開展的脈絡,為您揭開輸入法智能化背后的神秘面紗。單機時代的輸入法有一定年齡的用戶對單機時代的輸入法會深有印象。在那個時代,電腦似乎還是專業(yè)人士手中的魔盒,輸入法講究的是一個“快〞字。所謂快,在那時被理解為重碼率低,以五筆為代表的一批基于字形、筆畫、音形結合的輸入法在當時十分流行,經過專業(yè)訓練的打字員的輸入速度甚至超過英文輸入,很少有人考慮輸入法的易用性。隨著電腦的日益普及,全拼、智能ABC、紫光、微軟拼音、拼音加加等輸入法的用戶數日益上升,畢竟拼音才是普通用戶最容易學習的輸入方式。這些產品開場考慮易用性的問題,有了用戶個人詞庫、自定義詞庫、組詞和組句的概念,輸入的準確度有了大幅度的提升。但互聯網才剛剛走入人們的生活,機器的存儲、計算能力也有限,輸入法本質上還是一款單機軟件。單擊輸入法講求速度但易用性欠佳詞庫,注音和詞頻拼音輸入法的核心是詞庫,詞庫是記錄的集合,每條記錄包括詞條、注音和同音詞的詞序〔大多數表達為詞頻或概率〕三個根本元素構成。早期的輸入法的詞條和注音通常來自專業(yè)機構和個人的人工整理。詞序通?;诮y(tǒng)計詞頻,拿較大規(guī)模的文本〔例如幾年的人民日報〕作為標準訓練庫〔通常稱為語料〕。統(tǒng)計時首先將語料切分成詞條形式,比方“今天漫天大雪〞,如果輸入法詞典中有“今天,漫天,大雪〞這些詞,那么這句話就會被切分成“今天|漫天|大雪〞。這個過程稱為分詞。切分不是唯一的,“今天|漫|天|大雪〞也是一種可能的切分,分詞的目的是尋找一種最合理的切分方法。分詞的具體技術在本文中不做詳述,但合理的詞頻統(tǒng)計一定是基于合理的分詞方法。切分后每個詞條的總出現次數稱為詞頻,除以所有詞條出現的總次數后得到出現的概率。當輸入特定的拼音序列時,如果匹配上多個詞條,將按照詞頻或概率的上下確定展現順序。理論上,如果詞庫集合無窮大,可以把所有文本片段放入詞庫中。例如“今天漫天大雪〞所有字串全部放入詞庫一共有21個詞條。所有這樣的碎片參加詞庫,理論上可以匹配用戶想輸入的任何信息。但不幸的是,電腦的計算能力、存儲能力、以及軟件的安裝包大小等,不允許過大的詞庫。早期的輸入法詞庫的規(guī)模最大也只有十萬條左右。在單機時代,輸入法的好壞往往取決于詞庫的大小、質量、合理性等。組詞和組句當用戶輸入的拼音序列無法完整匹配上詞庫中的任何一個詞條時,這時有兩種做法,一種是早期輸入法如全拼和智能ABC的做法,僅僅提供應用戶最長匹配的詞,例如輸入“jin’tian’man’tian’da’xue〞這個句子,給用戶的候選是“今天〞,當用戶作出明確的選擇后再給用戶后續(xù)選擇。另一種做法紫光、拼音加加等輸入法發(fā),通過某種方法猜想用戶想輸入的完整句子或短語作為候選。實現這一輸入方式,首先需要對用戶輸入的整體拼音串進展切分,切分成不同的音節(jié),比方用戶輸入“jin’tian’man’tian’da’xue〞時,“jin’tian|man’tian|da’xue〞,是一種切分方式,而“jin’tian|man|tian’da|xue〞是另一種切分方式。之后把每一個拼音切分映射成詞庫中的詞,得到不同的詞與詞的組合。最終可能的組合有“今天|漫天|大學〞,“今天|漫天|大雪〞,“今天|慢|天大|學〞等。最終將哪種組合方式展現給用戶呢?最普遍的做法是,計算每一種組合方式的組合概率。對于組合w1,w2,w3,w4,最簡單的計算方式就是:P(w1,w2,w3,w4)=P(w1)*P(w2)*P(w3)*P(w4)那么整體組合概率就依賴于每個詞單獨出現的概率〔也即詞頻〕。這種組合概率計算方法稱為1元模型,統(tǒng)計信息少,計算復雜度低,也有一定的準確率,在早期有著很廣泛的應用。但這種方法的錯誤率也是比擬高的,例如,如果在全局信息中,P(大學)>P(大雪),那么概率最大會是“今天漫天大學〞,用戶仍然需要進一步修改“大學〞得到“大雪〞才能輸出選項。這個問題如何解決呢?互聯網輸入法正是我們手邊流行的輸入法互聯網時代的輸入法互聯網時代的輸入法以搜狗輸入法為代表,它誕生于互聯網應用爆炸的時代,電腦已經不再是少數人手中的玩具,已經深入到千家萬戶中,聊天、論壇、寫博、評論、電子等網絡應用已經取代專業(yè)輸入成為主流需求。由于傳播渠道有了質的改善,各個輸入法產品之間的競爭也顯得更為劇烈。傳統(tǒng)的詞庫制作方法已經不能滿足網民的需求,表達在以下的三個方面:1、詞庫中大都是比擬權威的正式詞條,而少有網民的口語詞匯

2、互聯網上的新詞熱詞往往成為網民們熱衷討論的話題,需要非??斓脑~庫更新速度

3、網民在進展某個特定領域輸入的時候,嚴重缺乏該領域的專業(yè)詞條讓我們看看搜狗輸入法所代表的新一代輸入法的進步所在:互聯網語料互聯網語料是解決上述問題的主要鑰匙。網絡上充滿著大量的信息,有的是權威發(fā)布的信息〔如官方新聞等〕,有的是網民的交互活動產生的信息〔如論壇,博客〕,當然也有大量的無效信息,例如廣告?zhèn)麂N、SEO作弊等?;ヂ摼W語料的生本錢身是一個復雜的問題,但依賴于搜狗搜索引擎的技術底蘊和海量數據處理能力,我們能夠比擬方便的獲得最新的優(yōu)質語料。這也是輸入法能越來越“聰明〞的根底。新詞和口語詞互聯網具有這樣兩個特點:有大量網民產生的“非主流〞的口語詞匯;隨時會產生新的詞匯、詞法或流行語。這就意味著,傳統(tǒng)的基于人工構造的詞典不會有很好的效果??谡Z詞發(fā)現和新詞發(fā)現成為互聯網輸入法的重要技術點。比方“帥哥〞這個詞,在官方、正統(tǒng)的詞庫中是不會存在的,但在網絡上使用頻率非常高。再如“云計算〞這樣的詞,在特定時間出現井噴。這兩類詞的發(fā)現在技術實現上稍有不同,但都是基于對海量語料的高頻模板的挖掘。幸運的是,新詞發(fā)現〔特別是專有名詞的發(fā)現〕是近年來研究界關注較多的領域,有豐碩的成果;而搜狗搜索引擎本身也有著豐富的積累,使我們能用很短的時間取得突破。專業(yè)細胞詞庫

專業(yè)詞匯的發(fā)現技術和新詞、口語詞類似,只要我們能夠獲得特定專業(yè)領域的足夠語料,后續(xù)的挖掘行為是雷同的。我們通過對文本分類和聚類算法,將某一個領域中被局部用戶使用比擬多的詞會聚合成一個類,形成我們的專業(yè)詞庫〔也就是搜狗的細胞詞庫〕,并通過細胞詞庫推薦的形式,推薦給需要的用戶使用來提高其輸入的效率。組詞算法的革命通過新詞發(fā)現、口語詞發(fā)現、專業(yè)細胞詞庫,輸入法已經聰明了很多,能夠做到“與時俱進〞了。下面我們回到最開場的話題:輸入法怎樣變得更聰明,能更準確的理解用戶的意圖呢?還是以“今天漫天大雪〞為例。如果是一個人,光看到“daxue〞時,第一印象很可能也是“大學〞,但如果看到“mantiandaxue〞,通常會反映過來是“漫天大雪〞。這是因為人的思考結合了上下文和語境等因素。這也給我們一個啟示,“漫天〞和“大雪〞之間的關系更強,一個改良的方法是,在分詞統(tǒng)計的時候,不僅統(tǒng)計詞條出現的次數,還統(tǒng)計“二元組〞連續(xù)出現的概率,比方P(漫天,大雪),那么在計算整體組合概率的時候,就可以簡單的使用:P(今天,漫天,大雪)=P(今天)*P(漫天,大雪)

由于在統(tǒng)計語料中,〔漫天,大雪〕出現的次數會遠遠地大于〔漫天,大學〕的出現次數,因此最終“今天漫天大雪〞的組合概率將更勝一籌。顯然的,這種基于“二元組〞的概率計算方法更具有整體性。但相比基于詞的概率計算方法,卻要存儲更多的信息,如果詞典中有N個詞,那么理論上需要存儲的組合數目為N*N,空間上是之前的平方級別。而且由于訓練語料相比照擬小而且不容易獲取,因此實際統(tǒng)計出來的組合數目相比全局空間來講要少很多。嚴格說來,二元模型并不是互聯網時代的新鮮事物,微軟拼音、黑馬神拼等輸入法早在單機時代也使用過類似的模型。但受限于訓練語料的規(guī)模以及機器的計算存儲能力,從計算效率和效果上,都不是非常令人滿意,此外過大的安裝包大小也影響了他們的傳播。在互聯網時代,用戶桌面電腦的性能有了大幅提高,使較復雜的模型有了可能。我們能不能使用更大的數據規(guī)模、更強的模型來做到更好的效果呢?盡管用戶桌面電腦的性能提升顯著,但單機計算能力和存儲空間還是有限的,我們不得不考慮一些使用老式電腦、或者網絡狀況不佳下載緩慢的用戶。在諸多因素的平衡下,主流的輸入法大多數仍是基于“二元組〞的概率計算模型,所以,輸入法聰明了很多,但仍然聰明得有限。云輸入法時代將至輸入法新革命云時代的輸入法互聯網時代的輸入法仍然是傳統(tǒng)意義上的桌面輸入法,需要以安裝包或者定期更新的形式把信息庫存儲到用戶本地電腦上,而用戶在輸入的時候也必須使用本地的存儲和計算資源。很顯然,這種傳播、更新、存儲和計算方式,將是當前輸入法開展的主要瓶頸。但是隨著云時代的到來,網絡延時不斷降低,瀏覽器假設逐步取代本地操作系統(tǒng),這就為輸入法逐漸脫離桌面的限制,成為純粹的網絡輸入法帶來了契機。直到“搜狗云輸入法〞的誕生,云時代輸入法的雛形,才真正開場向世人嶄露頭角。何謂云輸入法搜狗云輸入法本質上是網絡輸入法,但為何稱為“云輸入法〞?一方面,輸入法本身的核心處理過程主要是信息存儲、信息挖掘和概率計算,而非信息傳輸。搜狗云輸入法的存儲和計算都是在大規(guī)模效勞器集群上完成的,這些效勞器不僅存儲能力巨大,而且多核處理器性能超強,能夠同時支持成千上萬的用戶進展在線計算。用戶端只需要通過網絡把復雜的計算任務請求發(fā)送到效勞器群上然后等待效勞器群返回計算結果,這個大規(guī)模效勞器的集群,正是云計算中的“云端〞。另一方面,搜狗云輸入法已經對外公開了計算接口,成為一個真正的輸入法計算效勞提供者,任何用戶和第三方開發(fā)商都可以通過和效勞器群直接交互來獲得計算效勞。可以看出,搜狗云輸入法其本身已經具有了“云計算〞的種種特質,因此冠名“云輸入法〞并不過分。顯而易見,相比于個人桌面電腦,云輸入法使用的大規(guī)模效勞器集群的存儲計算能力已是不可同日而語;同時,由于效勞器成了所有用戶的“容器〞,在這個容器中進展信息挖掘和信息更新就可以變得實時。這種利好是如何具體表達的呢?超大信息量相比于桌面輸入法的小而精,搜狗云輸入法可以做到輸入領域的大而全。通過搜索引擎抓取前所未有的超大訓練語料〔TB級別〕,可以做到無論是口語,古文,散文,現代文,詩詞歌賦等不同文體,還是政治,經濟,體育,娛樂等不同領域,都能面面俱到,應有盡有。權威詞條,高頻口語,方言俚語,專業(yè)詞匯,網絡熱詞等古今中外,都可以統(tǒng)統(tǒng)納入詞典而不受任何限制。實時更新通過對用戶輸入的實時統(tǒng)計和挖掘,可以根據用戶對詞條的輸入情況,隨時對詞庫進展補充和更新,進展基于用戶詞的新詞發(fā)現;并且根據用戶輸入的分詞統(tǒng)計,隨時對詞庫的詞頻做出合理的調整,給用戶最合理的詞條排序;另外,還可以通過搜索引擎不斷的抓取最新的網絡資源,及時的分析網絡新詞并參加詞庫,以最快的速度使用戶獲利。整句輸入質的提升由于“大腦〞可以記住的文字信息量更大了,思考的速度也可以變得更快了,自然而然,此時的輸入法就可以變更聰明了。通過擴大信息量并且采用更復雜的概率計算模型,整句輸入的體驗有了質的提升。首先,以“緩解工作壓力(huan’jie’gong’zuo’ya’li)〞為例,如果采用基于“二元組〞的概率計算模型,會得到什么樣的結果呢?翻開搜狗桌面輸入法,經過拼音輸入得到“換屆工作壓力〞,令人失望。切出搜狗云輸入法,輸入結果那么是“緩解工作壓力〞。為什么桌面輸入法得不到最終的結果呢?輸入法開展趨勢展望這種二元概率計算模型,會看到前后兩個詞之間的關系,但是卻看不到“緩解〞到“壓力〞之間聯系?!矒Q屆,工作〕是同音下最高頻的二元組,因此對于二元概率計算模型,“換屆工作壓力〞的整體概率強于“緩解工作壓力〞。但在搜狗云輸入法中,我們對三元組〔緩解,工作,壓力〕的概率也會進展存儲并且在計算整體概率時使用。顯然,這是一種更合理的整句概率計算方法,因為進一步加強了前后詞之間的聯系。有一個顯而易見的結論:如果我們計算整體概率時采用N元組概率信息,那么N越大,我們對整體組合概率的評估也會越準確。當然,更大的“N〞會導致存儲空間成指數級的上升,這也是桌面輸入法目前大都限制在二元模型上的最主要原因。但是云輸入法卻不受這樣的限制,因此我們在構建模型庫的時候,不僅存儲了二元組信息,還存儲了三元組信息已經更長多元組的信息。當然,這個“N〞不可能無限的擴大下去,計算復雜度問題和語料稀疏性問題終究不可防止。那搜狗云輸入法又是如何解決這個問題的呢?在進展分詞過程中,我們不僅統(tǒng)計詞條和元組的頻率,同時我們會統(tǒng)計遠距離搭配的頻率,這些遠距離搭配,有的是實體意義上的搭配,有的是句式語法意義上的搭配,最終都能為整句輸入的改善提供巨大的幫助。現在終于到了答復我們在前言中拋出的問題的時候了?!罢敍Q策部門為彌合收入差距的鴻溝集思廣益時〞這句話,云輸入法為何可以完美的輸出?通過觀察可以發(fā)現,“當……時〞,“彌合……的鴻溝〞,都是比擬固定的搭配,前者是句式方面的,而后者是實體意義上的搭配。而這些搭配都是我們可以通過分詞過程中的搭配抽取得到的。有了這兩個搭配參與到句子整體概率計算中,那么整個句子就可以正確無誤的計算出來。統(tǒng)計更長的元組頻率和更遠距離的詞語搭配,并且海量存儲任何可能出現的語言現象,做到見多識廣,這就是“云輸入〞在理解用戶輸入意圖方面如此之好的原因所在??偨Y與展望隨著互聯網開展的日新月異,輸入法的更新換代也越發(fā)迅速。搜狗在輸入法上的成功,依賴于整個搜狗技術團隊堅實而強大的技術力量。它站在巨人的肩旁上,集搜索引擎、大規(guī)模數據處理、自然語言處理和大規(guī)模網絡并發(fā)處理等多項技術于一身,真正代表了未來輸入法開展的趨勢。而搜狗輸入法對輸入法市場的最大奉獻,就是它對用戶創(chuàng)造的價值,乃至對整個中文社會所提供的社會價值和經濟價值,而且激活了這個市場的良性競爭,最終使千千萬萬的用戶得到最正確的并且不斷改良的輸入體驗。但技術的開展不會有片刻的停歇,未來的輸入法也必須更加的智能才能跟得上時代的步伐。輸入法技術開展的方向,必將是不斷增加人類的知識,不斷地增加對人類思考的模擬,讓輸入法真正能夠理解用戶的思維和意圖。希望搜狗云輸入法不僅能夠不斷的自我完善和改良,同時也能起到一個拋磚引玉的作用,繼續(xù)促進整體輸入法市場蓬勃向前的開展,讓用戶得到終極完美的輸入體驗。從五筆到火星中文輸入法開展歷程【簡介】

最近,隨著火星文的流行和各種新輸入法的層出不窮,平時不怎么受大家關注的小小輸入法曝光率驟然提高。說起輸入法,就不能不提漢字和電腦的融合關系。我國計算機的開發(fā)應用從上世紀五十年代開場就一直沒有停頓過,不過個人電腦得以快速普及應該是從90年代開場的,這其中除有易用的Window系統(tǒng)推進作用外,解決掉漢字在電腦中的輸入也是關鍵所在,人們可以在電腦中輸入漢字、應用漢字,電腦對中國人來說變的不再陌生,開場走入全家萬戶。最近,隨著火星文的流行和各種新輸入法的層出不窮,平時不怎么受大家關注的小小輸入法曝光率驟然提高。說起輸入法,就不能不提漢字和電腦的融合關系。我國計算機的開發(fā)應用從上世紀五十年代開場就一直沒有停頓過,不過個人電腦得以快速普及應該是從90年代開場的,這其中除有易用的Window系統(tǒng)推進作用外,解決掉漢字在電腦中的輸入也是關鍵所在,人們可以在電腦中輸入漢字、應用漢字,電腦對中國人來說變的不再陌生,開場走入全家萬戶。

從1981年國家標準局發(fā)布?信息交換用漢字編碼字符集根本集?GB2312-80以來,27年中漢字輸入法經歷了從無到有,從難到易,從簡單到智能的巨大演變過程,回憶它的開展歷程,我們可以一窺整個個人電腦在國內的開展史。

第一階段:電腦中可以輸入漢字了代表輸入法:五筆字型輸入法

電腦在我國普及,第一個急需要解決的問題就是,如何將漢字輸入到電腦中,為此國家1981年發(fā)布了GB2312-80,1983年,王永民先生推出了劃時代的五筆字型輸入法,五筆輸入法不但可以讓我們輸入漢字,而且也極大的解決了輸入速度這一頑癥。90年代初五筆輸入法的熱度,大家可以從日常生活中體會到一些,比方遍地開花的電腦培訓學校把五筆輸入法當成重點課程,你可以依靠對五筆輸入法的熟練程度,輕松找到一份不錯的文職工作,甚至可以開間打字社……,由此可見五筆輸入法在當時是多么的重要.

1983年王永民先生推出五筆字型輸入法

第二階段:人人皆可輸入代表輸入法:智能ABC

五筆輸入法解決了漢字輸入的問題,且輸入速度也很快,從而盛行一時。但很快隨著電腦用戶的越來越多,強背字根、入門難的先天問題越來越突顯出來了,更多的人需要一款使用簡單,入門輕松的輸入法來代替五筆輸入法。這個時候,1991年由長城集團與大學合作推出的智能ABC漢字輸入法的出現解決了這一問題。它入門簡單只要會拼音就能上手,而且?guī)в泻唵蔚穆撓牒陀洃浌δ?,這些特點,讓它很快得到了初級用戶的喜愛,尤其是在Windows系統(tǒng)將它內置,成為系統(tǒng)默認安裝輸入法之一后,使用它的用戶越來越多

Windows系統(tǒng)預裝的智能ABC,讓更多的人可以輸入文字

第三階段:效率不再只是五筆的代言詞代表輸入法:搜狗拼音輸入法

五筆入門較難,但輸入效率快,智能ABC入門簡單,但輸入效率不高。如何做到兩全其美呢?即入門簡單又可以保證輸入效率的輸入法在眾多呼聲中出現了,這種輸入法入門簡單〔會拼音即可〕,且能保持較高的輸入速度〔全拼聯想、龐大詞庫、簡拼等諸多功能極大的提高了輸入效率〕,搜狗拼音輸入法應該算是它們中的佼佼者,另外紫光拼音、谷歌拼音、QQ拼音也都屬于這一類的輸入法。

搜狗拼音輸入法讓拼音輸入也高速

第四階段:輸入不只有文字代表輸入法:火星文輸入法

輸入法的前三個開展階段,都是針對漢字的輸入方式和速度方面進展改良優(yōu)化,不過隨著網絡的高速開展,漢字的作用正在慢慢轉變,越來越多的人輸入文字不再只是為了工作,更多的是為了交流、展現自我。網絡這個大舞臺,讓原本少人問津的生僻字、古文字,甚至各種符號有了表現平臺。新時代需求下,以上只能輸入文字的常規(guī)輸入法,對這些需求已經無能為力。為此,不只可輸入文字,對生僻字、古文字、火星字以及各類符號同樣支持的新一代輸入法孕育而生了,常見的火星文輸入法算是其中做的最為出色的一款,它解析了輸入法其實不只能輸入文字。

火星文輸入法開拓網絡輸入新模式

輸入法一路走來,大概經歷了以上四個開展階段,我們可以看出,每個階段的開展原動力都是出于對用戶的需求滿足為出發(fā)點,如今,整個輸入法領域可謂百花齊放,大家都在為更快更簡單更全面的輸入法目標邁進。打字機與換筆史話

〔原文連載于?電腦報?1994年〕

按:本文節(jié)選自作者撰著的科普著作?中國換筆潮——計算機與漢字書寫革命?中的一個章節(jié),〔XX,1994年版〕更改章節(jié)標題后刊載,以饗讀者。

“指動字成,字成指動;任你如何XX,如何機智;

難叫他收回成命消去半行,任你眼淚流完也難洗掉一字。〞

上述這首小詩,摘引自中古波斯詩人歐瑪爾.海亞姆的名作?魯拜集?。?魯拜集?在我國,除了文學愛好者之外,知道它的人為數不多,可是在英語通行的地區(qū),它類似于我國的?唐詩三百首?,是家喻戶曉的詩集。上述小詩,正是?魯拜集?中的第七十一首,它指的是什么呢?或許你會脫口而出——“打字機〞。

確實,使用拼音文字國家的人,大都把它看成打字機的寫真。據美國?讀者文摘?亞洲版記載,一位女打字員,當她的高級打字機出了毛病時,就幽默地引用這首詩,說明她不應該負任何責任。我們知道,在歐瑪爾.海亞姆生活的那一時代,打字機還遠未出世。但是,打字機的影響如此深入人心,以致造成了大家以為它與拼音文字是同時來到人世的錯覺。

打字機的誕生,曾被西方歷史學家稱為是“人類文化史上繼造紙術和印刷術之后的第三項文化工具的創(chuàng)造〞。把打字機與我國的兩大書寫創(chuàng)造并列,在中國人的眼里似乎不可思議,它卻給拼音文字“打〞出“書寫革命〞的“福音書〞。

拉丁文字圈與漢字文字圈,“兩足鼎立〞的局面,持續(xù)了相當長的歷史。當漢字和拼音文字分別走向了自己的成熟期以后,書寫革命的鋒芒,消消地會聚到了另一焦點。

自文字成熟以來,兩大文字圈的蕓蕓眾生,案牘書寫的首要工具大體一樣。以手握“筆〞,蘸墨水,寫于“紙〞上的模式,支配了人類千百年的書寫。僅就“筆〞而言,似乎東西方也只有軟硬的差異。

中國人習慣于用“毛筆〞,筆頭軟軟的毛筆被列入了“文房四寶〞之首,有所謂羊毫、雞毫、狼毫、兔毫、虎毫、豹毫;史書記載蒙恬創(chuàng)造秦筆時,是以“鹿毛為柱,羊毛為被〞;而王羲之書寫?蘭庭序?所用之筆,那么由老鼠的胡須制成;更有人采用猩猩毛甚至嬰兒的胎發(fā)來制造軟筆,可謂奇思異想,為改善漢字書寫工具費盡心機。

歐洲大陸上的人們,偏愛較硬的筆。在淘汰了古代的“葦桿筆〞后,“羽管筆〞被使用了數百年之久?,F代英語里“筆〞這個單詞pen,就是來自拉丁文中的penna,意思是“羽毛〞。我們常常在電影里看到歐洲貴族用一片彎彎的羽毛優(yōu)雅地簽字,圣經中也有傳教士用羽管筆抄寫福音書的自畫像。據說,火雞和鵝翅膀上的羽毛,是制作筆的最正確材料,而用左翼的羽毛管做筆,對右手寫字的人最為適宜。用羽毛寫字固然高雅,但一支筆寫不了幾天就會磨損,西方人很早以前就開場尋找更耐久的材料。羅馬時代有了青銅筆尖,但鋼制的筆尖直到19世紀才開場批量生產。

如果兩大文字圈的人都只是著重于“筆〞本身的改良,恐怕沒有什么奇跡可能發(fā)生,至多只是在西方人的“自來水筆〞風行全球后,被中國人承受成為手寫漢字的日常工具,根本不可能動搖漢字書寫傳統(tǒng)的結實根基。

奇跡發(fā)生在18世紀后期,首先是英國,然后法國、美國、德國,先后發(fā)動了第一次工業(yè)革命,率先辭別了以人力、畜力為動力的農業(yè)時代。

工業(yè)革命的奇跡始終與各式各樣的“機〞伴生伴長:從詹姆斯.哈格里沃斯創(chuàng)造的“珍妮紡紗機〞開場,鐘表匠凱依和木匠海斯創(chuàng)造了第一臺水力驅動的紡紗機;修理工出身的詹姆斯.瓦特完成了他的第一臺蒸汽機;工程師喬治.斯蒂芬森為世界上第一條鐵路提供了“蒸汽機車〞……

在機械化的喧囂聲中,為拼音文字書寫鋪路的機器迅速參加了合唱的行列,這是直接“威脅〞到筆在書寫領域之壟斷地位的一種“寫字機〞。

世界上第一臺打字機終究是由誰在何時何地創(chuàng)造,各種資料說法不盡一樣。可能是由于中國人對創(chuàng)造打字機的成果看不上眼,國內系統(tǒng)介紹它的文章寥寥無幾。就是一些英文打字講義和教材,也只是在前言里順便提一兩句而已。我們只能根據所搜羅的假設干零星資料〔包括英語原文〕進展歸納和整理。

記錄時間最早的是英國女皇安妮逝世的那年,即1714年,一位名叫亨利.米爾的英國人首先登記了創(chuàng)造專利。據說米爾創(chuàng)造的這種機器,“無論什么文章都可以用它寫在羊皮紙上,其整潔清晰的程度與印刷品毫無區(qū)別〞。然而,沒有人知道它的模樣,甚至不能夠描述它看上去象什么東西。

據美國人講,第一個美國打字機專利是底特律市的威廉.奧斯丁.伯特于1829年注冊,它的名字是“伯特家庭字母打字機〞。

奧地利人認為,第一臺有紀念意義的打字機是細木匠彼得.米堅霍費爾于1864年制作。這種打字機的接觸桿是木制的,木桿的前端釘上許多小針,組成不同的字母。當木桿打在紙上時,小針就把字母印在紙上——這一點倒與現代的“針式打印機〞十分相似。

還有其他一些說法,比方法國馬賽的“與鋼筆書寫一樣快〞的機器等等。當時這種機器的創(chuàng)造者,大概多為木匠、鐘表匠或機械工匠。有關打字機誕生各種爭論,預示著當時這種新的書寫工具已受到人們普遍的關注,天時地利,呼之欲出。

從第一個打字機的專利到第一臺有實用價值的打字機面世大約經過了150年。由于能夠借鑒各種初期打字機的研制經歷,現代打字機本身的構造已是瓜熟蒂落,但在如何排列字母鍵的問題上,卻遇到了不小的麻煩,而克制障礙所采用的方法,連今天的計算機也感到無可奈何——它引出了一那么有趣而遺憾的創(chuàng)造故事。

美國“南北戰(zhàn)爭〞正硝煙滾滾,林肯總統(tǒng)高舉著?解放宣言?的偉大旗幟,把美國內戰(zhàn)推進到“以革命方式進展戰(zhàn)爭〞的重要階段。在北方重鎮(zhèn)芝加哥稍北一點的密執(zhí)安湖畔,座落著美麗的港口城市——米爾沃基。北方軍隊節(jié)節(jié)勝利的喜訊不斷傳來,使身為報館編輯的克里斯托弗.肖爾斯感到分外沖動。

此時的肖爾斯,雖然時刻掛念著戰(zhàn)局的開展,迫切期望用自己的筆盡快報道北軍的戰(zhàn)績,但是,更令他不思茶飯的煩惱的事情,還是擺在面前的這架“小玩意〞,也許它才能夠幫助自己實現“夢筆生花〞的夙愿。在傾注了肖爾斯與他的兩位合伙人數年心血后,這構造精細的打字機,目前已進展到了研究的關鍵。機器靜靜地擺放在桌上,袖珍的齒輪、杠桿、螺釘、撥叉、滾筒……,一切都是那么完美、協(xié)調,似乎是機械原理集大成之作。

一排排的園形按鍵,均勻地分布在機器的正面;稍有機械常識的人,都可以循著每一按鍵向內部觀察——按鍵通過傳動裝置,聯接著金屬桿,而每根桿的末端,都刻寫著一個美觀的字母,一個可由按鍵控制向前“擊打〞的“字母筆〞。

所有的構思巧妙之極,現代打字機就要哇哇墜地了。肖爾斯緊X地坐在桌旁,分開十指,快速地壓下一個個按鍵?!斑青辏青戗?,聽上去還是那么刺耳。肖爾斯緊鎖著眉頭,按一下,停一下,紙上卻印出了端正的字跡?!半y道我的打字機只能一字一頓地斷續(xù)打?〞肖爾斯自言自語道:“那簡直太可笑了。〞

原來,問題就出在鍵盤上。按照常規(guī),肖爾斯把26個英文字母,順序地排列在鍵盤上,ABCD,然后是EFG……。為了使打出的字跡一個挨著一個,這些按鍵不能相距太遠。打字的時候,只要手指的動作稍快,按鍵連著的金屬桿就會你擠我,我擦你,相互發(fā)生干預現象。

肖爾斯“入定〞般地坐著,心里越想越煩?!澳阆氪蚩靻幔课移蛔屇憧?!〞他找來一本字典,粗略地統(tǒng)計了英語中哪些是最常用的字母,然后重新安排了字母鍵的位置。他把所有常用字母之間的距離,都排到盡可能遠一些,讓手指移動的過程盡量延長。

反常的思維方法竟然取得了成功。手指、按鍵、金屬桿,有條有理地連續(xù)運動?!皣}噠噠……〞肖爾斯沖動地打出了一行字母,如同印刷字一樣精巧:

“第一個祝福,獻給所有的男士,特別地,獻給所有的女士!〞

肖爾斯“特別地

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論