人機交互HCI小組研討班會議記錄_第1頁
人機交互HCI小組研討班會議記錄_第2頁
人機交互HCI小組研討班會議記錄_第3頁
人機交互HCI小組研討班會議記錄_第4頁
人機交互HCI小組研討班會議記錄_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、2003年8月2日至4日人機交互(HCI)小組研討班會議記錄地點:鳳山溫泉度假村時間:2003年8月2日至4日參加人:戴老師、王宏安主任、華慶一老師、北大陳文光老師、人機交互小組相關(guān)成員報告人1:田豐題目:Post-WIMP界面交互特征研究 時間:2003年8月2日 下午1 問:你所談及的POST_WIMP是否是建立了一個新的交互風(fēng)格?答:如果建立一個統(tǒng)一的新的交互風(fēng)格,還有一定的難度,因此我只是從交互特性方面進行了研究。2 問:認(rèn)知處理能力中的Data-Limited是什么?答:一種數(shù)據(jù)質(zhì)量的限制、包括人在大腦中已經(jīng)形成的一些固有的知識等3 問:你們在作測試和評估時,有沒有和自然的筆進行自然

2、性的比較?答:我們的依據(jù)是根據(jù)最簡單的任務(wù)完成。具體的紙筆與電子筆比較,對于較熟練的用戶,差別不是很大,但是對于不熟悉的用戶,差別會大一些。4 問:你們所開發(fā)的這樣一種筆輸入,和鼠標(biāo)鍵盤從認(rèn)知還有效率方面來說,哪一種會更多些?答:因人而異,對于熟練用戶其認(rèn)知的負(fù)擔(dān)小,因此其效率高,但對于不熟練用戶來說,認(rèn)知負(fù)擔(dān)可能會大一些。 此外還和任務(wù)有關(guān)、與應(yīng)用有關(guān)、與背景有關(guān)。 當(dāng)然,在特定的文化中還有差別。5 問:有關(guān)范式的問題,從紙筆到Frame 會不會成為交流的障礙?答:Frame是特定的數(shù)據(jù)管理,需要從顯式到隱式進行一定的轉(zhuǎn)化。6問:開發(fā)中的主要困難是什么?答:patch等多種數(shù)據(jù)識別和切分問題

3、。7問:平時我們用自然的紙筆進行交流時,它是一個感知的問題,不需要的訓(xùn)練,對于所做的手勢是不需要用腦子去想的,那么對于你們所開發(fā)的筆式系統(tǒng)是不是需要考慮下一步的手勢的問題?答:我所考慮的是手勢的多樣性的問題,也就是說是考慮到了大多數(shù)人所常用的手勢。8問:是以用戶為中心,還是以技術(shù)為中心。答:這一方面我們考慮的較少,我們主要是從交互的特性來考慮,而并不是從人的方面來考慮。小結(jié)(華老師):以技術(shù)為中心,并不是用戶要求的單位。首先是研究人用紙,什么是最小單位,這里指的最小單位不僅僅限于語法單位,而且限于語義單位。其次是從用戶角度分析什么是最小單位。9問:什么是交互任務(wù),什么是自然隱式的交互任務(wù)?答:

4、交互任務(wù),是一種基本任務(wù),是用戶向計算機提出的一種操作。自然隱式的交互任務(wù), 是用戶在交互過程中不需要關(guān)注任務(wù)的執(zhí)行方式和過程。10 問: 用戶意圖和Stroke的關(guān)系?答:stroke可以看成是從用戶角度來講,在紙筆環(huán)境中一個基本的交互任務(wù)。它是從用戶的交互意圖來講一個最小的單位。11 問:Post-WIMP替代WIMP,那么在評估時,是否具有同樣的功能?答:我們的手勢方面還需要做進一步的工作,交互自然性方面也做的不夠。當(dāng)交互手勢無法合理地表示任務(wù)時,我們采用顯式的WIMP交互方式進行。 人的手勢是創(chuàng)造出來的,我認(rèn)為這不是自然性的問題,其實在WIMP,也不是自然性的問題。其實只要用戶習(xí)慣了就

5、是自然的,積累多了,就是自然的了,也就是說訓(xùn)練成就熟悉的問題。討論:我覺得這是混淆了交互自然性和交互自動性這兩個概念。(華老師) 交互自然性,人的心理距離和計算機所表現(xiàn)的距離是匹配的。交互自動性,可經(jīng)過長期訓(xùn)練,提高交互自動性,但并不代表人的心理距離和計算機所表現(xiàn)的距離會發(fā)生變化。12 問:談?wù)勈謩莸哪:詥栴},也就是范式的容量問題?答:由具體的應(yīng)用限制。13 問:如何權(quán)衡用戶希望和系統(tǒng)功能這兩者之間的矛盾?答:理想化的模式是用戶所需要的就是系統(tǒng)所需要的。 從一個任務(wù)本身來說,特定的類型應(yīng)該用特定的范式,不同的應(yīng)用可以有不同的需求。小結(jié)(華老師):用戶界面的目標(biāo)是自然,但是效率也同樣重要,不自

6、然應(yīng)該有特定的要求,所以需要走一條折衷的道路。14 問:為什么選擇紙筆,而不是聲音和視覺?這兩個在自然性方面有無比較?答:目前對于語音的研究還是一個“瓶頸”,關(guān)鍵是識別率低的問題。而且,聲音和視覺,對于可視化方面沒有太大的幫助。15 問:人工智能方面的突破能否使得人機交互更自然?答:應(yīng)該是這樣的。 有本關(guān)于直接操作和軟件Agent的爭論,發(fā)表在2000 ICM InterAction上。有興趣的同志可以去看看??偨Y(jié)(戴老師):1筆式用戶界面的工作是肯定的,Post-WIMP界面交互特征作了不少的研究,這方面的工作我們還會接著做下去,而且除了紙筆交互以外,我們還會做三維等等風(fēng)格的多樣化的軟件。2

7、 目前計算機的角色在于交流,我認(rèn)為交流的順序是從情感到語言到文字最后再到計算機。3我們在和微軟做的重大資金項目的題目是“面向主流、自然、高效多通道用戶界面研究”。所以面向主流是我們的出發(fā)點。 報告人2:馬翠霞題目:無處不在計算環(huán)境時間:2003年8月2日 上午1 問:“無處不在”的嚴(yán)格定義是什么?答:指獲取服務(wù)方式的無處不在。2 問:其制約因素很多,目前實驗室能做到什么程度?答:我們目前在找一個研究切入點。對無處不在計算的研究,設(shè)備和網(wǎng)絡(luò)是一個很重要的方面。鑒于實驗室的基礎(chǔ),應(yīng)當(dāng)基于我們的已有工作和優(yōu)勢所在開展研究,目前可以從生活經(jīng)驗捕捉和上下文感知方面來做,主要表現(xiàn)在交互方式的研究上。3 問

8、:無處不在計算的研究,在平臺和協(xié)議方面的應(yīng)用如何?答:分布式移動在協(xié)議應(yīng)用方面較強。對于平臺方面,例如, 對上下文感知的研究,一些著名的研究機構(gòu)曾研究過關(guān)于上下文的基礎(chǔ)平臺,可以將上下文與不同的應(yīng)用銜接起來。4 問:上下文感知是在設(shè)計階段已經(jīng)設(shè)計還是在運行階段才考慮?答:上下文感知一般是通過傳感器來捕捉上下文信息,然后再進行相應(yīng)的處理。可以事先設(shè)計好大多數(shù)上下文,在運行過程中也動態(tài)處理部分上下文。5 問:智能空間和無處不在的關(guān)系是什么?答:他們的環(huán)境是一致的,智能空間是集中體現(xiàn)這種思想的一個重要方面。智能空間是無處不在的一個實例化,它是物理空間和信息空間的融合體。6 問:無處不在的核心是什么?

9、答:無處不在計算打破傳統(tǒng)的人機方式,覆蓋面很廣,牽涉的學(xué)科和技術(shù)也很多,核心不能只局限于某一點。7 問:無處不在是一種觀念還是一種范式?答:還無最終確定,還在討論中。8 問:增強式現(xiàn)實和可穿戴技術(shù)能否覆蓋無處不在的范圍?答:他們的重點不同,而且針對不同的用戶群和應(yīng)用領(lǐng)域,因此不能完全覆蓋。9 問:就我們實驗室而言,首先應(yīng)該解決的研究問題是什么?答:上下文感知和生活經(jīng)驗捕捉問題??偨Y(jié)(華老師):無處不在的計算主要解決的問題如下:一是處理任務(wù)的專用設(shè)備,只是任務(wù)的單一性。二是用戶界面用的是物理方式表示,而不是數(shù)字方式。三是使得表示更加自然??偨Y(jié)(戴老師):1 我們提出的無處不在計算和軟件所的中長期

10、發(fā)展計劃有關(guān)。2 實驗室關(guān)注的原因是,我們所有的工作都可以歸結(jié)為“無處不在”。3 所提及的智能空間可作為無處不在計算的一個代表,是對物理空間的描述。4 目前無處不在技術(shù)有三個發(fā)展方向,分別是自然界面、上下文感知以及信息捕捉。報告人3:欒尚敏題目:人機中的知識處理時間:2003年8月2日 下午1 問:知識處理如何同具體的上下文聯(lián)系起來?答:位置感知。 上下文有邏輯上下文、知識上下文等對用戶進行靜態(tài)分析,用動態(tài)的方式來抓取用戶信息,但是進展較慢。上下文的表示難以表示形式模型,而且超過了確定的上下文無關(guān)文法。2 問:如何將用戶和系統(tǒng)進行關(guān)聯(lián)?答:提高界面的自適應(yīng)性,必須增強用戶的學(xué)習(xí)能力。討論(華老

11、師):我認(rèn)為用戶的學(xué)習(xí)和系統(tǒng)的改造這是兩方面的問題。3 問:機器學(xué)習(xí)的方法有什么?答:基于概率、語義還有分類等。4 問:圖一中的任務(wù)生成是什么?答:是生成一個自動搜索,這是系統(tǒng)要生成的任務(wù),為Action.5 有沒有例子?答:暫時還沒有。總結(jié)(戴老師):1 欒尚敏的文章檔較高,工作能力是肯定的。2 目前我們實驗室在理論方面的力量需要增強。3 人機交互的知識處理由兩個目的:一是使計算機聰明起來;二是使人用起來方便起來。這兩者的結(jié)合是一個螺旋上升的過程。4 希望有一個例子能夠把你所作的工作串起來。5 最好能和具體的應(yīng)用結(jié)合起來。報告人4:華慶一老師題目:交叉學(xué)科對HCI的影響時間:2003年8月3

12、日 上午報告:我先介紹一下與人機交互有關(guān)的會議和雜志文獻一是ACM Proceedings of CHI Conference(新的理論和實踐成果,發(fā)展趨勢等等)二是ACM Proceedings of UIST Conference(用戶界面開發(fā)方法,技術(shù)及平臺)三是ACM Proceedings of IUI Conference(人工智能理論和技術(shù)在人機交互上的應(yīng)用)四是一些有關(guān)有影響人機交互的雜志。例如,ACM Interaction, ACM TOCHI, Interaction Though Computing 以及 International Journey of Human C

13、omputer Study、International Journey of Human Computer Interaction下面談?wù)勡浖こ?、需求工程、人工智能和認(rèn)知心理學(xué)對HCI的影響1 軟件工程軟件工程自90年代以來,形成了自己的用戶界面開發(fā)方法和技術(shù),如Use-Case Driven的方法。軟件工程對人機交互領(lǐng)域研究的批評很刻薄,“他們(指人機交互)不是提供支持,而是制造麻煩?!逼渲饕蛟谌藱C交互領(lǐng)域中的理論研究和實踐缺乏和軟件工程方法的集成。例如Task-Based的分析和設(shè)計以傳統(tǒng)認(rèn)知思想為基礎(chǔ),起源于最早提出的GMOS模型,將任務(wù)看成是一種從頂向下的分解過程,而非人與自然的

14、交互過程。這樣的認(rèn)知模型正在受到理論和實踐的挑戰(zhàn)。一方面分布式認(rèn)知的研究表明認(rèn)知建立于人與人,人與自然的交互之中,另一方面,Scenario-based和Use-Case Driven的方法在工程中的成功應(yīng)用證明了Task-Based的分析和設(shè)計與實際情況的不匹配性。2 需求工程需求工程是90年代后從軟件工程中分離出來的研究領(lǐng)域,因為人們越來越認(rèn)識到保證系統(tǒng)需求的一致性和完備性的意義。在需求工程中,存在兩種不同的方法和技術(shù)來提取和描述需求:抽象方法(如面向?qū)ο蟮哪P?,過程模型和目標(biāo)模型)和上下文方法(如Scenario-based和Use-Case Driven的描述)。與HCI相同,需求工程

15、的研究重點是在分析目標(biāo)或任務(wù)的基礎(chǔ)上,如何操作化這些目標(biāo)和任務(wù)。不同點在于需求工程著重于捕獲組織和企業(yè)的目標(biāo),而HCI主要研究個人任務(wù)在人機之間的分配問題。然而,傳統(tǒng)的需求工程思想正在受到軟件工程實踐的挑戰(zhàn),如Agile Programming和eXtreme Programming,因為需求本身的可變性質(zhì)。3 人工智能傳統(tǒng)的人工智能研究,如第一代專家系統(tǒng)是建立在符號層次上的(如基于規(guī)則的或基于框架的系統(tǒng))。第二代專家系統(tǒng)或基于知識的系統(tǒng)從符號表示層次上升到知識層次?;谥R的系統(tǒng)的問題求解建立在兩類知識上:一是問題域知識,如對象、關(guān)系、事件和過程等。二是問題求解知識,如目標(biāo)分解策略、安排綜合

16、等。在HCI研究中,人工智能的方法和技術(shù)得到了大量的應(yīng)用,如使用軟件Agent來自動或半自動地執(zhí)行過去必須由用戶完成的任務(wù)。然而,在學(xué)術(shù)界和工程實踐中的一個爭論問題如何合理地在用戶和系統(tǒng)之間分配任務(wù)(即直接操作還是軟件Agent。表現(xiàn)在任務(wù)的完成上,直接操作方認(rèn)為可能性告訴任務(wù),由用戶直接執(zhí)行。軟件Agent方認(rèn)為可能性告訴任務(wù),由軟件代理執(zhí)行。軟件Agent捕捉用戶的意圖很困難。我希望提出一種折衷的方法,或是一種中庸的方法。也就是說,不追求功能的分配,而在于知識的分配,首先從用戶的角度看問題,而不是從系統(tǒng)的觀點看問題)。如同其它領(lǐng)域,傳統(tǒng)的人工智能研究正在受到分布式認(rèn)知的理論和實踐的挑戰(zhàn)。4

17、 認(rèn)知心理學(xué)認(rèn)知心理學(xué)對計算機科學(xué)和人機交互研究影響巨大,形成了上面所提及的每個學(xué)科研究的理論和實踐的基礎(chǔ)。過去的人機交互、軟件工程、需求工程和人工智能研究基本上都是基于傳統(tǒng)的認(rèn)知思想的,即腦與人體的分離,腦是一種被動表示引擎,其基本功能是建立外部物理世界的內(nèi)部表示。今天的分布式認(rèn)知學(xué)可以看成是傳統(tǒng)認(rèn)知思想的一個補,強調(diào)認(rèn)知是一種社會化的、具體化的、腦和身體相結(jié)合的過程。分布式認(rèn)知學(xué),以我本人的觀點,建立了新一代人機交互研究方法和技術(shù)的理論和實踐基礎(chǔ)。補充:需求性和可用性的問題注意,可用性工程和可用性科學(xué)的區(qū)別。可用性工程,是一個判斷的規(guī)則和評估標(biāo)準(zhǔn)??捎眯钥茖W(xué)是指介于科學(xué)理論(認(rèn)知、心理)和

18、人機交互實踐中間的一種應(yīng)用性科學(xué)。可用性對傳統(tǒng)的認(rèn)知科學(xué)提出了挑戰(zhàn)。現(xiàn)在有個爭論:直接操作和軟件Agent。表現(xiàn)在任務(wù)的完成上,直接操作方認(rèn)為可能性告訴任務(wù),由用戶直接執(zhí)行。軟件Agent方認(rèn)為可能性告訴任務(wù),由軟件代理執(zhí)行。軟件Agent捕捉用戶的意圖很困難。我希望提出一種折衷的方法,或是一種中庸的方法。也就是說,不追求功能的分配,而在于知識的分配,首先從用戶的角度看問題,而不是從系統(tǒng)的觀點看問題。總結(jié)(戴老師):1 模型問題(基金項目、973)目前進展緩慢,發(fā)表文章容易,如何找到一個合適的模型,用來指導(dǎo)我們的設(shè)計。2 用戶界面設(shè)計及中小企業(yè)信息化方面的軟件工程的問題人機交互沒有自己的理論和

19、方法,其實軟件工程更是一樣,如果軟件能用工程的思想來解決那就最好,但是至今還沒有成功。最初的結(jié)構(gòu)化模型有弊端,無法實現(xiàn)加的工程,隨之出現(xiàn)了以ER模型為基礎(chǔ)的CASE工具。希望我們的開發(fā)小組在基于筆的應(yīng)用中,將加的軟件工程應(yīng)用進來,并支持開發(fā)。目前企業(yè)的需求不同,模型的問題則是關(guān)鍵。3 軟件開發(fā)有4個部分,界面、數(shù)據(jù)庫管理、算法和接口。界面占主要部分,就是界面軟件。軟件工程的問題:新起來的UML太大了,文檔太多了,對于中小企業(yè)并不合適,能否找到UML的一個子集,適合中小企業(yè)的現(xiàn)狀。不知道極限編程的思想有沒有利用的可能呢?用戶建模的問題:用戶概念模型:用戶對一個系統(tǒng)的理解,稱為用戶概念模型。(NO

20、RMAN的觀點是,用戶概念模型是不能建立起來的。)用戶模型:根據(jù)用戶的要求,變成計算機所能理解的模型。語義模型:可以編程的,計算機可以實現(xiàn)的。認(rèn)知模型用戶模型語義模型和華老師提出的用戶概念模型設(shè)計者模型體系模型是一致的。報告人5:王丹力題目:基于場景(Scenario)的設(shè)計時間:2003年8月3日 上午1 問:場景的描述方式是什么?答:場景有4種描述方式:文本描述、故事板、錄像、腳本原型。2 問:概念模型、用戶模型和場景設(shè)計的關(guān)系是什么?如何使用場景?答:在需求分析階段,場景提供了一種交互的工具,是用戶和系統(tǒng)設(shè)計人員對未來系統(tǒng)的想象達到一致。這個階段就是提取概念模型的過程。 在設(shè)計階段,想象

21、場景提供了對未來系統(tǒng)的想象,幫助設(shè)計者設(shè)計用戶需要的系統(tǒng),同時提供設(shè)計者和開發(fā)人員以及開發(fā)人員之間的交互工具。 在應(yīng)用階段,場景提供了一種有效的培訓(xùn)和系統(tǒng)使用說明的工具。小結(jié)(華老師):場景描述用戶問題,是對用戶的交互情景描述,是一種非形式化的東西。描述需求,用戶和系統(tǒng)的關(guān)系。描述設(shè)計,需要有提升又有補充。3 問:場景是不是用的是窮舉的方法?答:場景可以給出使用的實例,但不能說是窮舉。場景的描述是為了分析并從中提取設(shè)計的需求。另外場景還是一種交流的工具。4 問:既然和既定的目標(biāo)有差異,那么你是如何達到目標(biāo)的?答:逐步的、漸進的。5 問:你所舉的場景描述的例子,最終達到了什么目標(biāo)?答:構(gòu)造一個虛

22、擬物理實驗室。6問:Carroll的成果是什么?答:我們看到的有2個例子:網(wǎng)絡(luò)環(huán)境下的學(xué)習(xí):虛擬實驗室和網(wǎng)絡(luò)化社區(qū)。7 問:場景分析和其他行業(yè)的情景分析有區(qū)別嗎?答:先給一個說明:Scenario譯為場景符合了在人工智能中曾經(jīng)提到過劇本中的場景概念。場景在人機交互中和其他領(lǐng)域中應(yīng)用基本沒有區(qū)別,它提供了一種分析方法和工具。8 問:采用場景設(shè)計是為了得到use case嗎?答:場景只是一種對未來的想象,他可以用來啟發(fā)你的思路,它是一種輔助工具。Use case 是一種面向?qū)ο蟮脑O(shè)計方法,它采用了基于場景的設(shè)計思想。小結(jié)(華老師):場景是一個信息源(Resource),無法從理論上和實踐上作為指南

23、(Guildline)。此外,場景設(shè)計是設(shè)計過程參與,但是參與方式為場景??偨Y(jié)(戴老師):1 希望搞清楚所舉的場景描述的例子,最終是什么?2 最終的人機交互,是一個什么過程?3 Classroom不是場景所能描述完整的,這個系統(tǒng)最終是個什么樣?4 場景與Use case是關(guān)系。5 如何把場景分析的方法應(yīng)用到我們的幼教系統(tǒng)中,或是能不能提供一種評估的方法,這是你所需要考慮的問題。報告人6:梁華題目:GMOS模型時間:2003年8月3日 下午1 問:GMOS模型的指導(dǎo)意義是什么?答:對于GUI可以做出早期的預(yù)測,但對于 3D界面,限制就比較大。對于目前我們開發(fā)的普教系統(tǒng),就可以預(yù)測用戶的行為。2

24、問:GMOS模型把時間作為唯一的指標(biāo)?你認(rèn)為它的擴展性如何?答:前提是基于任務(wù)分析,任務(wù)分為操作子,把時間作為唯一的指標(biāo)。可以把一些簡單的外部指標(biāo)加進去,但還需要其他的評估方式。3 問:對于并行加工、學(xué)習(xí)經(jīng)驗方面有預(yù)測的方法嗎?答:KLM、CMN、NGOMSL三種模型,都不包括并行加工,CPM可以對并行加工進行較好的預(yù)測,NGOMSL可以對程序化的學(xué)習(xí)經(jīng)驗進行預(yù)測。4 問:時間是知識加上操作時間,有無程序響應(yīng)時間?答:沒有考慮程序響應(yīng)時間,GMOS模型主要是從心理學(xué)角度來考慮的。5 問:對于熟練用戶,操作鍵盤和筆的時間長短比較如何?答:GOMS模型首先是基于任務(wù)的。任務(wù)性質(zhì)不同,鍵盤和筆各有優(yōu)

25、勢。對于文字任務(wù),如果都是新手,以前沒有用過鍵盤和電子筆,這樣評估,筆應(yīng)該更快一些。6 問:有沒有考慮疲勞度的影響?答:沒有考慮,犯錯率也是疲勞度的一個指標(biāo)。7 問:是否認(rèn)為不同的交互任務(wù)完全是人的推理行為?答:熟練用戶不需要推理,新手或不熟練用戶需要。GMOS模型只描述某些特殊的情況,即熟練用戶的操作行為。8 問:外部世界的表示對心理有什么影響?從心理學(xué)角度來看,往往刪除掉的東西是可以測量的,而往往對于我們有影響的東西,是不可測量的。是不是這樣?答:動態(tài)的影響較大,但是無法預(yù)測。不完全如此。實驗室進行評估時,一般都處于受控狀態(tài);如果實驗設(shè)計合理,可以同時考慮很多因素。分析時采用合適的統(tǒng)計方法

26、,各個因素的影響都可以分析到。另外和和測量手段、分析能力也有關(guān)。9問:GMOS模型在學(xué)術(shù)界的反應(yīng)如何?其文獻的時間是什么時候?答:20世紀(jì)90年代(1996年左右的比較多),近兩年較少。總結(jié)(戴老師):1 GMOS模型支持我們有一定的難度,3D有難度,那么對于筆呢?以前的界面設(shè)計中有沒有用GMOS模型。答:田豐、北師大的牟書和我曾經(jīng)討論過“普教”系統(tǒng)的評估,用的就GOMS。2 GMOS模型本身是模型,還是分別都能形成模型?答:理論上講,GOMS是模型,它提供一種工程方法,用以進行系統(tǒng)設(shè)計,在設(shè)計之前預(yù)測用戶的行為。在實際操作上,它提供了一個很好的思路,用以進行任務(wù)分析。3 多通道的問題,考慮M

27、、S的問題,如何選擇?如何應(yīng)用到我們的系統(tǒng)中,G是什么?O是什么?答:對于我們的系統(tǒng),如筆式用戶界面軟件、3D界面軟件,可以確定基本的交互任務(wù),交互方法和選擇方法。報告人7:張習(xí)文題目:數(shù)字筆跡計算的探討時間:2003年8月3日 晚上1 問:系統(tǒng)的識別是否具有進化能力?答:我們的工作針對的是算法,而不是系統(tǒng)開發(fā),目前沒有研究該問題。但,可以具有進化能力,例如,在校正了錯誤識別后,一是可以將用戶的個性化樣本單獨存儲在該用戶的樣本庫中,對該用戶以后的樣本識別就可以得到改進;再者,也可以將該樣本加入系統(tǒng)樣本庫中,以后類似的樣本就可以得到較好的識別。這兩種做法都可以使得系統(tǒng)具有識別的進化能力。2 問:

28、筆跡處理是對筆劃處理嗎?答:筆跡同文本、圖形、圖像、音頻、視頻一樣,也可以看作是一種信息表達方式。Ink的最小單位是筆劃,而每個筆劃是由一系列點組成的。而用戶是將筆跡看成是若干內(nèi)容單元。所以筆跡處理也是多層次的,可以是處理單獨筆劃的,包括增加點、減少點、改變點,也可以是多個相關(guān)筆劃的處理。根據(jù)具體應(yīng)用要求,還會要求從筆跡中提取單字并進行識別、提取圖形并進行識別。3 問:目前的識別率如何?答:單字識別率與待處理筆跡的質(zhì)量有很大關(guān)系。單字識別與單字提取也有很大關(guān)系,錯誤的單字提取不可能得到正確的單字識別。但,正確的單字提取不一定就能得到正確的單字識別。正確的單字識別還與識別器有關(guān)。漢王識別器已經(jīng)做

29、得很好了,但在實際中還有很多不能令人滿意的地方。如果字符間距、寬度一致,很多方法都會得到較好的單字提取。針對具有一定隨意的連續(xù)手寫中文的單字提取,我們提出了利用多層次信息,考慮筆劃的多種可能組合,取得了較好的效果。4 問:時間對于記錄筆跡信息的影響是什么?答:根據(jù)用戶輸入可以得到生成筆劃的起始時間和終止時間,也可以得到每個筆劃點的生成時間。利用筆劃時間可以計算筆劃點速度、加速度等信息。與筆劃時間有關(guān)的信息可以用來輔助單字提取、筆劃分割(圖形識別)等。5 問:你是如何考慮時間和空間在識別中的關(guān)系的?答:有的研究人員對時間和空間進行加權(quán),但它們具有相關(guān)性,空間上較遠(yuǎn)的筆劃在時間上也是較遠(yuǎn)的,而時間

30、上較近的筆劃在空間上也是較近的,而時間上較遠(yuǎn)的筆劃在空間上可能較近、也可能較遠(yuǎn)。我們在單字提取中部分考慮了時間的利用,筆劃是以時間順序記錄的,但考慮上述情況,在某個筆劃的前后小范圍內(nèi)搜索筆劃,進行組合判斷。時間信息利用還與后面的識別方法有關(guān),有的研究人員利用筆劃點速度、加速度進行手繪筆劃分割,這就要求記錄筆劃點時間,而有的方法只是基于筆劃點曲率、角度進行手繪筆劃分割,則不需要筆劃點時間信息。6 問:請解釋一下微軟的王堅對于Ink的定義?答:一是高質(zhì)量繪制;二是智能理解;三是容易操作。(敖翔)總結(jié)(戴老師):1 識別率低的原因有兩方面:從負(fù)面來講,識別問題本身就很難;從正面來講,沒有必要作。2

31、Ink是獨立存在的,它是一種新的信息表示方式。3 對于政府官員的批閱、評審以及現(xiàn)在的電子商務(wù)的問題,微軟就提出了在表格上直接應(yīng)用筆輸入的問題,這樣就牽扯到識別率低的問題。我們做的基金委項目,由于切分的問題,導(dǎo)致識別率很低。從產(chǎn)權(quán)上來講,我們的識別算法可能作不過漢王,所以我們不做識別算法。4 我們提出的Patch算法在白板上應(yīng)用不錯,所以基于Ink操作的應(yīng)用上我們可以做。報告人8:張鳳軍題目:虛擬環(huán)境下的三維交互技術(shù)時間:2003年8月3日 晚上1 問:你所說的場景與王丹力所提的場景有什么不同?答:我所說的場景是從事物的擺放層次上來說的,這里所說的場景是Scene。王丹力所提的場景是指生活片斷,

32、英文是 Scenario。2 問:假定Scenario用三維表示上是否一致?答:我所描述的主要是幾何上的東西,所以應(yīng)該是不一樣的。3 問:Z方向如何體現(xiàn)?答:一般是有隱含的約束的,例如在梯子上運動和地面上運動,我都建立了約束,使得他們的運動都是在梯子或是地面所在的平面上運動??偨Y(jié)(戴老師):1 目前3D Mouse沒有用起來,心理學(xué)在這一方面能不能做些工作?2 空間定位和視覺定位的問題,現(xiàn)有的導(dǎo)游過于呆板,能不能有所改進?3 手勢隱喻的問題,操作的問題,可以考慮一下。4 語義模型的問題,對于3D界面以及虛擬家具的模型問題,場景對于復(fù)雜性的要求較低。我的觀點是真實感不是第一重要的,交互才是最重要

33、的,建模還是需要不斷的完善。5 3D界面與DeskTop界面是有本質(zhì)區(qū)別的,現(xiàn)有的微軟界面是快速的,而3D界面則是較慢的。我想給心理學(xué)的提一個建議,現(xiàn)有的GMOS模型能否支持?6 三維是和設(shè)備有關(guān)的,我們要從概念上入手,而不是從設(shè)備上。我有一個設(shè)想,現(xiàn)有的游戲設(shè)備能否作為交互設(shè)備呢。報告人9:華慶一老師題目:分布式認(rèn)知時間:2003年8月5日 上午報告:對傳統(tǒng)任務(wù)分析作一些補充:主要參考文獻:The Psychology of Human Computer Interaction, By Card, et al. (1983) 任務(wù)分配有四類,他們是用戶任務(wù)、應(yīng)用任務(wù)、交互任務(wù)以及抽象任務(wù)我本

34、人認(rèn)為任務(wù)分析和分配不是一個好的人機交互需求捕獲出發(fā)點,在此之前應(yīng)當(dāng)有一個知識在人機之間的分配過程。這個過程應(yīng)當(dāng)是基于分布式認(rèn)知思想的。分布式認(rèn)知:基本參考文獻:1. Hollan, J et al. Distributed Cognition: Toward a New Foundation for Human-Computer Interaction Research, ACM TOCHI (June 2000)2. SALOMAN, G., Ed. 1993. Distributed Cognitions: Psychological and Educational Considerat

35、ions. Learning in Doing: Social, Cognitive, and Computational Perspectives. Cambridge University Press, New York, NY.3. NORMAN, D. A. 1993. Things That Make Us Smart: Defending Human Attributes in the Age of the Machine. Addison-Wesley Longman Publ. Co., Inc., Reading, MA.討論:1 問:分布式認(rèn)知的定義和描述答:依然處于爭論中

36、,不同的學(xué)派從不同的角度有不同的定義.2 問:對于我們?nèi)藱C交互有什么影響?答:主要是外部表現(xiàn)對問題求解的影響。外部表示是顯式的,而且很復(fù)雜,人難以理解。不應(yīng)注意人和機器的相同點,而是不同點,注重知識的分配。如何改造輸出,不同的外部,人的認(rèn)知是不同的,(反射式認(rèn)知、簡單認(rèn)知)。OFFICE系統(tǒng)中,外部輸出改成同步表示,就是隱藏掉難以處理,難以表示的東西。圖形操作系統(tǒng)的優(yōu)點就是用圖形表示以前用數(shù)字、字符和命令表示的東西,其實就是幫助記憶的。3 問:分布式認(rèn)知是指一個人的知識分布還是多人的知識分布?答:都有,認(rèn)識是一個時間和空間相互交叉的結(jié)果。時間上有歷史性的,就包括了全人類的認(rèn)識,無法分清是個人的

37、還是群體的??臻g同樣如此,既有個人的,又有群體的認(rèn)知結(jié)果。CSCW,引入計算機協(xié)作工作,就是多人協(xié)同工作的結(jié)果。4 問:計算機如何去描述人的較快的求解過程?答:分布式認(rèn)知說明了知識是在人和外部分布的,應(yīng)該進行知識分配,還不僅僅是功能的分配,即那部分是計算機占有,那部分是人占有。5 如何應(yīng)用到不同的教學(xué)系統(tǒng)中?答:認(rèn)知是有層次的,從低級到高級的,不同的人,有不同的界面風(fēng)格,而且問題的表示不同,算法的復(fù)雜性也應(yīng)該不同。對于不同的用戶群體,應(yīng)提供不同的外部表示。比如對于專家和一般初學(xué)者,所提供的外部表示一定是不同的。總結(jié)(北大陳文廣老師)時間:2003年8月5日 上午對于你們的講座,我很受啟發(fā),我就

38、大概講講我們北大的工作吧。我們目前的工作主要其中為以下幾個方面。1 語音,手持設(shè)備,只一方面需要加入基礎(chǔ)研究。2 語音識別我們主要是應(yīng)用別人的成果,下一步該怎么辦,還要進一步考慮。3 自然語言理解是在受限的基礎(chǔ)上去做的。4 戴老師提出真實感不是最重要的,我很同意這一觀點,下一步我們要做是如何非真實感繪圖的應(yīng)用用到人機交互中去。5 對音樂(按調(diào))檢索的提出。6 搜索引擎結(jié)果量大的問題,我們考慮應(yīng)用自然語言的應(yīng)用。下一步要做的工作是用自然語言實現(xiàn)新聞的播報和查詢。語音的問題是難點。我們考慮的是計算機對用戶的理解加以應(yīng)用的問題,用戶操作的分析問題以及信息處理、文摘提取等問題也是我們需要考慮的問題??偨Y(jié)(王宏安主任)時間:2003年8月5日 上午人機交互的研究成果很重要,未來的研究前景很好。這次會議開的很成功,希望提供一個學(xué)術(shù)交流的平臺,大家通過交流,都有了很大的收獲。每個報告都很精彩,發(fā)言很激烈,戴老師的評論很精彩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論