人機交互HCI小組研討班會議記錄

上傳人：石*** IP屬地：廣東上傳時間：2021-11-30 格式：DOC 頁數(shù)：12 大?。?3KB 積分：12 舉報 版權(quán)申訴

已閱讀5頁，還剩7頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、2003年8月2日至4日人機交互(HCI)小組研討班會議記錄地點：鳳山溫泉度假村時間：2003年8月2日至4日參加人：戴老師、王宏安主任、華慶一老師、北大陳文光老師、人機交互小組相關(guān)成員報告人1：田豐題目：Post-WIMP界面交互特征研究時間：2003年8月2日下午1 問：你所談及的POST_WIMP是否是建立了一個新的交互風(fēng)格？答：如果建立一個統(tǒng)一的新的交互風(fēng)格，還有一定的難度，因此我只是從交互特性方面進行了研究。2 問：認(rèn)知處理能力中的Data-Limited是什么？答：一種數(shù)據(jù)質(zhì)量的限制、包括人在大腦中已經(jīng)形成的一些固有的知識等3 問：你們在作測試和評估時，有沒有和自然的筆進行自然

2、性的比較？答：我們的依據(jù)是根據(jù)最簡單的任務(wù)完成。具體的紙筆與電子筆比較，對于較熟練的用戶，差別不是很大，但是對于不熟悉的用戶，差別會大一些。4 問：你們所開發(fā)的這樣一種筆輸入，和鼠標(biāo)鍵盤從認(rèn)知還有效率方面來說，哪一種會更多些？答：因人而異，對于熟練用戶其認(rèn)知的負(fù)擔(dān)小，因此其效率高，但對于不熟練用戶來說，認(rèn)知負(fù)擔(dān)可能會大一些。此外還和任務(wù)有關(guān)、與應(yīng)用有關(guān)、與背景有關(guān)。當(dāng)然，在特定的文化中還有差別。5 問：有關(guān)范式的問題，從紙筆到Frame 會不會成為交流的障礙？答：Frame是特定的數(shù)據(jù)管理，需要從顯式到隱式進行一定的轉(zhuǎn)化。6問：開發(fā)中的主要困難是什么？答：patch等多種數(shù)據(jù)識別和切分問題

3、。7問：平時我們用自然的紙筆進行交流時，它是一個感知的問題，不需要的訓(xùn)練，對于所做的手勢是不需要用腦子去想的，那么對于你們所開發(fā)的筆式系統(tǒng)是不是需要考慮下一步的手勢的問題？答：我所考慮的是手勢的多樣性的問題，也就是說是考慮到了大多數(shù)人所常用的手勢。8問：是以用戶為中心，還是以技術(shù)為中心。答：這一方面我們考慮的較少，我們主要是從交互的特性來考慮，而并不是從人的方面來考慮。小結(jié)（華老師）：以技術(shù)為中心，并不是用戶要求的單位。首先是研究人用紙，什么是最小單位，這里指的最小單位不僅僅限于語法單位，而且限于語義單位。其次是從用戶角度分析什么是最小單位。9問：什么是交互任務(wù)，什么是自然隱式的交互任務(wù)？答：

4、交互任務(wù)，是一種基本任務(wù)，是用戶向計算機提出的一種操作。自然隱式的交互任務(wù), 是用戶在交互過程中不需要關(guān)注任務(wù)的執(zhí)行方式和過程。10 問：用戶意圖和Stroke的關(guān)系？答：stroke可以看成是從用戶角度來講，在紙筆環(huán)境中一個基本的交互任務(wù)。它是從用戶的交互意圖來講一個最小的單位。11 問：Post-WIMP替代WIMP，那么在評估時，是否具有同樣的功能？答：我們的手勢方面還需要做進一步的工作，交互自然性方面也做的不夠。當(dāng)交互手勢無法合理地表示任務(wù)時，我們采用顯式的WIMP交互方式進行。人的手勢是創(chuàng)造出來的，我認(rèn)為這不是自然性的問題，其實在WIMP，也不是自然性的問題。其實只要用戶習(xí)慣了就

5、是自然的，積累多了，就是自然的了，也就是說訓(xùn)練成就熟悉的問題。討論：我覺得這是混淆了交互自然性和交互自動性這兩個概念。（華老師）交互自然性，人的心理距離和計算機所表現(xiàn)的距離是匹配的。交互自動性，可經(jīng)過長期訓(xùn)練，提高交互自動性，但并不代表人的心理距離和計算機所表現(xiàn)的距離會發(fā)生變化。12 問：談?wù)勈謩莸哪：詥栴}，也就是范式的容量問題？答：由具體的應(yīng)用限制。13 問：如何權(quán)衡用戶希望和系統(tǒng)功能這兩者之間的矛盾？答：理想化的模式是用戶所需要的就是系統(tǒng)所需要的。從一個任務(wù)本身來說，特定的類型應(yīng)該用特定的范式，不同的應(yīng)用可以有不同的需求。小結(jié)（華老師）：用戶界面的目標(biāo)是自然，但是效率也同樣重要，不自

6、然應(yīng)該有特定的要求，所以需要走一條折衷的道路。14 問：為什么選擇紙筆，而不是聲音和視覺？這兩個在自然性方面有無比較？答：目前對于語音的研究還是一個“瓶頸”，關(guān)鍵是識別率低的問題。而且，聲音和視覺，對于可視化方面沒有太大的幫助。15 問：人工智能方面的突破能否使得人機交互更自然？答：應(yīng)該是這樣的。有本關(guān)于直接操作和軟件Agent的爭論，發(fā)表在2000 ICM InterAction上。有興趣的同志可以去看看?？偨Y(jié)（戴老師）：1筆式用戶界面的工作是肯定的，Post-WIMP界面交互特征作了不少的研究，這方面的工作我們還會接著做下去，而且除了紙筆交互以外，我們還會做三維等等風(fēng)格的多樣化的軟件。2

7、目前計算機的角色在于交流，我認(rèn)為交流的順序是從情感到語言到文字最后再到計算機。3我們在和微軟做的重大資金項目的題目是“面向主流、自然、高效多通道用戶界面研究”。所以面向主流是我們的出發(fā)點。報告人2：馬翠霞題目：無處不在計算環(huán)境時間：2003年8月2日上午1 問：“無處不在”的嚴(yán)格定義是什么？答：指獲取服務(wù)方式的無處不在。2 問：其制約因素很多，目前實驗室能做到什么程度？答：我們目前在找一個研究切入點。對無處不在計算的研究，設(shè)備和網(wǎng)絡(luò)是一個很重要的方面。鑒于實驗室的基礎(chǔ)，應(yīng)當(dāng)基于我們的已有工作和優(yōu)勢所在開展研究，目前可以從生活經(jīng)驗捕捉和上下文感知方面來做，主要表現(xiàn)在交互方式的研究上。3 問

8、：無處不在計算的研究，在平臺和協(xié)議方面的應(yīng)用如何？答：分布式移動在協(xié)議應(yīng)用方面較強。對于平臺方面，例如，對上下文感知的研究，一些著名的研究機構(gòu)曾研究過關(guān)于上下文的基礎(chǔ)平臺，可以將上下文與不同的應(yīng)用銜接起來。4 問：上下文感知是在設(shè)計階段已經(jīng)設(shè)計還是在運行階段才考慮？答：上下文感知一般是通過傳感器來捕捉上下文信息，然后再進行相應(yīng)的處理。可以事先設(shè)計好大多數(shù)上下文，在運行過程中也動態(tài)處理部分上下文。5 問：智能空間和無處不在的關(guān)系是什么？答：他們的環(huán)境是一致的，智能空間是集中體現(xiàn)這種思想的一個重要方面。智能空間是無處不在的一個實例化，它是物理空間和信息空間的融合體。6 問：無處不在的核心是什么？

9、答：無處不在計算打破傳統(tǒng)的人機方式，覆蓋面很廣，牽涉的學(xué)科和技術(shù)也很多，核心不能只局限于某一點。7 問：無處不在是一種觀念還是一種范式？答：還無最終確定，還在討論中。8 問：增強式現(xiàn)實和可穿戴技術(shù)能否覆蓋無處不在的范圍？答：他們的重點不同，而且針對不同的用戶群和應(yīng)用領(lǐng)域，因此不能完全覆蓋。9 問：就我們實驗室而言，首先應(yīng)該解決的研究問題是什么？答：上下文感知和生活經(jīng)驗捕捉問題?？偨Y(jié)（華老師）：無處不在的計算主要解決的問題如下：一是處理任務(wù)的專用設(shè)備，只是任務(wù)的單一性。二是用戶界面用的是物理方式表示，而不是數(shù)字方式。三是使得表示更加自然?？偨Y(jié)（戴老師）：1 我們提出的無處不在計算和軟件所的中長期

10、發(fā)展計劃有關(guān)。2 實驗室關(guān)注的原因是，我們所有的工作都可以歸結(jié)為“無處不在”。3 所提及的智能空間可作為無處不在計算的一個代表，是對物理空間的描述。4 目前無處不在技術(shù)有三個發(fā)展方向，分別是自然界面、上下文感知以及信息捕捉。報告人3：欒尚敏題目：人機中的知識處理時間：2003年8月2日下午1 問：知識處理如何同具體的上下文聯(lián)系起來？答：位置感知。上下文有邏輯上下文、知識上下文等對用戶進行靜態(tài)分析，用動態(tài)的方式來抓取用戶信息，但是進展較慢。上下文的表示難以表示形式模型，而且超過了確定的上下文無關(guān)文法。2 問：如何將用戶和系統(tǒng)進行關(guān)聯(lián)？答：提高界面的自適應(yīng)性，必須增強用戶的學(xué)習(xí)能力。討論（華老

11、師）：我認(rèn)為用戶的學(xué)習(xí)和系統(tǒng)的改造這是兩方面的問題。3 問：機器學(xué)習(xí)的方法有什么？答：基于概率、語義還有分類等。4 問：圖一中的任務(wù)生成是什么？答：是生成一個自動搜索，這是系統(tǒng)要生成的任務(wù)，為Action.5 有沒有例子？答：暫時還沒有。總結(jié)（戴老師）：1 欒尚敏的文章檔較高，工作能力是肯定的。2 目前我們實驗室在理論方面的力量需要增強。3 人機交互的知識處理由兩個目的：一是使計算機聰明起來；二是使人用起來方便起來。這兩者的結(jié)合是一個螺旋上升的過程。4 希望有一個例子能夠把你所作的工作串起來。5 最好能和具體的應(yīng)用結(jié)合起來。報告人4：華慶一老師題目：交叉學(xué)科對HCI的影響時間：2003年8月3

12、日上午報告：我先介紹一下與人機交互有關(guān)的會議和雜志文獻一是ACM Proceedings of CHI Conference（新的理論和實踐成果，發(fā)展趨勢等等）二是ACM Proceedings of UIST Conference（用戶界面開發(fā)方法，技術(shù)及平臺）三是ACM Proceedings of IUI Conference（人工智能理論和技術(shù)在人機交互上的應(yīng)用）四是一些有關(guān)有影響人機交互的雜志。例如，ACM Interaction, ACM TOCHI, Interaction Though Computing 以及 International Journey of Human C

13、omputer Study、International Journey of Human Computer Interaction下面談?wù)勡浖こ?、需求工程、人工智能和認(rèn)知心理學(xué)對HCI的影響1 軟件工程軟件工程自90年代以來，形成了自己的用戶界面開發(fā)方法和技術(shù)，如Use-Case Driven的方法。軟件工程對人機交互領(lǐng)域研究的批評很刻薄，“他們（指人機交互）不是提供支持，而是制造麻煩?！逼渲饕蛟谌藱C交互領(lǐng)域中的理論研究和實踐缺乏和軟件工程方法的集成。例如Task-Based的分析和設(shè)計以傳統(tǒng)認(rèn)知思想為基礎(chǔ)，起源于最早提出的GMOS模型，將任務(wù)看成是一種從頂向下的分解過程，而非人與自然的

14、交互過程。這樣的認(rèn)知模型正在受到理論和實踐的挑戰(zhàn)。一方面分布式認(rèn)知的研究表明認(rèn)知建立于人與人，人與自然的交互之中，另一方面，Scenario-based和Use-Case Driven的方法在工程中的成功應(yīng)用證明了Task-Based的分析和設(shè)計與實際情況的不匹配性。2 需求工程需求工程是90年代后從軟件工程中分離出來的研究領(lǐng)域，因為人們越來越認(rèn)識到保證系統(tǒng)需求的一致性和完備性的意義。在需求工程中，存在兩種不同的方法和技術(shù)來提取和描述需求：抽象方法（如面向?qū)ο蟮哪Ｐ?，過程模型和目標(biāo)模型）和上下文方法（如Scenario-based和Use-Case Driven的描述）。與HCI相同，需求工程

15、的研究重點是在分析目標(biāo)或任務(wù)的基礎(chǔ)上，如何操作化這些目標(biāo)和任務(wù)。不同點在于需求工程著重于捕獲組織和企業(yè)的目標(biāo)，而HCI主要研究個人任務(wù)在人機之間的分配問題。然而，傳統(tǒng)的需求工程思想正在受到軟件工程實踐的挑戰(zhàn)，如Agile Programming和eXtreme Programming，因為需求本身的可變性質(zhì)。3 人工智能傳統(tǒng)的人工智能研究，如第一代專家系統(tǒng)是建立在符號層次上的（如基于規(guī)則的或基于框架的系統(tǒng)）。第二代專家系統(tǒng)或基于知識的系統(tǒng)從符號表示層次上升到知識層次?；谥R的系統(tǒng)的問題求解建立在兩類知識上：一是問題域知識，如對象、關(guān)系、事件和過程等。二是問題求解知識，如目標(biāo)分解策略、安排綜合

16、等。在HCI研究中，人工智能的方法和技術(shù)得到了大量的應(yīng)用，如使用軟件Agent來自動或半自動地執(zhí)行過去必須由用戶完成的任務(wù)。然而，在學(xué)術(shù)界和工程實踐中的一個爭論問題如何合理地在用戶和系統(tǒng)之間分配任務(wù)（即直接操作還是軟件Agent。表現(xiàn)在任務(wù)的完成上，直接操作方認(rèn)為可能性告訴任務(wù)，由用戶直接執(zhí)行。軟件Agent方認(rèn)為可能性告訴任務(wù)，由軟件代理執(zhí)行。軟件Agent捕捉用戶的意圖很困難。我希望提出一種折衷的方法，或是一種中庸的方法。也就是說，不追求功能的分配，而在于知識的分配，首先從用戶的角度看問題，而不是從系統(tǒng)的觀點看問題）。如同其它領(lǐng)域，傳統(tǒng)的人工智能研究正在受到分布式認(rèn)知的理論和實踐的挑戰(zhàn)。4

17、認(rèn)知心理學(xué)認(rèn)知心理學(xué)對計算機科學(xué)和人機交互研究影響巨大，形成了上面所提及的每個學(xué)科研究的理論和實踐的基礎(chǔ)。過去的人機交互、軟件工程、需求工程和人工智能研究基本上都是基于傳統(tǒng)的認(rèn)知思想的，即腦與人體的分離，腦是一種被動表示引擎，其基本功能是建立外部物理世界的內(nèi)部表示。今天的分布式認(rèn)知學(xué)可以看成是傳統(tǒng)認(rèn)知思想的一個補，強調(diào)認(rèn)知是一種社會化的、具體化的、腦和身體相結(jié)合的過程。分布式認(rèn)知學(xué)，以我本人的觀點，建立了新一代人機交互研究方法和技術(shù)的理論和實踐基礎(chǔ)。補充：需求性和可用性的問題注意，可用性工程和可用性科學(xué)的區(qū)別。可用性工程，是一個判斷的規(guī)則和評估標(biāo)準(zhǔn)?？捎眯钥茖W(xué)是指介于科學(xué)理論（認(rèn)知、心理）和

18、人機交互實踐中間的一種應(yīng)用性科學(xué)。可用性對傳統(tǒng)的認(rèn)知科學(xué)提出了挑戰(zhàn)。現(xiàn)在有個爭論：直接操作和軟件Agent。表現(xiàn)在任務(wù)的完成上，直接操作方認(rèn)為可能性告訴任務(wù)，由用戶直接執(zhí)行。軟件Agent方認(rèn)為可能性告訴任務(wù)，由軟件代理執(zhí)行。軟件Agent捕捉用戶的意圖很困難。我希望提出一種折衷的方法，或是一種中庸的方法。也就是說，不追求功能的分配，而在于知識的分配，首先從用戶的角度看問題，而不是從系統(tǒng)的觀點看問題。總結(jié)（戴老師）：1 模型問題（基金項目、973）目前進展緩慢，發(fā)表文章容易，如何找到一個合適的模型，用來指導(dǎo)我們的設(shè)計。2 用戶界面設(shè)計及中小企業(yè)信息化方面的軟件工程的問題人機交互沒有自己的理論和

19、方法，其實軟件工程更是一樣，如果軟件能用工程的思想來解決那就最好，但是至今還沒有成功。最初的結(jié)構(gòu)化模型有弊端，無法實現(xiàn)加的工程，隨之出現(xiàn)了以ER模型為基礎(chǔ)的CASE工具。希望我們的開發(fā)小組在基于筆的應(yīng)用中，將加的軟件工程應(yīng)用進來，并支持開發(fā)。目前企業(yè)的需求不同，模型的問題則是關(guān)鍵。3 軟件開發(fā)有4個部分，界面、數(shù)據(jù)庫管理、算法和接口。界面占主要部分，就是界面軟件。軟件工程的問題：新起來的UML太大了，文檔太多了，對于中小企業(yè)并不合適，能否找到UML的一個子集，適合中小企業(yè)的現(xiàn)狀。不知道極限編程的思想有沒有利用的可能呢？用戶建模的問題：用戶概念模型：用戶對一個系統(tǒng)的理解，稱為用戶概念模型。（NO

20、RMAN的觀點是，用戶概念模型是不能建立起來的。）用戶模型：根據(jù)用戶的要求，變成計算機所能理解的模型。語義模型：可以編程的，計算機可以實現(xiàn)的。認(rèn)知模型用戶模型語義模型和華老師提出的用戶概念模型設(shè)計者模型體系模型是一致的。報告人5：王丹力題目：基于場景（Scenario）的設(shè)計時間：2003年8月3日上午1 問：場景的描述方式是什么？答：場景有4種描述方式：文本描述、故事板、錄像、腳本原型。2 問：概念模型、用戶模型和場景設(shè)計的關(guān)系是什么？如何使用場景？答：在需求分析階段，場景提供了一種交互的工具，是用戶和系統(tǒng)設(shè)計人員對未來系統(tǒng)的想象達到一致。這個階段就是提取概念模型的過程。在設(shè)計階段，想象

21、場景提供了對未來系統(tǒng)的想象，幫助設(shè)計者設(shè)計用戶需要的系統(tǒng)，同時提供設(shè)計者和開發(fā)人員以及開發(fā)人員之間的交互工具。在應(yīng)用階段，場景提供了一種有效的培訓(xùn)和系統(tǒng)使用說明的工具。小結(jié)（華老師）：場景描述用戶問題，是對用戶的交互情景描述，是一種非形式化的東西。描述需求，用戶和系統(tǒng)的關(guān)系。描述設(shè)計，需要有提升又有補充。3 問：場景是不是用的是窮舉的方法？答：場景可以給出使用的實例，但不能說是窮舉。場景的描述是為了分析并從中提取設(shè)計的需求。另外場景還是一種交流的工具。4 問：既然和既定的目標(biāo)有差異，那么你是如何達到目標(biāo)的？答：逐步的、漸進的。5 問：你所舉的場景描述的例子，最終達到了什么目標(biāo)？答：構(gòu)造一個虛

22、擬物理實驗室。6問：Carroll的成果是什么？答：我們看到的有2個例子：網(wǎng)絡(luò)環(huán)境下的學(xué)習(xí)：虛擬實驗室和網(wǎng)絡(luò)化社區(qū)。7 問：場景分析和其他行業(yè)的情景分析有區(qū)別嗎？答：先給一個說明：Scenario譯為場景符合了在人工智能中曾經(jīng)提到過劇本中的場景概念。場景在人機交互中和其他領(lǐng)域中應(yīng)用基本沒有區(qū)別，它提供了一種分析方法和工具。8 問：采用場景設(shè)計是為了得到use case嗎？答：場景只是一種對未來的想象，他可以用來啟發(fā)你的思路，它是一種輔助工具。Use case 是一種面向?qū)ο蟮脑O(shè)計方法，它采用了基于場景的設(shè)計思想。小結(jié)（華老師）：場景是一個信息源（Resource），無法從理論上和實踐上作為指南

23、（Guildline）。此外，場景設(shè)計是設(shè)計過程參與，但是參與方式為場景?？偨Y(jié)（戴老師）：1 希望搞清楚所舉的場景描述的例子，最終是什么？2 最終的人機交互，是一個什么過程？3 Classroom不是場景所能描述完整的，這個系統(tǒng)最終是個什么樣？4 場景與Use case是關(guān)系。5 如何把場景分析的方法應(yīng)用到我們的幼教系統(tǒng)中，或是能不能提供一種評估的方法，這是你所需要考慮的問題。報告人6：梁華題目：GMOS模型時間：2003年8月3日下午1 問：GMOS模型的指導(dǎo)意義是什么？答：對于GUI可以做出早期的預(yù)測，但對于 3D界面，限制就比較大。對于目前我們開發(fā)的普教系統(tǒng)，就可以預(yù)測用戶的行為。2

24、問：GMOS模型把時間作為唯一的指標(biāo)？你認(rèn)為它的擴展性如何？答：前提是基于任務(wù)分析，任務(wù)分為操作子，把時間作為唯一的指標(biāo)。可以把一些簡單的外部指標(biāo)加進去，但還需要其他的評估方式。3 問：對于并行加工、學(xué)習(xí)經(jīng)驗方面有預(yù)測的方法嗎？答：KLM、CMN、NGOMSL三種模型，都不包括并行加工，CPM可以對并行加工進行較好的預(yù)測，NGOMSL可以對程序化的學(xué)習(xí)經(jīng)驗進行預(yù)測。4 問：時間是知識加上操作時間，有無程序響應(yīng)時間？答：沒有考慮程序響應(yīng)時間，GMOS模型主要是從心理學(xué)角度來考慮的。5 問：對于熟練用戶，操作鍵盤和筆的時間長短比較如何？答：GOMS模型首先是基于任務(wù)的。任務(wù)性質(zhì)不同，鍵盤和筆各有優(yōu)

25、勢。對于文字任務(wù)，如果都是新手，以前沒有用過鍵盤和電子筆，這樣評估，筆應(yīng)該更快一些。6 問：有沒有考慮疲勞度的影響？答：沒有考慮，犯錯率也是疲勞度的一個指標(biāo)。7 問：是否認(rèn)為不同的交互任務(wù)完全是人的推理行為？答：熟練用戶不需要推理，新手或不熟練用戶需要。GMOS模型只描述某些特殊的情況，即熟練用戶的操作行為。8 問：外部世界的表示對心理有什么影響？從心理學(xué)角度來看，往往刪除掉的東西是可以測量的，而往往對于我們有影響的東西，是不可測量的。是不是這樣？答：動態(tài)的影響較大，但是無法預(yù)測。不完全如此。實驗室進行評估時，一般都處于受控狀態(tài)；如果實驗設(shè)計合理，可以同時考慮很多因素。分析時采用合適的統(tǒng)計方法

26、，各個因素的影響都可以分析到。另外和和測量手段、分析能力也有關(guān)。9問：GMOS模型在學(xué)術(shù)界的反應(yīng)如何？其文獻的時間是什么時候？答：20世紀(jì)90年代(1996年左右的比較多)，近兩年較少。總結(jié)（戴老師）：1 GMOS模型支持我們有一定的難度，3D有難度，那么對于筆呢？以前的界面設(shè)計中有沒有用GMOS模型。答：田豐、北師大的牟書和我曾經(jīng)討論過“普教”系統(tǒng)的評估，用的就GOMS。2 GMOS模型本身是模型，還是分別都能形成模型？答：理論上講，GOMS是模型，它提供一種工程方法，用以進行系統(tǒng)設(shè)計，在設(shè)計之前預(yù)測用戶的行為。在實際操作上，它提供了一個很好的思路，用以進行任務(wù)分析。3 多通道的問題，考慮M

27、、S的問題，如何選擇？如何應(yīng)用到我們的系統(tǒng)中，G是什么？O是什么？答：對于我們的系統(tǒng)，如筆式用戶界面軟件、3D界面軟件，可以確定基本的交互任務(wù)，交互方法和選擇方法。報告人7：張習(xí)文題目：數(shù)字筆跡計算的探討時間：2003年8月3日晚上1 問：系統(tǒng)的識別是否具有進化能力？答：我們的工作針對的是算法，而不是系統(tǒng)開發(fā)，目前沒有研究該問題。但，可以具有進化能力，例如，在校正了錯誤識別后，一是可以將用戶的個性化樣本單獨存儲在該用戶的樣本庫中，對該用戶以后的樣本識別就可以得到改進；再者，也可以將該樣本加入系統(tǒng)樣本庫中，以后類似的樣本就可以得到較好的識別。這兩種做法都可以使得系統(tǒng)具有識別的進化能力。2 問：

28、筆跡處理是對筆劃處理嗎？答：筆跡同文本、圖形、圖像、音頻、視頻一樣，也可以看作是一種信息表達方式。Ink的最小單位是筆劃，而每個筆劃是由一系列點組成的。而用戶是將筆跡看成是若干內(nèi)容單元。所以筆跡處理也是多層次的，可以是處理單獨筆劃的，包括增加點、減少點、改變點，也可以是多個相關(guān)筆劃的處理。根據(jù)具體應(yīng)用要求，還會要求從筆跡中提取單字并進行識別、提取圖形并進行識別。3 問：目前的識別率如何？答：單字識別率與待處理筆跡的質(zhì)量有很大關(guān)系。單字識別與單字提取也有很大關(guān)系，錯誤的單字提取不可能得到正確的單字識別。但，正確的單字提取不一定就能得到正確的單字識別。正確的單字識別還與識別器有關(guān)。漢王識別器已經(jīng)做

29、得很好了，但在實際中還有很多不能令人滿意的地方。如果字符間距、寬度一致，很多方法都會得到較好的單字提取。針對具有一定隨意的連續(xù)手寫中文的單字提取，我們提出了利用多層次信息，考慮筆劃的多種可能組合，取得了較好的效果。4 問：時間對于記錄筆跡信息的影響是什么？答：根據(jù)用戶輸入可以得到生成筆劃的起始時間和終止時間，也可以得到每個筆劃點的生成時間。利用筆劃時間可以計算筆劃點速度、加速度等信息。與筆劃時間有關(guān)的信息可以用來輔助單字提取、筆劃分割（圖形識別）等。5 問：你是如何考慮時間和空間在識別中的關(guān)系的？答：有的研究人員對時間和空間進行加權(quán)，但它們具有相關(guān)性，空間上較遠(yuǎn)的筆劃在時間上也是較遠(yuǎn)的，而時間

30、上較近的筆劃在空間上也是較近的，而時間上較遠(yuǎn)的筆劃在空間上可能較近、也可能較遠(yuǎn)。我們在單字提取中部分考慮了時間的利用，筆劃是以時間順序記錄的，但考慮上述情況，在某個筆劃的前后小范圍內(nèi)搜索筆劃，進行組合判斷。時間信息利用還與后面的識別方法有關(guān)，有的研究人員利用筆劃點速度、加速度進行手繪筆劃分割，這就要求記錄筆劃點時間，而有的方法只是基于筆劃點曲率、角度進行手繪筆劃分割，則不需要筆劃點時間信息。6 問：請解釋一下微軟的王堅對于Ink的定義？答：一是高質(zhì)量繪制；二是智能理解；三是容易操作。（敖翔）總結(jié)（戴老師）：1 識別率低的原因有兩方面：從負(fù)面來講，識別問題本身就很難；從正面來講，沒有必要作。2

31、Ink是獨立存在的，它是一種新的信息表示方式。3 對于政府官員的批閱、評審以及現(xiàn)在的電子商務(wù)的問題，微軟就提出了在表格上直接應(yīng)用筆輸入的問題，這樣就牽扯到識別率低的問題。我們做的基金委項目，由于切分的問題，導(dǎo)致識別率很低。從產(chǎn)權(quán)上來講，我們的識別算法可能作不過漢王，所以我們不做識別算法。4 我們提出的Patch算法在白板上應(yīng)用不錯，所以基于Ink操作的應(yīng)用上我們可以做。報告人8：張鳳軍題目：虛擬環(huán)境下的三維交互技術(shù)時間：2003年8月3日晚上1 問：你所說的場景與王丹力所提的場景有什么不同？答：我所說的場景是從事物的擺放層次上來說的，這里所說的場景是Scene。王丹力所提的場景是指生活片斷，

32、英文是 Scenario。2 問：假定Scenario用三維表示上是否一致？答：我所描述的主要是幾何上的東西，所以應(yīng)該是不一樣的。3 問：Z方向如何體現(xiàn)？答：一般是有隱含的約束的，例如在梯子上運動和地面上運動，我都建立了約束，使得他們的運動都是在梯子或是地面所在的平面上運動?？偨Y(jié)（戴老師）：1 目前3D Mouse沒有用起來，心理學(xué)在這一方面能不能做些工作？2 空間定位和視覺定位的問題，現(xiàn)有的導(dǎo)游過于呆板，能不能有所改進？3 手勢隱喻的問題，操作的問題，可以考慮一下。4 語義模型的問題，對于3D界面以及虛擬家具的模型問題，場景對于復(fù)雜性的要求較低。我的觀點是真實感不是第一重要的，交互才是最重要

33、的，建模還是需要不斷的完善。5 3D界面與DeskTop界面是有本質(zhì)區(qū)別的，現(xiàn)有的微軟界面是快速的，而3D界面則是較慢的。我想給心理學(xué)的提一個建議，現(xiàn)有的GMOS模型能否支持？6 三維是和設(shè)備有關(guān)的，我們要從概念上入手，而不是從設(shè)備上。我有一個設(shè)想，現(xiàn)有的游戲設(shè)備能否作為交互設(shè)備呢。報告人9：華慶一老師題目：分布式認(rèn)知時間：2003年8月5日上午報告：對傳統(tǒng)任務(wù)分析作一些補充：主要參考文獻：The Psychology of Human Computer Interaction, By Card, et al. (1983) 任務(wù)分配有四類，他們是用戶任務(wù)、應(yīng)用任務(wù)、交互任務(wù)以及抽象任務(wù)我本

34、人認(rèn)為任務(wù)分析和分配不是一個好的人機交互需求捕獲出發(fā)點，在此之前應(yīng)當(dāng)有一個知識在人機之間的分配過程。這個過程應(yīng)當(dāng)是基于分布式認(rèn)知思想的。分布式認(rèn)知:基本參考文獻：1. Hollan, J et al. Distributed Cognition: Toward a New Foundation for Human-Computer Interaction Research, ACM TOCHI (June 2000)2. SALOMAN, G., Ed. 1993. Distributed Cognitions: Psychological and Educational Considerat

35、ions. Learning in Doing: Social, Cognitive, and Computational Perspectives. Cambridge University Press, New York, NY.3. NORMAN, D. A. 1993. Things That Make Us Smart: Defending Human Attributes in the Age of the Machine. Addison-Wesley Longman Publ. Co., Inc., Reading, MA.討論：1 問：分布式認(rèn)知的定義和描述答：依然處于爭論中

36、，不同的學(xué)派從不同的角度有不同的定義.2 問：對于我們?nèi)藱C交互有什么影響？答：主要是外部表現(xiàn)對問題求解的影響。外部表示是顯式的，而且很復(fù)雜，人難以理解。不應(yīng)注意人和機器的相同點，而是不同點，注重知識的分配。如何改造輸出，不同的外部，人的認(rèn)知是不同的，（反射式認(rèn)知、簡單認(rèn)知）。OFFICE系統(tǒng)中，外部輸出改成同步表示，就是隱藏掉難以處理，難以表示的東西。圖形操作系統(tǒng)的優(yōu)點就是用圖形表示以前用數(shù)字、字符和命令表示的東西，其實就是幫助記憶的。3 問：分布式認(rèn)知是指一個人的知識分布還是多人的知識分布？答：都有，認(rèn)識是一個時間和空間相互交叉的結(jié)果。時間上有歷史性的，就包括了全人類的認(rèn)識，無法分清是個人的

37、還是群體的?？臻g同樣如此，既有個人的，又有群體的認(rèn)知結(jié)果。CSCW，引入計算機協(xié)作工作，就是多人協(xié)同工作的結(jié)果。4 問：計算機如何去描述人的較快的求解過程？答：分布式認(rèn)知說明了知識是在人和外部分布的，應(yīng)該進行知識分配，還不僅僅是功能的分配，即那部分是計算機占有，那部分是人占有。5 如何應(yīng)用到不同的教學(xué)系統(tǒng)中？答：認(rèn)知是有層次的，從低級到高級的，不同的人，有不同的界面風(fēng)格，而且問題的表示不同，算法的復(fù)雜性也應(yīng)該不同。對于不同的用戶群體，應(yīng)提供不同的外部表示。比如對于專家和一般初學(xué)者，所提供的外部表示一定是不同的。總結(jié)（北大陳文廣老師）時間：2003年8月5日上午對于你們的講座，我很受啟發(fā)，我就

38、大概講講我們北大的工作吧。我們目前的工作主要其中為以下幾個方面。1 語音，手持設(shè)備，只一方面需要加入基礎(chǔ)研究。2 語音識別我們主要是應(yīng)用別人的成果，下一步該怎么辦，還要進一步考慮。3 自然語言理解是在受限的基礎(chǔ)上去做的。4 戴老師提出真實感不是最重要的，我很同意這一觀點，下一步我們要做是如何非真實感繪圖的應(yīng)用用到人機交互中去。5 對音樂（按調(diào)）檢索的提出。6 搜索引擎結(jié)果量大的問題，我們考慮應(yīng)用自然語言的應(yīng)用。下一步要做的工作是用自然語言實現(xiàn)新聞的播報和查詢。語音的問題是難點。我們考慮的是計算機對用戶的理解加以應(yīng)用的問題，用戶操作的分析問題以及信息處理、文摘提取等問題也是我們需要考慮的問題?？偨Y(jié)（王宏安主任）時間：2003年8月5日上午人機交互的研究成果很重要，未來的研究前景很好。這次會議開的很成功，希望提供一個學(xué)術(shù)交流的平臺，大家通過交流，都有了很大的收獲。每個報告都很精彩，發(fā)言很激烈，戴老師的評論很精彩

人人文庫> 全部分類> 應(yīng)用文書 > 事務(wù)文書

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

人機交互HCI小組研討班會議記錄

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔