建構(gòu)半導體制造過程產(chǎn)品異常資料挖礦技術(shù)之研究_第1頁
建構(gòu)半導體制造過程產(chǎn)品異常資料挖礦技術(shù)之研究_第2頁
建構(gòu)半導體制造過程產(chǎn)品異常資料挖礦技術(shù)之研究_第3頁
建構(gòu)半導體制造過程產(chǎn)品異常資料挖礦技術(shù)之研究_第4頁
建構(gòu)半導體制造過程產(chǎn)品異常資料挖礦技術(shù)之研究_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、.PAGE :.;建構(gòu)半導體製造過程產(chǎn)品異常資料挖礦技術(shù)之研討梁蕙姿 簡禎富 彭金堂國立清華大學工業(yè)工程與工程管理研討所國立清華大學工業(yè)工程與工程管理研討所元培科學技術(shù)學院經(jīng)營管理研討所摘 要為因應半導體製造過程中產(chǎn)品製程技術(shù)的快速變化、複雜產(chǎn)品組合及生產(chǎn)週期時間長的生產(chǎn)環(huán)境,如何在自動化系統(tǒng)輔助的大量生產(chǎn)之下,在製造過程中提供工程人員可確認正確的製程參數(shù),以及發(fā)現(xiàn)產(chǎn)品異常時可立刻針對問題的特徵進行問題真因追蹤與分析,針對獲得的資訊進行合適的決策並將能夠已受影響的產(chǎn)品列表管理,以減少產(chǎn)品的良率損失,已成為重要的產(chǎn)業(yè)應用與學術(shù)研討議題。本研討目的係研討資料挖礦技術(shù)中關(guān)聯(lián)規(guī)則的Apriori 演算

2、法,結(jié)合半導體領(lǐng)域知識,將製造過程中追蹤已發(fā)生問題的解決方式,進行關(guān)聯(lián)資料的搜尋並予以方式化,並利用決策樹歸納法進行可疑緣由區(qū)別的建議;本研討並建構(gòu)此半導體製造過程中的資料挖礦應用系統(tǒng)雛型,而以目前半導體製造中自動化系統(tǒng)所蒐集的資料結(jié)合此方法而建構(gòu)一半導體製造過程中的資料挖礦應用系統(tǒng)為此研討的實作驗證,以完好地檢驗資料挖礦的方法與步驟進行大量資料的篩選、推演與方式建構(gòu)等過程;結(jié)論歸納本研討結(jié)果與貢獻,並探討未來研討方向。關(guān)鍵字:資料挖礦、決策分析、半導體製造管理、關(guān)聯(lián)規(guī)則The Study of Data Mining Techniques for Analyzing Semiconducto

3、r Manufacturing Product AbnormalHui-Tzu Liang Chen-Fu Chien Jin-Tang PengDepartment of Industrial Engineering and Engineering Management, NationalDepartment of Industrial Engineering and Engineering Management, NationalGraduate Institute of Yuanpei Institute of Science and TechnologyABSTRACTThe envi

4、ronment within the semiconductor industry is one that is made up of rapidly changing technologies, complicated product groups, extensive production hours. The following points have become crucial issues for industrial application and academic research within the semiconductor industry: methods by wh

5、ich accurate processing parameters may be provided for engineers to confirm to, within an automation system during mass production; methods by which abnormal wafers may be instantly tracked and analyzed, based on the problems/defects of each individual case; methods by which obtained data may be app

6、ropriately processed, by which affected products may be managed through a report chart, and by which yield loss of products may be lessened.This study will focus on the Apriori algorithm used in data mining technologies, and will incorporate working knowledge of the semiconductor industry, to search

7、 for, and to develop the solution used to track existing problems within the fabrication process. The decision tree analysis method will also be used to categorize and differentiate possible problem sources. This study will also configure an initial prototype of a data mining application system to b

8、e used within the semiconductor fabrication process. The data mining application system produced from combining this prototype with the automation system currently used for semiconductor fabs will be set forth as a feasible example in this study, and comprehensive data will be filtered, calculated,

9、and modeling, based upon data mining methods and procedures. Research results of this study will be classified and organized, and a goal for future studies will be examined. Keywords:Data Mining、Decision Analysis、Semiconductor Manufacture Management、Association Rule一、前言我國半導體產(chǎn)業(yè)不論是產(chǎn)值、全球佔有率、或是自給才干近年來皆有

10、顯著的表現(xiàn)。根據(jù)統(tǒng)計1987年時臺灣半導體產(chǎn)品產(chǎn)值達全球的0.6%,在企業(yè)與政府的全力協(xié)作及衝刺之下,於1995年已上升至2.6%(何宜佳,民92)。在半導體製造技術(shù)日趨進步與純熟之下,已進入八吋、十二吋晶圓的年代,這其中大量資金的投入是不可或缺的,特別是十二吋晶圓廠其所投入的金額約需30億美圓。因此,在如此龐大的投資金額與技術(shù)快速變化之下,如何規(guī)避經(jīng)營風險已是臺灣甚至全球半導體業(yè)者共同面對的重要課題。在半導體廠製造環(huán)境中,不乏包含200種以上的製程與設(shè)備種類,假設(shè)以半導體製程的創(chuàng)新速度與產(chǎn)品多樣性生産特性、或是生産才干及其大批量生産方式發(fā)展而言,對於目前已存在的八吋廠或是十二吋廠來說,不論是

11、製程設(shè)備或是自動化系統(tǒng)的規(guī)劃上,皆會影響晶圓廠的本錢與生產(chǎn)效率。因此,為因應製造過程中產(chǎn)品的製程技術(shù)變化、以及在自動化系統(tǒng)的輔助大量生產(chǎn)之下,如何在製造過程中提供工程人員可確認正確的製程參數(shù)、以及發(fā)現(xiàn)產(chǎn)品異常時,可立刻針對問題的特徵進行問題真因追蹤與分析,並將能夠已受影響的產(chǎn)品列表管理,以減少產(chǎn)品的良率損失與如何針對獲得的資訊進行合適的決策,將是生產(chǎn)人員所必須面對的挑戰(zhàn)。就目前的企業(yè)對於數(shù)以百萬筆的歷史資料處理方式而言,當產(chǎn)品發(fā)生異?;驗樘囟ㄈ蝿斩仨毜玫讲糠葙Y訊的援助時,假設(shè)將其一一分類並運用於分析上,其實是件耗時且相當困難的任務;通常在自動化系統(tǒng)中資料庫僅記錄現(xiàn)場正運用的已設(shè)定參數(shù)值,因此

12、當產(chǎn)品被發(fā)現(xiàn)已產(chǎn)生異常時往往無法及時獲得當時製造過程中的參數(shù)設(shè)定值,必須依賴製程或設(shè)備工程人員的紀錄或是其他備份的資料庫,資料不易獲得且方法繁雜。但由於資料挖礦(Data Mining)技術(shù)的發(fā)展,使得從龐大複雜的資料中萃取出隱含有用的資訊,以客觀的統(tǒng)計分析提供快速且正確的訊息變?yōu)槟軌?。資料挖礦技術(shù)是一種統(tǒng)計工具的應用,其結(jié)合該產(chǎn)業(yè)領(lǐng)域的專業(yè)與資料庫知識,從資料庫或其他資料儲藏系統(tǒng)中,針對大量的資料進行篩選、推演與方式建構(gòu)等程序,以發(fā)掘隱含在資料與方式中的訊息進而轉(zhuǎn)換成為商機,或是提供決策者新的知識以利於決策的進行簡禎富等,民90;簡禎富等,民92。因此,本研討將以目前半導體製造中自動化系統(tǒng)所

13、蒐集的資料結(jié)合資料挖礦技術(shù)的應用,建立半導體製造過程中所蒐集資料的資料挖礦分析,以提供工程師問題追蹤的另一種方法的選擇。本研討是運用半導體自動化系統(tǒng)的資料庫為資料挖礦的資料來源,並運用資料挖礦中的關(guān)聯(lián)規(guī)則作為分析問題的方法,藉此協(xié)助製程工程人員如何在大量的生產(chǎn)資料中找出能夠隱藏的訊息,以快速的找出與問題相關(guān)性的關(guān)聯(lián)資訊,確保問題能在較短的時間內(nèi)予以解決,不至於呵斥產(chǎn)品的損失擴大。因此本研討目的有以下三點建構(gòu)一半導體製造過程中所蒐集資料的資料挖礦分析方法,以發(fā)現(xiàn)資料中隱含的有用資訊,以提供決策者參考。建構(gòu)製造過程中製程參數(shù)與機臺資料的關(guān)聯(lián)規(guī)則,以提供一可追蹤產(chǎn)品、製程或設(shè)備參數(shù)設(shè)定值的有用資訊,

14、幫助製程或設(shè)備工程人員進行問題追蹤。針對問題的特徵進行大量資料的匯整並發(fā)掘其中隱含的資訊,以協(xié)助工程人員的問題真因追蹤與分析,並將能夠已受影響的產(chǎn)品列表管理,以減少產(chǎn)品的良率損失。二、文獻探討2-1半導體製程半導體技術(shù)變化快速,目前已進入深次微米的時代,產(chǎn)業(yè)的生產(chǎn)趨勢將是集中資源於最具中心競爭力產(chǎn)品的生產(chǎn)方式。過去政府對於半導體產(chǎn)業(yè)的推動與規(guī)劃不遺餘力,自設(shè)置科學工業(yè)園區(qū)開始,陸續(xù)引進該產(chǎn)業(yè)的科技工業(yè)及科技人才,並著手培訓國內(nèi)人才以帶動我國工業(yè)技術(shù)的研討與創(chuàng)新,以促進高科技產(chǎn)業(yè)生根發(fā)展,加速我國的經(jīng)濟建設(shè)為目的。目前在半導體產(chǎn)業(yè)的硬體建設(shè)上雖可滿足產(chǎn)業(yè)的大量需求,但是隨之而來的將是如何在快速生

15、產(chǎn)與大量產(chǎn)能中,提升良率與及時發(fā)現(xiàn)異常等問題。半導體的製造流程是由矽晶圓開始,經(jīng)過一連串製程步驟,如圖1半導體製程表示圖中,包括最初的磊晶沉積、沉積、微影處理的光學顯影、快速高溫製程、化學氣相沉積、離子植入、蝕刻、化學研磨與製程監(jiān)控等前段製程,以及封裝、測試等後段製程才可完成一顆可運用的IC。自1947年發(fā)明電晶體後,新的技術(shù)亦不斷的被發(fā)現(xiàn),其技術(shù)的創(chuàng)新與快速使得積體電路製造在短短的數(shù)十年間迅速發(fā)展至今日的奈米半導體製程。圖 SEQ 圖表 * ARABIC s 1 1 半導體製程表示圖2-2晶圓廠自動化系統(tǒng)半導體產(chǎn)業(yè)的自動化製造系統(tǒng)普通稱之為CIM(Computer Integrated Ma

16、nufacture),CIM是以IT技術(shù)應用於製造環(huán)境中,將公司內(nèi)部各個獨立的部分自動化系統(tǒng)加以整合使生產(chǎn)作業(yè)自動化,以因應大量產(chǎn)品的需求與產(chǎn)品品質(zhì)的提升,進而發(fā)揮整體的效益。關(guān)於晶圓廠自動化系統(tǒng)之資料倉儲,以前段製程FAB生產(chǎn)流程中的Lot Transportation、Lot History、Recipe、Data Collection等四種資料流來了解在自動化系統(tǒng)的製造環(huán)境中,系統(tǒng)是如何紀錄與獲得各產(chǎn)品的生產(chǎn)資料以及所需求的資料是存放於何處。首先是Lot Transportation,系統(tǒng)中將會紀錄每一批產(chǎn)品在製造過程中即時的資料,如進出機臺的時間、運用的參數(shù)、製造時間等,並將這些經(jīng)過設(shè)

17、計存放的資料依需求將其存放於固定的空間,以作為資料分析的依據(jù),這也就是所謂的Lot History;系統(tǒng)對與Lot Transportation與Lot History的存放方式是在製造過程中同時進行的。其次是Recipe即製程參數(shù)的資料流,當運用者透過自動化系統(tǒng)的介面獲得機臺與Lot ID的關(guān)係之後,系統(tǒng)將提供一組適合該Lot在此機臺製造的參數(shù),這就是自動化系統(tǒng)所帶來的便利之一。最後的一項資料流Data Collection,一批Lot在製造的過程中是需求不斷的進行檢測以確保產(chǎn)品的品質(zhì),生產(chǎn)機臺也是如此必須在固定時間或生產(chǎn)片數(shù)達一定數(shù)量後進行檢測與維護,所以在這些過程中系統(tǒng)將會依據(jù)所設(shè)計的蒐

18、集條件完好的紀錄資料,而這些資料也將會是所需的部分。不論是即時的生產(chǎn)資料或是歷史資料將存放在系統(tǒng)所指定的資料庫中。通常自動化製造系統(tǒng)的資料庫中除了儲存產(chǎn)品製造時所需的機臺、產(chǎn)品、製程參數(shù)等根本資料之外,也包含生產(chǎn)過程中各需求點的量測值與量測規(guī)格需求。這些資料經(jīng)過規(guī)劃之後有規(guī)則的將及時資料與歷史資料個別置於關(guān)聯(lián)的資料項中,並適當適時的進行儲存與備份的任務。也因此當工程人員欲進行資料追蹤或異常產(chǎn)品緣由清查時,往往必須透過多方單位的資料援助與溝通即費時又浪費人力,容易延誤問題的解決,所以如何解決工程人員快速的獲得資料與正確的分析資料是各企業(yè)所需求的。在本研討中將以資料挖礦的技術(shù)建立一適合運用者查詢與

19、分析資料的方法,以協(xié)助工程人員的問題追蹤與分析。2-3資料挖礦對於資料挖礦的意義有很多學者提出不同的解釋,也提出很多意義相近卻不同的名稱,例如資料庫知識發(fā)現(xiàn)Knowledge Discovery in Databases; KDD、知識萃取Knowledge extraction、資料考古學Data archeology、資料捕撈Data dredgingHan and Kamber, 2001。而比較常用的名稱是資料挖礦與資料庫知識發(fā)現(xiàn),F(xiàn)ayyad et al. (1996)定義資料庫知識發(fā)現(xiàn)的過程是,一個包含很多重要搜尋步驟的程序過程,從資料中來發(fā)現(xiàn)有效的、新穎的、潛在有用的、以及最終可

20、了解的樣型,資料挖礦是知識發(fā)現(xiàn)過程中一個最關(guān)鍵的步驟;Berry and Linoff (1997)則定義資料挖礦是經(jīng)由自動或半自動的方式探求和分析資料,從大量資料中能夠擷取出有意義的樣型和規(guī)則。綜合以上,資料庫知識發(fā)現(xiàn)和資料挖礦的目的皆一樣,同樣是從資料庫的大量資料中發(fā)現(xiàn)有用的資訊以提供決策者參考,只是資料庫知識發(fā)現(xiàn)描畫出資料準備階段之過程,也就是資料如何從資料庫轉(zhuǎn)換成資料挖礦工具可運用的程序皆完好的描畫,然而要達到資料挖礦的目的,資料挖礦的定義已隱含有資料準備的概念,因此,可直接採用資料挖礦此一名詞。也因此,本研討定義資料挖礦為經(jīng)由自動或半自動的方式探求和分析資料,從大量資料中能夠擷取出有

21、意義的樣型和規(guī)則,發(fā)現(xiàn)事先未知的隱含資訊與知識,以提供決策者相關(guān)的參考資訊。資料挖礦中所運用的發(fā)掘技術(shù)與類型,通常包含關(guān)聯(lián)規(guī)則、分類規(guī)則、叢集規(guī)則、預測分析、趨勢分析、偏向分析等類型。為完成以上的各類型,在資料挖礦的技術(shù)中將運用資料庫理論、資料倉儲、人工智慧、機器學習、統(tǒng)計學等領(lǐng)域,包含統(tǒng)計分析方法(Statistical Analysis)、決策樹(Decision Tree)、類神經(jīng)網(wǎng)路(Neural Network)、基因演算法(Genetic Algorithms)、粗糙集(Rough Set)、線上分析處理 (OLAP)的技術(shù)等。2-4關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則是資料挖礦方式中最常被應用方式之

22、一Berry and Linoff, 1997; Han and Fu, 1999; Han and Kamber, 2001; Tung et al., 2003; 陳家仁等,民92。關(guān)聯(lián)規(guī)則主要是從龐大資料中,探求資料間欄位的相關(guān)性。過去對於關(guān)聯(lián)規(guī)則已有相當多的研討,也證明關(guān)聯(lián)規(guī)則為一有效之方法,其方法的特性主要是,關(guān)聯(lián)規(guī)則能容易解釋其產(chǎn)生的規(guī)則,且可完好呈現(xiàn)變數(shù)之間的影響,但篩選規(guī)則的條件設(shè)定很重要,否則條件太鬆能夠呵斥結(jié)果多且凌亂,相反地,假設(shè)條件太嚴能夠忽略掉一些罕見變數(shù)的有趣樣型。關(guān)聯(lián)規(guī)則方法是Agrawal et al.在1993年提出,T是指一筆買賣記錄Transaction內(nèi)

23、物品項的集合。而D則是一切買賣記錄T的集合。假假設(shè)在集合D中,項目X與項目Y產(chǎn)生關(guān)聯(lián)規(guī)則,表示當買賣記錄T有項目X時,有很大機會也會同時有項目Y,此規(guī)則可表示為XYIf X, then Y,X為前提項目組Antecedent item set,Y為結(jié)果項目組Consequent item set,X和Y皆為一切相異物品項目集合的子集合,且。針對每一項關(guān)聯(lián)規(guī)則If X, then Y可以用支持度Support、信賴度Confidence以及增益Lift等三個指標來評估其成效和重要性。此三項指標的計算公式與物理意義分別闡述如下:支持度:,即代表前提項目X與結(jié)果項目Y一同出現(xiàn)的機率。也就是在規(guī)則中,

24、前提項目X與結(jié)果項目Y一同出現(xiàn)的買賣記錄筆數(shù)佔全部買賣記錄筆數(shù)的百分比。信賴度:,即代表在前提項目X發(fā)生的情況下,前提項目X與結(jié)果項目Y又同時發(fā)生的機率。此為關(guān)聯(lián)規(guī)則的預測強度。此指標之物理意義為當前提項目X發(fā)生時,可推得結(jié)論為結(jié)果項目Y的信賴度。增益:,比較信賴度與結(jié)果項目Y單獨發(fā)生時之機率兩者間的大小。其代表的物理意義為關(guān)聯(lián)規(guī)則的條件機率比母體中本來發(fā)生的機率大才具有意義。關(guān)聯(lián)規(guī)則的產(chǎn)生必需滿足決策者所訂定之最小支持度Minimum support threshold和最小信賴度Minimum confidence threshold,當滿足這兩個條件後,再判斷增益能否大於1,當三個指標皆

25、成立,即推導出有意義的關(guān)聯(lián)規(guī)則。就普通資料庫的探勘關(guān)聯(lián)規(guī)則上,其過程可為以下步驟(Han and Kamber, 2001):找出一切頻繁項目集合(Frequent Itemset):依據(jù)定義,頻繁項目集合所出現(xiàn)的次數(shù)必須與運用者預先定義的最小支持度數(shù)目一樣。由頻繁項目集合產(chǎn)生強關(guān)聯(lián)規(guī)則:依據(jù)定義,其所產(chǎn)生的規(guī)則必須滿足最小支持度與最小信賴度,如此規(guī)則方可成立。過程中其關(guān)聯(lián)規(guī)則的總體效能是由步驟(1)所決定,因此有效的找出頻繁項目集合是關(guān)聯(lián)規(guī)則的重點。Apriori演算法是關(guān)聯(lián)規(guī)則中最為常用來找尋頻繁項目集合的演算法,Apriori演算法是運用逐層搜尋的方法(Agrawal and Srika

26、nt, 1994),依據(jù)上述的探勘關(guān)聯(lián)規(guī)則步驟,可逐漸敘述Apriori演算法流程如下:定義最小支持度及最小信賴度。Apriori演算法運用了候選項目集合(Candidate Itemset) 的觀念,假設(shè)候選項目集合的支持度大於或等於最小支持度,則該候選項目集合為頻繁項目集合。首先由資料庫讀入一切的買賣,得出候選1項目集合 (Candidate 1-Itemset)的支持度,在找出頻繁單項目集合(Frequent 1-Itemset),並利用這些頻繁單項目集合的結(jié)合,產(chǎn)生候選2項目集合 (Candidate 2-Itemset) 。在搜尋資料庫,得出候選2項目集合的支持度以後,在找出頻繁2項

27、目集合,並利用這些頻繁2項目集合的結(jié)合,產(chǎn)生3項目集合。重覆搜尋資料庫,與最小支持度比較,產(chǎn)生頻繁項目集合,再結(jié)合產(chǎn)生下一級候選項目集合,直到不再結(jié)合產(chǎn)生出新的候選項目集合為止。關(guān)於關(guān)聯(lián)規(guī)則的研討,主要是研討發(fā)掘關(guān)聯(lián)規(guī)則的演算法,如何從含有大量資料的資料庫中,快速的找出有意義的關(guān)聯(lián)規(guī)則Srikant and Agrawal, 1996; Han and Fu, 1999; Berzal et al., 2001; Changchien and Lu, 2001; Tung et al., 2003,在實務應用上,Srikant and Agrawal1997有提及關(guān)聯(lián)規(guī)則在商業(yè)、保險、醫(yī)學等之

28、應用,其他主要的應用領(lǐng)域包括購物籃分析Fayyad et al., 1996、商品擺架安排Srikant and Agrawal, 1997、欺騙行為偵查Berry and Linoff, 1997、醫(yī)學研討葉忠和吳恆睿,2002,在半導體的應用上,如透過半導體晶圓允收測試資料,建構(gòu)製程事故診斷資料挖礦架構(gòu),以作為工程師及領(lǐng)域?qū)<医鉀Q問題的參考,進而提升其製程良率的改善簡禎富等,民90; Han and Kamber, 2000。資料挖礦技術(shù)應用於半導體領(lǐng)域的研討很多,本研討將著重於半導體自動化系統(tǒng)生產(chǎn)製造過程中,所蒐集的資料以配合資料挖礦技術(shù)的應用,提供工程師一快速的搜尋規(guī)則及方案建議。三、

29、研討方法本節(jié)將探討半導體製造過程中,對於產(chǎn)品量測(Lot QC)資料異常及報廢的產(chǎn)品如何應用資料挖礦技術(shù)尋求合適的資訊以提供解決方案的選擇。本研討之研討架構(gòu)係依據(jù)資料挖礦方式及資料挖礦流程建構(gòu),包含問題定義、資料處理、資料挖礦應用、以及評估等步驟,研討架構(gòu)如圖2所示。本研討在資料分類及彙整部分,為了提供資料挖礦方式一正確、乾淨、完好的資料,必須確保來源資料的完好性,使得產(chǎn)生的資訊品質(zhì)達到有效性及正確性的要求,在資料挖礦部分採用關(guān)聯(lián)規(guī)則的Apriori演算法進行關(guān)聯(lián)資料的搜尋,以及決策樹歸納法進行可疑緣由區(qū)別的建議。3-1問題定義本研討將探討在半導體製造過程中,發(fā)生產(chǎn)品報廢問題與Lot QC時產(chǎn)

30、生Data Lost或產(chǎn)生OOS (Out Of Spec.)時,如何從資料庫中快速的追蹤所產(chǎn)生的問題,藉由資料挖礦技術(shù)的應用將能夠呵斥的要素從資料庫中篩選出,以提供工程師能掌握有利的資料進行分析。3-2資料處理為了使資料挖礦的資訊能符合實際需求及其正確性與完好性,對於發(fā)掘前的資料處理是重要的關(guān)鍵。因此,本研討將對於產(chǎn)品報廢的現(xiàn)象緣由與歷史資料進行分類及彙整,以作為領(lǐng)域資料的一部分。在於Lot QC方面將建置搜尋Data Lost及OOS的規(guī)則,說明如下產(chǎn)品報廢現(xiàn)象緣由分類及彙整半導體的製造程序是環(huán)環(huán)相扣的,如有任一程序發(fā)生異常通常會影響未來的製程甚至導致產(chǎn)品報廢。當報廢發(fā)生時假設(shè)能在較短時間

31、內(nèi)找出緣由,對於有同樣製程的產(chǎn)品即可立刻追蹤並掌握問題,可減少產(chǎn)品的報廢數(shù)量。製造過程中產(chǎn)生報廢的緣由錯綜複雜,就以現(xiàn)行工程師的經(jīng)驗中,再彙整出現(xiàn)象緣由及解決方案於領(lǐng)域資料庫中如表1所示,運用此彙整的表格提供工程師一對應的訊息,以縮短找尋資料及因個人經(jīng)驗判別的時間,並且將其他同生產(chǎn)條件的產(chǎn)品列出能夠發(fā)生此現(xiàn)象報廢的產(chǎn)品,以盡早提出因應措施。依據(jù)表1的現(xiàn)象為區(qū)分的類別,各類別緣由的分類及各緣由的處理方式對應如圖3所示,依各類別緣由及對策的對應關(guān)聯(lián),假設(shè)有新的現(xiàn)象發(fā)生將可再陸續(xù)參與領(lǐng)域資料庫中。Lot QC data lost及發(fā)生OOS問題時的追蹤通常一批Lot在投片開始至完成前段製程的歷程中,

32、將經(jīng)歷多次的量測以確保產(chǎn)品在製圖2 半導體製造過程產(chǎn)品異常應用資料挖礦研討架構(gòu)圖造過程中能確實符合製程上的規(guī)格,因此量測出的數(shù)值將影響該批Lot的品質(zhì)。以目前具有自動化系統(tǒng)的半導體廠而言,量測的方法或資料的蒐集與運算已是非常正確與快速,但是在這之前的量測參數(shù)能否正確的被設(shè)定於自動化系統(tǒng)中,以及資料能否完好的被系統(tǒng)所蒐集,將有賴於系統(tǒng)的設(shè)計及參數(shù)的設(shè)定。Data lost的發(fā)生有兩種狀況,一為參數(shù)設(shè)定的不完好,能夠是由資料維護時遺漏或工程師提供不完好;另一為機臺與系統(tǒng)的data傳送出現(xiàn)異常,能夠是機臺端當機或傳送機制停擺或系統(tǒng)端產(chǎn)生異常;至於OOS的產(chǎn)生即是製程條件的異常所致。因此,在以上所提的

33、這些問題將可由自動化系統(tǒng)人員與製程工程師共同建立解決方案,至於如何在Lot QC data lost及OOS依然發(fā)生時快速找到問題,本研討將運用資料挖礦技術(shù)提供一快速的搜尋方法,以縮短工程師進入資料庫探求的時間,並減少不符合量測規(guī)格的產(chǎn)品繼續(xù)產(chǎn)出。此階段將以關(guān)聯(lián)規(guī)則的Apriori演算法與自動化系統(tǒng)工程師的領(lǐng)域知識配合建置一合宜的搜尋方式。表 SEQ 表格 * ARABIC s 1 1 產(chǎn)品報廢分類對應表範例現(xiàn)象分類破片污漬報廢緣由說明Box盒蓋鬆脫呵斥破片 CLEAN及旋乾異常ABNORENG 破片 治工具呵斥破片治工具呵斥破片-晶舟E.P未抓到 人為破片 CLEAN及旋乾異常ABNORN-

34、SCRAP 水痕 因應方式check run card能否異常呵斥Box盒蓋未正常蓋上Check Recipe 設(shè)定能否異常.3-3資料挖礦本研討運用關(guān)聯(lián)規(guī)則的Apriori演算法獲得產(chǎn)品報廢的現(xiàn)況與要素分析,計算其支持度與信賴度以確定分析出來的資訊能否為正確有效的,並以決策樹歸納法配合領(lǐng)域資料的分析,建議其合宜的解決方案。至於Lot QC方面,亦是以關(guān)聯(lián)規(guī)則的Apriori演算法與自動化系統(tǒng)的領(lǐng)域資料推導出發(fā)生問題的能夠要素,以提供快速的資料搜尋途徑。資料挖礦流程如圖4所示。以下問題產(chǎn)品報廢及Lot QC問題追蹤為例,說明資料挖礦流程逐層分析。當發(fā)生Lot QC的Data lost時,工程師

35、可提供該產(chǎn)品的發(fā)生站點、時間、量測的機臺等訊息,依據(jù)所提供的訊息進入CIM資料庫中確認根本資料的設(shè)定、系統(tǒng)與機臺端傳送及機臺端的資訊。根本資料的設(shè)定將確認其參數(shù)值、規(guī)格值、量測機臺與生產(chǎn)機臺的對應及產(chǎn)品與機臺的對應關(guān)係等,而機臺端將確認其能否已將資料完好蒐集。假設(shè)根本資料的設(shè)定問題已發(fā)生則調(diào)整設(shè)定,假設(shè)機臺端已發(fā)現(xiàn)未完好蒐集資料則是機臺端問題,假設(shè)根本資料的設(shè)定及機臺端皆正確,則建議著重在系統(tǒng)與機臺端傳送問題。當OOS發(fā)生時,工程師可提供該產(chǎn)品的發(fā)生站點、時間、量測的機臺等訊息,依據(jù)所提供的訊息進入CIM資料庫中確認根本資料的設(shè)定值,假設(shè)根本資料的設(shè)定問題已發(fā)生則調(diào)整設(shè)定。在產(chǎn)品報廢現(xiàn)象緣由追

36、蹤上運用Apriori的逐層搜尋疊代方法的特性,方法如下:圖3 Domain Knowledge階層資料表圖例首先必須將該產(chǎn)品發(fā)生的現(xiàn)象及特徵提供給方式如產(chǎn)品型號、發(fā)生的站點、發(fā)生的機臺、報廢的現(xiàn)象、報廢的特徵等。依據(jù)該產(chǎn)品發(fā)生的現(xiàn)象及特徵進行第一次的資料庫掃描並定義最小支持度及最小信賴度。得出該現(xiàn)象的候選1項目集合(1-Itemset)的支持度,以及找出頻繁單項目集合(Frequent 1-Itemset),利用這些頻繁單項目集合的結(jié)合產(chǎn)生候選2項目集合(2-Itemset)。支持度的計算為:將輸入的屬性與目標屬性以一對一或一對多的方式產(chǎn)生多種項目集合,並計算各項目集合中X與Y同時出現(xiàn)的資料

37、筆數(shù)佔一切資料筆數(shù)的百分比。再搜尋資料庫,得出該現(xiàn)象的候選2項目集合的支持度,再找出頻繁2項目集合,並利用這些頻繁2項目集合的結(jié)合,產(chǎn)生3項目集合。重覆搜尋資料庫,與最小支持度比較,假設(shè)產(chǎn)生的頻繁項目集合(Lk)大於或等於運用者所定義的最小支持度,則頻繁項目集合即被找到。當頻繁項目集合出現(xiàn)之後進行信賴度的計算。當頻繁項目集合的信賴度與最小信賴度比較,假設(shè)大於或等於運用者所定義的最小信賴度,則候選規(guī)則產(chǎn)生並進行一切頻繁項目集合最小信賴度比較。計算一切候選規(guī)則的增益,假設(shè)增益值大於1則選取,小於或等於1則放棄,最後將產(chǎn)生顯著的關(guān)聯(lián)規(guī)則。最後整理頻繁項目集合,以產(chǎn)出所定義的目標。圖4 資料挖礦流程3

38、-4評估資料挖礦中除了資料庫理論、資料倉儲、人工智慧、機器學習、統(tǒng)計學等領(lǐng)域之外,在專家領(lǐng)域知識上更是不可短少,以本研討而言是針對半導體製造過程的問題追蹤,因此,結(jié)合半導體製造、製程、設(shè)備以及自動化系統(tǒng)的領(lǐng)域知識等是必要的,在發(fā)掘的結(jié)果上不論是分類、規(guī)則、表示方式皆需求符合領(lǐng)域?qū)<业恼J知與經(jīng)驗。經(jīng)過一連串的資料挖礦技術(shù)應用,將報廢產(chǎn)品及Lot QC問題追蹤建構(gòu)出追蹤規(guī)則,使同樣生產(chǎn)條件的產(chǎn)品可提早防範一樣狀況發(fā)生,以減少損失並適時的提出其決策建議。四、實證研討4-1產(chǎn)品報廢追蹤問題定義在普通製造過程中,除非是顯著的現(xiàn)象才會立刻的被斷定產(chǎn)品報廢例如,破片,但是原因假設(shè)為製程參數(shù)設(shè)定異常,或是設(shè)備

39、異常則較難被立刻發(fā)現(xiàn),因此潛藏於在製品中的報廢要素如何被過濾出,並加以防範將是重要的問題。以產(chǎn)品發(fā)生報廢為例,當報廢的產(chǎn)品在工程師初步判斷之後,彙整報廢的特徵為電性偏低,並列出有影響的站點,以作為以下資料處理的線索來源。資料處理將發(fā)生產(chǎn)品報廢的產(chǎn)品批號、型號、目前製程站點、發(fā)生報廢的站點、發(fā)生報廢的機臺、發(fā)生報廢時所運用的製程參數(shù)、特徵等,輸入於雛型系統(tǒng)中以利於資料發(fā)掘。資料挖礦由產(chǎn)品報廢的特徵與現(xiàn)象可以歸類出Recipe Fail、Etch不淨、Vt不合等三種能夠報廢類型,如表2產(chǎn)品報廢分類對應表。依據(jù)本研討提出的資料挖礦流程處理如下:表2 產(chǎn)品報廢分類對應表現(xiàn)象類別要素對應Recipe F

40、ail1.TSF Down load Fail2.CIM data error3.設(shè)備異常4.製程不合而PASS 5.製程污染 6.製程重覆做 7.製程漏做 Etch不淨1.TSF Down load Fail2.CIM data error3.設(shè)備異常Vt不合2.CIM data error4.製程不合而PASS 6.製程重覆做Eng判別呵斥此現(xiàn)象的能夠發(fā)生站點List。依據(jù)該產(chǎn)品發(fā)生的現(xiàn)象及特徵進行第一次的資料庫掃描並定義最小支持度為1.94及最小信賴度50%。也就是說,在310筆資料中,產(chǎn)生報廢的能夠要素有6類,假設(shè)為均勻分配的情況,則每一類平均約為60筆資料,因此其支持度應大於60/3

41、10=1.94%,才代表足夠之顯著程度;而設(shè)定信賴度為獲得關(guān)聯(lián)規(guī)則其顯著程度達一半以上。得出該現(xiàn)象的候選1項目集合的支持度,以及找出頻繁單項目集合,利用這些頻繁單項目集合的結(jié)合產(chǎn)生候選2項目集合。結(jié)果如表3所示。再搜尋資料庫,得出該現(xiàn)象的候選2項目集合的支持度,再找出頻繁2項目集合,並利用這些頻繁2項目集合的結(jié)合,產(chǎn)生3項目集合。結(jié)果如表4所示。再搜尋資料庫,得出該現(xiàn)象的候選3項目集合的支持度,再找出頻繁3項目集合,並利用這些頻繁3項目集合的結(jié)合,產(chǎn)生4項目集合。結(jié)果如表5所示。重覆搜尋資料庫,與最小支持度比較,假設(shè)產(chǎn)生的頻繁項目集合(Lk)大於或等於運用者所定義的最小支持度,則頻繁項目集合即

42、被找到。結(jié)果如表6所示。當頻繁項目集合出現(xiàn)之後進行信賴度的計算,結(jié)果如表6所示。最後工程師可將列出的要素對應存於領(lǐng)域資料庫中的處理方式建議,其處理方式如表7報廢現(xiàn)象分類對應表,並且追蹤同樣生產(chǎn)條件的產(chǎn)品如表8可疑產(chǎn)品追蹤清單。表3 候選1項目集合ItemsetSup.count1.TSF Down load Fail22.CIM data error33.設(shè)備異常24.製程不合而PASS 25.製程污染 46.製程重覆做 27.製程漏做 1表4 候選2項目集合ItemsetSup.count1.TSF Down load Fail且2.CIM data error21.TSF Down loa

43、d Fail且3.設(shè)備異常31.TSF Down load Fail且2.CIM data error21.TSF Down load Fail且3.設(shè)備異常31.TSF Down load Fail且4.製程不合而PASS11.TSF Down load Fail且5.製程污染11.TSF Down load Fail且6.製程重覆做12.CIM data error 且3.設(shè)備異常 22.CIM data error 且4.製程不合而PASS22.CIM data error 且5.製程污染12.CIM data error 且6.製程重覆做23.設(shè)備異常且4.製程不合而PASS13.設(shè)備

44、異常且5.製程污染13.設(shè)備異常且6.製程重覆做14.製程不合而PASS 且5.製程污染14.製程不合而PASS且6.製程重覆做25.製程污染且 6.製程重覆做1表5 候選3項目集合ItemsetSup.count1.TSF Down load Fail且2.CIM data error21.TSF Down load Fail且3.設(shè)備異常32.CIM data error 且3.設(shè)備異常 22.CIM data error 且4.製程不合而PASS22.CIM data error 且6.製程重覆做24.製程不合而PASS且6.製程重覆做2表6 候選4項目集合ItemsetSup.coun

45、tConf.2.CIM data error 且3.設(shè)備異常 264.67%2.CIM data error 且4.製程不合而PASS297.00%2.CIM data error 且6.製程重覆做297.00%4.製程不合而PASS且6.製程重覆做297.00%表7 報廢現(xiàn)象分類對應表緣由因應方式2.CIM data error 且3.設(shè)備異常確認CIM資料維護歷史資料確認該設(shè)備異常紀錄狀況2.CIM data error 且4.製程不合而PASS確認CIM資料維護歷史資料進一步確認 LQC 時的實際量測值2.CIM data error 且6.製程重覆做確認CIM資料維護歷史資料確認該產(chǎn)品

46、的製造過程歷史資料4.製程不合而PASS且6.製程重覆做確認 LQC 時的實際量測值確認該產(chǎn)品的製造過程歷史資料表8 可疑產(chǎn)品追蹤清單Lot IDProduct IDRoute IDCurrent Oper. IDPastTimeData_Lot_08Data_Prod_A1Data_Route_AData_Oper_60102004/2/14 15:00Data_Lot_08Data_Prod_B1Data_Route_BData_Oper_24052004/2/15 09:00Data_Lot_18Data_Prod_B1Data_Route_BData_Oper_25062004/2/1

47、6 02:01Data_Lot_20Data_Prod_B1Data_Route_BData_Oper_26072004/2/16 05Data_Lot_09Data_Prod_B1Data_Route_BData_Oper_26072004/2/17 11Data_Lot_10Data_Prod_B1Data_Route_BData_Oper_26082004/2/17 14-2結(jié)果與討論在實際半導體製造過程中,工程師必須透過部門與部門之間的協(xié)調(diào),之後經(jīng)過資料庫管理部門的核可,才可透過資料庫管理人員依工程師的需求,進行資料搜尋,在經(jīng)過一連串的資料獲得步驟之後,工程師最後才干再進行分析與討論,

48、如此程序完成後問題能夠已擱置數(shù)日了。因此,假設(shè)工程師在初步的問題確認後,可立刻透過本研討資料挖礦架構(gòu)的篩選,將可減少以上繁覆的程序與核可步驟,假設(shè)進一步結(jié)合自動化工程師、製程工程師、或是設(shè)備工程師的經(jīng)驗,將可縮短問題追蹤的時間與產(chǎn)品的損失、或是因人員異動而失去的解決問題的經(jīng)驗值。關(guān)聯(lián)規(guī)則之Apriori演算法是運用逐層搜尋的方法,每進行一個層次的搜尋則必須掃描資料庫一次,直到條件完成,即找到符合條件的頻繁項目集合,然而當程式的條件愈為複雜,則相對的其重覆搜尋資料庫次數(shù)亦提高;也就是說與最小支持度比較產(chǎn)生頻繁項目集合,再結(jié)合產(chǎn)生下一級候選項目集合,直到不再結(jié)合產(chǎn)生出新的候選項目集合為止。因此,當

49、資料庫的資料量愈大及程式的條件愈嚴謹,系統(tǒng)必須相對付出的是掃描資料庫資料時的系統(tǒng)負荷,因此在Apriori演算法應用於大量資料與系統(tǒng)負荷方面,將會影響資料挖礦的效能。就程式運作上,Apriori演算法是必須完好的執(zhí)行結(jié)束,因為其逐層搜尋的方式必須由第一層開始,逐層比較其支持度再產(chǎn)生頻繁項目集合,假設(shè)中途停頓後其所產(chǎn)生的支持度將不具完好性,也無法真實呈現(xiàn)產(chǎn)出的結(jié)果。因此,假設(shè)有此現(xiàn)象將需求重新執(zhí)行探勘程式,以確保效度檢定的合理性與正確性。五、結(jié)論與建議本研討對於半導體製造過程的問題追蹤,藉由資料挖礦的方法與步驟,進行大量資料的篩選、推演與方式建構(gòu)等過程,協(xié)助工程人員處理問題,盡能夠減少在龐大的資

50、料中發(fā)掘的困難度,使其方便的發(fā)掘出隱含的訊息,以及快速的找到與問題相關(guān)的關(guān)聯(lián)資訊。在資料挖礦的過程中,領(lǐng)域資料與相關(guān)人員的經(jīng)驗扮演著重要的角色,假設(shè)能將經(jīng)驗予以有系統(tǒng)的保管,其在資料挖礦的過程上將可給予相當程度的幫助。本研討驗證上所採用的資料量及資料種類,與實際半導體系統(tǒng)的資料量比較相對較少,因此在執(zhí)行程式的速度與獲得的資料方面會與實際值有落差。在研討方法上,以關(guān)聯(lián)規(guī)則的Apriori演算法雖可達到驗證的目的,但是當實際應用於半導體產(chǎn)業(yè)中時,除了系統(tǒng)軟體與硬體上的提升外,領(lǐng)域資料的再補充以及方法效率亦是探討的重點。在未來的研討上,將資料挖礦觀念導入半導體製造過程中,則對於半導體整體的Wafer

51、 Level Tracking上,即由前端的Wafer Start以致於EDA(Engineer Data Analysis)的資料分析,將是另一種追蹤問題的方式,但是必需先將半導體自動化系統(tǒng)資料庫進行整合,以及建置更完好的領(lǐng)域經(jīng)驗知識庫,方可進行較為完善的資料挖礦。參考文獻Agrawal, R., Imielinski, T. and Swami, A., (1993), “Mining Association Rules Between Sets of Items in Large Databases, Proceedings of The 1993 ACM SIGMOD International Conference on Management of Data, Washington Agrawal, R. and Srikant, R., (1994), “Fast Algorithms for Mining Association Rule, Proceedings of the 20th International Confere

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論