數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)_第1頁
數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)_第2頁
數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)_第3頁
數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)_第4頁
數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)資料僅供參考文件編號:2022年4月數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)版本號:A修改號:1頁次:1.0審核:批準(zhǔn):發(fā)布日期:全國大學(xué)生數(shù)學(xué)建模競賽選拔賽承諾書我們完全明白,在競賽開始后參賽隊(duì)員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊(duì)外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競賽章程和參賽規(guī)則的,如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競賽章程和參賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽章程和參賽規(guī)則的行為,我們將受到嚴(yán)肅處理,并取消參賽資格。我們參賽選擇的題號是(從A/B/C/D中選擇一項(xiàng)填寫):A參賽隊(duì)員(打印后再手簽)::1.2.3.指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人(沒有可不填寫): (論文紙質(zhì)版與電子版中的以上信息必須一致,只是電子版中無需簽名。以上內(nèi)容請仔細(xì)核對,提交后將不再允許做任何修改。如填寫錯誤,論文可能被取消評獎資格。)日期:2015年7月29日

醫(yī)保欺詐的主動發(fā)現(xiàn)摘要醫(yī)療保險(xiǎn)是關(guān)系到國計(jì)民生和國家發(fā)展的重大問題,醫(yī)保欺詐問題嚴(yán)重威脅醫(yī)保基金安全,妨礙醫(yī)保政策的有效實(shí)施,因此醫(yī)保欺詐行為的主動發(fā)現(xiàn)對醫(yī)療保險(xiǎn)的發(fā)展、完善和社會穩(wěn)定發(fā)展有重大的意義。本提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的識別的鑒別醫(yī)保欺詐行為的方法。對于數(shù)據(jù)的處理,我們選擇了Excel和Access根據(jù)病人ID將表病人資料和表費(fèi)用明細(xì)表進(jìn)行了匯總和歸一,并剔除了包括記錄不完整、格式錯誤之內(nèi)的無效數(shù)據(jù),在這個過程中我們發(fā)現(xiàn)了所有的消費(fèi)記錄只是買藥,并且在這個月的消費(fèi)記錄中只有極少數(shù)病人存在轉(zhuǎn)科室行為,而且一部分病人是自費(fèi)的,沒有醫(yī)保欺詐嫌疑,還有一些病人存在多人共用醫(yī)保卡的現(xiàn)象,直接確定其為醫(yī)保欺詐,這些病人的消費(fèi)記錄為我們訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)提供了樣本支持。對于這個問題,我們首先用Excel和Access從大量的數(shù)據(jù)中篩選出了對欺詐識別有用的信息,其中包括病人的年齡,性別,所在科室,當(dāng)月總消費(fèi)以及當(dāng)月消費(fèi)頻率等等你,又考慮到不同科室的消費(fèi)情況存在差異因此我們求出了各個科室的平均消費(fèi)額,并且做出了每個病人當(dāng)月的消費(fèi)對對應(yīng)科室平均消費(fèi)的相對差。有了這些欺詐因子和自費(fèi)患者以及共用醫(yī)保卡患者的消費(fèi)記錄,我們建立了Logistic二元回歸模型,來評估各個欺詐因子對欺詐的可能性大小的影響進(jìn)而剔除了對欺詐可能性無效的欺詐因子,保留了對欺詐可能性影響顯著的欺詐因子作為輸入向量對BP神經(jīng)進(jìn)行訓(xùn)練,并且用訓(xùn)練后的網(wǎng)絡(luò)對醫(yī)保病人進(jìn)行了欺詐識別。最終我們認(rèn)為輸出結(jié)果為1的病人具有重大醫(yī)保欺詐嫌疑。關(guān)鍵詞醫(yī)保欺詐Logistic二元回歸BP神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)

問題重述問題背景醫(yī)療保險(xiǎn)是為解決公民或勞動者因?yàn)榧膊『头且蚬?fù)傷,喪失勞動能力后的治療費(fèi)用及服務(wù),給予物質(zhì)幫助的一種社會保險(xiǎn)制度。醫(yī)療保險(xiǎn)欺詐行為是指違反醫(yī)療保險(xiǎn)管理法規(guī)和政策,采用虛構(gòu)事實(shí)、隱瞞真相以及其他方法,向醫(yī)保基金管理機(jī)構(gòu)騙取醫(yī)?;鸹蜥t(yī)保待遇的行為。這一行為具有兩個基本特征:一是主觀表現(xiàn)為直接故意,并且以非法占有醫(yī)保基金或非法獲得醫(yī)保待遇為目的,二是實(shí)施手段主要是通過虛構(gòu)事實(shí)和隱瞞真相,即故意虛構(gòu)未曾發(fā)生的保險(xiǎn)事故,或者對發(fā)生的保險(xiǎn)事故編造虛假的原因或者夸大損失程度,以達(dá)到騙取醫(yī)療保險(xiǎn)基金或醫(yī)療保險(xiǎn)待遇的目的。我國自城鎮(zhèn)職工醫(yī)療保險(xiǎn)和新農(nóng)村合作醫(yī)療制度實(shí)施以來,欺騙醫(yī)?;鸬陌讣粩喟l(fā)生,事實(shí)上,醫(yī)療保險(xiǎn)欺詐在許多國家每年都有數(shù)億美元的損失,對醫(yī)?;鸢踩珮?gòu)成了重大的威脅,妨礙了各國醫(yī)保政策的實(shí)施,因此醫(yī)療保險(xiǎn)欺詐已成為各國非常重視的社會問題利用數(shù)學(xué)建模的方法分析醫(yī)療保險(xiǎn)欺詐行為,建立相應(yīng)的數(shù)學(xué)模型可為發(fā)現(xiàn)醫(yī)療保險(xiǎn)欺詐問題提供科學(xué)有力的依據(jù)。問題描述醫(yī)療保險(xiǎn)欺詐行為具有兩個基本特征:一是主觀表現(xiàn)為直接故意,并且以非法占有醫(yī)?;鸹蚍欠ǐ@得醫(yī)保待遇為目的;二是實(shí)施手段主要是通過虛構(gòu)事實(shí)和隱瞞真相,即故意虛構(gòu)未曾發(fā)生的保險(xiǎn)事故,或者對發(fā)生的保險(xiǎn)事故編造虛假的原因或者夸大損失程度,以達(dá)到騙取醫(yī)療保險(xiǎn)基金或醫(yī)療保險(xiǎn)待遇的目的。騙保人進(jìn)行醫(yī)保欺詐時(shí)通常使用的手段有冒用他人醫(yī)療保險(xiǎn)證、卡就醫(yī);異地就醫(yī)人員偽造或虛開醫(yī)療票據(jù)回來報(bào)銷;“掛床”住院就醫(yī);要求醫(yī)院開具本人不必要的診療項(xiàng)目或藥品,由他人代作或代用等。下面這些情況都有可能是醫(yī)保欺詐:單張?zhí)幏剿庂M(fèi)特別高,一張卡在一定時(shí)間內(nèi)反復(fù)多次拿藥等。問題分析BP神經(jīng)網(wǎng)絡(luò)是一種按誤差你傳播算法訓(xùn)練的前饋網(wǎng)絡(luò),學(xué)習(xí)過程由信號的正向傳播與誤差的逆向傳播兩個過程組成.正向傳播時(shí),模式作用于輸入層,經(jīng)隱層處理后,傳入誤差的逆向傳播階段,將輸出誤差按某形式,通過隱層向輸入層逐層返回,并“分?jǐn)偂苯o各層的所有單元,從而獲得各層單元的參考誤差或稱誤差信號,以作為修改各單元權(quán)值的依據(jù).權(quán)值不斷修改的過程,也就是網(wǎng)絡(luò)學(xué)習(xí)過程.此過程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差準(zhǔn)逐漸減少到可接受的程度或達(dá)到設(shè)定的學(xué)習(xí)次數(shù)為止。目前BP神經(jīng)網(wǎng)絡(luò)已在國內(nèi)外相關(guān)經(jīng)濟(jì)研究領(lǐng)域得到廣泛應(yīng)用,在國內(nèi)的證券、銀行等相關(guān)領(lǐng)域已有學(xué)者開始運(yùn)用BP網(wǎng)絡(luò)進(jìn)行研究,葉明華將該方法運(yùn)用到機(jī)動車保險(xiǎn)欺詐的研究當(dāng)中,并且嘗試了統(tǒng)計(jì)回歸與神經(jīng)網(wǎng)絡(luò)的融合,證實(shí)了神經(jīng)網(wǎng)絡(luò)運(yùn)用于保險(xiǎn)欺詐的識別是可行的,并且通過回歸分析精煉后的識別因子能夠使神經(jīng)網(wǎng)絡(luò)具有更好的識別效果。在這個問題中,數(shù)據(jù)量巨大,同時(shí)自費(fèi)患者和欺詐患者(共用醫(yī)保卡)提供了大量的樣本,而這些樣本恰好可以用于BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,同時(shí)還可以用Logistic二元回歸分析篩選出影響顯著的欺詐因子,將定量與定性相結(jié)合,使結(jié)果更準(zhǔn)確。因此,對于這個問題,運(yùn)用層次分析法和Logistic二元回歸分析相結(jié)合的方法進(jìn)行醫(yī)保欺詐的識別。模型假設(shè)1.自費(fèi)病人無醫(yī)保欺詐嫌疑2.消費(fèi)總額和消費(fèi)數(shù)量為負(fù)數(shù)的視為記錄錯誤,取絕對值計(jì)算3.忽略這個月內(nèi)極少數(shù)病人轉(zhuǎn)科室治療的情況4.這個月當(dāng)?shù)貨]有地震等重大災(zāi)難的發(fā)生模型的建立與求解預(yù)處理數(shù)據(jù)樣本與欺詐因子選取根據(jù)附錄表格和中的病人資料和消費(fèi)記錄中使用Excel和Access的數(shù)據(jù)處理函數(shù),結(jié)合相關(guān)資料,先做出各個科室的平均消費(fèi)額,然后提取出包括病人科室,病人所在科室的平均消費(fèi)額,病人當(dāng)月總費(fèi)用,當(dāng)月拿藥頻次,年齡,性別在內(nèi)的6個欺詐因子,并將這些欺詐因子整合到病人ID中,表格見附件1。表欺詐因子匯總表醫(yī)保病人ID病人科室各科室平均消費(fèi)額當(dāng)月拿藥頻次當(dāng)月總費(fèi)用年齡性別36305015220.429162769018732.452116879915220.6462178614203996226497218732.529219905618732.646252473815220.348240626015220.448116730518732.647133196818732.830216121317357716126571095.1321自費(fèi)病人與醫(yī)保卡共用病人從題目表病人資料醫(yī)??ㄌ栆粰谥泻Y選出醫(yī)保卡號為1的病人,提取出他們的病人ID并確定他們?yōu)樽再M(fèi)病人。對醫(yī)??ㄌ栆粰谶\(yùn)用COUNTIF函數(shù)篩選一卡多用病人發(fā)現(xiàn)存在2人共用醫(yī)保卡以及3人共用醫(yī)??ǖ默F(xiàn)象,提取出他們的ID并確定其為共用醫(yī)??ú∪恕7謩e根據(jù)自費(fèi)病人以及醫(yī)??ü灿貌∪说腎D作出如表格的欺詐因子匯總表便于進(jìn)一步分析。欺詐因子的精煉運(yùn)用二元離散選擇模型對選取的6個欺詐因子進(jìn)行回歸分析,從中獲取具有顯著性的欺詐因子,我們通過IBMSPSSStatistics19軟件實(shí)現(xiàn)樣本數(shù)據(jù)的Logistic二元回歸分析。參數(shù)設(shè)定為:方法:Enter步進(jìn)概率:進(jìn)入=,刪除=;最大迭代次數(shù):50Exp(B)的.(X):95%。

表迭代歷史記錄迭代-2對數(shù)似然值系數(shù)Constant步驟01234567a.模型中包括常量。b.初始-2對數(shù)似然值:c.因?yàn)閰?shù)估計(jì)的更改范圍小于.001,所以估計(jì)在迭代次數(shù)7處終止。表為迭代歷史記錄,估計(jì)在迭代7次后終止,初始的-2對數(shù)似然值達(dá)到。表分類表已觀測已預(yù)測欺詐與否百分比校正01步驟0欺詐與否022585013750.0總計(jì)百分比a.模型中包括常量。b.切割值為.500在表中可見在輸入的樣本中有22585例被預(yù)測為0,有375例應(yīng)該為1的也被預(yù)測為0,預(yù)測正確率%。

表顯著性檢驗(yàn)得分dfSig.步驟0變量相對差1.202當(dāng)月總費(fèi)用1.006當(dāng)月拿藥頻次1.237年齡1.001性別(1)1.000病人科室1.000各科室平均消費(fèi)額1.000總統(tǒng)計(jì)量7.000表是對模型的全局檢驗(yàn),為似然比檢驗(yàn),共給出七個結(jié)果:sig值<表明有統(tǒng)計(jì)學(xué)意義。從中可見病人當(dāng)月總費(fèi)用,年齡,性別,病人所在科室以及病人所在科室的平均消費(fèi)額對回歸具有顯著影響,而其他因素沒有影響。根據(jù)這個結(jié)論就可以建立醫(yī)保欺詐識別的BP網(wǎng)絡(luò)模型。醫(yī)保欺詐識別的BP網(wǎng)絡(luò)模型1) 設(shè)置初始權(quán)值W(0)為較小的隨機(jī)非零值。2) 給定輸入/輸出樣本集合,{誤差指標(biāo)E總誤差指標(biāo)E重復(fù)下列過程直至滿足收斂條件(Ealla) 對于任意一個樣本p,計(jì)算正向過程: 反向過程:b) 修正權(quán)值包括兩種學(xué)習(xí)方式:模式(Pattern)學(xué)習(xí)方式:訓(xùn)練(Epoch)學(xué)習(xí)方式:網(wǎng)絡(luò)輸入矩陣是由Logistic二元回歸分析獲取的具有模型顯著性的5個欺詐識別因子向量組成,網(wǎng)絡(luò)輸出向量矩陣是由是否欺詐(0和1)組成的一維矩陣,0代表該病人沒有欺詐,1代表欺詐。經(jīng)過反復(fù)多次試驗(yàn),本著誤差最小,訓(xùn)練時(shí)間最短的原則最終確定了有2個隱藏層的BP神經(jīng)網(wǎng)絡(luò)模型。設(shè)置目標(biāo)誤差為,最大迭代次數(shù)50000等。圖BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練圖從圖中看出我們的BP神經(jīng)網(wǎng)絡(luò)經(jīng)過396個迭代周期,歷時(shí)2分50秒之后終于達(dá)到了目標(biāo)誤差。訓(xùn)練過程如圖所示。圖模擬訓(xùn)練過程圖欺詐病人識別根據(jù)訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò),對不能確定是否欺詐的病人進(jìn)行欺詐識別,找到可能的欺詐病人ID,并根據(jù)其欺詐可能性大小進(jìn)行了排序,排序越靠前欺詐嫌疑越大。最終結(jié)果請看附件5.

模型的評價(jià)與推廣模型的優(yōu)缺點(diǎn)本文采取采取Logistic回歸和BP神經(jīng)網(wǎng)絡(luò)結(jié)合的方法,運(yùn)用Spss軟件對樣本進(jìn)行Logistic回歸分析提取具有模型顯著性的識別因子;將所得識別因子作為BP神經(jīng)網(wǎng)絡(luò)模型的輸入向量進(jìn)行訓(xùn)練,并選取檢驗(yàn)樣本對模型的有效性進(jìn)行預(yù)測檢驗(yàn),證明了模型的準(zhǔn)確性和用這種方法用于醫(yī)保欺詐識別的可行性。本模型基于BP神經(jīng)網(wǎng)絡(luò)的方法具有很多優(yōu)點(diǎn):BP神經(jīng)網(wǎng)絡(luò)的非線性映射能力強(qiáng),數(shù)學(xué)理論證明三層的神經(jīng)網(wǎng)絡(luò)就能夠以任意精度逼近任何非線性連續(xù)函數(shù)。避開了求欺詐因子與欺詐與否之間復(fù)雜函數(shù)關(guān)系的過程,使問題的解決更加簡單,其次BP神經(jīng)網(wǎng)絡(luò)具有一定的容錯能力,BP神經(jīng)網(wǎng)絡(luò)在其局部的或者部分的神經(jīng)元受到破壞后對全局的訓(xùn)練結(jié)果不會造成很大的影響,也就是說即使系統(tǒng)在受到局部損傷時(shí)還是可以正常工作的。同時(shí)本模型也存在著一定的局限性,BP神經(jīng)網(wǎng)絡(luò)是一種局部搜索的優(yōu)化方法,它要解決的是一個復(fù)雜非線性化問題,網(wǎng)絡(luò)的權(quán)值是通過沿局部改善的方向逐漸進(jìn)行調(diào)整的,這樣會使算法陷入局部極值,加上BP神經(jīng)網(wǎng)絡(luò)對初始網(wǎng)絡(luò)權(quán)重非常敏感,以不同的權(quán)重初始化網(wǎng)絡(luò),其往往會收斂于不同的局部極小,這也是我們多次訓(xùn)練會得到不同結(jié)果的原因。其次,BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的選擇至今尚無一種統(tǒng)一而完整的理論指導(dǎo),一般只能由經(jīng)驗(yàn)選定。網(wǎng)絡(luò)結(jié)構(gòu)選擇過大,訓(xùn)練中效率不高,可能出現(xiàn)過擬合現(xiàn)象,造成網(wǎng)絡(luò)性能低,容錯性下降,若選擇過小,則又會造成網(wǎng)絡(luò)可能不收斂。而網(wǎng)絡(luò)的結(jié)構(gòu)直接影響網(wǎng)絡(luò)的逼近能力及推廣性質(zhì)。本文中我們采取了多次試驗(yàn)的方法,確定了網(wǎng)絡(luò)的結(jié)構(gòu),具有一定的主觀性。模型的推廣該模型可有效檢測出醫(yī)保中發(fā)生的詐騙現(xiàn)象,這一模型基于BP神經(jīng)網(wǎng)絡(luò)可以很容易地推廣到其他類型的保險(xiǎn)行業(yè)中,例如人壽保險(xiǎn),機(jī)動車險(xiǎn)等。同時(shí)本模型雖然給出了具有重大醫(yī)保欺詐嫌疑的病人ID,遺憾的是我們并沒有給出每個病人欺詐的具體概率是多少,這也是我們模型需要改進(jìn)的地方。我們的結(jié)果可以為醫(yī)保欺詐的識別,提供一份寶貴的可參考的資料。參考文獻(xiàn)[1]林源.國內(nèi)外醫(yī)療保險(xiǎn)欺詐研究現(xiàn)狀分析[J].INSURANCESTUDIES,2010,12(12):115-122[2]劉坤坤,車險(xiǎn)保險(xiǎn)欺詐識別和測量模型實(shí)證研究——基于廣東省車險(xiǎn)歷史索賠數(shù)據(jù),暨南學(xué)報(bào)(哲學(xué)社會科學(xué)版),8:50-55,2012。[3]朱大奇,史慧編著.人工神經(jīng)網(wǎng)絡(luò)原理及應(yīng)用[M].科學(xué)出版社,2006[4]唐萬梅.BP神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化問題的研究[J].系統(tǒng)工程理論與實(shí)踐.2005(10)[5]劉彩紅.BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法的研究[D].重慶:重慶師范大學(xué),2008.1-76[6]段超霞,田學(xué)民.基于正交最小二乘的傅立葉神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選取方法[J].石油化工自動化.2012(06)[7]葉飛躍.數(shù)據(jù)挖掘過程中的模糊聚類方法[J].計(jì)算機(jī)與現(xiàn)代化.2003(09)[8]王學(xué)民編著.應(yīng)用多元分析[M].上海財(cái)經(jīng)大學(xué)出版社,1999[9]廖寧放,高稚允.BP神經(jīng)網(wǎng)絡(luò)用于函數(shù)逼近的最佳隱層結(jié)構(gòu)[J].北京理工大學(xué)學(xué)報(bào).1998(04)[10]叢爽編著.面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用[M].中國科學(xué)技術(shù)大學(xué)出版社,1998[11]鄧偉妮.基于BP神經(jīng)網(wǎng)絡(luò)的西安市PM10污染預(yù)報(bào)及其MATLAB實(shí)現(xiàn)[D].西安科大學(xué)2008

七、附錄訓(xùn)練BP程序clc,clearall;%definetheinputandoutputpqz=xlsread('E:\數(shù)學(xué)\數(shù)學(xué)建模\深圳杯2015\A題\篩選后的BP素材\欺詐者的樣本.xlsx','B2:G376')

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論