版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第 頁免責(zé)聲明:圖文來源網(wǎng)絡(luò)征集,版權(quán)歸原作者所有。若侵犯了您的合法權(quán)益,請作者持權(quán)屬證明與本站聯(lián)系,我們將及時更正、刪除!謝謝!高校財務(wù)樣本數(shù)據(jù)庫研究 摘要:研究了大數(shù)據(jù)算法在高校財務(wù)數(shù)據(jù)分析中的應(yīng)用,提出了基于水庫抽樣算法建立樣本數(shù)據(jù)庫的方法,結(jié)果表明:基于水庫抽樣算法建立樣本數(shù)據(jù)庫,能夠大幅縮短建立時間、系統(tǒng)開銷小、且建立完成后其內(nèi)部數(shù)據(jù)具有良好的均勻特性,可有效解決傳統(tǒng)高校財務(wù)管理中基礎(chǔ)數(shù)據(jù)樣本生成時間長、開銷大、分布不均勻的缺點,提高了財務(wù)基礎(chǔ)數(shù)據(jù)分析質(zhì)量,推動了高校財務(wù)管理工作的發(fā)展 關(guān)鍵詞:大數(shù)據(jù);高校財務(wù);數(shù)據(jù)分析 大數(shù)據(jù)對高校財務(wù)管理的影響比較廣泛而深遠,它將有利于高校的資源
2、配置,強化高校全面預(yù)算管理,加強成本核算意識,同時提高資金使用效益,防范財務(wù)風(fēng)險,使高校側(cè)重預(yù)算編制和結(jié)果分析的財務(wù)管理向業(yè)務(wù)全過程的財務(wù)管理轉(zhuǎn)變,實現(xiàn)高校財務(wù)管理新變革大數(shù)據(jù)為高校財務(wù)管理帶來變革的關(guān)鍵特性之一是其預(yù)測性作用,傳統(tǒng)財務(wù)利用財務(wù)報表和人為經(jīng)驗為高校財務(wù)管理者提供決策依據(jù),隨著海量數(shù)據(jù)的產(chǎn)生,此種方式已不能在合理的時間范圍內(nèi)產(chǎn)生合理性的判斷依據(jù),遠不能達到目前高校財務(wù)管理精細(xì)化要求,更偏離信息化時代所強調(diào)的信息支持決策的發(fā)展方向從目前高校財務(wù)管理實際來看,基礎(chǔ)數(shù)據(jù)的分析是關(guān)鍵,而數(shù)據(jù)更新及時、均勻特性好的樣本數(shù)據(jù)庫是進行分析的前提條件但由于受到高校財務(wù)數(shù)據(jù)多等因素限制,傳統(tǒng)財務(wù)的
3、線性掃描處理方法無法對基礎(chǔ)數(shù)據(jù)進行快速均勻的抽取處理,導(dǎo)致了高校財務(wù)數(shù)據(jù)分析工作上的困難,不利于高校財務(wù)管理工作的開展應(yīng)用大數(shù)據(jù)對數(shù)據(jù)進行全面分析,遵循的是每件事情都有跡可循,找到事物變化的規(guī)律,能夠更好地對高校資源籌劃、資本運營、資產(chǎn)管理以及當(dāng)前辦學(xué)和長期的規(guī)劃進行預(yù)測,把握高校發(fā)展方向,使教育產(chǎn)出能更好地適應(yīng)市場需求,合理配置資源,提高經(jīng)濟與社會效益,實現(xiàn)高??缭绞娇沙掷m(xù)發(fā)展大數(shù)據(jù)技術(shù)的出現(xiàn),為高校財務(wù)數(shù)據(jù)分析工作提供了新的技術(shù)手段,文中將大數(shù)據(jù)算法與高校財務(wù)數(shù)據(jù)分析進行結(jié)合與應(yīng)用,在保證速度的前提下,建立具有良好均勻特性的樣本數(shù)據(jù)庫 樣本數(shù)據(jù)庫 數(shù)據(jù)庫構(gòu)架 數(shù)據(jù)挖掘與分析是大數(shù)據(jù)在教育領(lǐng)
4、域中的應(yīng)用之一,其主要作用是進行預(yù)測分析、行為分析、學(xué)業(yè)分析等的應(yīng)用和研究其中財務(wù)數(shù)據(jù)分析能夠為學(xué)生心理健康、獎優(yōu)助評、貧困生關(guān)懷、個性化就業(yè)等領(lǐng)域提供數(shù)據(jù)參考為了實現(xiàn)數(shù)據(jù)的有效收集,應(yīng)建立財務(wù)基礎(chǔ)數(shù)據(jù)樣本數(shù)據(jù)庫,為下一步數(shù)據(jù)分析提供有力支持,其總體架構(gòu)為:傳統(tǒng)財務(wù)通常利用線性掃描與隨機選取的方法進行樣本數(shù)據(jù)抽取,抽取過程中需要將所有數(shù)據(jù)加載進內(nèi)存或緩存,同時在索引遞增的同時利用隨機函數(shù)生成索引用于確定抽取元素數(shù)據(jù)加載和隨機索引生成帶來了大量的系統(tǒng)開銷,同時如果隨機算法的選擇并不優(yōu)秀,還會導(dǎo)致樣本的重復(fù)概率增加為解決上述問題,文中利用水庫抽樣算法作為樣本數(shù)據(jù)抽取的基礎(chǔ)算法,該算法打破了傳統(tǒng)財務(wù)
5、線性的時間處理局限,在未損失精度的前提下,提供傳統(tǒng)財務(wù)所不能提供的海量數(shù)據(jù)樣本生成能力樣本數(shù)據(jù)庫除了數(shù)據(jù)抽取功能之外,還要求具有數(shù)據(jù)的統(tǒng)計分類和序列化功能對樣本數(shù)據(jù)進行統(tǒng)計分類可以實現(xiàn)按類別和權(quán)重的樣本抽取,從而豐富大數(shù)據(jù)分析的手段同時通過對樣本數(shù)據(jù)進行統(tǒng)計分類,還能解決基礎(chǔ)數(shù)據(jù)的序列化問題序列化通過為分類數(shù)據(jù)添加指定索引,可以大大提升數(shù)據(jù)的檢索速度和準(zhǔn)確性所以,做好樣本數(shù)據(jù)的統(tǒng)計分類,并按照財務(wù)管理信息類別對基礎(chǔ)數(shù)據(jù)進行合理的序列化對數(shù)據(jù)處理是十分必要的對樣本數(shù)據(jù)進行分類和序列化之后,可對每一類數(shù)據(jù)進行必要的統(tǒng)計,總結(jié)樣本數(shù)據(jù)特點,把握樣本數(shù)據(jù)處理原則,提高樣本數(shù)據(jù)的處理質(zhì)量 數(shù)據(jù)庫數(shù)據(jù)樣本
6、處理流程 數(shù)據(jù)樣本處理流程為: 數(shù)據(jù)庫抽樣算法及其改進 數(shù)據(jù)庫線性抽樣算法 在盡可能快的時間內(nèi),對基礎(chǔ)數(shù)據(jù)庫中的學(xué)生進行盡力均勻抽取,形成樣本用于數(shù)據(jù)分析盡力均勻抽取意味著盡力保證每個學(xué)生被抽為樣本的概率是相同的輸入:基礎(chǔ)數(shù)據(jù)庫中的學(xué)生數(shù)據(jù)輸出:這組數(shù)據(jù)的個均勻取樣 水庫抽樣算法定義 針對應(yīng)用情景,可以利用水庫抽樣算法進行樣本抽取,該算法的特征為:)抽取時限要求較高,且數(shù)據(jù)只掃描一次)利用計算機資源有限,只為用戶想要獲取的個取樣分配內(nèi)存空間用于計算)掃描前個數(shù)據(jù)時,已保存的個取樣是均勻抽取的,隨著的增長,個取樣的隨機性一直不變算法定義為:)申請一個長度為的數(shù)組保存抽樣)保存首先接收到的個元素)
7、當(dāng)接收到第個新元素時,以的概率隨機替換中元素 改進算法均勻性證明 該算法的取樣是均勻的,在任何時候接收到大于的個數(shù)時,選出的個數(shù)一定是已掃描數(shù)據(jù)中的均勻抽?。寒?dāng)接收到第個數(shù)時,第個數(shù)能保存在數(shù)組中的概率為(),因為在接收到第個數(shù)的時候要以()的概率隨機替換而第個數(shù)被選中的概率是,他們相乘為,就是第個數(shù)被換出數(shù)組的概率所以()就是在接收個元素時,第個數(shù)在數(shù)組中的概率同理在接收第個數(shù)時,第個數(shù)仍然保存在數(shù)組中的概率為(),以此類推,接收第個數(shù)時,第個元素仍保存在數(shù)組中的概率為(),如果上述事件都發(fā)生,那么在接收第個數(shù)時,第個數(shù)才能保存在數(shù)組中,因此它保留在抽樣數(shù)組中的概率是這些時間發(fā)生概率的積,就
8、是()()()() 算法實現(xiàn) 算法實現(xiàn)的偽代碼為:初始化:;處理:()(,)() 實證結(jié)果分析 財務(wù)流程中,對于業(yè)務(wù)數(shù)據(jù)的時效性有較高要求,處理算法的優(yōu)劣直接影響執(zhí)行算法主機的系統(tǒng)開銷,從而影響整個財務(wù)流程的運轉(zhuǎn)速度為對比傳統(tǒng)線性掃描算法和水庫抽樣算法的系統(tǒng)開銷,對兩種算法進行了程序?qū)崿F(xiàn),設(shè)定樣本規(guī)模為并進行了樣本抽取,種抽取算法帶來的系統(tǒng)開銷對比如圖()所示,可見傳統(tǒng)線性掃描隨數(shù)據(jù)量級的上升系統(tǒng)開銷不斷增大,而水庫抽樣則穩(wěn)定在樣本規(guī)模時的臨界值傳統(tǒng)的利用隨機數(shù)確定抽樣元素,隨機函數(shù)利用時間等作為種子產(chǎn)生隨機數(shù),雖保證了隨機性,但不能保證樣本抽取的均勻特性,而水庫抽樣彌補了傳統(tǒng)方法的這個缺陷,
9、圖()展示了部分抽樣結(jié)果 結(jié)語 大數(shù)據(jù)環(huán)境中,高校財務(wù)數(shù)據(jù)的數(shù)量級不斷提升,因此基礎(chǔ)數(shù)據(jù)的分析成為難點而樣本數(shù)據(jù)庫作為基礎(chǔ)數(shù)據(jù)分析的必要支撐,其建立生成尤為重要通過本文的分析可知,大數(shù)據(jù)技術(shù)的出現(xiàn),給了均勻、快速的樣本生成以新的手段支持,為在允許的時間與精度范圍內(nèi)的分析提供了依據(jù)本文提供了基礎(chǔ)數(shù)據(jù)樣本數(shù)據(jù)庫的建立思路,在樣本數(shù)據(jù)庫的基礎(chǔ)上利用水庫抽樣算法進行抽樣,作者對上述思路進行了程序?qū)崿F(xiàn)并提供了試驗結(jié)果該應(yīng)用手段解決了高校財務(wù)管理中基礎(chǔ)數(shù)據(jù)樣本來源困難,提高了財務(wù)基礎(chǔ)數(shù)據(jù)分析質(zhì)量,豐富了高校財務(wù)分析工作手段 參考文獻: 韓丹丹大數(shù)據(jù)時代下高校財務(wù)管理如何做好基礎(chǔ)數(shù)據(jù)的分析財務(wù)管理,(): 黎羊基于高校財務(wù)管理問題的調(diào)查與對策研究長春:吉林大學(xué),: 薛硯丹基于決策樹算法的高校財務(wù)管理與決策分析研究銀川:寧夏大學(xué),: 王宏志大數(shù)據(jù)算法北京:機械工業(yè)出版社,: 王元卓,靳小龍,程學(xué)旗網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望計算機學(xué)報,(): 孫大為,張廣艷,鄭緯民大數(shù)據(jù)流式計算:關(guān)鍵技術(shù)及系統(tǒng)實例軟件學(xué)報,(): 楊靜,張楠男,李建,等決策樹算法的研究與應(yīng)用計算機技術(shù)與發(fā)展,(): 陳東淺談高校財務(wù)決策支持系統(tǒng)及
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 風(fēng)力發(fā)電基礎(chǔ)攪拌樁施工合同
- 廣告牌租賃合同樣本
- 2025美術(shù)班培訓(xùn)合作合同
- 親子閱讀服裝租賃協(xié)議范本
- 停車場安全管理合同范本
- 水果蔬菜卸車協(xié)議
- 茶葉店租賃合同品味茶香人生
- 兒童教育培訓(xùn)租賃解除協(xié)議
- 自然保護區(qū)草場租賃合同
- 農(nóng)場物業(yè)聘用合同
- 《HSK標(biāo)準(zhǔn)教程1》-HSK1-L8課件
- 保險專題高凈值人士的財富傳承課件
- 幼兒園小班繪本:《藏在哪里了》 課件
- 上冊外研社六年級英語復(fù)習(xí)教案
- 替班換班登記表
- 社會保險法 課件
- 阿利的紅斗篷 完整版課件PPT
- 橋梁工程擋土墻施工
- 供應(yīng)商質(zhì)量問題處理流程范文
- 實驗室生物安全手冊(完整版)資料
- 裝飾裝修施工方案
評論
0/150
提交評論