![數(shù)據(jù)科學(xué)技術(shù)群工作匯報_第1頁](http://file4.renrendoc.com/view/0c8b300c9bee4e9782d736704ca9dc72/0c8b300c9bee4e9782d736704ca9dc721.gif)
![數(shù)據(jù)科學(xué)技術(shù)群工作匯報_第2頁](http://file4.renrendoc.com/view/0c8b300c9bee4e9782d736704ca9dc72/0c8b300c9bee4e9782d736704ca9dc722.gif)
![數(shù)據(jù)科學(xué)技術(shù)群工作匯報_第3頁](http://file4.renrendoc.com/view/0c8b300c9bee4e9782d736704ca9dc72/0c8b300c9bee4e9782d736704ca9dc723.gif)
![數(shù)據(jù)科學(xué)技術(shù)群工作匯報_第4頁](http://file4.renrendoc.com/view/0c8b300c9bee4e9782d736704ca9dc72/0c8b300c9bee4e9782d736704ca9dc724.gif)
![數(shù)據(jù)科學(xué)技術(shù)群工作匯報_第5頁](http://file4.renrendoc.com/view/0c8b300c9bee4e9782d736704ca9dc72/0c8b300c9bee4e9782d736704ca9dc725.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)據(jù)科學(xué)技術(shù)群工作匯報數(shù)據(jù)科學(xué)知識點分類知識點描述專業(yè)課程基礎(chǔ)課程計算機專業(yè)基礎(chǔ)課程,包括程序設(shè)計、數(shù)據(jù)結(jié)構(gòu)、體系結(jié)構(gòu)、操作系統(tǒng)、數(shù)據(jù)庫原理等;進階課程計算機專業(yè)研究生課程,包括算法、統(tǒng)計、機器學(xué)習(xí)、信息檢索、數(shù)據(jù)挖掘等;職業(yè)技能通用技能大數(shù)據(jù)從業(yè)者應(yīng)當掌握的基本技能,是學(xué)習(xí)和工作的基礎(chǔ),涉及Linux系統(tǒng),版本控制軟件、集成開發(fā)環(huán)境、容器化技術(shù)和云計算平臺等;開發(fā)語言主流的程序開發(fā)語言、腳本語言、統(tǒng)計分析語言和數(shù)據(jù)庫語言,包括Java、Python、R、SQL等,每一個大數(shù)據(jù)從業(yè)者都應(yīng)當熟練掌握1種以上開發(fā)語言;算法專題介紹大數(shù)據(jù)分析和處理相關(guān)的算法原理,包括深度學(xué)習(xí)、協(xié)同過濾、聚類分析和回
2、歸分析等分析類算法,也包括分布式事務(wù)、分布式一致性、Map/Reduce等分布式算法;系統(tǒng)平臺SQL數(shù)據(jù)庫主要介紹傳統(tǒng)基于關(guān)系模型并且采用SQL語言作為訪問接口的數(shù)據(jù)庫管理系統(tǒng),也包括Hive等架構(gòu)在分布式系統(tǒng)上的類SQL系統(tǒng)和基于中間件技術(shù)的分布式數(shù)據(jù)庫服務(wù);NoSQL數(shù)據(jù)庫介紹新型的非關(guān)系數(shù)據(jù)庫管理系統(tǒng),這些系統(tǒng)所采用的數(shù)據(jù)模型包括鍵值對、圖模型、文檔模型和寬表模型等,主要通過API接口進行訪問;數(shù)據(jù)處理平臺介紹用于大規(guī)模數(shù)據(jù)處理的分布式基礎(chǔ)架構(gòu)平臺,包括Apache基金會所開發(fā)的Hadoop和加州大學(xué)伯克利分校開源的Spark系統(tǒng);數(shù)據(jù)科學(xué)知識點分類知識點描述系統(tǒng)平臺數(shù)據(jù)流處理介紹基于數(shù)
3、據(jù)流模型進行在線數(shù)據(jù)實時處理的系統(tǒng),主要包括Storm和Spark Streaming;緩存系統(tǒng)在對大規(guī)模數(shù)據(jù)集進行分析和處理過程,采用緩存系統(tǒng)能夠有效提高處理性能,目前主流的緩存系統(tǒng)有GemFire、Redis和Cache;消息處理基于分布式隊列的消息發(fā)布和訂閱系統(tǒng)已經(jīng)被廣泛用于處理不斷產(chǎn)生的海量日志信息及交易信息,主流的開源消息處理系統(tǒng)有Kafka和RabitMQ;數(shù)據(jù)分析用于數(shù)據(jù)分析和挖掘的軟件和工具包,主要有Mahout、TensorFlow、MATLAB和Weka等;數(shù)據(jù)可視化采用圖表等方式對數(shù)據(jù)進行展示在大數(shù)據(jù)應(yīng)用中占有重要地位,相關(guān)的軟件工具和庫包括Tableau、Google
4、Charts、Gephi和plotly等;數(shù)據(jù)集成規(guī)劃和研發(fā)大數(shù)據(jù)系統(tǒng)時通常需要對不同來源、不同格式和質(zhì)量的數(shù)據(jù)進行集成,目前已經(jīng)有很多用于數(shù)據(jù)采集、轉(zhuǎn)換和集成的軟件平臺,F(xiàn)lume和OpenRefine是其中具有代表性的;資源調(diào)度介紹用于集群資源(CPU、內(nèi)存、存儲和網(wǎng)絡(luò)等)管理和分配的系統(tǒng)工具,包括YARN和Mesos;案例分析領(lǐng)域應(yīng)用通過案例分析可以讓學(xué)習(xí)者獲取大數(shù)據(jù)技術(shù)應(yīng)用的直觀感受,有助于對相關(guān)技術(shù)的的理解和進一步學(xué)習(xí)。目前大數(shù)據(jù)技術(shù)已經(jīng)被應(yīng)用于眾多領(lǐng)域,具有代表性的有知識圖譜、用戶畫像、推薦系統(tǒng)、異常檢測、社交網(wǎng)絡(luò)、零售分析、計算廣告和人工智能;人才培養(yǎng)角色描述大數(shù)據(jù)科學(xué)家(Big
5、 Data Scientist)專注于大數(shù)據(jù)領(lǐng)域特定科學(xué)問題的深入研究,具有整合不同來源、不同格式、不同質(zhì)量數(shù)據(jù)集的能力,通過對數(shù)據(jù)集的融合和分析,提出具有創(chuàng)新性的解決方案。從業(yè)者可以擁有不同的知識背景,如經(jīng)濟、物理、統(tǒng)計、計算機和應(yīng)用數(shù)學(xué)等,通常擁有碩士或博士學(xué)位。大數(shù)據(jù)分析師(Big Data Analyst)針對給定應(yīng)用場景和系統(tǒng)中的數(shù)據(jù)進行分析,對具體問題提出可行的解決方案,并能夠指導(dǎo)工程師進行開發(fā)和測試。從業(yè)者通常擁有數(shù)學(xué)、統(tǒng)計、計算機、經(jīng)濟或金融的學(xué)士學(xué)位,并且熟悉主流的編程語言、開源系統(tǒng)和統(tǒng)計分析工具。大數(shù)據(jù)架構(gòu)師(Big Data Architect)針對特定的大數(shù)據(jù)問題和需求
6、,設(shè)計相應(yīng)的系統(tǒng)架構(gòu),是連接大數(shù)據(jù)科學(xué)家、大數(shù)據(jù)分析師和大數(shù)據(jù)工程師的橋梁,負責大數(shù)據(jù)解決方案的全生命周期管理,包括需求分析、技術(shù)選型、架構(gòu)設(shè)計、應(yīng)用設(shè)計、開發(fā)和測試、部署和運維。從業(yè)者需要有豐富的應(yīng)用架構(gòu)經(jīng)驗,熟悉主流大數(shù)據(jù)處理平臺的優(yōu)缺點和適用場景。大數(shù)據(jù)工程師(Big Data Engineer)根據(jù)大數(shù)據(jù)架構(gòu)師的設(shè)計,在具體項目中負責數(shù)據(jù)的收集、預(yù)處理、算法實現(xiàn)、可視化及部署和運維。從業(yè)者應(yīng)當熟練使用主流的軟硬件平臺、開發(fā)語言和測試工具,具有學(xué)習(xí)使用大數(shù)據(jù)相關(guān)開源系統(tǒng)的能力,通常擁有計算機相關(guān)專業(yè)的學(xué)士學(xué)位??茖W(xué)家與分析師架構(gòu)師與工程師2018年本科師資培訓(xùn)項目評審(已完成)要求與流程
7、為期三天,容量不少于40人項目經(jīng)費不超過人民幣80000元(含稅費和管理費)2018年1月19日前提交2018年1月31日前推薦至Google教育合作部門推薦標準課程內(nèi)容與主講教師(有助于學(xué)員開拓視野,加深對數(shù)據(jù)科學(xué)的理解)項目負責人背景和依托單位的保障能力申報情況共收到4份申請書第一推薦:貴州財經(jīng)大學(xué)2018年第一批產(chǎn)學(xué)合作協(xié)同育人課程項目推薦要求與流程適用于本科課堂教學(xué)和在線教育的課程資源申報截止日期是2018年4月30日截止日期前發(fā)送到wanzc項目建設(shè)經(jīng)費人民幣5萬元(1年)與項目掛鉤的真實課程情況推薦標準與依托單位所開設(shè)正式課程的關(guān)系(2/3相符)與數(shù)據(jù)科學(xué)技術(shù)知識點相符(優(yōu)先支持系
8、統(tǒng)平臺和案例分析相關(guān)課程)課程基礎(chǔ)(課程資源、主講人背景等)課程規(guī)模(學(xué)時、選課人數(shù)等)歡迎咨詢和交流!推薦谷歌中國教育合作項目專家組成員參見谷歌中國教育合作項目專家組施行辦法任期2年參加年度專家組會議,討論和擬定合作項目下一步方向和工作重點;審議谷歌教育合作項目重大項目發(fā)布或活動方案草案,提供專家咨詢建議;受邀參加谷歌教育合作項目申報書評審,給出評審結(jié)果和意見;可選參加谷歌中國教育合作部所組織的會議或活動,參與研討、分享和交流。推薦標準從事數(shù)據(jù)科學(xué)相關(guān)的科研與教學(xué)工作;積極參與數(shù)據(jù)科學(xué)技術(shù)群的活動與交流;:3000數(shù)據(jù)科學(xué)技術(shù)課程資源建設(shè)內(nèi)容教學(xué)大綱(目標、教材、教學(xué)內(nèi)容、課時安排、考評標準)教學(xué)課件(PP
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度綠色環(huán)保會議室場地租賃合同
- 2025年度掛靠汽車租賃公司車輛租賃與品牌建設(shè)合同范本
- 2025年度家庭裝修廢棄物處理服務(wù)合同
- 2025年度新型標磚產(chǎn)品銷售代理合同
- 2025年度房地產(chǎn)開發(fā)項目合同條款深度解析
- 2025年工業(yè)園EPC項目合同(綠色交通系統(tǒng))
- 2025年度公園雕塑主題公園夜間照明設(shè)計合同
- 2025年度國際供應(yīng)鏈金融合同模板匯編
- 2025年度房屋租賃押金退還服務(wù)合同
- 2025年度健身場館租賃與運營管理合同范本
- 2025年公司品質(zhì)部部門工作計劃
- 2024年世界職業(yè)院校技能大賽高職組“市政管線(道)數(shù)字化施工組”賽項考試題庫
- 華為研發(fā)部門績效考核制度及方案
- CSC資助出國博士聯(lián)合培養(yǎng)研修計劃英文-research-plan
- 《環(huán)境管理學(xué)》教案
- 2025年蛇年年度營銷日歷營銷建議【2025營銷日歷】
- (一模)寧波市2024學(xué)年第一學(xué)期高考模擬考試 數(shù)學(xué)試卷(含答案)
- 攝影入門課程-攝影基礎(chǔ)與技巧全面解析
- 冀少版小學(xué)二年級下冊音樂教案
- 【龍集鎮(zhèn)稻蝦綜合種養(yǎng)面臨的問題及優(yōu)化建議探析(論文)13000字】
- 父母贈與子女農(nóng)村土地協(xié)議書范本
評論
0/150
提交評論