版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Python文件和數(shù)據(jù)格式化高級(jí)技術(shù)講解匯報(bào)人:XX2024-01-11文件操作與I/O處理數(shù)據(jù)格式化基礎(chǔ)高級(jí)字符串格式化技術(shù)文件與數(shù)據(jù)交互技術(shù)數(shù)據(jù)清洗與預(yù)處理技術(shù)數(shù)據(jù)可視化技術(shù)文件操作與I/O處理01使用`open()`函數(shù)打開(kāi)文件,指定文件名和打開(kāi)模式(如讀取、寫入、追加等)。打開(kāi)文件關(guān)閉文件上下文管理使用`close()`方法關(guān)閉文件,釋放資源。使用`with`語(yǔ)句可以自動(dòng)管理文件的打開(kāi)和關(guān)閉,確保文件在使用后被正確關(guān)閉。030201打開(kāi)與關(guān)閉文件使用`read()`方法一次性讀取整個(gè)文件內(nèi)容。讀取整個(gè)文件使用`readlines()`方法或循環(huán)遍歷文件對(duì)象逐行讀取文件內(nèi)容。逐行讀取在打開(kāi)文件時(shí)指定字符編碼,如`utf-8`,以確保正確讀取文件內(nèi)容。指定字符編碼讀取文件內(nèi)容
寫入文件內(nèi)容寫入文件使用`write()`方法向文件中寫入內(nèi)容。追加內(nèi)容使用`append()`方法或在打開(kāi)文件時(shí)使用追加模式向文件中追加內(nèi)容。指定字符編碼在打開(kāi)文件時(shí)指定字符編碼,以確保正確寫入文件內(nèi)容。使用`os.getcwd()`方法獲取當(dāng)前工作目錄。獲取當(dāng)前工作目錄拼接文件路徑獲取文件擴(kuò)展名文件路徑轉(zhuǎn)換使用`os.path.join()`方法拼接文件路徑,確保路徑的正確性。使用`os.path.splitext()`方法獲取文件的擴(kuò)展名。使用`os.path.abspath()`、`os.path.realpath()`等方法進(jìn)行文件路徑的轉(zhuǎn)換和處理。文件路徑處理數(shù)據(jù)格式化基礎(chǔ)02Python中的數(shù)據(jù)類型包括整數(shù)、浮點(diǎn)數(shù)、復(fù)數(shù)、布爾值、字符串、列表、元組、字典和集合等。變量是存儲(chǔ)數(shù)據(jù)的一種方式,可以存儲(chǔ)不同類型的數(shù)據(jù),并且變量的值可以隨時(shí)改變。數(shù)據(jù)類型與變量變量數(shù)據(jù)類型字符串格式化符號(hào)Python中使用%作為字符串格式化符號(hào),后面跟不同的字母表示不同類型的數(shù)據(jù),例如%s表示字符串,%d表示整數(shù)等。字符串格式化方法除了使用%進(jìn)行字符串格式化外,還可以使用str.format()方法和f-string進(jìn)行字符串格式化。字符串格式化列表格式化列表是一種有序的數(shù)據(jù)結(jié)構(gòu),可以使用列表推導(dǎo)式和for循環(huán)等方式進(jìn)行格式化。元組格式化元組是一種不可變的數(shù)據(jù)結(jié)構(gòu),可以使用元組推導(dǎo)式和for循環(huán)等方式進(jìn)行格式化。字典格式化字典是一種無(wú)序的鍵值對(duì)數(shù)據(jù)結(jié)構(gòu),可以使用字典推導(dǎo)式和for循環(huán)等方式進(jìn)行格式化。列表、元組和字典格式化可以通過(guò)自定義函數(shù)來(lái)實(shí)現(xiàn)更復(fù)雜的格式化需求,例如對(duì)日期、時(shí)間和數(shù)字等進(jìn)行特殊格式化。自定義格式化函數(shù)的作用可以通過(guò)定義函數(shù),并在函數(shù)內(nèi)部使用字符串格式化、列表推導(dǎo)式、字典推導(dǎo)式等技術(shù)來(lái)實(shí)現(xiàn)自定義的格式化功能。自定義格式化函數(shù)的實(shí)現(xiàn)自定義格式化函數(shù)高級(jí)字符串格式化技術(shù)03f-string基本用法通過(guò)在字符串前加`f`或`F`,在字符串內(nèi)使用大括號(hào)`{}`包裹變量名,實(shí)現(xiàn)字符串的格式化輸出。表達(dá)式求值在f-string的大括號(hào)內(nèi)可以放入表達(dá)式,Python會(huì)對(duì)其進(jìn)行求值并將結(jié)果插入到字符串中。調(diào)試信息輸出利用f-string可以方便地輸出變量的值和表達(dá)式的結(jié)果,有助于程序的調(diào)試。f-string格式化030201通過(guò)位置參數(shù),可以將變量值按照順序插入到字符串的指定位置。位置參數(shù)使用關(guān)鍵字參數(shù)可以指定變量名及其對(duì)應(yīng)的值,實(shí)現(xiàn)更加靈活的字符串格式化。關(guān)鍵字參數(shù)通過(guò)使用特定的格式化字符串(如`{:d}`、`{:f}`等),可以控制變量的輸出格式。格式化字符串str.format()方法變量替換通過(guò)為模板字符串提供變量值,可以實(shí)現(xiàn)字符串的批量替換。自定義分隔符可以通過(guò)修改`Template`類的`delimiter`屬性,自定義模板字符串中的分隔符。模板字符串定義使用`string.Template`類可以定義模板字符串,其中使用`$`和變量名表示需要替換的變量。模板字符串ASCII編碼是最簡(jiǎn)單的字符編碼方式,使用7位二進(jìn)制數(shù)表示一個(gè)字符,共能表示128個(gè)字符。ASCII編碼Unicode是一種統(tǒng)一的字符編碼標(biāo)準(zhǔn),使用16位或32位二進(jìn)制數(shù)表示一個(gè)字符,可以表示世界上幾乎所有的字符。Unicode編碼UTF-8是一種變長(zhǎng)字節(jié)表示的Unicode字符編碼方式,可以用1到4個(gè)字節(jié)表示一個(gè)字符,兼容ASCII編碼。UTF-8編碼在Python中,可以使用`encode()`方法將字符串編碼為字節(jié)串,使用`decode()`方法將字節(jié)串解碼為字符串。編碼與解碼方法字符串編碼與解碼文件與數(shù)據(jù)交互技術(shù)04讀取CSV文件01使用Python內(nèi)置的csv模塊,通過(guò)創(chuàng)建csv.reader對(duì)象來(lái)讀取CSV文件內(nèi)容??梢灾鹦谢蛑鹆凶x取數(shù)據(jù),并支持自定義分隔符、引號(hào)字符等。寫入CSV文件02同樣使用csv模塊,創(chuàng)建csv.writer對(duì)象來(lái)寫入數(shù)據(jù)到CSV文件??梢詫懭雴涡谢蚨嘈袛?shù)據(jù),并設(shè)置分隔符、引號(hào)字符等。CSV文件與數(shù)據(jù)框的轉(zhuǎn)換03利用pandas庫(kù),可以方便地將CSV文件轉(zhuǎn)換為DataFrame對(duì)象,進(jìn)行數(shù)據(jù)處理和分析。CSV文件讀寫操作JSON文件讀寫操作使用Python內(nèi)置的json模塊,通過(guò)json.load()函數(shù)讀取JSON文件內(nèi)容,并將其轉(zhuǎn)換為Python對(duì)象(如列表或字典)。寫入JSON文件使用json.dump()函數(shù)將Python對(duì)象轉(zhuǎn)換為JSON格式,并寫入到文件中??梢栽O(shè)置縮進(jìn)、排序等參數(shù)來(lái)美化輸出。JSON與數(shù)據(jù)框的轉(zhuǎn)換pandas庫(kù)也支持將JSON數(shù)據(jù)轉(zhuǎn)換為DataFrame對(duì)象,方便進(jìn)行數(shù)據(jù)分析和處理。讀取JSON文件讀取XML文件使用xml.etree.ElementTree模塊來(lái)解析XML文件。通過(guò)ElementTree對(duì)象可以遍歷XML文檔的各個(gè)元素,并獲取其屬性和文本內(nèi)容。寫入XML文件使用ElementTree模塊創(chuàng)建XML文檔。先創(chuàng)建Element對(duì)象表示XML元素,然后通過(guò)ElementTree對(duì)象將元素組合成完整的XML文檔,并使用write()方法寫入到文件中。XML與數(shù)據(jù)框的轉(zhuǎn)換可以使用pandas庫(kù)將XML數(shù)據(jù)轉(zhuǎn)換為DataFrame對(duì)象,便于進(jìn)行數(shù)據(jù)分析和處理。XML文件讀寫操作讀取Excel文件使用pandas庫(kù)的read_excel()函數(shù)讀取Excel文件內(nèi)容,并將其轉(zhuǎn)換為DataFrame對(duì)象。支持讀取單個(gè)或多個(gè)工作表,并可以指定列類型、日期格式等參數(shù)。寫入Excel文件使用pandas庫(kù)的to_excel()函數(shù)將DataFrame對(duì)象轉(zhuǎn)換為Excel格式,并寫入到文件中??梢栽O(shè)置工作表名稱、索引、列名等參數(shù)。Excel文件的樣式設(shè)置可以使用openpyxl庫(kù)對(duì)Excel文件進(jìn)行樣式設(shè)置,如設(shè)置單元格格式、字體、顏色等。Excel文件讀寫操作數(shù)據(jù)清洗與預(yù)處理技術(shù)05缺失值識(shí)別通過(guò)Pandas庫(kù)中的isnull()或isna()函數(shù)識(shí)別數(shù)據(jù)中的缺失值。填充缺失值使用fillna()函數(shù),可以選擇填充固定值、均值、中位數(shù)等。刪除缺失值使用dropna()函數(shù)刪除含有缺失值的行或列。缺失值處理異常值檢測(cè)利用標(biāo)準(zhǔn)差、四分位數(shù)等方法檢測(cè)異常值。替換異常值將異常值替換為合理范圍內(nèi)的值,如中位數(shù)、均值等。刪除異常值對(duì)于嚴(yán)重偏離正常范圍的異常值,可以選擇刪除。異常值處理通過(guò)dtypes屬性查看數(shù)據(jù)框中每列的數(shù)據(jù)類型。數(shù)據(jù)類型識(shí)別使用astype()函數(shù)將數(shù)據(jù)轉(zhuǎn)換為所需類型,如int、float、str等。數(shù)據(jù)類型轉(zhuǎn)換利用to_datetime()函數(shù)將字符串轉(zhuǎn)換為日期或時(shí)間格式。日期和時(shí)間處理數(shù)據(jù)類型轉(zhuǎn)換03聚合操作在分組后,可以使用sum()、mean()、count()等函數(shù)對(duì)數(shù)據(jù)進(jìn)行聚合計(jì)算。01數(shù)據(jù)排序使用sort_values()函數(shù)按照指定列的值進(jìn)行升序或降序排序。02數(shù)據(jù)分組利用groupby()函數(shù)按照一個(gè)或多個(gè)列對(duì)數(shù)據(jù)進(jìn)行分組,便于進(jìn)行聚合操作。數(shù)據(jù)排序與分組數(shù)據(jù)可視化技術(shù)06繪圖基礎(chǔ)介紹Matplotlib庫(kù)的基本概念、繪圖元素和常用函數(shù)。圖表類型詳細(xì)講解Matplotlib支持的各種圖表類型,如折線圖、柱狀圖、散點(diǎn)圖、餅圖等。自定義圖表講解如何調(diào)整圖表的顏色、樣式、標(biāo)簽等屬性,以及添加圖例、標(biāo)題、軸標(biāo)簽等元素。Matplotlib庫(kù)基礎(chǔ)操作介紹Seaborn庫(kù)提供的各種統(tǒng)計(jì)圖形,如箱線圖、小提琴圖、熱力圖等。統(tǒng)計(jì)圖形詳細(xì)講解如何使用Seaborn庫(kù)繪制數(shù)據(jù)的分布情況,包括直方圖、核密度估計(jì)圖等。數(shù)據(jù)分布講解Seaborn庫(kù)的配色方案和樣式設(shè)置,以及如何自定義配色和樣式。配色與樣式Seaborn庫(kù)進(jìn)階應(yīng)用交互式基礎(chǔ)介紹Plotly庫(kù)的基本概念、繪圖元素和常用函數(shù),以及如何實(shí)現(xiàn)交互式繪圖。圖表類型詳細(xì)講解Plotly支持的各種圖表類型,如折線圖、柱狀圖、散點(diǎn)圖、熱力圖等。自定
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 微生物代謝控制發(fā)酵-緒論-原理課件
- Westwin:2024年戶外家具出海趨勢(shì)報(bào)告 當(dāng)春季踏青不遠(yuǎn)行 戶外家具出海的增長(zhǎng)機(jī)會(huì)在哪里
- 湖南省郴州市桂陽(yáng)縣蒙泉學(xué)校2024屆九年級(jí)下學(xué)期中考一模數(shù)學(xué)試卷(含答案)
- 5年中考3年模擬試卷初中生物八年級(jí)下冊(cè)專項(xiàng)素養(yǎng)綜合全練(一)
- 5年中考3年模擬試卷初中道德與法治八年級(jí)下冊(cè)01第1課時(shí)公平正義的價(jià)值
- 讓考生最頭疼的十大聽(tīng)力問(wèn)題盤點(diǎn)
- 小學(xué)四年級(jí)下冊(cè)全冊(cè)音樂(lè)教案(人教版)
- 中學(xué)小初貫通式培養(yǎng)方案
- DB11-T 493.3-2022 道路交通管理設(shè)施設(shè)置規(guī)范 第3部分:道路交通信號(hào)燈
- GB/T 5169.23-2008電工電子產(chǎn)品著火危險(xiǎn)試驗(yàn)第23部分:試驗(yàn)火焰管形聚合材料500 W垂直火焰試驗(yàn)方法
- 2023年山東文化產(chǎn)業(yè)職業(yè)學(xué)院高職單招(數(shù)學(xué))試題庫(kù)含答案解析
- GB/T 27677-2017鋁中間合金
- GB/T 16400-2015絕熱用硅酸鋁棉及其制品
- 二年級(jí)體育教案-障礙跑教學(xué)設(shè)計(jì) 全國(guó)通用
- 專利撰寫模板五書
- SVN操作培訓(xùn)手冊(cè)
- 2023年華中科技大學(xué)考博英語(yǔ)試題
- 旅客地道施工方案
- 一年級(jí)上冊(cè)語(yǔ)文《語(yǔ)文園地三》人教部編版課件
- 培訓(xùn)合格證書結(jié)業(yè)證書畢業(yè)證書模板
評(píng)論
0/150
提交評(píng)論