版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
高中信息技術(shù)
必修一數(shù)據(jù)與計(jì)算
一、數(shù)據(jù)與信息
1.數(shù)據(jù)是對(duì)客觀(guān)事物的符號(hào)表示,在計(jì)算機(jī)科學(xué)中,數(shù)據(jù)是指所有能輸入到計(jì)算機(jī)并被計(jì)算機(jī)程
序處理的符號(hào)總稱(chēng),其表現(xiàn)形式可以是文字(數(shù)字)、圖形、圖像、音頻、視頻等。
2.信息的一般定義是數(shù)據(jù)所包含的意義。在信息論中,香農(nóng)給出的定義是用來(lái)消除隨機(jī)不確定的東西。
3.信息的特征:
(1)載體依附性:即信息必須依附于載體存在,不存在沒(méi)有載體的信息。
(2)時(shí)效性:信息(的內(nèi)容或價(jià)值)會(huì)隨著時(shí)間的推移發(fā)生變化。
(3)共享性:信息可以共享,且在傳播的過(guò)程中不發(fā)生損耗。
(4)可加工處理性、真?zhèn)涡裕盒畔⑹强梢赃M(jìn)行加工的,加工后的信息具有真?zhèn)涡浴?/p>
(5)價(jià)值性:信息的價(jià)值包括顯性?xún)r(jià)值和隱形價(jià)值兩個(gè)方面,同時(shí)價(jià)值的高低具有相對(duì)性。
二、數(shù)字化
1.、數(shù)字化的定義:將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的過(guò)程稱(chēng)為數(shù)字化。其中用到的主要設(shè)備是模數(shù)轉(zhuǎn)
換器(ADC)。
2.模擬量:模擬信號(hào)以連續(xù)變化的物理量存在,自然界中大多數(shù)信號(hào)都以模擬量形式存在。
3.數(shù)字量:數(shù)字信號(hào)在取值上是離散的、不連續(xù)的信號(hào)。
4.將模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)一般需要經(jīng)過(guò)采桂、量化與編碼三個(gè)步驟。
(1)采樣的參數(shù)是采樣頻率,單位是赫茲(Hz)。根據(jù)采樣定理:當(dāng)采樣頻率大于或等于被采樣
信號(hào)最高頻率的兩倍時(shí),得到的離散信號(hào)可以完整的保留原始信號(hào)的所有信息。
(2)量化指將信號(hào)的連續(xù)取值近似為宜限仝離散值的過(guò)程。量化主要參數(shù)是量化位數(shù),單位是
比特(bit);量化位數(shù)越多,劃分的越精細(xì),量化結(jié)果與實(shí)際數(shù)據(jù)也越接近。
三、數(shù)制
四、編碼
UltraEdit軟件字符內(nèi)碼
ASCII碼
通常用來(lái)對(duì)拉丁字母進(jìn)行編碼(半角符號(hào))。該編碼使用1個(gè)字節(jié)中的低7位編碼,由128個(gè)代碼
組成(每個(gè)字節(jié)的開(kāi)頭0~7,即00~7F)。1個(gè)ASCII碼字符儲(chǔ)存時(shí)占用1個(gè)字節(jié)的空間。
GB2312
通常用來(lái)對(duì)漢字進(jìn)行編碼(全角符號(hào))。1個(gè)GB2312編碼的字符存儲(chǔ)時(shí)占用2個(gè)字節(jié)的空間,每
個(gè)字節(jié)的開(kāi)頭均為8~F。
注:(1)"10"的內(nèi)碼是3130o(2)小寫(xiě)字母的編碼比對(duì)應(yīng)的大寫(xiě)字母大32D。如“A”的ASCII
碼為65,“a”的ASCII碼為97(均為十進(jìn)制),十六進(jìn)制相差20H。(3)i為69H,j為6AH。(4)
做題中關(guān)注點(diǎn)在字符的內(nèi)碼,內(nèi)碼的每個(gè)字節(jié)開(kāi)頭是0~7,還是8~F。
五、圖形編碼
1.條形碼:常見(jiàn)的條形碼是由反差率相差很大的黑條和白條排成的平行圖案。我國(guó)普遍采用的條
形碼是EAN13條形碼
2.二維碼:用某種特定的幾何圖形按一定規(guī)律在平面上分布黑白相間的圖形記錄數(shù)據(jù)符號(hào)信息。
相對(duì)條形碼,二維碼存儲(chǔ)信息量更大。
3.對(duì)條形碼和二維碼的識(shí)別過(guò)程中雖然用到了攝像頭,但信息是直接從圖形編碼中獲取的,所以
不涉及數(shù)字化的過(guò)程。
六、多媒體編碼
1.圖像存儲(chǔ)容量:總像素X顏色位深度(位)(單位:bit)
總像素=寬像素X高像素(單位:個(gè))
顏色位深度:用來(lái)表示每個(gè)像素顏色的二進(jìn)制數(shù)的長(zhǎng)度。如256種顏色的圖像,它的位深度為8位
(28=256)。RGB顏色模式圖像是24位。
數(shù)據(jù)存儲(chǔ)容量單位
(1)b:bit(比特),存放一位二進(jìn)制數(shù),是最小的儲(chǔ)存容量單位。
(2)B:Byte(字節(jié)),8bit為IByte,為一個(gè)基本單位
(3)常用儲(chǔ)存單位間的關(guān)系:
1Byte(B)=8bit;1KB=1024B;1MB=1024KB;1GB=1024MB;1TB=1O24GB;1PB=1O24GB
2.音頻的容量:采樣頻率*量化位數(shù)*聲道數(shù)*時(shí)長(zhǎng)(單位:bit)
3.視頻容量:幀圖像大小*總幀數(shù)(單位:bit)
七、數(shù)據(jù)保存與數(shù)據(jù)安全
1.計(jì)算機(jī)數(shù)據(jù)的管理已經(jīng)經(jīng)歷了人工管理、文件管理、數(shù)據(jù)庫(kù)管理三個(gè)階段。
2.結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)
(1)結(jié)構(gòu)化數(shù)據(jù):也成為行數(shù)據(jù),可以由二維表來(lái)進(jìn)行邏輯表達(dá)和實(shí)現(xiàn)的數(shù)據(jù)
(2)非結(jié)構(gòu)化數(shù)據(jù):數(shù)據(jù)結(jié)構(gòu)不規(guī)范,不完整,無(wú)法用二維表來(lái)進(jìn)行邏輯呈現(xiàn)。
(3)半結(jié)構(gòu)化數(shù)據(jù):介于結(jié)構(gòu)化和非結(jié)構(gòu)化之間,具有一定的結(jié)構(gòu)性
3.通過(guò)保護(hù)介質(zhì)實(shí)現(xiàn)數(shù)據(jù)安全的方法:磁盤(pán)陣列、數(shù)據(jù)備份、異地容災(zāi)
4.通過(guò)加密數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)安全的方法(保密性):凱撒加密、換位密碼、簡(jiǎn)單異或
5.通過(guò)數(shù)據(jù)校驗(yàn)保證數(shù)據(jù)完整的方法(完整性):MD5,CRC(奇偶校驗(yàn))、SHA1
八、數(shù)據(jù)處理
1.常見(jiàn)的數(shù)據(jù)問(wèn)題及其處理方法:
(1)數(shù)據(jù)缺失:數(shù)據(jù)集中普遍存在的問(wèn)題,一般可能是數(shù)據(jù)丟失或數(shù)據(jù)本身不完整
處理方法:忽略或采用平均值、中間值或概率統(tǒng)計(jì)值填充。
(2)數(shù)據(jù)重復(fù):在多數(shù)據(jù)源合并時(shí)經(jīng)常出現(xiàn),導(dǎo)致資源冗余和浪費(fèi)。
處理方法:進(jìn)一步審核的基礎(chǔ)上進(jìn)行合并或刪除。
(3)異常數(shù)據(jù):數(shù)據(jù)集中的某些數(shù)據(jù)不符合一般規(guī)律,例:健康系統(tǒng)顯示體溫到達(dá)50攝氏度。
處理方法:這些有可能是要去掉的噪聲,也有可能是含有重要信息的數(shù)據(jù)對(duì)象。
(4)邏輯錯(cuò)誤:屬性與實(shí)際不符,違背業(yè)務(wù)規(guī)則或邏輯,例:某人的生日為13月4。日
處理方法:對(duì)應(yīng)的字段需要設(shè)置取值范圍判斷。
(5)格式不一致:多出現(xiàn)在數(shù)據(jù)來(lái)源多樣的系統(tǒng)中
處理方法:將不同格式的數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一格式后再進(jìn)行處理。
2.常用的數(shù)據(jù)處理和統(tǒng)計(jì)分析工具有Excel、SPSS、SAS、MATLAB等軟件,也可以通過(guò)R>Python.
Java等計(jì)算機(jī)語(yǔ)言編程進(jìn)行數(shù)據(jù)處理。
3.常見(jiàn)的圖表類(lèi)型有:柱形圖、折線(xiàn)圖、餅圖、雷達(dá)圖、散點(diǎn)圖、氣泡圖等。
九、大數(shù)據(jù)
1.大數(shù)據(jù)的特征
(1)數(shù)據(jù)體量巨大(2)速度快:包括產(chǎn)生速度和處理速度。
(3)數(shù)據(jù)類(lèi)型多(4)價(jià)值密度低
2.大數(shù)據(jù)思維
(1)分析全體數(shù)據(jù)而不是抽樣數(shù)據(jù)(2)不再追求精確性,而是能夠接受數(shù)據(jù)的混雜性
(3)不一定強(qiáng)調(diào)因果性而是更加注重相關(guān)性。
十、大數(shù)據(jù)處理
1.大數(shù)據(jù)處理的基本思想:“分治思想”,即將一個(gè)復(fù)雜的問(wèn)題拆分成兩個(gè)或多個(gè)相同或相似的子
問(wèn)題,找到求這幾個(gè)問(wèn)題的解法之后,再找出合適的方法把它們組合成求整個(gè)問(wèn)題的解法。
2.大數(shù)據(jù)處理的數(shù)據(jù)類(lèi)型:
(1)靜態(tài)數(shù)據(jù):在處理時(shí)已經(jīng)收集完成、在計(jì)算時(shí)不會(huì)發(fā)生改變的數(shù)據(jù)
處理方法:批處理
(2)流數(shù)據(jù):不間斷地、持續(xù)地到達(dá)的實(shí)時(shí)數(shù)據(jù)。流數(shù)據(jù)的價(jià)值會(huì)隨著時(shí)間的流逝降低。
處理方法:流計(jì)算或?qū)崟r(shí)分析計(jì)算
(3)圖數(shù)據(jù):現(xiàn)實(shí)世界中以圖形式展現(xiàn)的數(shù)據(jù)。如社交網(wǎng)絡(luò)、道路交通等
處理方法:圖計(jì)算
3.批處理
Hadoop是一個(gè)可運(yùn)行于大規(guī)模計(jì)算機(jī)集群上的分布式系統(tǒng)基礎(chǔ)架構(gòu),適用于靜態(tài)數(shù)據(jù)的批量
計(jì)算。Hadoop計(jì)算平臺(tái)主要包括Common公共庫(kù)、分布式文件系統(tǒng)HDFS、分布式數(shù)據(jù)庫(kù)HBase、
分布式并行計(jì)算模型MapReduce等多個(gè)模塊。
(1)分布式文件系統(tǒng)(HDFS):將大規(guī)模海量數(shù)據(jù)以文件的形式、用多個(gè)副本保存在不同的存儲(chǔ)
節(jié)點(diǎn)中,并用分布式系統(tǒng)管理。HDFS是一個(gè)高度容錯(cuò)性的文件系統(tǒng),云盤(pán)、網(wǎng)盤(pán)的底層一般采用
HDFS實(shí)現(xiàn)。
(2)分布式數(shù)據(jù)庫(kù)(HBase):HBase建立在HDFS提供的底層存儲(chǔ)基礎(chǔ)上,采用基于列的存儲(chǔ)方
式,主要存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),具有良好的橫向擴(kuò)展能力。
(3)分布式并行計(jì)算模型(MapReduce):MapReduce是一種分布式并行編程模型,能夠進(jìn)行大規(guī)模的
并行計(jì)算。其核心處理思想是將任務(wù)分解并分發(fā)到多個(gè)節(jié)點(diǎn)上進(jìn)行并行處理,最后匯總輸出。
4.流計(jì)算
流計(jì)算主要用于處理流數(shù)據(jù),如大型購(gòu)物網(wǎng)絡(luò)的廣告推薦、社交網(wǎng)絡(luò)的個(gè)性化推薦等。處理流
數(shù)據(jù)的軟件主要有TwitterStorm、Heron>Yahoo!S4等。Storm和S4是目前較為流行的開(kāi)源分
布式實(shí)時(shí)計(jì)算系統(tǒng)。
5.圖計(jì)算
現(xiàn)實(shí)世界中的很多數(shù)據(jù)以圖的形式呈現(xiàn),或者是需要轉(zhuǎn)換為圖后才能分析。目前圖處理的軟件
主要分為兩類(lèi):圖數(shù)據(jù)庫(kù)和并行圖處理系統(tǒng)。
H■*一■、文本數(shù)據(jù)處理
1.文本數(shù)據(jù)處理主要應(yīng)用在搜索引擎、情報(bào)分析、自動(dòng)摘要、自動(dòng)校對(duì)、論文查重、文本分類(lèi)、
垃圾郵件過(guò)濾、機(jī)器翻譯、自動(dòng)應(yīng)答等方面。
2.典型的文本處理過(guò)程主要包括分詞、特征提取、數(shù)據(jù)分析、結(jié)果呈現(xiàn)等。
3.中文分詞方法
(1)基于詞典(字符匹配)的分詞方法:用詞典中的詞語(yǔ)進(jìn)行比對(duì)。案例:Python中的jieba庫(kù)
(2)基于統(tǒng)計(jì)的分詞方法:根據(jù)上下文相鄰字出現(xiàn)的頻率統(tǒng)計(jì)。
(3)基于規(guī)則的分詞方法:根據(jù)現(xiàn)有資料和規(guī)律學(xué)習(xí)實(shí)現(xiàn)分詞。
4.特征提取方法
(1)根據(jù)專(zhuān)家知識(shí)挑選有價(jià)值的特征。(約等于人工分析)
(2)用數(shù)學(xué)建模的方法構(gòu)造評(píng)估函數(shù)自動(dòng)選取特征。(目前大多采用)
5.結(jié)果呈現(xiàn)方式:
(1)標(biāo)簽云:用文字大小形式表現(xiàn)詞語(yǔ)的重要性
(2)文本情感分析:根據(jù)分析的粒度不同,可以分為詞語(yǔ)級(jí)、語(yǔ)句級(jí)、整篇文章級(jí)三類(lèi)。
十二、數(shù)據(jù)可視化
1.數(shù)據(jù)可視化是將數(shù)據(jù)以圖形、圖像等形式表示、直接呈現(xiàn)數(shù)據(jù)中蘊(yùn)含信息的處理過(guò)程。
2.可視化的作用:快速觀(guān)察與追蹤數(shù)據(jù)、實(shí)時(shí)分析數(shù)據(jù)、增強(qiáng)數(shù)據(jù)的解釋力與吸引力等。
3.可視化的基本方法
(1)有關(guān)時(shí)間趨勢(shì)的可視化:展示隨時(shí)間的推移而變化的數(shù)據(jù),可采用柱形圖、折線(xiàn)圖等。
(2)有關(guān)比例的可視化:展示各部分的大小及其占總體比例關(guān)系的數(shù)據(jù),可以采用餅圖、環(huán)形圖
(也稱(chēng)面包圈圖)等。
(3)有關(guān)關(guān)系的可視化:探究具有關(guān)聯(lián)性數(shù)據(jù)的分布關(guān)系,可以使用散點(diǎn)圖、氣泡圖等。
(4)有關(guān)差異的可視化:包含多種變量的對(duì)象與同類(lèi)之間的差異和聯(lián)系,可以采用雷達(dá)圖。
(5)有關(guān)空間關(guān)系的可視化:地理數(shù)據(jù)或者基于地理數(shù)據(jù)的分析結(jié)果可以運(yùn)用不同顏色或圖表直
接在地圖上進(jìn)行展示。
十三、大數(shù)據(jù)的典型應(yīng)用
1.大數(shù)據(jù)應(yīng)用領(lǐng)域:隨著大數(shù)據(jù)在各行業(yè)的應(yīng)用,數(shù)據(jù)成為核心資產(chǎn)。目前,大數(shù)據(jù)廣泛應(yīng)用于
金融、交通、環(huán)境、醫(yī)療、能源、農(nóng)業(yè)等領(lǐng)域,極大地促進(jìn)了各行業(yè)的發(fā)展。
2.大數(shù)據(jù)在電子商務(wù)方面的應(yīng)用;精準(zhǔn)營(yíng)銷(xiāo)基于用戶(hù)購(gòu)買(mǎi)行為挖掘用戶(hù)偏好;倉(cāng)儲(chǔ)管理實(shí)現(xiàn)商品
自動(dòng)補(bǔ)貨;供應(yīng)鏈管理實(shí)現(xiàn)最優(yōu)配送路徑;智能網(wǎng)站分析用戶(hù)后向用戶(hù)智能推薦商品。
十四、人工智能
1.人工智能的概念:人工智能是指以機(jī)器(計(jì)算機(jī))為載體,模仿、延伸和擴(kuò)展人類(lèi)智能、其與人
類(lèi)或其他動(dòng)物所呈現(xiàn)的生物智能有著重要區(qū)別。
2.人工智能的主要方法
(1)符號(hào)主義:認(rèn)為學(xué)習(xí)或者其他的智能特征原則上均可以被型號(hào)精確地描述,從而被機(jī)器仿真。
符號(hào)主義方法包含知識(shí)庫(kù)和推理引擎兩個(gè)部分。它先將所有知識(shí)以邏輯形式表達(dá),然后依靠推理引
擎,去驗(yàn)證命題或謂語(yǔ)正確與否,或者學(xué)習(xí)推導(dǎo)出新規(guī)則、新知識(shí)。
案例:"鴕鳥(niǎo)會(huì)飛"、專(zhuān)家系統(tǒng)
(2)聯(lián)結(jié)主義:通過(guò)模仿人類(lèi)大腦中神經(jīng)元之間的復(fù)雜交互來(lái)進(jìn)行認(rèn)知推理。多層神經(jīng)網(wǎng)絡(luò)(包
含輸入端、隱藏層和輸出端)是一種典型的深度學(xué)習(xí)模型。
(3)行為主義:認(rèn)為智能體可以在與環(huán)境的交互中不斷學(xué)習(xí),從而提升自己的智能水平。
案例:掃地機(jī)器人
3.人工智能的應(yīng)用分類(lèi)
(1)領(lǐng)域人工智能:依賴(lài)于領(lǐng)域知識(shí)和數(shù)據(jù)的人工智能。
(2)跨領(lǐng)域人工智能:智能系統(tǒng)從一個(gè)領(lǐng)域快速跨越到另一個(gè)領(lǐng)域。
(3)混合增強(qiáng)人工智能:多種智能體的混合形式,他將人的作用或人的認(rèn)知模型引入人工智能系
統(tǒng),形成“混合增強(qiáng)智能”的形態(tài)。需要注意的是,在智能疊加協(xié)調(diào)的回路中,人類(lèi)智能是智能回路
的總開(kāi)關(guān)。
4.人工智能對(duì)社會(huì)的影響
(1)人工智能改善人類(lèi)生活:智能家居、智慧城市、智能出行、智能購(gòu)物等。
(2)人工智能促進(jìn)經(jīng)濟(jì)發(fā)展:提供虛擬勞動(dòng)力、提高生產(chǎn)力、加快實(shí)體經(jīng)濟(jì)轉(zhuǎn)型升級(jí)。
(3)人工智能帶來(lái)的社會(huì)擔(dān)憂(yōu):人工智能取代人類(lèi)崗位,威脅人類(lèi)安全。
十五、基礎(chǔ)算法
一、算法概念
1.廣義的講,“算法”指的是解決問(wèn)題或完成任務(wù)的一系列步驟。在計(jì)算機(jī)科學(xué)領(lǐng)域內(nèi),“算法”
指的是計(jì)算機(jī)解決問(wèn)題的步驟,是為了解決問(wèn)題而需要讓計(jì)算機(jī)有序執(zhí)行的,無(wú)歧義的,有限步驟
的集合。
2.算法的特征:(1)有窮性:一個(gè)算法的處理步驟必須是有限的。
(2)可行性:每一步的操作與要求都是可行的,并且能夠在有限時(shí)間內(nèi)完成。
(3)確定性:每一步的執(zhí)行描述必須是明確的
(4)0個(gè)或多個(gè)輸入(5)1個(gè)或多個(gè)輸出
3.描述算法的方法:1自然語(yǔ)言描述;2流程圖描述;3偽代碼描述;4用程序設(shè)計(jì)語(yǔ)言描述。
4.編程解決問(wèn)題的一般過(guò)程:1抽象與建模;2設(shè)計(jì)算法;3編寫(xiě)程序;4調(diào)試運(yùn)行程序。
二、流程圖基本圖形及功能
三、解析算法和枚舉算法
#雞兔同籠問(wèn)題:今有雉兔同籠,上有三十五頭,下有九十四足,問(wèn)雉兔各幾何?
1.解析算法:用數(shù)學(xué)公式或解題步驟計(jì)算結(jié)果
importmath
r=float(input("請(qǐng)輸入圓的半徑:"))
ifr>0:
s=math.pi*r**2
c=2*math.pi*r
print(,圓的面積為:',s)
print「圓的周長(zhǎng)為:,,c)
else:
print("輸入的半徑無(wú)效!")
2,枚舉算法:按一定的順序一一列舉所有可能解
forchickeninrange(l>35):
rabbit=35chicken
if2*chicken+4*rabbit==94:
pr\Lnt('雞有',chicken,'只')
print('兔有',rabbit,'只’)
四、程序組成分析
1.注釋?zhuān)涸诖a中添加注釋?zhuān)梢詫?duì)代碼功能進(jìn)行解釋說(shuō)明。注釋在代碼運(yùn)行過(guò)程中不參與執(zhí)行。
Python中有兩種注釋方式:1.用,#,開(kāi)頭的單行注釋?zhuān)?.用三引號(hào)開(kāi)頭和結(jié)尾的多行注釋?zhuān)@
種注釋本質(zhì)是創(chuàng)建了一個(gè)多行字符串。
2.變量和賦值:
程序中有些數(shù)據(jù)是未知或是可變的,為了零活的使用這些數(shù)據(jù),可以使用變量進(jìn)行存儲(chǔ)。
示例第二行就創(chuàng)建了一個(gè)名為r的變量,用于存儲(chǔ)外部輸入圓的半徑。
(1)變量命名時(shí)需要遵循一些基本規(guī)則:
1變量名只能由字母(含漢字),數(shù)字和下劃線(xiàn)三種字符構(gòu)成;
2變量名不能以數(shù)字開(kāi)頭;
3變量名區(qū)分大小寫(xiě);
4變量名不能和保留字相同;
這里特別需要指出兩點(diǎn):
lPython變量名支持中文字符,但考慮兼容性一般不建議使用;
2Python共有35個(gè)保留字(見(jiàn)下圖),這些不可以被作為變量名使用。
(2)賦值語(yǔ)句:變量名=值;變量名=表達(dá)式;a,b=b,a
(3)賦值運(yùn)算符:"="、"+="、"="、"*="、“/=”、”%=”等
3.數(shù)據(jù)類(lèi)型:
Python共有四種基本數(shù)據(jù)類(lèi)型:整型、實(shí)型(浮點(diǎn)型)、字符串型和布爾型
(1)整數(shù)類(lèi)型(int):數(shù)學(xué)中的整數(shù)。例:10;
除此之外整數(shù)類(lèi)型可以用多種進(jìn)制表示,二進(jìn)制前綴0b或0B(10=0bl010);八進(jìn)制00或
00(10=0012);十六進(jìn)制前綴0X或0X(10=0xA)
(2)浮點(diǎn)類(lèi)型(float):數(shù)學(xué)中的實(shí)數(shù)。例10.0、1.0el
(3)字符串型(str):字符串可以用單引號(hào)、雙引號(hào)、三引號(hào)表示。
(4)布爾類(lèi)型(Bool):只有True和False兩個(gè)值。
4.運(yùn)算符和優(yōu)先級(jí)
運(yùn)算符功能和作用示例優(yōu)先級(jí)
()小括號(hào)略0(最高)
**幕運(yùn)算略1
*、/、//、%乘,除,整除,取余整除:不大于除法結(jié)果的最2
大整數(shù);取余:
x%y=xy(x//y)
+、加法、減法略3
<、>、<=、>=關(guān)系運(yùn)算符結(jié)果為布爾類(lèi)型4
==、!=關(guān)系運(yùn)算符結(jié)果為布爾類(lèi)型5
in、notin存在性判斷結(jié)果為布爾類(lèi)型6
not非結(jié)果為布爾類(lèi)型7
and與結(jié)果為布爾類(lèi)型8
or或結(jié)果為布爾類(lèi)型9
=賦值a,b二b,a10
5.表達(dá)式:變量、常量、運(yùn)算符按一定規(guī)則組合構(gòu)成的式子
(1)表達(dá)式中存在多種運(yùn)算符時(shí),按優(yōu)先級(jí)運(yùn)算,優(yōu)先級(jí)相同則從左到右
(2)Python中認(rèn)為“0”(數(shù)值(空字符串)和False等價(jià),非零數(shù)和非空字符串和True等價(jià)
(3)字符串比較時(shí),比較的是兩者的ASCII碼值,從左到右逐位比較。例"123"<"23"=True
(4)數(shù)值類(lèi)型的運(yùn)算結(jié)果保留更精確的值。例1+2.0=3.0
6.常用內(nèi)建函數(shù)
(l)input([prompt]):獲取輸入,函數(shù)的參數(shù)為輸出提示字符,返回值為字符串類(lèi)型
(2)int(objectbase]):將數(shù)值字符串轉(zhuǎn)為整型,base聲明進(jìn)制類(lèi)型,默認(rèn)base=10=返
回值為十進(jìn)制整藪類(lèi)型。例int("FF”,16)=255
(3)float(object):轉(zhuǎn)為實(shí)型
(4)abs(x):返回x的絕對(duì)值
(5)len(seq):返回列表或字符串的長(zhǎng)度,整數(shù)類(lèi)型
(6)str(x):將x轉(zhuǎn)為字符串類(lèi)型
(7)chr(x):x為ASCII碼值,返回x對(duì)應(yīng)的字符(字符串型)
(8)ord(x):x為字符串,返回x對(duì)應(yīng)的ACSII碼值,整數(shù)類(lèi)型
(9)round(x[,n]):對(duì)x四舍五入,保留n位小數(shù)。round(6.78,l)=6.8
(10)max()Jmin():返回列表中的最大值和最小值
(ll)print():輸出內(nèi)容到控制臺(tái)。當(dāng)參數(shù)只有一個(gè),會(huì)自動(dòng)將非字符類(lèi)型轉(zhuǎn)為字符類(lèi)型后輸出。
當(dāng)參數(shù)有多個(gè),可以用逗號(hào)連接后轉(zhuǎn)換為字符串輸出。例:print(10);print(10,“全”,10,“美”)
7.字符串類(lèi)型(str)
(1)字符串一旦創(chuàng)建就無(wú)法更改(2)字符串的索引方式有正負(fù)兩種
(3)字符串切片:字符串名[start:stop:step],結(jié)果含頭不含尾,step可以為負(fù)。
(4)常用字符串操作方法
s.upper()#全部小寫(xiě)轉(zhuǎn)大寫(xiě)
s.lower()#全部大寫(xiě)轉(zhuǎn)小寫(xiě)
s.split(sep)#根據(jù)sep分割字符串s
s.find(y)#返回y第一次出現(xiàn)在s中的索引值,若未出現(xiàn)則為1
s.replace(oldnew[^max])#將old用new替換,max為最大替換次數(shù)。
s.count(sub)#統(tǒng)計(jì)sub在s中出現(xiàn)的次數(shù)
s.join(iter)#用s對(duì)iter做分隔符
注意:由于字符串是不可變對(duì)象,所以以上方法不會(huì)改變s的值,只是將改變后的結(jié)果進(jìn)行返
回。
8.列表類(lèi)型(list)
(1)列表類(lèi)型為可變對(duì)象,列表中的每個(gè)元素?cái)?shù)據(jù)類(lèi)型可以相同也可以不同,甚至可以嵌套列表
類(lèi)型;
(2)列表的訪(fǎng)問(wèn)和切片和字符串基本相同;
(3)列表的常用操作方法:
s.append(x)#在列表的最后添加一個(gè)元素x
s.clear()#清空列表s中的所有元素
s.insert(i,x)#在s的第i位置增加元素x
s.pop(i)#將$第i位置的元素刪除
s.remove(x)#將列表中第一次出現(xiàn)的x字符刪除
s.sort(reverse)#對(duì)序列排序reverse=True(降序)/False(升序,默認(rèn))
s.reverse。#將$的內(nèi)容反轉(zhuǎn)
注意:以上方法會(huì)直接改變列表s的值。
9.字典類(lèi)型(die)
例:d={"姓名":"小明","年齡":13,"性別":"男"}
(1)字典類(lèi)型的特點(diǎn)是用花括號(hào)將各種元素放在一起,字典的每個(gè)元素都由兩部分組成:"鍵":"
值”,整個(gè)合起來(lái)叫“鍵值對(duì)”。
(2)字典的值只能通過(guò)“鍵”索引,因?yàn)樽值鋬?nèi)部元素是無(wú)序排列的,沒(méi)有索引值的概念。
(3)字典添加值、修改值、刪除值:
修改:d["性別"]="女"
添加:d["國(guó)籍"]="中國(guó)"
刪除:deld["性別”]
(4)可以用d.key()或d.value()單獨(dú)輸出字典的鍵和值
10.多分支結(jié)構(gòu)
if(判斷條件〉:
語(yǔ)句塊1
elif(判斷條件》:
語(yǔ)句塊2
else:
語(yǔ)句塊3
(1)Python用代碼縮進(jìn)表示代碼間的包含關(guān)系,同一級(jí)別代碼縮進(jìn)相同
(2)當(dāng)〈判斷條件>為T(mén)rue才執(zhí)行對(duì)應(yīng)分支語(yǔ)句塊
(3)else并非必須,且當(dāng)前面有條件(if)滿(mǎn)足后,后面的判斷(elif)會(huì)直接跳過(guò),不執(zhí)行。
#例:
if10>5:
print(10)
elif20>10:
print(20)
#運(yùn)行結(jié)果:10
.循環(huán)語(yǔ)句
for(循環(huán)變量〉in<循環(huán)對(duì)象〉:
語(yǔ)句塊
(l)for循環(huán)是有限次循環(huán),〈循環(huán)對(duì)象〉可以是字符串、列表,也可以是range。函數(shù)。
(2)range(start,stop,step)格式和字符串或列表切片類(lèi)似。
while(判斷語(yǔ)句〉:
語(yǔ)句塊
(3)while的判斷語(yǔ)句不當(dāng),可能會(huì)造成“無(wú)限循環(huán)”。當(dāng)〈判斷語(yǔ)句〉結(jié)果為T(mén)rue運(yùn)行循環(huán),
為False退出循環(huán)。
(4)break:結(jié)束并退出當(dāng)前層循環(huán)
(5)continue:結(jié)束本次循環(huán),進(jìn)入下一次循環(huán)
12.自定義函數(shù)
def〈函數(shù)名)(〈參數(shù)1>,(參數(shù)2>...):
語(yǔ)句塊
[return[返回值]]
(1)函數(shù)命名規(guī)則同變量命名規(guī)則(2)函數(shù)參數(shù)可以設(shè)置默認(rèn)值:〈參數(shù)3>=(默認(rèn)值〉
(3)return語(yǔ)句用于返還函數(shù)處理結(jié)果,并且結(jié)束函數(shù)運(yùn)行
(4)函數(shù)內(nèi)部變量為局部變量,當(dāng)需要使用全局變量時(shí)需要用global聲明
13.第三方庫(kù)的使用
(l)import(庫(kù)名〉(2)import(庫(kù)名〉as〈別名)
(3)from〈庫(kù)名〉import(函數(shù)名〉(4)from〈庫(kù)名>import*
注:常用的math和random模塊函數(shù)見(jiàn)下頁(yè)圖表。
14.利用Pandas模塊處理數(shù)據(jù)
(1)常用的Python擴(kuò)展模塊有numpy、scipy、pandas和matplotlib等,pandas模塊主要用于
數(shù)據(jù)的處理和分析。
(2)Python中引入pandas模塊的方法:importpandasaspd,pd是用戶(hù)為導(dǎo)入模塊取的別名。
(3)pandas提供了Series和DataFrame兩種數(shù)據(jù)結(jié)構(gòu)。
Series(系列):
①Series是一種一維的數(shù)據(jù)結(jié)構(gòu),包含一個(gè)數(shù)組的數(shù)據(jù)和一個(gè)與數(shù)據(jù)關(guān)聯(lián)的索引(index),索引
值默認(rèn)是從。起遞增的整數(shù),數(shù)據(jù)可以是不同類(lèi)型的元素。列表、字典等可以用來(lái)創(chuàng)建Series數(shù)
據(jù)結(jié)構(gòu)。
②Series對(duì)象屬性
屬性說(shuō)明
indexSeries的下標(biāo)索引,其值默認(rèn)是從0起遞增的整數(shù),也可以指定為字符串型
values存放Series值的一個(gè)數(shù)組
DataFrame(數(shù)據(jù)框):
①DataFrame是一種二維的數(shù)據(jù)結(jié)構(gòu),由1個(gè)索引列(index)和若干個(gè)數(shù)據(jù)列組成,每個(gè)數(shù)據(jù)列可
以是不同的類(lèi)型。DataFrame可以看作是共享同一個(gè)index的Series的集合。
創(chuàng)建DataFrame對(duì)象的方法很多,通常用一個(gè)相等長(zhǎng)度的列表或字典來(lái)創(chuàng)建。
②DataFrame常用對(duì)象屬性
屬性說(shuō)明
indexDataFrame的行索引
columns存放各列的標(biāo)題
Values存放二維數(shù)據(jù)的值
T行列轉(zhuǎn)置
(4)pandas模塊中的Series對(duì)象
①創(chuàng)建Series
importpandasaspd
sl=pd.Series([l,2,3,4])
s2=pd.Series([l,2,3,4],index=[〃a","b〃,"c","d"])
②Series對(duì)象向檢索和修改
輸出索引值為。的值:print(sl[0])
輸出索引值為"b"的值:print(s2[〃b〃])
輸出values小于3的值:print(sl[sl<3])
修改索引值為1的值為1。:sl[l]=10
(5)pandas模塊中DataFrame對(duì)象
創(chuàng)建DataFrame對(duì)象:
使用一個(gè)相等長(zhǎng)度的列表或字典創(chuàng)建DataFrame對(duì)象。
如x=pd.DataFrame({"xl":[1,2,3,4],"x2”:[5,6,7,8],"x3":[9,10,11,
12]))
導(dǎo)入二維數(shù)據(jù)文件創(chuàng)建DataFrame對(duì)象。
pd.read_excel(filename)#從Excel文件導(dǎo)入數(shù)據(jù)
pd.read_csv(filename)#從CSV文件導(dǎo)入數(shù)據(jù)
DataFrame對(duì)象導(dǎo)出到二維數(shù)據(jù)文件
df.to_excel(filename)#導(dǎo)出數(shù)據(jù)到Excel文件
df.to_csv(filename)#導(dǎo)出數(shù)據(jù)到CSV文件
②查看DataFrame對(duì)象:
通過(guò)index、columns、values屬性可以查看DataFrame對(duì)象的行索引、列索引及數(shù)據(jù),如:
df.index、df.columns、df.valueso
查看數(shù)據(jù)列:通過(guò)字典記法或?qū)傩詸z索DataFrame對(duì)象中的一列數(shù)據(jù),如:df['icT]或df.id。
查看數(shù)據(jù)行:通過(guò)head()、tail。返回DataFrame的前n行、后n行數(shù)據(jù);通過(guò)索引查看指定行,
如:df[2:5],返回df對(duì)象中第2、3、4行數(shù)據(jù);通過(guò)布爾型數(shù)據(jù)選取滿(mǎn)足條件的行。如:df[df["
age"]>=18]o
使用at□方法可以根據(jù)行標(biāo)簽和列標(biāo)簽選取單個(gè)值,如:df.at[0,"姓名"
③DataFrame對(duì)象中行、列的編輯
可以通過(guò)insert()、drop()、rename。、append。、set_value()等函數(shù)進(jìn)行DataFrame對(duì)象
中行、列的編輯。^一
(6)DataFrame常用函數(shù)
tom1?注
count0ira(N?N)R?XIAO/IIR認(rèn)為咄向drop()M*uh*0/l歐認(rèn)為
灣組的ojfil
7as
tlMlO和敘20/1默認(rèn)為Q曬append插入《聞》行)不2nl
mean()平均值
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年黑龍江貨車(chē)資格從業(yè)資格證考試答案
- 2025年德州道路貨運(yùn)駕駛員從業(yè)資格考試題庫(kù)
- 博物館建設(shè)設(shè)備樁機(jī)租賃協(xié)議
- 招投標(biāo)法規(guī)在大數(shù)據(jù)行業(yè)的實(shí)施
- 南寧市房屋租賃合同:電競(jìng)館租賃
- 燃?xì)夤緭岆U(xiǎn)車(chē)輛管理
- 保安隊(duì)長(zhǎng)聘用合同樣本模板
- 塑料制品危險(xiǎn)品儲(chǔ)存指南
- 藝術(shù)品交易服務(wù)合同簽訂注意事項(xiàng)
- 古建筑磚石修復(fù)合同
- 2024年南平實(shí)業(yè)集團(tuán)有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 咖啡學(xué)概論智慧樹(shù)知到期末考試答案2024年
- (高清版)DZT 0217-2020 石油天然氣儲(chǔ)量估算規(guī)范
- 深圳港口介紹
- 2024年執(zhí)業(yè)醫(yī)師考試-中醫(yī)執(zhí)業(yè)助理醫(yī)師筆試歷年真題薈萃含答案
- 2024年工貿(mào)行業(yè)安全知識(shí)考試題庫(kù)500題(含答案)
- 2024版國(guó)開(kāi)電大法學(xué)本科《合同法》歷年期末考試案例分析題題庫(kù)
- 產(chǎn)婦產(chǎn)后心理障礙的原因分析及心理護(hù)理措施
- T-SHNA 0004-2023 有創(chuàng)動(dòng)脈血壓監(jiān)測(cè)方法
- 提高學(xué)生學(xué)習(xí)策略的教學(xué)方法
- 客服招聘策劃方案
評(píng)論
0/150
提交評(píng)論