浙教版高中信息技術(shù)必修一數(shù)據(jù)與計(jì)算知識(shí)點(diǎn)大全_第1頁(yè)
浙教版高中信息技術(shù)必修一數(shù)據(jù)與計(jì)算知識(shí)點(diǎn)大全_第2頁(yè)
浙教版高中信息技術(shù)必修一數(shù)據(jù)與計(jì)算知識(shí)點(diǎn)大全_第3頁(yè)
浙教版高中信息技術(shù)必修一數(shù)據(jù)與計(jì)算知識(shí)點(diǎn)大全_第4頁(yè)
浙教版高中信息技術(shù)必修一數(shù)據(jù)與計(jì)算知識(shí)點(diǎn)大全_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

高中信息技術(shù)

必修一數(shù)據(jù)與計(jì)算

一、數(shù)據(jù)與信息

1.數(shù)據(jù)是對(duì)客觀(guān)事物的符號(hào)表示,在計(jì)算機(jī)科學(xué)中,數(shù)據(jù)是指所有能輸入到計(jì)算機(jī)并被計(jì)算機(jī)程

序處理的符號(hào)總稱(chēng),其表現(xiàn)形式可以是文字(數(shù)字)、圖形、圖像、音頻、視頻等。

2.信息的一般定義是數(shù)據(jù)所包含的意義。在信息論中,香農(nóng)給出的定義是用來(lái)消除隨機(jī)不確定的東西。

3.信息的特征:

(1)載體依附性:即信息必須依附于載體存在,不存在沒(méi)有載體的信息。

(2)時(shí)效性:信息(的內(nèi)容或價(jià)值)會(huì)隨著時(shí)間的推移發(fā)生變化。

(3)共享性:信息可以共享,且在傳播的過(guò)程中不發(fā)生損耗。

(4)可加工處理性、真?zhèn)涡裕盒畔⑹强梢赃M(jìn)行加工的,加工后的信息具有真?zhèn)涡浴?/p>

(5)價(jià)值性:信息的價(jià)值包括顯性?xún)r(jià)值和隱形價(jià)值兩個(gè)方面,同時(shí)價(jià)值的高低具有相對(duì)性。

二、數(shù)字化

1.、數(shù)字化的定義:將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的過(guò)程稱(chēng)為數(shù)字化。其中用到的主要設(shè)備是模數(shù)轉(zhuǎn)

換器(ADC)。

2.模擬量:模擬信號(hào)以連續(xù)變化的物理量存在,自然界中大多數(shù)信號(hào)都以模擬量形式存在。

3.數(shù)字量:數(shù)字信號(hào)在取值上是離散的、不連續(xù)的信號(hào)。

4.將模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)一般需要經(jīng)過(guò)采桂、量化與編碼三個(gè)步驟。

(1)采樣的參數(shù)是采樣頻率,單位是赫茲(Hz)。根據(jù)采樣定理:當(dāng)采樣頻率大于或等于被采樣

信號(hào)最高頻率的兩倍時(shí),得到的離散信號(hào)可以完整的保留原始信號(hào)的所有信息。

(2)量化指將信號(hào)的連續(xù)取值近似為宜限仝離散值的過(guò)程。量化主要參數(shù)是量化位數(shù),單位是

比特(bit);量化位數(shù)越多,劃分的越精細(xì),量化結(jié)果與實(shí)際數(shù)據(jù)也越接近。

三、數(shù)制

四、編碼

UltraEdit軟件字符內(nèi)碼

ASCII碼

通常用來(lái)對(duì)拉丁字母進(jìn)行編碼(半角符號(hào))。該編碼使用1個(gè)字節(jié)中的低7位編碼,由128個(gè)代碼

組成(每個(gè)字節(jié)的開(kāi)頭0~7,即00~7F)。1個(gè)ASCII碼字符儲(chǔ)存時(shí)占用1個(gè)字節(jié)的空間。

GB2312

通常用來(lái)對(duì)漢字進(jìn)行編碼(全角符號(hào))。1個(gè)GB2312編碼的字符存儲(chǔ)時(shí)占用2個(gè)字節(jié)的空間,每

個(gè)字節(jié)的開(kāi)頭均為8~F。

注:(1)"10"的內(nèi)碼是3130o(2)小寫(xiě)字母的編碼比對(duì)應(yīng)的大寫(xiě)字母大32D。如“A”的ASCII

碼為65,“a”的ASCII碼為97(均為十進(jìn)制),十六進(jìn)制相差20H。(3)i為69H,j為6AH。(4)

做題中關(guān)注點(diǎn)在字符的內(nèi)碼,內(nèi)碼的每個(gè)字節(jié)開(kāi)頭是0~7,還是8~F。

五、圖形編碼

1.條形碼:常見(jiàn)的條形碼是由反差率相差很大的黑條和白條排成的平行圖案。我國(guó)普遍采用的條

形碼是EAN13條形碼

2.二維碼:用某種特定的幾何圖形按一定規(guī)律在平面上分布黑白相間的圖形記錄數(shù)據(jù)符號(hào)信息。

相對(duì)條形碼,二維碼存儲(chǔ)信息量更大。

3.對(duì)條形碼和二維碼的識(shí)別過(guò)程中雖然用到了攝像頭,但信息是直接從圖形編碼中獲取的,所以

不涉及數(shù)字化的過(guò)程。

六、多媒體編碼

1.圖像存儲(chǔ)容量:總像素X顏色位深度(位)(單位:bit)

總像素=寬像素X高像素(單位:個(gè))

顏色位深度:用來(lái)表示每個(gè)像素顏色的二進(jìn)制數(shù)的長(zhǎng)度。如256種顏色的圖像,它的位深度為8位

(28=256)。RGB顏色模式圖像是24位。

數(shù)據(jù)存儲(chǔ)容量單位

(1)b:bit(比特),存放一位二進(jìn)制數(shù),是最小的儲(chǔ)存容量單位。

(2)B:Byte(字節(jié)),8bit為IByte,為一個(gè)基本單位

(3)常用儲(chǔ)存單位間的關(guān)系:

1Byte(B)=8bit;1KB=1024B;1MB=1024KB;1GB=1024MB;1TB=1O24GB;1PB=1O24GB

2.音頻的容量:采樣頻率*量化位數(shù)*聲道數(shù)*時(shí)長(zhǎng)(單位:bit)

3.視頻容量:幀圖像大小*總幀數(shù)(單位:bit)

七、數(shù)據(jù)保存與數(shù)據(jù)安全

1.計(jì)算機(jī)數(shù)據(jù)的管理已經(jīng)經(jīng)歷了人工管理、文件管理、數(shù)據(jù)庫(kù)管理三個(gè)階段。

2.結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)

(1)結(jié)構(gòu)化數(shù)據(jù):也成為行數(shù)據(jù),可以由二維表來(lái)進(jìn)行邏輯表達(dá)和實(shí)現(xiàn)的數(shù)據(jù)

(2)非結(jié)構(gòu)化數(shù)據(jù):數(shù)據(jù)結(jié)構(gòu)不規(guī)范,不完整,無(wú)法用二維表來(lái)進(jìn)行邏輯呈現(xiàn)。

(3)半結(jié)構(gòu)化數(shù)據(jù):介于結(jié)構(gòu)化和非結(jié)構(gòu)化之間,具有一定的結(jié)構(gòu)性

3.通過(guò)保護(hù)介質(zhì)實(shí)現(xiàn)數(shù)據(jù)安全的方法:磁盤(pán)陣列、數(shù)據(jù)備份、異地容災(zāi)

4.通過(guò)加密數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)安全的方法(保密性):凱撒加密、換位密碼、簡(jiǎn)單異或

5.通過(guò)數(shù)據(jù)校驗(yàn)保證數(shù)據(jù)完整的方法(完整性):MD5,CRC(奇偶校驗(yàn))、SHA1

八、數(shù)據(jù)處理

1.常見(jiàn)的數(shù)據(jù)問(wèn)題及其處理方法:

(1)數(shù)據(jù)缺失:數(shù)據(jù)集中普遍存在的問(wèn)題,一般可能是數(shù)據(jù)丟失或數(shù)據(jù)本身不完整

處理方法:忽略或采用平均值、中間值或概率統(tǒng)計(jì)值填充。

(2)數(shù)據(jù)重復(fù):在多數(shù)據(jù)源合并時(shí)經(jīng)常出現(xiàn),導(dǎo)致資源冗余和浪費(fèi)。

處理方法:進(jìn)一步審核的基礎(chǔ)上進(jìn)行合并或刪除。

(3)異常數(shù)據(jù):數(shù)據(jù)集中的某些數(shù)據(jù)不符合一般規(guī)律,例:健康系統(tǒng)顯示體溫到達(dá)50攝氏度。

處理方法:這些有可能是要去掉的噪聲,也有可能是含有重要信息的數(shù)據(jù)對(duì)象。

(4)邏輯錯(cuò)誤:屬性與實(shí)際不符,違背業(yè)務(wù)規(guī)則或邏輯,例:某人的生日為13月4。日

處理方法:對(duì)應(yīng)的字段需要設(shè)置取值范圍判斷。

(5)格式不一致:多出現(xiàn)在數(shù)據(jù)來(lái)源多樣的系統(tǒng)中

處理方法:將不同格式的數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一格式后再進(jìn)行處理。

2.常用的數(shù)據(jù)處理和統(tǒng)計(jì)分析工具有Excel、SPSS、SAS、MATLAB等軟件,也可以通過(guò)R>Python.

Java等計(jì)算機(jī)語(yǔ)言編程進(jìn)行數(shù)據(jù)處理。

3.常見(jiàn)的圖表類(lèi)型有:柱形圖、折線(xiàn)圖、餅圖、雷達(dá)圖、散點(diǎn)圖、氣泡圖等。

九、大數(shù)據(jù)

1.大數(shù)據(jù)的特征

(1)數(shù)據(jù)體量巨大(2)速度快:包括產(chǎn)生速度和處理速度。

(3)數(shù)據(jù)類(lèi)型多(4)價(jià)值密度低

2.大數(shù)據(jù)思維

(1)分析全體數(shù)據(jù)而不是抽樣數(shù)據(jù)(2)不再追求精確性,而是能夠接受數(shù)據(jù)的混雜性

(3)不一定強(qiáng)調(diào)因果性而是更加注重相關(guān)性。

十、大數(shù)據(jù)處理

1.大數(shù)據(jù)處理的基本思想:“分治思想”,即將一個(gè)復(fù)雜的問(wèn)題拆分成兩個(gè)或多個(gè)相同或相似的子

問(wèn)題,找到求這幾個(gè)問(wèn)題的解法之后,再找出合適的方法把它們組合成求整個(gè)問(wèn)題的解法。

2.大數(shù)據(jù)處理的數(shù)據(jù)類(lèi)型:

(1)靜態(tài)數(shù)據(jù):在處理時(shí)已經(jīng)收集完成、在計(jì)算時(shí)不會(huì)發(fā)生改變的數(shù)據(jù)

處理方法:批處理

(2)流數(shù)據(jù):不間斷地、持續(xù)地到達(dá)的實(shí)時(shí)數(shù)據(jù)。流數(shù)據(jù)的價(jià)值會(huì)隨著時(shí)間的流逝降低。

處理方法:流計(jì)算或?qū)崟r(shí)分析計(jì)算

(3)圖數(shù)據(jù):現(xiàn)實(shí)世界中以圖形式展現(xiàn)的數(shù)據(jù)。如社交網(wǎng)絡(luò)、道路交通等

處理方法:圖計(jì)算

3.批處理

Hadoop是一個(gè)可運(yùn)行于大規(guī)模計(jì)算機(jī)集群上的分布式系統(tǒng)基礎(chǔ)架構(gòu),適用于靜態(tài)數(shù)據(jù)的批量

計(jì)算。Hadoop計(jì)算平臺(tái)主要包括Common公共庫(kù)、分布式文件系統(tǒng)HDFS、分布式數(shù)據(jù)庫(kù)HBase、

分布式并行計(jì)算模型MapReduce等多個(gè)模塊。

(1)分布式文件系統(tǒng)(HDFS):將大規(guī)模海量數(shù)據(jù)以文件的形式、用多個(gè)副本保存在不同的存儲(chǔ)

節(jié)點(diǎn)中,并用分布式系統(tǒng)管理。HDFS是一個(gè)高度容錯(cuò)性的文件系統(tǒng),云盤(pán)、網(wǎng)盤(pán)的底層一般采用

HDFS實(shí)現(xiàn)。

(2)分布式數(shù)據(jù)庫(kù)(HBase):HBase建立在HDFS提供的底層存儲(chǔ)基礎(chǔ)上,采用基于列的存儲(chǔ)方

式,主要存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),具有良好的橫向擴(kuò)展能力。

(3)分布式并行計(jì)算模型(MapReduce):MapReduce是一種分布式并行編程模型,能夠進(jìn)行大規(guī)模的

并行計(jì)算。其核心處理思想是將任務(wù)分解并分發(fā)到多個(gè)節(jié)點(diǎn)上進(jìn)行并行處理,最后匯總輸出。

4.流計(jì)算

流計(jì)算主要用于處理流數(shù)據(jù),如大型購(gòu)物網(wǎng)絡(luò)的廣告推薦、社交網(wǎng)絡(luò)的個(gè)性化推薦等。處理流

數(shù)據(jù)的軟件主要有TwitterStorm、Heron>Yahoo!S4等。Storm和S4是目前較為流行的開(kāi)源分

布式實(shí)時(shí)計(jì)算系統(tǒng)。

5.圖計(jì)算

現(xiàn)實(shí)世界中的很多數(shù)據(jù)以圖的形式呈現(xiàn),或者是需要轉(zhuǎn)換為圖后才能分析。目前圖處理的軟件

主要分為兩類(lèi):圖數(shù)據(jù)庫(kù)和并行圖處理系統(tǒng)。

H■*一■、文本數(shù)據(jù)處理

1.文本數(shù)據(jù)處理主要應(yīng)用在搜索引擎、情報(bào)分析、自動(dòng)摘要、自動(dòng)校對(duì)、論文查重、文本分類(lèi)、

垃圾郵件過(guò)濾、機(jī)器翻譯、自動(dòng)應(yīng)答等方面。

2.典型的文本處理過(guò)程主要包括分詞、特征提取、數(shù)據(jù)分析、結(jié)果呈現(xiàn)等。

3.中文分詞方法

(1)基于詞典(字符匹配)的分詞方法:用詞典中的詞語(yǔ)進(jìn)行比對(duì)。案例:Python中的jieba庫(kù)

(2)基于統(tǒng)計(jì)的分詞方法:根據(jù)上下文相鄰字出現(xiàn)的頻率統(tǒng)計(jì)。

(3)基于規(guī)則的分詞方法:根據(jù)現(xiàn)有資料和規(guī)律學(xué)習(xí)實(shí)現(xiàn)分詞。

4.特征提取方法

(1)根據(jù)專(zhuān)家知識(shí)挑選有價(jià)值的特征。(約等于人工分析)

(2)用數(shù)學(xué)建模的方法構(gòu)造評(píng)估函數(shù)自動(dòng)選取特征。(目前大多采用)

5.結(jié)果呈現(xiàn)方式:

(1)標(biāo)簽云:用文字大小形式表現(xiàn)詞語(yǔ)的重要性

(2)文本情感分析:根據(jù)分析的粒度不同,可以分為詞語(yǔ)級(jí)、語(yǔ)句級(jí)、整篇文章級(jí)三類(lèi)。

十二、數(shù)據(jù)可視化

1.數(shù)據(jù)可視化是將數(shù)據(jù)以圖形、圖像等形式表示、直接呈現(xiàn)數(shù)據(jù)中蘊(yùn)含信息的處理過(guò)程。

2.可視化的作用:快速觀(guān)察與追蹤數(shù)據(jù)、實(shí)時(shí)分析數(shù)據(jù)、增強(qiáng)數(shù)據(jù)的解釋力與吸引力等。

3.可視化的基本方法

(1)有關(guān)時(shí)間趨勢(shì)的可視化:展示隨時(shí)間的推移而變化的數(shù)據(jù),可采用柱形圖、折線(xiàn)圖等。

(2)有關(guān)比例的可視化:展示各部分的大小及其占總體比例關(guān)系的數(shù)據(jù),可以采用餅圖、環(huán)形圖

(也稱(chēng)面包圈圖)等。

(3)有關(guān)關(guān)系的可視化:探究具有關(guān)聯(lián)性數(shù)據(jù)的分布關(guān)系,可以使用散點(diǎn)圖、氣泡圖等。

(4)有關(guān)差異的可視化:包含多種變量的對(duì)象與同類(lèi)之間的差異和聯(lián)系,可以采用雷達(dá)圖。

(5)有關(guān)空間關(guān)系的可視化:地理數(shù)據(jù)或者基于地理數(shù)據(jù)的分析結(jié)果可以運(yùn)用不同顏色或圖表直

接在地圖上進(jìn)行展示。

十三、大數(shù)據(jù)的典型應(yīng)用

1.大數(shù)據(jù)應(yīng)用領(lǐng)域:隨著大數(shù)據(jù)在各行業(yè)的應(yīng)用,數(shù)據(jù)成為核心資產(chǎn)。目前,大數(shù)據(jù)廣泛應(yīng)用于

金融、交通、環(huán)境、醫(yī)療、能源、農(nóng)業(yè)等領(lǐng)域,極大地促進(jìn)了各行業(yè)的發(fā)展。

2.大數(shù)據(jù)在電子商務(wù)方面的應(yīng)用;精準(zhǔn)營(yíng)銷(xiāo)基于用戶(hù)購(gòu)買(mǎi)行為挖掘用戶(hù)偏好;倉(cāng)儲(chǔ)管理實(shí)現(xiàn)商品

自動(dòng)補(bǔ)貨;供應(yīng)鏈管理實(shí)現(xiàn)最優(yōu)配送路徑;智能網(wǎng)站分析用戶(hù)后向用戶(hù)智能推薦商品。

十四、人工智能

1.人工智能的概念:人工智能是指以機(jī)器(計(jì)算機(jī))為載體,模仿、延伸和擴(kuò)展人類(lèi)智能、其與人

類(lèi)或其他動(dòng)物所呈現(xiàn)的生物智能有著重要區(qū)別。

2.人工智能的主要方法

(1)符號(hào)主義:認(rèn)為學(xué)習(xí)或者其他的智能特征原則上均可以被型號(hào)精確地描述,從而被機(jī)器仿真。

符號(hào)主義方法包含知識(shí)庫(kù)和推理引擎兩個(gè)部分。它先將所有知識(shí)以邏輯形式表達(dá),然后依靠推理引

擎,去驗(yàn)證命題或謂語(yǔ)正確與否,或者學(xué)習(xí)推導(dǎo)出新規(guī)則、新知識(shí)。

案例:"鴕鳥(niǎo)會(huì)飛"、專(zhuān)家系統(tǒng)

(2)聯(lián)結(jié)主義:通過(guò)模仿人類(lèi)大腦中神經(jīng)元之間的復(fù)雜交互來(lái)進(jìn)行認(rèn)知推理。多層神經(jīng)網(wǎng)絡(luò)(包

含輸入端、隱藏層和輸出端)是一種典型的深度學(xué)習(xí)模型。

(3)行為主義:認(rèn)為智能體可以在與環(huán)境的交互中不斷學(xué)習(xí),從而提升自己的智能水平。

案例:掃地機(jī)器人

3.人工智能的應(yīng)用分類(lèi)

(1)領(lǐng)域人工智能:依賴(lài)于領(lǐng)域知識(shí)和數(shù)據(jù)的人工智能。

(2)跨領(lǐng)域人工智能:智能系統(tǒng)從一個(gè)領(lǐng)域快速跨越到另一個(gè)領(lǐng)域。

(3)混合增強(qiáng)人工智能:多種智能體的混合形式,他將人的作用或人的認(rèn)知模型引入人工智能系

統(tǒng),形成“混合增強(qiáng)智能”的形態(tài)。需要注意的是,在智能疊加協(xié)調(diào)的回路中,人類(lèi)智能是智能回路

的總開(kāi)關(guān)。

4.人工智能對(duì)社會(huì)的影響

(1)人工智能改善人類(lèi)生活:智能家居、智慧城市、智能出行、智能購(gòu)物等。

(2)人工智能促進(jìn)經(jīng)濟(jì)發(fā)展:提供虛擬勞動(dòng)力、提高生產(chǎn)力、加快實(shí)體經(jīng)濟(jì)轉(zhuǎn)型升級(jí)。

(3)人工智能帶來(lái)的社會(huì)擔(dān)憂(yōu):人工智能取代人類(lèi)崗位,威脅人類(lèi)安全。

十五、基礎(chǔ)算法

一、算法概念

1.廣義的講,“算法”指的是解決問(wèn)題或完成任務(wù)的一系列步驟。在計(jì)算機(jī)科學(xué)領(lǐng)域內(nèi),“算法”

指的是計(jì)算機(jī)解決問(wèn)題的步驟,是為了解決問(wèn)題而需要讓計(jì)算機(jī)有序執(zhí)行的,無(wú)歧義的,有限步驟

的集合。

2.算法的特征:(1)有窮性:一個(gè)算法的處理步驟必須是有限的。

(2)可行性:每一步的操作與要求都是可行的,并且能夠在有限時(shí)間內(nèi)完成。

(3)確定性:每一步的執(zhí)行描述必須是明確的

(4)0個(gè)或多個(gè)輸入(5)1個(gè)或多個(gè)輸出

3.描述算法的方法:1自然語(yǔ)言描述;2流程圖描述;3偽代碼描述;4用程序設(shè)計(jì)語(yǔ)言描述。

4.編程解決問(wèn)題的一般過(guò)程:1抽象與建模;2設(shè)計(jì)算法;3編寫(xiě)程序;4調(diào)試運(yùn)行程序。

二、流程圖基本圖形及功能

三、解析算法和枚舉算法

#雞兔同籠問(wèn)題:今有雉兔同籠,上有三十五頭,下有九十四足,問(wèn)雉兔各幾何?

1.解析算法:用數(shù)學(xué)公式或解題步驟計(jì)算結(jié)果

importmath

r=float(input("請(qǐng)輸入圓的半徑:"))

ifr>0:

s=math.pi*r**2

c=2*math.pi*r

print(,圓的面積為:',s)

print「圓的周長(zhǎng)為:,,c)

else:

print("輸入的半徑無(wú)效!")

2,枚舉算法:按一定的順序一一列舉所有可能解

forchickeninrange(l>35):

rabbit=35chicken

if2*chicken+4*rabbit==94:

pr\Lnt('雞有',chicken,'只')

print('兔有',rabbit,'只’)

四、程序組成分析

1.注釋?zhuān)涸诖a中添加注釋?zhuān)梢詫?duì)代碼功能進(jìn)行解釋說(shuō)明。注釋在代碼運(yùn)行過(guò)程中不參與執(zhí)行。

Python中有兩種注釋方式:1.用,#,開(kāi)頭的單行注釋?zhuān)?.用三引號(hào)開(kāi)頭和結(jié)尾的多行注釋?zhuān)@

種注釋本質(zhì)是創(chuàng)建了一個(gè)多行字符串。

2.變量和賦值:

程序中有些數(shù)據(jù)是未知或是可變的,為了零活的使用這些數(shù)據(jù),可以使用變量進(jìn)行存儲(chǔ)。

示例第二行就創(chuàng)建了一個(gè)名為r的變量,用于存儲(chǔ)外部輸入圓的半徑。

(1)變量命名時(shí)需要遵循一些基本規(guī)則:

1變量名只能由字母(含漢字),數(shù)字和下劃線(xiàn)三種字符構(gòu)成;

2變量名不能以數(shù)字開(kāi)頭;

3變量名區(qū)分大小寫(xiě);

4變量名不能和保留字相同;

這里特別需要指出兩點(diǎn):

lPython變量名支持中文字符,但考慮兼容性一般不建議使用;

2Python共有35個(gè)保留字(見(jiàn)下圖),這些不可以被作為變量名使用。

(2)賦值語(yǔ)句:變量名=值;變量名=表達(dá)式;a,b=b,a

(3)賦值運(yùn)算符:"="、"+="、"="、"*="、“/=”、”%=”等

3.數(shù)據(jù)類(lèi)型:

Python共有四種基本數(shù)據(jù)類(lèi)型:整型、實(shí)型(浮點(diǎn)型)、字符串型和布爾型

(1)整數(shù)類(lèi)型(int):數(shù)學(xué)中的整數(shù)。例:10;

除此之外整數(shù)類(lèi)型可以用多種進(jìn)制表示,二進(jìn)制前綴0b或0B(10=0bl010);八進(jìn)制00或

00(10=0012);十六進(jìn)制前綴0X或0X(10=0xA)

(2)浮點(diǎn)類(lèi)型(float):數(shù)學(xué)中的實(shí)數(shù)。例10.0、1.0el

(3)字符串型(str):字符串可以用單引號(hào)、雙引號(hào)、三引號(hào)表示。

(4)布爾類(lèi)型(Bool):只有True和False兩個(gè)值。

4.運(yùn)算符和優(yōu)先級(jí)

運(yùn)算符功能和作用示例優(yōu)先級(jí)

()小括號(hào)略0(最高)

**幕運(yùn)算略1

*、/、//、%乘,除,整除,取余整除:不大于除法結(jié)果的最2

大整數(shù);取余:

x%y=xy(x//y)

+、加法、減法略3

<、>、<=、>=關(guān)系運(yùn)算符結(jié)果為布爾類(lèi)型4

==、!=關(guān)系運(yùn)算符結(jié)果為布爾類(lèi)型5

in、notin存在性判斷結(jié)果為布爾類(lèi)型6

not非結(jié)果為布爾類(lèi)型7

and與結(jié)果為布爾類(lèi)型8

or或結(jié)果為布爾類(lèi)型9

=賦值a,b二b,a10

5.表達(dá)式:變量、常量、運(yùn)算符按一定規(guī)則組合構(gòu)成的式子

(1)表達(dá)式中存在多種運(yùn)算符時(shí),按優(yōu)先級(jí)運(yùn)算,優(yōu)先級(jí)相同則從左到右

(2)Python中認(rèn)為“0”(數(shù)值(空字符串)和False等價(jià),非零數(shù)和非空字符串和True等價(jià)

(3)字符串比較時(shí),比較的是兩者的ASCII碼值,從左到右逐位比較。例"123"<"23"=True

(4)數(shù)值類(lèi)型的運(yùn)算結(jié)果保留更精確的值。例1+2.0=3.0

6.常用內(nèi)建函數(shù)

(l)input([prompt]):獲取輸入,函數(shù)的參數(shù)為輸出提示字符,返回值為字符串類(lèi)型

(2)int(objectbase]):將數(shù)值字符串轉(zhuǎn)為整型,base聲明進(jìn)制類(lèi)型,默認(rèn)base=10=返

回值為十進(jìn)制整藪類(lèi)型。例int("FF”,16)=255

(3)float(object):轉(zhuǎn)為實(shí)型

(4)abs(x):返回x的絕對(duì)值

(5)len(seq):返回列表或字符串的長(zhǎng)度,整數(shù)類(lèi)型

(6)str(x):將x轉(zhuǎn)為字符串類(lèi)型

(7)chr(x):x為ASCII碼值,返回x對(duì)應(yīng)的字符(字符串型)

(8)ord(x):x為字符串,返回x對(duì)應(yīng)的ACSII碼值,整數(shù)類(lèi)型

(9)round(x[,n]):對(duì)x四舍五入,保留n位小數(shù)。round(6.78,l)=6.8

(10)max()Jmin():返回列表中的最大值和最小值

(ll)print():輸出內(nèi)容到控制臺(tái)。當(dāng)參數(shù)只有一個(gè),會(huì)自動(dòng)將非字符類(lèi)型轉(zhuǎn)為字符類(lèi)型后輸出。

當(dāng)參數(shù)有多個(gè),可以用逗號(hào)連接后轉(zhuǎn)換為字符串輸出。例:print(10);print(10,“全”,10,“美”)

7.字符串類(lèi)型(str)

(1)字符串一旦創(chuàng)建就無(wú)法更改(2)字符串的索引方式有正負(fù)兩種

(3)字符串切片:字符串名[start:stop:step],結(jié)果含頭不含尾,step可以為負(fù)。

(4)常用字符串操作方法

s.upper()#全部小寫(xiě)轉(zhuǎn)大寫(xiě)

s.lower()#全部大寫(xiě)轉(zhuǎn)小寫(xiě)

s.split(sep)#根據(jù)sep分割字符串s

s.find(y)#返回y第一次出現(xiàn)在s中的索引值,若未出現(xiàn)則為1

s.replace(oldnew[^max])#將old用new替換,max為最大替換次數(shù)。

s.count(sub)#統(tǒng)計(jì)sub在s中出現(xiàn)的次數(shù)

s.join(iter)#用s對(duì)iter做分隔符

注意:由于字符串是不可變對(duì)象,所以以上方法不會(huì)改變s的值,只是將改變后的結(jié)果進(jìn)行返

回。

8.列表類(lèi)型(list)

(1)列表類(lèi)型為可變對(duì)象,列表中的每個(gè)元素?cái)?shù)據(jù)類(lèi)型可以相同也可以不同,甚至可以嵌套列表

類(lèi)型;

(2)列表的訪(fǎng)問(wèn)和切片和字符串基本相同;

(3)列表的常用操作方法:

s.append(x)#在列表的最后添加一個(gè)元素x

s.clear()#清空列表s中的所有元素

s.insert(i,x)#在s的第i位置增加元素x

s.pop(i)#將$第i位置的元素刪除

s.remove(x)#將列表中第一次出現(xiàn)的x字符刪除

s.sort(reverse)#對(duì)序列排序reverse=True(降序)/False(升序,默認(rèn))

s.reverse。#將$的內(nèi)容反轉(zhuǎn)

注意:以上方法會(huì)直接改變列表s的值。

9.字典類(lèi)型(die)

例:d={"姓名":"小明","年齡":13,"性別":"男"}

(1)字典類(lèi)型的特點(diǎn)是用花括號(hào)將各種元素放在一起,字典的每個(gè)元素都由兩部分組成:"鍵":"

值”,整個(gè)合起來(lái)叫“鍵值對(duì)”。

(2)字典的值只能通過(guò)“鍵”索引,因?yàn)樽值鋬?nèi)部元素是無(wú)序排列的,沒(méi)有索引值的概念。

(3)字典添加值、修改值、刪除值:

修改:d["性別"]="女"

添加:d["國(guó)籍"]="中國(guó)"

刪除:deld["性別”]

(4)可以用d.key()或d.value()單獨(dú)輸出字典的鍵和值

10.多分支結(jié)構(gòu)

if(判斷條件〉:

語(yǔ)句塊1

elif(判斷條件》:

語(yǔ)句塊2

else:

語(yǔ)句塊3

(1)Python用代碼縮進(jìn)表示代碼間的包含關(guān)系,同一級(jí)別代碼縮進(jìn)相同

(2)當(dāng)〈判斷條件>為T(mén)rue才執(zhí)行對(duì)應(yīng)分支語(yǔ)句塊

(3)else并非必須,且當(dāng)前面有條件(if)滿(mǎn)足后,后面的判斷(elif)會(huì)直接跳過(guò),不執(zhí)行。

#例:

if10>5:

print(10)

elif20>10:

print(20)

#運(yùn)行結(jié)果:10

.循環(huán)語(yǔ)句

for(循環(huán)變量〉in<循環(huán)對(duì)象〉:

語(yǔ)句塊

(l)for循環(huán)是有限次循環(huán),〈循環(huán)對(duì)象〉可以是字符串、列表,也可以是range。函數(shù)。

(2)range(start,stop,step)格式和字符串或列表切片類(lèi)似。

while(判斷語(yǔ)句〉:

語(yǔ)句塊

(3)while的判斷語(yǔ)句不當(dāng),可能會(huì)造成“無(wú)限循環(huán)”。當(dāng)〈判斷語(yǔ)句〉結(jié)果為T(mén)rue運(yùn)行循環(huán),

為False退出循環(huán)。

(4)break:結(jié)束并退出當(dāng)前層循環(huán)

(5)continue:結(jié)束本次循環(huán),進(jìn)入下一次循環(huán)

12.自定義函數(shù)

def〈函數(shù)名)(〈參數(shù)1>,(參數(shù)2>...):

語(yǔ)句塊

[return[返回值]]

(1)函數(shù)命名規(guī)則同變量命名規(guī)則(2)函數(shù)參數(shù)可以設(shè)置默認(rèn)值:〈參數(shù)3>=(默認(rèn)值〉

(3)return語(yǔ)句用于返還函數(shù)處理結(jié)果,并且結(jié)束函數(shù)運(yùn)行

(4)函數(shù)內(nèi)部變量為局部變量,當(dāng)需要使用全局變量時(shí)需要用global聲明

13.第三方庫(kù)的使用

(l)import(庫(kù)名〉(2)import(庫(kù)名〉as〈別名)

(3)from〈庫(kù)名〉import(函數(shù)名〉(4)from〈庫(kù)名>import*

注:常用的math和random模塊函數(shù)見(jiàn)下頁(yè)圖表。

14.利用Pandas模塊處理數(shù)據(jù)

(1)常用的Python擴(kuò)展模塊有numpy、scipy、pandas和matplotlib等,pandas模塊主要用于

數(shù)據(jù)的處理和分析。

(2)Python中引入pandas模塊的方法:importpandasaspd,pd是用戶(hù)為導(dǎo)入模塊取的別名。

(3)pandas提供了Series和DataFrame兩種數(shù)據(jù)結(jié)構(gòu)。

Series(系列):

①Series是一種一維的數(shù)據(jù)結(jié)構(gòu),包含一個(gè)數(shù)組的數(shù)據(jù)和一個(gè)與數(shù)據(jù)關(guān)聯(lián)的索引(index),索引

值默認(rèn)是從。起遞增的整數(shù),數(shù)據(jù)可以是不同類(lèi)型的元素。列表、字典等可以用來(lái)創(chuàng)建Series數(shù)

據(jù)結(jié)構(gòu)。

②Series對(duì)象屬性

屬性說(shuō)明

indexSeries的下標(biāo)索引,其值默認(rèn)是從0起遞增的整數(shù),也可以指定為字符串型

values存放Series值的一個(gè)數(shù)組

DataFrame(數(shù)據(jù)框):

①DataFrame是一種二維的數(shù)據(jù)結(jié)構(gòu),由1個(gè)索引列(index)和若干個(gè)數(shù)據(jù)列組成,每個(gè)數(shù)據(jù)列可

以是不同的類(lèi)型。DataFrame可以看作是共享同一個(gè)index的Series的集合。

創(chuàng)建DataFrame對(duì)象的方法很多,通常用一個(gè)相等長(zhǎng)度的列表或字典來(lái)創(chuàng)建。

②DataFrame常用對(duì)象屬性

屬性說(shuō)明

indexDataFrame的行索引

columns存放各列的標(biāo)題

Values存放二維數(shù)據(jù)的值

T行列轉(zhuǎn)置

(4)pandas模塊中的Series對(duì)象

①創(chuàng)建Series

importpandasaspd

sl=pd.Series([l,2,3,4])

s2=pd.Series([l,2,3,4],index=[〃a","b〃,"c","d"])

②Series對(duì)象向檢索和修改

輸出索引值為。的值:print(sl[0])

輸出索引值為"b"的值:print(s2[〃b〃])

輸出values小于3的值:print(sl[sl<3])

修改索引值為1的值為1。:sl[l]=10

(5)pandas模塊中DataFrame對(duì)象

創(chuàng)建DataFrame對(duì)象:

使用一個(gè)相等長(zhǎng)度的列表或字典創(chuàng)建DataFrame對(duì)象。

如x=pd.DataFrame({"xl":[1,2,3,4],"x2”:[5,6,7,8],"x3":[9,10,11,

12]))

導(dǎo)入二維數(shù)據(jù)文件創(chuàng)建DataFrame對(duì)象。

pd.read_excel(filename)#從Excel文件導(dǎo)入數(shù)據(jù)

pd.read_csv(filename)#從CSV文件導(dǎo)入數(shù)據(jù)

DataFrame對(duì)象導(dǎo)出到二維數(shù)據(jù)文件

df.to_excel(filename)#導(dǎo)出數(shù)據(jù)到Excel文件

df.to_csv(filename)#導(dǎo)出數(shù)據(jù)到CSV文件

②查看DataFrame對(duì)象:

通過(guò)index、columns、values屬性可以查看DataFrame對(duì)象的行索引、列索引及數(shù)據(jù),如:

df.index、df.columns、df.valueso

查看數(shù)據(jù)列:通過(guò)字典記法或?qū)傩詸z索DataFrame對(duì)象中的一列數(shù)據(jù),如:df['icT]或df.id。

查看數(shù)據(jù)行:通過(guò)head()、tail。返回DataFrame的前n行、后n行數(shù)據(jù);通過(guò)索引查看指定行,

如:df[2:5],返回df對(duì)象中第2、3、4行數(shù)據(jù);通過(guò)布爾型數(shù)據(jù)選取滿(mǎn)足條件的行。如:df[df["

age"]>=18]o

使用at□方法可以根據(jù)行標(biāo)簽和列標(biāo)簽選取單個(gè)值,如:df.at[0,"姓名"

③DataFrame對(duì)象中行、列的編輯

可以通過(guò)insert()、drop()、rename。、append。、set_value()等函數(shù)進(jìn)行DataFrame對(duì)象

中行、列的編輯。^一

(6)DataFrame常用函數(shù)

tom1?注

count0ira(N?N)R?XIAO/IIR認(rèn)為咄向drop()M*uh*0/l歐認(rèn)為

灣組的ojfil

7as

tlMlO和敘20/1默認(rèn)為Q曬append插入《聞》行)不2nl

mean()平均值

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論