《各平臺(tái)數(shù)據(jù)采集及方法》課件-天眼查企業(yè)信息采集_第1頁
《各平臺(tái)數(shù)據(jù)采集及方法》課件-天眼查企業(yè)信息采集_第2頁
《各平臺(tái)數(shù)據(jù)采集及方法》課件-天眼查企業(yè)信息采集_第3頁
《各平臺(tái)數(shù)據(jù)采集及方法》課件-天眼查企業(yè)信息采集_第4頁
《各平臺(tái)數(shù)據(jù)采集及方法》課件-天眼查企業(yè)信息采集_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

天眼查企業(yè)

信息采集企業(yè)信息采集采集場(chǎng)景在天眼查搜索頁面選擇條件查詢,得到條件查詢后的結(jié)果列表頁。實(shí)例網(wǎng)址,是選擇了2個(gè)查詢條件(省份地區(qū):北京市;機(jī)構(gòu)類型:企業(yè))后得到的列表頁。然后點(diǎn)擊企業(yè)鏈接進(jìn)入詳情頁,采集企業(yè)詳情頁的數(shù)據(jù)。采集字段公司名稱、公司網(wǎng)址、公司簡(jiǎn)介、瀏覽量、更新時(shí)間、公司法人、公司注冊(cè)資金、統(tǒng)一社會(huì)信用代碼,納稅人識(shí)別號(hào)、公司類型等字段采集背景企業(yè)信息采集

在首頁【輸入框】中輸入目標(biāo)網(wǎng)址,點(diǎn)擊【開始采集】,八爪魚自動(dòng)打開網(wǎng)頁。步驟一打開網(wǎng)頁企業(yè)信息采集1、打開瀏覽器模式點(diǎn)擊按鈕,打開瀏覽器模式。在瀏覽器模式中,掃碼登錄。2、使用Cookie登錄天眼查進(jìn)入【打開網(wǎng)頁1】設(shè)置界面,勾選【使用指定的Cookie】,點(diǎn)擊【獲取當(dāng)前頁面Cookie】并保存。這樣就獲取到了登錄后的Cookie,啟動(dòng)時(shí)直接以登錄狀態(tài)打開網(wǎng)頁。步驟二、天眼查登錄企業(yè)信息采集步驟三、建立【翻頁循環(huán)】,以采集多頁數(shù)據(jù)

如果只是采集一頁數(shù)據(jù),可跳過此步驟。如果需要翻頁以采集多頁數(shù)據(jù):關(guān)閉瀏覽器模式,選擇頁面中的【>】按鈕,在操作提示上單擊【循環(huán)點(diǎn)擊下一頁】,創(chuàng)建【循環(huán)翻頁】。企業(yè)信息采集步驟四、建立【循環(huán)-點(diǎn)擊元素】,進(jìn)入每個(gè)企業(yè)詳情頁通過以下幾步,實(shí)現(xiàn)循環(huán)點(diǎn)擊每個(gè)企業(yè)鏈接,進(jìn)入企業(yè)詳情頁①選中頁面上第1個(gè)企業(yè)鏈接②在黃色操作提示框中,點(diǎn)擊【選中全部】③點(diǎn)擊【循環(huán)點(diǎn)擊每個(gè)鏈接】,進(jìn)入第1個(gè)企業(yè)的詳情頁企業(yè)信息采集步驟五、提取目標(biāo)字段并編輯字段。1、提取目標(biāo)字段選中頁面中的文本,然后在操作提示框中,點(diǎn)擊【采集該元素文本】。文本類字段都可以按照這樣的方式提取。示例中我們提取了公司名稱、公司網(wǎng)址、公司簡(jiǎn)介、更新時(shí)間、公司法人、統(tǒng)一社會(huì)信用代碼,納稅人識(shí)別號(hào)、等多個(gè)字段。企業(yè)信息采集步驟五、提取目標(biāo)字段并編輯字段。2、編輯字段進(jìn)入【提取數(shù)據(jù)】設(shè)置界面,可刪除多余字段,修改字段名,移動(dòng)字段順序、增加字段等。企業(yè)信息采集1、單擊【采集】并【啟動(dòng)本地采集】。啟動(dòng)后八爪魚開始自動(dòng)采集數(shù)據(jù)。步驟六、啟動(dòng)采集企業(yè)信息采集2、采集完成后,選擇合適的導(dǎo)出方式導(dǎo)出數(shù)據(jù)。支持導(dǎo)出為Excel、CSV、HTML、數(shù)據(jù)庫等。這里

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論