QQ群采集器使用方法_第1頁
QQ群采集器使用方法_第2頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 4/4QQ群采集器使用方法 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用方法 群是騰訊公司推出的多人聊天交流的一個(gè)公眾平臺,群主在創(chuàng)建群以后,可以邀請朋友或者有共同興趣愛好的人到一個(gè)群里面聊天。所以群對于營銷人員來說是一個(gè)很精準(zhǔn)的渠道,那么如何使用群采集器去采集呢。下面為大家詳細(xì)使用八爪魚采集器采集群的方法。 采集網(wǎng)站: http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /member.html 使用功能點(diǎn): Cookie登錄 Ajax點(diǎn)擊 修

2、改Xpath 步驟1:創(chuàng)建群采集任務(wù) 1)進(jìn)入主界面,選擇“自定義采集” http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟1 2)將要采集的網(wǎng)站URL復(fù)制粘貼到輸入框中,點(diǎn)擊“保存網(wǎng)址” http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟2 步驟2:Cookie登錄 1)打開網(wǎng)頁后,需要先登錄,可以先在手機(jī)登錄, 采集時(shí)點(diǎn)擊登錄按鈕,之后掃碼就可以成功登錄?;蛘唠娔X登錄,點(diǎn)擊二維碼右邊的頭像進(jìn)行登錄。 http:/./doc/8f

3、68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟3 2)登陸后,在高級選項(xiàng)中選擇自定義cookie,勾選打開網(wǎng)頁時(shí)使用固定cookie,再點(diǎn)擊獲取當(dāng)前頁面cookie,最后點(diǎn)擊“確定”,這樣以后再采集時(shí)就不用重復(fù)登錄了。(cookie有效時(shí)間以具體情況為準(zhǔn),到一定時(shí)間會失效,失效需重新登錄獲取cookie,另外如果是點(diǎn)擊頭像(電腦登錄的)需要把之前的點(diǎn)擊頭像登錄的點(diǎn)擊元素刪除) http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟4 步驟3:Ajax點(diǎn)擊 登錄

4、后,選擇需要采集的群,然后在右面的提示框中選擇“點(diǎn)擊該元素” http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟5 由于網(wǎng)頁涉及Ajax技術(shù)。所以需要選中點(diǎn)擊元素,打開“高級選項(xiàng)”,勾選“Ajax 加載數(shù)據(jù)”,設(shè)置時(shí)間為“15秒”。執(zhí)行前等待設(shè)置7秒, 因?yàn)轫撁娲蜷_后需要向下滑動(dòng)才可以出現(xiàn)更多內(nèi)容,所以還需要設(shè)置頁面滾動(dòng),滾動(dòng)次數(shù)選擇20次,(滾動(dòng)次數(shù)具體看群成員的數(shù)量,如果500個(gè)人,一般來說選擇25次能全部加載完)每次間隔1秒,完成后,點(diǎn)擊“確定”。 http:/./doc/8f68e694cf2f0066f

5、5335a8102d276a2002960e6.html 群采集器使用步驟6 步驟4:提取元素 1)選擇第一個(gè)號碼以及昵稱(綠色的位置),如果想采集群名片,性別,Q齡,入群時(shí)間,最后發(fā)言,也是可以選擇的,然后在右面的提示框中選擇“選中全部”,隨后選擇“采集元素”。 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟7 步驟5:修改Xpath 1)手動(dòng)執(zhí)行規(guī)則,發(fā)現(xiàn)循環(huán)列表里并沒有定位到所有元素,所以需要修改xpath,在循環(huán)方式中選擇不固定元素列表,修改xpath為/tbodyclass=list/tr http

6、:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟8 步驟5:數(shù)據(jù)采集及導(dǎo)出 1)打開流程按鈕,修改采集字段名稱,點(diǎn)擊“保存并開始采集” http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟9 2)啟動(dòng)本地采集 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟10 3)采集完成后,會跳出提示,選擇“導(dǎo)出數(shù)據(jù)”選擇“合適的導(dǎo)出方式”,將采集好的數(shù)據(jù)導(dǎo)出這里我們選

7、擇excel作為導(dǎo)出為格式,一份完好的號碼以及昵稱數(shù)據(jù)就采集好了,數(shù)據(jù)導(dǎo)出后如下圖 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟11 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 相關(guān)采集教程: 說說采集:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/sscj 微博粉絲信息采集:http:/./doc/8f68e694cf2f0066f5335a81

8、02d276a2002960e6.html /tutorial/wbyhxxcj 百家號爆文采集:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/bjharticlecj 微博采集方法:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/weibocj 百度相關(guān)搜索關(guān)鍵詞采集:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/bdxgssc

9、j 百度知道問答采集方法以及詳細(xì)步驟:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/zhidao 微信公眾號熱門文章采集:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/wxcjimg 豆瓣電影爬蟲使用方法:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/dbmoviecrawl 知乎爬蟲規(guī)則使用方法:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/zhihucrawl 八爪魚90萬用戶選擇的網(wǎng)頁數(shù)據(jù)采集器。 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 1、操作簡單,任何人都可以用:無需技術(shù)背景,會上網(wǎng)就能采集。完全可視化流程,點(diǎn)擊鼠標(biāo)完成操作,2分鐘即可快速入門。 2、功能強(qiáng)大,任何網(wǎng)站都可以采:對于點(diǎn)擊、登陸、翻頁、識別驗(yàn)證碼、瀑布流、Ajax腳本異步加載數(shù)據(jù)的網(wǎng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論