做微指數(shù)的爬蟲時,遇到點難題,去網(wǎng)上查些資料,發(fā)現(xiàn)有點錯誤;
特此經過研究,有了正確的采集方法。
1、采集界面,搜索關鍵字后頁面跳轉到指數(shù)界面,顯示搜索的指數(shù)。
2、fiddler抓包定位采集數(shù)據(jù)源,加載方式為json
3、獲取json數(shù)據(jù);
分析數(shù)據(jù)的加載方式,發(fā)現(xiàn)數(shù)據(jù)是在定位請求頭中的referer地址進行返回數(shù)據(jù)的,