Scrapy提取數(shù)據(jù)有自己的一套機(jī)制,被稱(chēng)作選擇器(selectors),通過(guò)特定的Xpath或者CSS表達(dá)式來(lái)選擇HTML文件的某個(gè)部分
Xpath是專(zhuān)門(mén)在XML文件中選擇節(jié)點(diǎn)的語(yǔ)言,也可以用在HTML上。
CSS是一門(mén)將HTML文檔樣式化語(yǔ)言,選擇器由它定義,并與特定的HTML元素的樣式相關(guān)聯(lián)。

XPath選擇器

常用的路徑表達(dá)式,這里列舉了一些常用的,XPath的功能非常強(qiáng)大,內(nèi)含超過(guò)100個(gè)的內(nèi)建函數(shù)。
下面為常用的方法

Android培訓(xùn),安卓培訓(xùn),手機(jī)開(kāi)發(fā)培訓(xùn),移動(dòng)開(kāi)發(fā)培訓(xùn),云培訓(xùn)培訓(xùn)

nodeName    選取此節(jié)點(diǎn)的所有節(jié)點(diǎn)/           從根節(jié)點(diǎn)選取//          從匹配選擇的當(dāng)前節(jié)點(diǎn)選擇文檔中的節(jié)點(diǎn),不考慮它們的位置
.           選擇當(dāng)前節(jié)點(diǎn)
..          選取當(dāng)前節(jié)點(diǎn)的父節(jié)點(diǎn)
@           選取屬性*           匹配任何元素節(jié)點(diǎn)
@*          匹配任何屬性節(jié)點(diǎn)
Node()      匹配任何類(lèi)型的節(jié)點(diǎn)

Android培訓(xùn),安卓培訓(xùn),手機(jī)開(kāi)發(fā)培訓(xùn),移動(dòng)開(kāi)發(fā)培訓(xùn),云培訓(xùn)培訓(xùn)

CSS選擇器

CSS層疊樣式表,語(yǔ)法由兩個(gè)主要部分組成:選擇器,一條或多條聲明
Selector {declaration1;declaration2;……}

下面為常用的使用方法

Android培訓(xùn),安卓培訓(xùn),手機(jī)開(kāi)發(fā)培訓(xùn),移動(dòng)開(kāi)發(fā)培訓(xùn),云培訓(xùn)培訓(xùn)

延伸閱讀

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負(fù)責(zé)任的教育,學(xué)習(xí)改變命運(yùn),軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動(dòng)軟件開(kāi)發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)學(xué)習(xí)是年輕人改變自己的最好方式