css并聯(lián)選擇器,類選擇器和后代選擇器的概念?
類選擇器以(.)為前綴,后面為類名。在標(biāo)簽中定義class屬性,然后設(shè)置屬性值為類名選擇器。
后代選擇器是一種多個(gè)用空格分隔的選擇器,別稱包含選擇器。
css3選擇器怎么選擇第3個(gè)?
li:nth-child(3n+0)
{
background:#ff0000;
}
webmagic詳解?
WebMagic是一個(gè)開源的Java垂直爬蟲框架,目標(biāo)是簡(jiǎn)化爬蟲的開發(fā)流程,讓開發(fā)者專注于邏輯功能的開發(fā)。設(shè)計(jì)原理
webmagic采用完全模塊化的設(shè)計(jì),功能覆蓋整個(gè)爬蟲的生命周期(鏈接提取、頁面下載、內(nèi)容抽取、持久化),支持多線程抓取,分布式抓取,并支持自動(dòng)重試、自定義UA/cookie等功能。
webmagic包含頁面抽取功能,開發(fā)者可以使用css selector、xpath和正則表達(dá)式進(jìn)行鏈接和內(nèi)容的提取,支持多個(gè)選擇器鏈?zhǔn)秸{(diào)用。
使用maven
webmagic使用maven管理依賴,在項(xiàng)目中添加對(duì)應(yīng)的依賴即可使用webmagic:
WebMagic 使用slf4j-log4j12作為slf4j的實(shí)現(xiàn).如果你自己定制了slf4j的實(shí)現(xiàn),請(qǐng)?jiān)陧?xiàng)目中去掉此依賴。
項(xiàng)目結(jié)構(gòu)
webmagic主要包括兩個(gè)包:
webmagic-corewebmagic核心部分,只包含爬蟲基本模塊和基本抽取器。webmagic-core的目標(biāo)是成為網(wǎng)頁爬蟲的一個(gè)教科書般的實(shí)現(xiàn)。
webmagic-extensionwebmagic的擴(kuò)展模塊,提供一些更方便的編寫爬蟲的工具。包括注解格式定義爬蟲、JSON、分布式等支持。
webmagic還包含兩個(gè)可用的擴(kuò)展包,因?yàn)檫@兩個(gè)包都依賴了比較重量級(jí)的工具,所以從主要包中抽離出來,這些包需要下載源碼后自己編譯。
css選擇器中可以匹配所有標(biāo)簽的是?
答案是星星選擇標(biāo)簽。
因?yàn)樾翘?hào)選擇器的定義是用于選擇html中的所有標(biāo)簽,在一個(gè)頁面中我們都會(huì)選擇去掉html所有標(biāo)簽的默認(rèn)樣式,然后根據(jù)自己的需求添加樣式,這個(gè)時(shí)候就需要使用*選擇標(biāo)簽。
另外一個(gè)*選擇標(biāo)簽也可以搭配到其他的標(biāo)簽進(jìn)行使用,用來選擇表示某個(gè)父元素下面的所有子元素標(biāo)簽。