很多情況下我們自己費(fèi)老大勁寫好采集規(guī)則時(shí),預(yù)覽的時(shí)候老是提示“標(biāo)題與作者完全一樣不采集”,這個(gè)問(wèn)題,感覺(jué)很郁悶。
筆者在開(kāi)始采集時(shí)也是老碰到這個(gè)問(wèn)題,有時(shí)為了達(dá)到必須采集完的目的,一度去找代碼研究。其實(shí)這個(gè)問(wèn)題很簡(jiǎn)單,
出現(xiàn)的原因就是當(dāng)前采集的文章標(biāo)題和你數(shù)據(jù)庫(kù)中已經(jīng)采集的文章標(biāo)題重復(fù)了,就是說(shuō)已經(jīng)采集過(guò)了。
這個(gè)是正常的,因?yàn)槟愎催x了“不采集標(biāo)題完全相同的信息(與入庫(kù)信息比較) ”這個(gè)選項(xiàng)。解決方法就是,
如果你想采集就把這個(gè)勾去掉,如果不 想重復(fù)采集,這個(gè)就是正常現(xiàn)象。