何为导航?
上次讲到采集网址改如何配置,并如何通过参数的形式来进行网址的批量配置,从而简化配置
操作。今天来重点讲一下导航规则的配置。
通常情况下,我们配置的采集网址就是需要采集数据的网址。但还有一种情况就是采集的网址
无规律可循,通过参数无法实现成批网址的配置,但其又有一个共同的特点,就是其网址都存在于一个网页中(通常我们称之为导航页面或入口页面)。
举一个例子:采集某个网站的时政新闻。
新闻的网址如下:
http://news.********.com/politics/2010-07/03/c_12293464.htm
...
[更多...]