一孑 posted on 七月 6, 2010 01:42
何为导航? 上次讲到采集网址改如何配置,并如何通过参数的形式来进行网址的批量配置,从而简化配置 操作。今天来重点讲一下导航规则的配置。 通常情况下,我们配置的采集网址就是需要采集数据的网址。但还有一种情况就是采集的网址 无规律可循,通过参数无法实现成批网址的配置,但其又有一个共同的特点,就是其网址都存在于一个网页中(通常我们称之为导航页面或入口页面)。 举一个例子:采集某个网站的时政新闻。 新闻的网址如下: http://news.********.com/politics/2010-07/03/c_12293464.htm ... [更多...]

Posted in: 在线培训 , 最新动态  Tags:
一孑 posted on 七月 6, 2010 00:04
自本周开始每周固定2个小时进行采集任务配置答疑,方式为加入QQ群,无论您是否为我们的授权用户,只要加入QQ群即可参与此活动。 本周为第一次,对主要问题总结如下: 1、如何采集flash: 采集flash和采集图片的道理是一样的,只要设置采集的数据类型为“图片”或“Flash”即可,但有一个前提条件就是,采集规则的配置是图片或falsh的有效地址,系统会解析出这个地址并进行文件下载。如果地址解析错误,则无法进行下载。今天用户遇到的问题是无法正确找打flash的真实地址,在此推荐使用fiddler,一款免费的http... [更多...]

Posted in: 在线培训 , 最新动态  Tags:
一孑 posted on 七月 2, 2010 18:54
Normal 0 7.8 磅 0 2 false false false EN-US ZH-CN X-NONE MicrosoftInternetExplorer4 ... [更多...]

Posted in: 在线培训 , 最新动态  Tags:

Blog Roll

    最新评论

    一孑工作室声明
    本站文章均为原创,如果转载请注明出处。

    © Copyright 2012『一孑工作室』
    管理我的网站
    京ICP备10018014号