一孑 posted on 九月 24, 2009 18:12
今天又更新了一版soukey采摘,修正了一些bug,呵呵,因为软件还在测试阶段,所以bug稍微多一点点,实在抱歉。 在今天更新的版本中,增加了多语言支持,当前支持中文简体和英文。

一孑 posted on 九月 22, 2009 08:11
在文章《如何添加自己的采集任务》中已有说明,尽管是按照Soukey采摘1.0版本进行的说明,又尽管Soukey采摘已经升级到1.6,但并不会影响当前系统的使用, 同时在Soukey采摘帮助tag中,还提供了两篇文章针对数据采集再次进行了说明 ,如果针对采集规则配置还有疑问的用户,可以查看这些内容,如果还不会配置,那就联系一孑吧。 最新消息: 1、从国庆后,本站不在提供源码下载,如果需要源码请到http://sourceforge.net/projects/soukeygetdata/ 下载; 2、国庆后发布Soukey采摘1.6正式版本,届时会启用... [更多...]

Posted in:   Tags: ,
一孑 posted on 九月 16, 2009 09:11
网友的问题,没有考虑便回答:Soukey采摘是用来采集网站数据的。晕死的回答。想了又想,对Soukey采摘的用途总结如下: 1、建站好帮手,可以采集任意网站的任务数据(有点夸张,不过就让我放肆一回吧),这样,网站的数据你就不用发愁了,无论你是想建立何种网站,同时还可以把数据自动发布到网站中,这样建站真的就可以是一条龙服务了; 2、数据分析,可定期对一些你关注的数据进行采集比对、分析,譬如:产品价格,定期采集某个产品在各个网站中的报价、或定期采集你发布的软件在各个网站的下载数量,从而根据数据分析应对策略;此方面应用极为广泛;且很容易扩充更丰富的功能; 3、可以用... [更多...]

Posted in: 操作答疑  Tags:
一孑 posted on 九月 15, 2009 05:48
昨日又更新了一个版本,增加了一些便捷的操作,譬如:任务分类改名、任务改名、任务拷贝粘贴等,同时也修正了一些bug。增强了字典的管理功能。 最近收集到的一些问题,在此也做一个统一答复: 1、数据加工,当前系统提供了一些简单的数据加工操作,譬如:字符串替换、增加前缀后缀等等,但针对数据的复杂加工并不是Soukey采摘当前的主要内容,Soukey采摘当前主要还是以采集数据位目标,后期会提供更完善的数据加工操作(排序,条件输出、简单的语义分析等等),但肯定不如专业的数据加工工具便捷,在此希望网友可以理解。不过当前提供的数据加工操作,基本上可以满足大部分采集任务对数据输出的要求... [更多...]

一孑 posted on 八月 4, 2009 05:12
Soukey采摘 V1.10 测试版发布,由于1.0版本的部分bug导致了一些用户无法采集任务,所以,1.10版本暂时仅支持本站下载,不支持专业软件站下载及自动升级操作。 V1.10 版本 功能变动说明: 1、修改了V1.0中已发现错误; 2、强化了采集数据发布功能,支持文件(文本、Excel)、数据库(Access、MSSqlserver、MySql)及在线发布操作; 3、封装了一个简化的浏览器,用于对Cookie及POST数据的监控及获取; 由于任务强化了导出功能,所以在任务格式的版本也发生了变化,当前最新为V1.2,但针对原... [更多...]

Posted in: 最新动态  Tags:
一孑 posted on 八月 1, 2009 06:04
各位Soukey采摘用户: Soukey采摘已经发布,下阶段准备稳定版本提升软件质量,但为了可以更好的服务于Soukey采摘用户,一孑工作站开始收集Soukey采摘用户的采集任务需求,并建立采集任务模版,提供用户下载,因此,如果您有采集任务的需求,可以发送给feiw@163.com。 谢谢大家的支持!

Posted in:   Tags:
一孑 posted on 七月 23, 2009 07:21
最近一直在完善Soukey采摘的两个功能:数据加工及数据导出 1、数据加工:可支持在数据采集后,进行字符串合并、字符串替换、字符串截取等操作,这样做可以有效的提升需要使用数据的精度,尽管这样做会降低数据采集的性能; 2、数据导出:在1.0版本中数据导出是一个鸡肋的功能, 此次对数据导出进行了有效加强,可以导出:文本、excel、access、mssqlserver、mysql等,同时还可进行web发布; 配合数据加工的功能,可以在一定程度上实现自动化的数据采集、加工、发布等操作,具体完善的功能可参见稍后的版本发布说明。 完成此功能后,暂时不对Souk... [更多...]

Posted in:   Tags: , ,
一孑 posted on 七月 14, 2009 09:53
Soukey采摘已经提交到了专业的软件下载站提供下载服务。 注意:Soukey采摘需要在Microsoft .net Framework 2.0环境下方可正常运行,由于工作失误并未提供readme进行详细说明,望大家谅解。 同时发现blogengine.net文章缩略时出现乱码,比较郁闷。

Posted in:   Tags: ,
一孑 posted on 七月 5, 2009 14:07
Soukey采摘1.0测试版终于可以提供下载了,同时源码也更新到了,都可通过本站下载。 相比较前一个版本,从功能上没有发生太大的本质变化,只是修改了大量的bug,并且加强了软件的操作,毕竟如果软件面向大众用户,软件的操作一定要更简单化。同时提供了在线更新的功能,可通过软件自动检查最新版本,并进行最新版本的下载。Soukey采摘功能 如下: 1、多任务、多线程的网页数据采集; 2、支持cookie、post方式; 3、采集数据具备任务临时保存功能,保障数据采集的有效性;临时数据保持为xml文件; 4、采集数据支持导出,可导出Excel及文本文... [更多...]

Posted in:   Tags:
c# 导出Excel的方法很多,在此不进行一一介绍,可通过网上查找。在此仅说明如果使用excel组件时,导出excel后无法彻底关闭excel的问题。 通过 new Interop.Excel.Application()后,在系统中就建立了excel.exe进程,当完成导入工作后,尽管使用了GC.Collect(),但还会存在有可能无法冠词excel进程的问题。给出的方法是杀掉excel进程,但需要在杀excel进程 前需要获知程序创建的进程ID,以便通过ID杀掉进程,而不是通过名称杀掉进程,看到网上有些例子是通过名称杀进程,这样做有可能导致正在使用的excel文件也会被杀掉,造... [更多...]

Posted in: 技术文档  Tags: , ,

Blog Roll

    最新评论

    一孑工作室声明
    本站文章均为原创,如果转载请注明出处。

    © Copyright 2010『一孑工作室』
    管理我的网站
    京ICP备10018014号