去年老婆要开个店铺,卖化妆品的,不过输入数据的时候真的头疼,因为我们是没有货源的,都是从代理那里找图片、介绍等,不过好在代理有个网站,闲来无事,就开发了这个小程序。
程序的功能:
1、采集数据
2、可配置的,只要输入一定的条件就能采任何东西了。
3、可导出成csv格式
4、可把数据导入到淘宝助手。
5、采集图片到本地。
6、可修改宝贝内容
7、可使用模板来进行描述
用了这个程序,1000多个商品,只用了一会就全部搞定了,不过还有些小bug,也懒得改了,自己用的反正。
先看看配置文件:
1<?xml version="1.0" encoding="utf-8" ?>
2<configuration>
3 <configSections>
4 <sectionGroup name="userSettings" type="System.Configuration.UserSettingsGroup, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" >
5 <section name="MyCollection.CollectSetting" type="System.Configuration.ClientSettingsSection, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" allowExeDefinition="MachineToLocalUser" requirePermission="false" />
6 </sectionGroup>
7 </configSections>
8 <connectionStrings>
9 <add name="MyCollection.Properties.Settings.MyCollectConnectionString"
10 connectionString="Data Source=.\SQLEXPRESS;AttachDbFilename=|DataDirectory|\MyCollect.mdf;Integrated Security=True;Connect Timeout=30;User Instance=True"
11 providerName="System.Data.SqlClient" />
12 </connectionStrings>
13 <userSettings>
14 <MyCollection.CollectSetting>
15 <setting name="SaveImagePath" serializeAs="String">
16 <value>D:\办公\淘游馆\香水彩妆\商品图片\</value>
17 </setting>
18 <setting name="SaveCSVPath" serializeAs="String">
19 <value>D:\办公\淘游馆\香水彩妆\描述模板\</value>
20 </setting>
21 <setting name="HtmlTemplet" serializeAs="String">
22 <value>D:\办公\淘游馆\香水彩妆\描述模板\wenwen.html</value>
23 </setting>
24 </MyCollection.CollectSetting>
25 </userSettings>
26</configuration>
SaveImagePath:保存图片到本地的路径
SaveCSVPath:导出文件所在目录
HtmlTemplet:宝贝描述模板文件
大概的界面:
主界面
显示此项目中的采集的数据
单个商品的详细内容,用的是winform的Edit,感觉还不错。
下面是进行采集的配置,界面如下:
如果用过动易那种采集系统的话,应该对此还比较熟悉,大致的话都是通过截取指定地方获取数据的。大家也可以看看实例。
在采集中,我没有使用WebRequest,因为我测试下来XmlHttp好像更快一点,而且不仅仅是一点点。
在Collect.cs中,是一个采集的类库,我想应该能满足一些读者的需求了。
程序原先用2005开发的,不过我这次转换了一下,可能要2008才能打开了:P
东西很小,不过当时因为刚接触2.0,所以东西写的不好,也没时间去改了,今天拿上来献丑,希望大家也能继续拓展这个程序,如果觉得好,需要改进,大家也可以随意改动,不过最好能通知我下,谢谢了:)
点击下载
PS:做网站这么多年,我的了解,做采集做的成功的,应该属大旗网和去哪儿这2个网站。
PS2:今天发表的Exception第三篇,写的实在太糟了,真对不起大家,后面我会改进一下的,不过最近真的很忙:(