火车头免费版为zencart网站采集多张图片

简介:

相信很多刚开始学习火车头的菜鸟们,也和烂泥一样使用的是火车头免费版,然后为我们的zencart网站进行一些产品数据的采集。但是在写采集规则的时候,会经常碰到的一个问题就是如何采集一个产品的多张图片。

采集一张图片的规则,相信大家都会写了。那么多张图片呢?如何写呢?其实,这个和我们写采集一张图的是一样的,只是在一些细节上面设置正确就ok了。下面我就自己采集的一个站点给各位做一下讲解。

我们知道要采集一个网站的图片,那么我们肯定是在火车头使用img标签来进行的。

clip_image001

要采集多张图片,我们肯定要找出来这些图片在源码中的代码。我下面举例来进行讲解:

clip_image002

在上图中是标记出来的1和2是两张不同的图片,但是我们仔细的观察可以发现img标签中,如果把图片的源地址和alt去掉的话,那么其他的都是一样的。而火车头有一个标签循环使用的功能,这就为我们采集多张图片提供了一个方便。我现在把源码粘贴出来:

<img src="http://www.simplydresses.com/_img/PRODUCTS/320/PromGirl-767611310.jpg" width="68" border="0" alt="Long One Shoulder Formal Dress P641 TI-P641" />

然后在火车头中进行采集规则的编写:

clip_image003

在数据提取方式中,我们选择了“正则提取”,而“正则匹配内容”中填写如下:

<img src="http://www.simplydresses.com/_img/PRODUCTS/[参数]/[参数]"(*)width="(*)"(*)border="(*)"(*)alt="(*)"(*)/>

组合结果中填写如下:

<img src="http://www.simplydresses.com/_img/PRODUCTS/[参数1]/[参数2]"/>

其中正则匹配内容第一个“参数”对应的是组合结果中的“参数1”,正则匹配内容第二个“参数”对应的是组合结果中的“参数2”,而其中的“*”是任意匹配的意思。

clip_image004

上图是设置好后,采集测试的结果

clip_image005

这个是导出的结果。

Ok,以上我们可以看到要采集多张图片,只要我们设置好了采集标签,然后此标签可以循环使用,就可以达到我们要的结果了……

相关文章
|
1月前
|
存储 搜索推荐
小红书InstantID来了, 一张照片几秒钟就能生成个性化图片
【2月更文挑战第24天】小红书InstantID来了, 一张照片几秒钟就能生成个性化图片
33 2
小红书InstantID来了, 一张照片几秒钟就能生成个性化图片
|
SQL 存储 JSON
微信朋友圈转发第三方网站带缩略图实现
前情提要 有时候我们会在朋友圈看到如下两种转发情况:一种是前面带缩略图的 ,一种是无缩略图的,当然有缩略图的不管是从用户体验,还是网站推广运营方都是更优的选择。 那我们看看微信分享朋友圈缩略图是 怎么一回事呢 注:微信6.5.5版本后,微信调整了分享规则。
1507 0
|
1月前
|
移动开发 安全 Linux
2024龙年新版ui周易测算网站H5源码/在线起名网站源码/运势测算网站系统源码
2024龙年新版ui周易测算网站H5源码/在线起名网站源码/运势测算网站系统源码
48 0
2024龙年新版ui周易测算网站H5源码/在线起名网站源码/运势测算网站系统源码
|
7月前
|
缓存 Kubernetes API
数据缓存系列分享(三):通过 StableDiffusion 扩展插件实现网红爆款文字光影图
在文章《23秒完成从零开始搭建StableDiffusion》中我们详细讲解了通过ECI的数据缓存快速搭建StableDiffusion应用,用户通过模型网站选择好自己需要的模型,然后创建ECI数据缓存,即可快速部署自己的StableDiffusion应用。本文将基于StableDiffusion + 扩展插件 ControlNet 来完成实现网红爆款文字光影图
317 0
数据缓存系列分享(三):通过 StableDiffusion 扩展插件实现网红爆款文字光影图
|
8月前
|
内存技术
在线版!音乐伴奏提取、变调、调速、查调性……太强大了!
由于Spleeter是要下载到电脑上运行的,由于电脑系统版本、电脑上的运行库等多方面原因,很多用户私信我说软件运行不了。
366 0
|
缓存 数据安全/隐私保护 对象存储
Hugo 网站优化(7): 把我图床搬到又拍云 (upyun) 了, 开始水印防盗
Hugo 网站优化(7): 把我图床搬到又拍云 (upyun) 了, 开始水印防盗
181 0
Hugo 网站优化(7): 把我图床搬到又拍云 (upyun) 了, 开始水印防盗
|
JavaScript 前端开发
跨时空的相遇~为她制作一个专属的QQ空间相册(附源代码)
跨时空的相遇~为她制作一个专属的QQ空间相册(附源代码)
跨时空的相遇~为她制作一个专属的QQ空间相册(附源代码)
|
JSON API 数据格式
电商收付通系列④,图片预上传,生成MediaID
部分微信支付业务指定商户需要使用图片上传 API来上报图片信息,从而获得必传参数的值:图片MediaID。即电商收付通接口有涉及到需要传图片的参数,不可以直接传图片文件,均需要通过指定的图片上传接口获取MediaID,再把MediaID传给相应的字段。比如二级商户进件接口需要上传营业执照,字段是business_license_copy,那么需要预先生成MediaID,将MediaID的值传business_license_copy。
127 0
电商收付通系列④,图片预上传,生成MediaID
|
数据采集 存储 Python
Python爬虫系列9-非诚勿扰等婚恋网数据批量抓取!
一般当大家遇到不顺心的时候,总是会焦虑,抱怨,我知道,这也是人软弱的一面,但是我们越是遇到困难,越是要振作起来,不要放弃自己,然后悄悄努力,只有这样才能让自己越来越好,如果一直沉浸在痛苦中,只会越来越糟。 适当的逼一逼自己,你会发现,人的潜力是无限的。
Python爬虫系列9-非诚勿扰等婚恋网数据批量抓取!
如何采集淘宝宝贝和备份宝贝到电脑上?
将整店的商品复制上传到新的店铺,需要使用软件的店铺采集方式,在电脑上运行大淘营淘宝宝贝复制专家,选择“店铺采集”,将要复制的店铺链接粘贴到地址栏,点“添加到列表”,接下来按提示去操作即可,就可以将店铺内的宝贝都复制上传到新的店铺
如何采集淘宝宝贝和备份宝贝到电脑上?