蓝天采集器数据采集教程
蓝天采集器数据采集教程,[滑稽]学采集首先要有网站搭建基础哦~本文将在蓝天采集器安装完成后的基础上开始讲解~[滑稽][玫瑰]
一、准备工具
1.蓝天采集器
2.米侠浏览器(方便获取网页源码)
3.MT管理器(方便分析代码)
PS:当然如果有电脑的话用电脑审查元素分析代码更方便,这样就不需要以上的软件了[滑稽][玫瑰]
二、教程步骤:
1.登录蓝天采集器后台管理,点击侧边栏【任务】—【添加任务】
2.任务名称随便填一个,保存,下一步
3.点击【采集器设置】先把自动补全网址和网址中文转码打开,不然采集数据可能异常
4.点击【起始页网址】-【起始页列表】那个➕号添加需要采集的网址
5.打开需要采集的网站,点击分类信息后再点击下一页,复制网址
4.点击【批量生成】选中数字,再粘贴刚才复制的网址,把网址后面的数字换成[内容],那个数字就是代表第几页,采集器的[内容]可以自动生成页数
5.点击【内容页网址】-【匹配内容页网址】-【提取网址规则】
6.打开需要采集的网址分页-【查看源代码】-【保存代码】
三、特别声明
本文所涉及的技术内容仅限用于学习研究目的,严禁用于任何非法或侵权用途。使用者因滥用该技术而导致的任何后果与责任,均由使用者自行承担,与本人及本教程无关。
|