采集工具:火车采集器(可以百度搜索一下这个工具的下载

采集模块:新闻 News


第一步、编写采集入库脚本接口 

新建:/api/caiji.php (应用于URL地址请求,大小写随意)

如果根目录没有api文件夹,就创建到 /public/api/caiji.php (应用于URL地址请求,大小写随意)

新建:./dayrui/My/Api/Caiji.php(首字母必须大写,最终php文件命名与上面的名称保持相同)

脚本文件中可以定义发布者等一些预定义字段默认值,如果你不会php的话可以保持默认

注意:本脚本的程序代码只对内容等字段入库有效,由于采集目标网站的数据规范性无法做到统一;

如果开发者对其他字段(例如多文件上传、复选框、联动字段等等)需要开发者自己根据采集的实际情况来编写入库程序来组装入库的POST数据,需要PHP开发技术基础,下面来举一些基础例子。

1、多文件上传字段

2、复选框字段


测试规则地址:

如果能显示出来栏目信息,说明ok了

如果显示api file is error,表示你./dayrui/My/Api/Caiji.php没有创建正确。


第二步、火车采集器编写web发布规则


QQ20161021-0@2x.png


三步、新建一个在线发布模块


QQ20161021-1@2x.png


四步、填写获取栏目列表的参数


image.png

按照上面的格式写就ok了


第五步、内容发布规则参数

image.png



表单参数:这里可以配置任意自定义字段的入库,不知道入库格式怎么办?

查看数据库储存数据格式进行入库处理,必要时需要在接口文件中重新编程


第六步、保存模块


QQ20161021-5@2x.png


第七步、然后返回web发布配置里面


QQ20161021-6@2x.png

按照图中的参数配置,点“获取栏目”,如果可以获取到就表示成功了一大半了


八步、测试入库发布


QQ20161021-7@2x.png


九步、后台查看采集内容


QQ20161021-8@2x.png

本文地址:https://m.xunruicms.com/doc/1084.html