爱收集资源网

骑士人才网站系统教程

网络 2023-06-28 01:02

在线发布模块,就是采集器通过网站后台,发布文章,也就是说,把你自动在网站后台发布文章的整个过程包含登入网站后台,选择栏目,到旁边的发布文章,这种步骤讲到采集器上面,就是在

线发布模块,之后规则采集到的值就通过标签名传递给在线发布模块,把数据递交到网站里去。

我们利用抓包工具Fiddler(下载地址:,下载后,只要仍然点击下一步,就安装好了),这个软件可以

把你自动添加文章做的操作记录出来,我们只须要把这种操作步骤复制到采集器上面就可以了。我们用勇士人才系统做教程,你们也同样用勇士人才系统搭建一个网站系根据教程一步一步的做。

1,打开WEB在线发布模块编辑器

点击“发布”按钮,如右图:

之后点击“新建”按钮,我们来新建一个发布模块,如右图:

说下上图的一个主要的选项:

“网站手动登入”:网站系统登陆的步骤和方法是写在哪里的;

“获取栏目列表”:获取网站的栏目的形式写在这儿;

“网页随机值获取”:在我们发布文章或则登陆的时侯,会有些值时刻变化,并不是我们填写的,而是网站系统手动生成的,我们这这儿获取这种特殊的值;

“内容发布参数”:把网站发布内容的步骤和形式填写在这儿;

2,网站手动登入

我们首先做网站登陆这一部份,首先打开并设置好前面我们安装好的Fiddler抓包软件如右图:

根据绿色框标明的选项来对抓包软件进行设置。两侧的地址就是Fiddler抓取到我们当前正在访问的地址,可能会抓到好多无用的地址,我们在抓下边登陆系统的时侯,先把早已抓到

无用的结果给清空如右图:

右击两侧任意处,弹出选项我们选择Remove==》AllSessions或则用快捷键Ctrl+X快捷键,来清空记录:

看结果早已全部清空了。

在根据以上步骤清空了抓包软件抓取到的结果后,打开网站的登入界面并输入正确的用户名密码点击登陆如右图:

登陆成功后,我们在看抓包软件如右图:

可以看见抓到了好多我们系统相关的地址,这么我们怎么找我们须要的地址呢?看右图:

我们选中两侧的地址,就可以查看左边抓到的信息,两侧有2个地方要看,在上图标志下来了,在第一处你们看见“POST”,第二处见到我们刚刚输入的用户名密码了是吧,假如符合这2点,就

说明,这个地址就是我们要获取的,为何呢?这儿就不说了,懂的人自然懂不懂的说了也不懂,这儿须要网站编程基础的人就会明白,方正你们根据这个方法找就对了,懂不懂原理就看个人

了。

你们可以用同样的方法,查看别的地址,是不会有这样的2点的。这么如今就把我们须要的信息获取到了,之后我们下边大约的讲解下这是哪些意思。讲解的比较的不专业,由于专业的人是不需

要的讲解的,只是通过不专业的语言让我们不专业的人能有个大约的了解。假如你须要更多了解,就去学习下做网站写代码吧,水很深那~~~~~~~~~~

我们把抓取的信息放在文本文件查看,点击右下角“ViewinNotepad”如右图:

文本文件如右图:

登陆的过程就是:用户账号数据在采集器上面我们称之为POST数据(标明3)是通过Referer:前面的地址(标志2)递交给POST旁边的地址(标明1),进行登陆验证。

这就是整个登陆过程。我们把这个过程写的采集器的发布模块上面去。

在WEB发布模块编辑器上面选择“网站手动登入”选项卡,之后点击下边的“黏贴抓包获取的数据”,弹出手动提取数据的空白框,之后把登陆抓到的POST数据填写进去,之后下边的UrlDecode选择和自己网站对应的编码点击下,如右图:(下边的图错了,箭头指向了“提取POST表单登陆数据”,是不对的,应当是右侧的“黏贴抓包获取的数据”):

klm 4118电流采集模块_自动采集发布_火车头采集器发布模块

以上操作完了点击“提取”按钮。结果如右图:

上图就把标签名和标签值一样对应提取下来了,选择一个标签名进行更改如右图:

对应的值我们用标签表示如上图。

之后我们把登陆地址后缀,来源页面地址后缀填写好如右图:

登陆地址后缀:就是抓包获取的post的旁边的地址,我们除去一部份填写这儿,去多少你自己决定。通常是取域名旁边的。

来源也地址后缀:是Referer旁边的地址,同前面除去同一部份填写这儿。

验证码地址:这儿填写验证码的地址,恰巧这个系统登陆是不须要验证码的。

在登陆地址后缀哪里有个hiddentoken=200e9656,根据工作经验这个是个网页随机变量,这个值每次登入是随机变化的,判读是不是验证码的办法有:

1,这个值看着很奇怪200e9656一看就不晓得是干嘛的,这个时侯就可以怀疑这个是不是个网页随机值

2,这么我们就把hiddentoken这个去页面源代码上面去找下,瞧瞧这个值是不是在页面上早已生成的存在的

3,通常这个值都是在来源页面生成的,所以我们就从来源页的页面源代码去查找这个值,这儿也就是登陆页面

查看结果如右图:

见到了把我们通过源代码发觉这个值是变化的,也就验证了我们里面的判读这个是个变化的值,我们在采集器上面称作网页随机值的,之后好多地方还会用到网页随机值,判读方法是一样的,

旁边再遇见的,就不在说了,直接使用了。

下边我们说下假如获取网页随机值。右图:

WEB发布模块编辑器上面选择“网页随机值获取“,点击下边的,“添加”按钮,如右图:

“获取页面”:前面说了是登陆的页面地址,这儿就写登陆页面的地址,这儿注意不是全部的地址,而是地址的旁边一部份这个是和“网站手动登入”那里设置的后缀开始是一样的。

随机值是在页面源代码里获取的,和写规则一样,前后截取,中间获取的就是随机值的值。设置好了点击“确定”按钮。之后还有好多须要获取网页随机值的方式一样,之后遇见也不会多说了。

添加好后如右图:

根据添加的次序,为网页随机值1网页随机值2等等。。。。

使用随机值:

随机值有的时侯是在网址上面有的时侯在POST参数上面,你们一定要灵活引用。

下边来说下,登陆成功标示码如右图:

采集器不是人,它不像你一样聪明的能判读是否登陆成功了。并且通常我们登陆成功后网站就会返回信息告诉我们是成功还是失败,这个返回的信息添加到登陆成功标示码这儿,

采集器登陆的时侯才会把你填写到这儿的信息和返回的信息做对比,倘若是一致的采集器就当登陆成功,不一致采集就当不成功。

访问的信息我们仍然是在Fiddler上面获取如右图:

同样是找到发布页面,两侧选择“Raw”下面就是访问的信息,通常情况下在这儿查找访问信息做为成功标示码,而且看右边蓝色标明“302”就代表有跳转,这个不是真实地址,下边的地址才是,我们应当从它下边的地址来找访问信息,如右图:

找到有些代表意义的,通常网站登陆成功就会提示成功,而且这个网站没有,我们只能从返回的信息中寻找些别的信息,汉字或则字符好多情况下并没有哪些意义,按照你的实际须要。其实是能判读是否成功登陆,或则说只会在成功登陆能够看见的信息,登陆失败不会出现,就可以拿来区分是否成功登陆。成功标示码讲到采集器上面如右图:

自动采集发布_火车头采集器发布模块_klm 4118电流采集模块

“登录失败验证码”:我们同样用抓包,而且我们故意输入错误的用户名,来看下登陆辨识返回的提示,根据前面找成功标示码一样找失败标示码如右图:

返回的信息中有很明晰的提示信息“用户名或密码错误”,就可以当我们成功标示码如右图:

成功标示码和错误标示码都可以是多个,一行一个。

下边说“内容发布参数”,操作和做“网站手动登入”是一样的。

首页我们在后台测试发布一篇文章,我们通常使用数字或则英文字母做测试,由于有的时侯用汉字抓包可能是乱码,我们不好辨认,如右图,:

之后清空抓包软件Fiddler上面不要的信息(抓登陆Post数据的时侯早已说过了),之后点击发布文章用Fiddler抓取发布文章的POST数据,如右图:

根据前面我们做登陆的时侯一样,找我们须要的地址,POST数据,成功标示码等等如上图,或则的的文本文件如下:

和登陆是一样的格式的,蓝色框的发布文章的抓的数据格式和登陆是不一样的,但是不同的网站抓到的结果也是不一样的,这个我们都不须要关注,直接复制放在采集器上面,采集器会

帮我们手动提取好如右图:

把我们填写的值对应用标签表示。我们查看发布页面的源代码看下分类是哪些情况如右图:

可以晓得type_id就是代表的分类,每位分类都有个数字替代就是上图的id对应的数字,type_id_cn是分类的名称。

抓包获取的值有乱码,我们怎么改成正确的呢,就拿“Submit”这个表单对应的值来说,我们把这个表单名称在发布页面源代码上面去查找下如右图:

火车头采集器发布模块_自动采集发布_klm 4118电流采集模块

源代码如上,对应的value="确定递交",就是其正确的值,通过以上更改发布模块弄成如右图:

“发布错误标示码“和“成功标示码”和前面到登陆成功标示码和失败标示码是一样的。

如今我们就要获取分类id和分类名称如右图:

在获取分类的时侯我们最好选择显示分类是那个下拉框显示的,通常也就是在添加文章哪里获取分类,我们在添加文章的页面找到分类那部份的源代码如右图:

找的代码的开始和结束,还有分类代码的格式,写的发布模块上面去如右图:

设置开始结束字符,分类列表名称及ID格式,分类和分类名称分别用“[分类ID]”,“[分类名称]”来表示。

刷新列表的页面地址和内容发布参数上面的来源页面后缀是一样的如右图:

这么经过前面步骤发布模块就写好了,我们起个名子名保存如右图:

测试发布模块:

关于网站根地址说明查看地址:

成功后给配置起一名子,我们就可以在规则上面使用了如右图:

发布模块在线制做视频版教程下载地址:%b5%da%b6%fe%bd%b2%a1%a2%bb%f0%b3%b5%b2%c9%bc%af%c6%f7%b7%a2WEB%b2%bc%c4%a3%bf%e9%d6%c6%d7%f7.flv

火车头采集器发布模块
上一篇:数骰子验证码,网络拦路先锋 下一篇:没有了