前一段时间,我曾经钻研了一段时间的post数据流,其实很希望可以通过软件代替手工做一些seo的事情,但是过程也遇到了很多技术难题,比如高级的正则表达式就是其中一个门槛之一,因为我们需要“标记”或“提取”数据特征的时候,必须使用正则匹配的模式的。
而且我们看国内很流行的软件,火车头采集器来说,其实我们平时使用的时候可能更多的时候,采用的代码截取,都是最简单的前后截取,直接用有规律的div就可以解决了。但是对于高级的采集这个问题就不能发展了,比如你需要去掉某些字符、比如你想替换某些网址等都需要最简单的正则了;但是还有更难的,比如你需要cookies登录采集,同时也需要你过一些验证码或者需要提取动态的生成的time值等,非正则不可了。
平时我们学的正则都是基于最基本的匹配,如下图的火车头:
但是我们平时工作中,只要稍微有些新想法,都需要更加高级的匹配模式和方法,而高级的正则也是必须要掌握和学习的一个部分了。
说了这么多,无疑想说的是,高级正则也有他作用的地方,下面所给出的是一个高级系统的正则表达式教程视频,只给高级seo需求的人,对于平时用不上的也可以不用学的。