偶然机会,遇上使用火车头采集器采集内容时候需要获取当前页面的URL地址,于是记录下操作:

1、在采集字段中添加链接字段

2、数据获取方式设置“从源码中获取数据”

3、数据来源设置:“从默认页》网页地址中”

4、提取方式:设置“正则提取”,正则表达式:

^(?<content>[\s\S]*?)$

火车头采集器采集获取文章链接URL地址

5、测试效果:

火车头采集器采集获取文章链接URL地址