偶然机会,遇上使用火车头采集器采集内容时候需要获取当前页面的URL地址,于是记录下操作:
1、在采集字段中添加链接字段
2、数据获取方式设置“从源码中获取数据”
3、数据来源设置:“从默认页》网页地址中”
4、提取方式:设置“正则提取”,正则表达式:
^(?<content>[\s\S]*?)$
5、测试效果:
偶然机会,遇上使用火车头采集器采集内容时候需要获取当前页面的URL地址,于是记录下操作:
1、在采集字段中添加链接字段
2、数据获取方式设置“从源码中获取数据”
3、数据来源设置:“从默认页》网页地址中”
4、提取方式:设置“正则提取”,正则表达式:
^(?<content>[\s\S]*?)$
5、测试效果: