微信公众号文章采集

共享时间: 2018-02-22
  • 社交
  • 微信
  • 公众号
  • 社交
网页数据采集模板简介

【通用】采集微信公众号文章,可按微信公众号名称,ID或者关键词进行采集。

 模板为采集关键词: "高可用架构",你可以随意更改为其它关键词或公众号名称,还可以同时使用多个关键词或名称,多个用逗号,分隔。

 主要采集字段:微信公众号名称,公众号ID,标题,作者,发布日期,正文,描述(可使用正文截取)等。

 

数据如下图:

  配置如下:


采集微信公众号注意事项:

  • 1.由于搜狗微信搜索结果的限制,每个关键词只能采集前10页文章,而每个公众号,只能获取最近10条文章;
  • 2.微信采集的原始图片是无法正常显示的(防盗链了),如需图片,请选中“是否下载图片”,即可先下载到简数,再通过ftp回传到您指定位置;
  • 3.默认采集字段:标题,作者,微信号,公众号名称,内容,发布时间,第一张图片链接等