好强的谷歌“ Excel ”,不用自己写代码就能爬虫,网友立马 cue 微软:慌不慌?
导读:家人们,要爬虫——现在用一个电子表格就行了。 一行代码也别写,第三方软件也甭安。 只需在表格里点几下就 ok。 不信,你瞧: 就这么两下,网页上的商品信息都有
家人们,要爬虫——现在用一个电子表格就行了。
一行代码也别写,第三方软件也甭安。
只需在表格里点几下就 ok。
不信,你瞧:
就这么两下,网页上的商品信息都有了。
一看到这是来自谷歌的产品(Google Sheet,谷歌的 "Excel"),大家就立马 cue 起了微软,问它慌不慌。
还有人称这是在 " 跨界打击 " 它。
△ 扫盲:" 巨硬 " 就是微软,网友给的调侃
好不热闹。
来看具体怎么实现。
以爬亚马逊某个手机产品的商品页为例。
我们先打开谷歌 Sheet(网友版即可),新建一个文档。
然后 copy 一下要爬的网址,粘进去。
然后就可以正式开始爬了。
要诀就是一个叫做ImportFromWeb的函数。
它也是个插件,没有的需要先安装一下(安装地址放文末了),然后通过 Google Sheet 程序的 " 扩展程序 " 菜单导入就行。
我们只需把 ImportFromWeb 函数放进 asin 那一列,然后第一个参数选中刚刚粘过来的网址,第二个参数把要爬的元素单元格拖一遍(除了 " 图片 ")。
稍等个 1~2s,价格、商品名等信息就都出来了!
看完整个操作,你也发现了,其实就是谷歌写了个脚本给咱封装好了直接用。
而据官方介绍,这个 ImportFromWeb 功能还能自动更新爬取到的信息。
而且只要是用 JS 写的网站都可以爬(基本等于绝大数网站了),每个函数还可支持 50 个 url,以及数千个数据点。
快点码起来吧~
参考链接:
[ 1 ] https://weibo.com/1402400261/M9ZY84thO?filter=hot&root_comment_id=0&type=comment
[ 2 ] https://www.getapp.sg/software/2060417/importfromweb
[ 3 ] https://workspace.google.com/marketplace/app/importfromweb_web_scraping_in_google_she/278587576794(安装 ImportFromWeb)
版权声明:本文部分来自互联网,由小编精心所写,本文地址:http://www.zhubian88.cn/smbk/64164.html,如需转载,请注明出处!