iS-RPA(v2021.3.0.0) 结构化数据抓取使用经验分享

Hi,大家好,iS-RPA2021.3.0.0 版本已经正式发布啦 👏 👏

不知道大家有没有下载试用呢 ~ 这次的设计器在界面上较之前的版本又有了一些新的细节优化,不知道各位细心的小伙伴们有木有发现呢 ~~

不过这都不重要!!今天要给大家介绍我们 3.0 版本一个处理数据炒鸡方便的工具——结构化数据抓取


在介绍这个工具之前,我们要先了解什么是结构化数据。 👇

iS-RPA(v2021.3.0.0) 结构化数据抓取使用经验分享

简单点来说就是有组织有规律、有对应关系、能够放进表格里的数据。

举个栗子:某新闻网站有若干条新闻,每个新闻都有新闻标题、正文、作者和发表时间组成;如果我想获取 100 条新闻和这些新闻的相关信息,那我希望把所有新闻的标题拿过来作为一列,正文拿出来作为一列,…每一行呢就是一条新闻的相关信息。

当然啦,网页中或者桌面程序中的表格数据本身就是结构化数据。


记得之前艺赛旗高阶考试里面有一道题:要获取论坛上五页的帖子。当时写这个流程,要先找各数据项的规律,使用 for 循环不停地修改目标的 selector…这对开发人员来说,虽然可能不属于难题,但是很繁琐;使用十几个甚至几十个组件去拾取几十条有规律的数据,效率也很低(虽然有时候很有成就感 hh)

NOW 我们现在使用结构化数据抓取这一个组件,就能够抓取到若干条有规律的数据了。
给大家简单演示一下 ~ 👉非表格数据抓取.mp4

同时也可以直接获取网页中的整个表格。👉表格数据抓取.mp4

在使用过程中,我发现社区的翻页按钮也是一个个会变的,所以只能拾取一个按钮。如果想获取多页的数据,有时候需要结合鼠标点击去翻页,或者将编辑好的按钮的 selector 传递到按钮的属性中。

关于这个问题,不知道大家有没有什么更好的解决方法或者想法呢。还有对整个组件的使用建议,也欢迎大家在使用之后一起讨论讨论呀!!感谢大家看到这里!!ღ(´・ᴗ・`) 比心 希望这个工具能够帮助您更方便地处理数据,解决问题!


更详细的使用说明可以移步线上使用手册哦 👉 结构化数据抓取使用方法