iS-RPA(v2021.3.0.0) 结构化数据抓取使用经验分享
Hi,大家好,iS-RPA2021.3.0.0 版本已经正式发布啦 👏 👏
不知道大家有没有下载试用呢 ~ 这次的设计器在界面上较之前的版本又有了一些新的细节优化,不知道各位细心的小伙伴们有木有发现呢 ~~
不过这都不重要!!今天要给大家介绍我们 3.0 版本一个处理数据炒鸡方便的工具——结构化数据抓取
在介绍这个工具之前,我们要先了解什么是结构化数据。 👇
简单点来说就是有组织有规律、有对应关系、能够放进表格里的数据。
举个栗子:某新闻网站有若干条新闻,每个新闻都有新闻标题、正文、作者和发表时间组成;如果我想获取 100 条新闻和这些新闻的相关信息,那我希望把所有新闻的标题拿过来作为一列,正文拿出来作为一列,…每一行呢就是一条新闻的相关信息。
当然啦,网页中或者桌面程序中的表格数据本身就是结构化数据。
记得之前艺赛旗高阶考试里面有一道题:要获取论坛上五页的帖子。当时写这个流程,要先找各数据项的规律,使用 for 循环不停地修改目标的 selector…这对开发人员来说,虽然可能不属于难题,但是很繁琐;使用十几个甚至几十个组件去拾取几十条有规律的数据,效率也很低(虽然有时候很有成就感 hh)
NOW 我们现在使用结构化数据抓取
这一个组件,就能够抓取到若干条有规律的数据了。
给大家简单演示一下 ~ 👉非表格数据抓取.mp4
同时也可以直接获取网页中的整个表格。👉表格数据抓取.mp4
在使用过程中,我发现社区的翻页按钮也是一个个会变的,所以只能拾取一个按钮。如果想获取多页的数据,有时候需要结合
鼠标点击
去翻页,或者将编辑好的按钮的 selector 传递到按钮的属性中。关于这个问题,不知道大家有没有什么更好的解决方法或者想法呢。还有对整个组件的使用建议,也欢迎大家在使用之后一起讨论讨论呀!!感谢大家看到这里!!ღ(´・ᴗ・`) 比心 希望这个工具能够帮助您更方便地处理数据,解决问题!
更详细的使用说明可以移步线上使用手册哦 👉 结构化数据抓取使用方法
666