获取文本这个组件,能获取什么样的文本

看官方的说明:

针对可拾取窗口页面的元素,获取元素中的文本,并将获取到的文本进行返回。

还有三点要注意:

  • 主要用于页面元素信息的搬运;
  • 未找到元素,则返回空文本,不抛出异常;
  • 利用第二点特性来容错,(即: 正常情况下可获取到文本,若不能获得则说明出错);

到底能获取什么样的文本

获取文章标题

获取文本这个组件,能获取什么样的文本

这是一个文章的标题。

获取文本这个组件,能获取什么样的文本

看结果:

获取文本这个组件,能获取什么样的文本


获取文章摘要

获取文本这个组件,能获取什么样的文本

这是一篇贴子的摘要。

获取文本这个组件,能获取什么样的文本

看结果:
获取文本这个组件,能获取什么样的文本


获取网页按钮

获取文本这个组件,能获取什么样的文本

一个登录按钮。

获取文本这个组件,能获取什么样的文本

看结果:

获取文本这个组件,能获取什么样的文本


获取一篇文章

获取文本这个组件,能获取什么样的文本

一篇文章中包含了很多段落。

获取文本这个组件,能获取什么样的文本

看结果:

获取文本这个组件,能获取什么样的文本


结合应用场景

例如我们要抓取一篇文章的标题和内容。

使用“获取文本”组件,即能抓标题也能抓内容了。
在 Python 中,还要引用第三方库,虽然也很方便,但 ISRPA 更容易上手。

看起来很简单。可是,没在应用场景中,这个仅是一项功能和用法。用在开发中,这就是一项技能。

看一个实例: 如何通过一篇文章的 URL 抓取标题和内容


以上仅针对“获取文本”的主要用法(即:页面元素信息搬运),结合实例谈谈想法。