selenium 中 get_attribute 的几种用法
以艺赛旗论坛为例,我们首先定位到第一篇置顶帖的元素。
element = browser.find_element_by_xpath('//*[@id="recent-pjax-container"]/div[1]/div/ul/li[1]/h2/a')
然后对 a 标签中的每个属性进行 get_attribute 操作。
除此以外,get_attribute 还有一些其他参数可以使用:get_attribute('textContent')
会获取标签之间的文本内容
>>> element.get_attribute('textContent')
'三重好礼 — 整个 8 月我们陪你 High 翻天 (文末实物图)\n '
get_attribute('innerHTML')
会获取标签之间的完整 html
>>> element.get_attribute('innerHTML')
'三重好礼 — 整个 8 月我们陪你 High 翻天 (文末实物图)\n '
get_attribute('outerHTML')
获取当前标签的完整 html
>>> element.get_attribute('outerHTML')
'<a class="ft-a-title" data-id="1564708073013" data-type="0" rel="bookmark" href="http://support.i-search.com.cn/article/1564708073013">三重好礼 — 整个 8 月我们陪你 High 翻天 (文末实物图)\n </a>'
赞一下。
👍