将网页信息规律提取成列表形式
解决的需求场景:
设计器进行提取文本操作时,cmd 会得到不规则的文本信息。而我们进行操作的时候,最好的信息格式是列表格式。以下函数是将不规则信息得到列表形式的函数。
# 规律提取网页的表格信息
def write_in_position():
# example of webpage position text
text = iie.get_text(url=r'http://www.sh.10086.cn/service/static/queryBill/GprsBill.html',selector=r'DIV:nth-of-type(11) > DIV:nth-of-type(1) > DIV:nth-of-type(1) > DIV:nth-of-type(2) > DIV:nth-of-type(5) > DIV:nth-of-type(2)',waitfor=10)
a = text.split('\n') # 分割后变成列表
print(list(text))
print(a)
item = []
for x in a:
a = x.strip()
if a != '':
item.append(a)
print(item)