获取网页表格数据

#导入包
import ubpa.iie as iie
import re
import pandas as pd

#title 是当前网页按 F12 后,拉到顶部 HTML->head->title title 标签里面的内容填入下面第一行代码中的 title 里面
#selector 是网页按 F12,找到 table 标签,将标签上的 class 或者 id 写入下面第一行代码中的 selector(必须保证唯一的)

table_string = iie.get_html(title=r’网页当前 title’,selector=r’表格的标签 class 或者 id’)
tb_start = re.compile(‘‘)
tb_end = re.compile(’’)
last_str = tb_end.sub(‘‘, tb_start.sub(’’, table_string))
lv_data = pd.read_html(last_str, flavor=“bs4”, header=None)[0] #这个就是获得的数据

print(lv_data)