把爬取的网页源代码保存到文档中

import urllib.request

import chardet

 

page = urllib.request.urlopen(‘http://www.meituba.com/tag/juesemeinv.html’) # 打开网页

htmlCode = page.read() # 获取网页源代码

 

#print(chardet.detect(htmlCode)) # 查看编码方式

data = htmlCode.decode(‘utf-8’)

#print(data) # 打印网页源代码

 

pageFile = open(‘pageCode.txt’,‘wb’)# 以写的方式打开 pageCode.txt

pageFile.write(htmlCode)# 写入

pageFile.close()# 开了记得关