Python 出现 UnicodeDecodeError: 'gbk' codec can't decode 报错,加 utf-8 和 gbk 都无法解决时 可以使用一下办法

使用 python 的时候经常会遇到文本的编码与解码问题,其中很常见的一种解码错误如题目所示,但是加上 encoding=‘gbk’换成 encoding=‘utf-8’都无法解决

可能是文本中出现的一些特殊符号超出了 gbk 的编码范围,可以选择编码范围更广的‘gb18030’,如:open(‘1.txt’,encoding=’gb18030’);  
若(2)仍不能解决,说明文中出现了连‘gb18030’也无法编码的字符,可以使用‘ignore’属性进行忽略,如:*open(‘1.txt’,encoding=’gb18030’,errors=‘ignore’);  *

解决方法为 open(‘1.txt’).read().decode(‘gb18030’,’ignore’)