pandas read_csv 编码错误导致无法读取的问题
当一个 csv 文件中包含中文时,使用pandas.read_csv会报如下错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb6 in position 0: invalid start byte
解决方案是设置编码格式
在 pandas.read_csv 中添加一个 encoding=’gbk’的参数:pandas.read_csv(..., encoding='gbk')
常用的编码格式
- UTF-8
- GBK
- ISO-8859-1
- CP1252
如果设置编码还是报错的话
解决方法是:用记事本打开 csv 文件,另存为设置编码为 UTF-8,然后重新读取文件时设置 encoding=‘UTF-8’ 就好了
学习,学习
learn