pandas read_csv 编码错误导致无法读取的问题

当一个 csv 文件中包含中文时,使用pandas.read_csv会报如下错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb6 in position 0: invalid start byte
解决方案是设置编码格式
在 pandas.read_csv 中添加一个 encoding=’gbk’的参数:
pandas.read_csv(..., encoding='gbk')

常用的编码格式  

  • UTF-8 
  • GBK 
  • ISO-8859-1 
  • CP1252

如果设置编码还是报错的话
解决方法是:用记事本打开 csv 文件,另存为设置编码为 UTF-8,然后重新读取文件时设置 encoding=‘UTF-8’ 就好了