utf-8和utf-8-sig的区别(CSV文件乱码)

前言:python 在写入csv文件中,出现了乱码的问题。

解决:utf-8 改为utf-8-sig

区别如下:

1、“utf-8”是以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序问题,因此它不需要BOM,所以当用“utf-8”编码方式读取带有BOM的文件时,它会把BOM当做是文件内容来处理,也就会发生类似上边的错误。

2、“utf-8-sig”中sig全拼为 signature 也就是”带有签名的utf-8”,因此”utf-8-sig”读取带有BOM的“ utf-8″文件时会把BOM单独处理,与文本内容隔离开,也是我们期望的结果。

发表评论

Free Web Hosting