chardet 编码判断

Zss 发表于:

测试数据库同步时的配置文件有时候需要在win或者在linux,而两者的编码不一致,gbk和utf8

使用python3可以统一使用utf8比较方便,但是因为之前的脚本用的是gbk,有的配置文件却是gbk,所以需要对文本做检测再使用不同的方式来读取

with open(self.config_path,'rb') as f:
    if 'UTF' in str(chardet.detect(f.read())).upper():
        self.code = 'utf8'
    else:
        self.code = 'gbk'

因为只涉及到utf8和gbk所以if else了

直接获得编码 chardet.detect(data).get(“encoding”)