python读取不同文件的编码问题

xiaoxiao2021-03-26 102

两个文件，一个utf-8，一个gb2312

读取gb2312时，直接读取，‘r’模式就可以，没有遇到问题，读取utf-8时，报错gbk不能对某某字符进行编码改为'rb'模式，再用decode进行解码一下，就可以正常了 1.stopwords = [] 2.f = open("D:\\task\\Chinese-master\\stopwords.txt",'rb') 3.for line in f: 3. lines = line.decode("utf-8").strip('\n') 4. stopwords.append(lines) 补充：python版本是3.5

转载请注明原文地址: https://ju.6miu.com/read-599996.html

技术

最新回复(0)