python读取不同文件的编码问题

    xiaoxiao2021-03-26  16

    两个文件,一个utf-8,一个gb2312

       读取gb2312时,直接读取,‘r’模式就可以,没有遇到问题,读取utf-8时,报错gbk不能对某某字符进行编码 改为'rb'模式,再用decode进行解码一下,就可以正常了 1.stopwords = [] 2.f = open("D:\\task\\Chinese-master\\stopwords.txt",'rb') 3.for line in f: 3. lines = line.decode("utf-8").strip('\n') 4. stopwords.append(lines) 补充:python版本是3.5
    转载请注明原文地址: https://ju.6miu.com/read-599996.html

    最新回复(0)