两个文件,一个utf-8,一个gb2312
读取gb2312时,直接读取,‘r’模式就可以,没有遇到问题,读取utf-8时,报错gbk不能对某某字符进行编码
改为'rb'模式,再用decode进行解码一下,就可以正常了
1.stopwords = []
2.f = open("D:\\task\\Chinese-master\\stopwords.txt",'rb')
3.for line in f:
3. lines = line.decode("utf-8").strip('\n')
4. stopwords.append(lines)
补充:python版本是3.5
转载请注明原文地址: https://ju.6miu.com/read-599996.html