繁体中文和简体中文编码
中文编码遇到问题
// 程序获取 获取的是简体中文
PS:最好统一输入,统一输入简体中文或者统一输入繁体中文,如果一般输入简体一半输入繁体,用window系统函数转换会出问题。
编码判断
百度api识别结果包含其他国文字(如:\uc601),window下python写txt,默认转gbk,如韩文转gbk,所以出现encode失败,需要过滤筛选
#中文Unicode编码判断,范围\u4e00~\u9fa5def containCHN(str):for ch in str:if not '\u4e00' <= ch <= '\u9fa5':return Falsereturn True