的chardet库来自动检测网页的编码方式,然后使用相应的编码方式来解析网页。
二、设置正确的请求头
的requests库来发送HTTP请求,并设置正确的请求头。
三、使用合适的解析器
l解析器,来解析中文网页。
四、处理特殊字符
的正则表达式或者其他方法来处理这些特殊字符,以便正确解析中文网页。
l爬取中文出现乱码问题。
时间:2019-10-02 19:01:33
的chardet库来自动检测网页的编码方式,然后使用相应的编码方式来解析网页。
二、设置正确的请求头
的requests库来发送HTTP请求,并设置正确的请求头。
三、使用合适的解析器
l解析器,来解析中文网页。
四、处理特殊字符
的正则表达式或者其他方法来处理这些特殊字符,以便正确解析中文网页。
l爬取中文出现乱码问题。