200字范文 > Python爬虫第一步之获取网页源代码

Python爬虫第一步之获取网页源代码

时间：2023-03-27 20:44:19

相关推荐

Python爬虫第一步之获取网页源代码

软件使用：Python2.7 +Pycharm，稍后使用Python3.5+notepad++试试

#coding: utf-8import urllibdef getHtml(url):page = urllib.urlopen(url)html = page.read()return htmlhtml = getHtml("/")

#coding = utf-8import urllibpage =urllib.urlopen("/")print page.read()

#-*- coding: UTF-8 -*- # 当运行之后，提示 please enter the website: 时，输入网站 import urllib2url=raw_input('please enter the website: ')page =urllib2.urlopen(url)print page.read()

# coding=utf-8#coding: utf-8

#-*- coding: UTF-8 -*-

三个功能应该是一样的

PY文件当中是不支持中文的，即使你输入的注释是中文也不行，为了解决这个问题，就需要把文件编码类型改为UTF-8的类型，输入这个代码就可以让PY源文件里面有中文了。

建议你写代码之前都把这句话加上，因为不管是注释还是弹出消息提示，免不了的要输入中文，所以这个基本是必须的。（搜索自百度知道）

剩下的参考

Python的Urllib库的基本使用教程

使用Markdown 编写，可见即可得

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。