200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > Python爬虫第一步之获取网页源代码

Python爬虫第一步之获取网页源代码

时间:2023-03-27 20:44:19

相关推荐

Python爬虫第一步之获取网页源代码

软件使用:Python2.7 +Pycharm,稍后使用Python3.5+notepad++试试

#coding: utf-8import urllibdef getHtml(url):page = urllib.urlopen(url)html = page.read()return htmlhtml = getHtml("/")

#coding = utf-8import urllibpage =urllib.urlopen("/")print page.read()

#-*- coding: UTF-8 -*- # 当运行之后,提示 please enter the website: 时,输入网站 import urllib2url=raw_input('please enter the website: ')page =urllib2.urlopen(url)print page.read()

# coding=utf-8#coding: utf-8

#-*- coding: UTF-8 -*-

三个功能应该是一样的

PY文件当中是不支持中文的,即使你输入的注释是中文也不行,为了解决这个问题,就需要把文件编码类型改为UTF-8的类型,输入这个代码就可以让PY源文件里面有中文了。

建议你写代码之前都把这句话加上,因为不管是注释还是弹出消息提示,免不了的要输入中文,所以这个基本是必须的。(搜索自百度知道)

剩下的参考

Python的Urllib库的基本使用教程

使用Markdown 编写,可见即可得

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。