200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > python爬取安居客网站上北京二手房数据

python爬取安居客网站上北京二手房数据

时间:2019-04-01 02:23:05

相关推荐

python爬取安居客网站上北京二手房数据

目标:爬取安居客网站上前10页北京二手房的数据,包括二手房源的名称、价格、几室几厅、大小、建造年份、联系人、地址、标签等。

网址为:/sale/

BeautifulSoup官网:/software/BeautifulSoup/

直接上代码:

import requestsfrom bs4 import BeautifulSoup'''遇到不懂的问题?Python学习交流群:113645满足你的需求,资料都已经上传群文件,可以自行下载!'''headers={'user-agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}link='/sale/'def getHouseInfo(link):r=requests.get(link,headers=headers)soup=BeautifulSoup(r.text,'lxml')house_list=soup.find_all('li',class_='list-item')for house in house_list:name=house.find('div',class_='house-title').a.text.strip()price=house.find('span',class_='price-det').text.strip()price_area=house.find('span',class_='unit-price').text.strip()#单位面积no_room=house.find('div',class_='details-item').span.text#几室几厅area=house.find('div',class_='details-item').contents[3].textfloor=house.find('div',class_='details-item').contents[5].textyear=house.find('div',class_='details-item').contents[7].textbroker=house.find('span',class_='brokername').textbroker=broker[1:]address=house.find('span',class_='comm-address').text.strip()address=address.replace('\xa0\xa0\n',' ')tag_list=house.find_all('span',class_='item-tags')tags=[i.text for i in tag_list]print(name,price,price_area,no_room,area,floor,year,broker,address,tags)for i in range(1,11):link=link+'/p'+str(i)print('page'+str(i))getHouseInfo(link)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。