代码拉取完成,页面将自动刷新
这个爬虫代码已过时,不再维护
之前微博是把html代码放到了js中,所以可以从代码中直接提取需要的数据
突然很好奇北京地铁每天的客流量变化,于是写了个爬虫。结果很有意思,每周7天的客流变化都很规律
https://www.ikaze.cn/sub_flows.html
get_flow_from_html()
函数def get_flow_from_html(html):
# 需要根据页数调整年份
year = 2018
soup = bs(html, 'html.parser')
work_list = soup.find_all('div', class_='work_list')
data = work_list[0].find_all('li')
for d in data:
s = data.get_text()
...
然后直接循环跑就行:
page=200
while page>0:
html = get_html(get_page_url(page))
get_flow_from_html(html)
...
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。