博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
用BeautifulSoup简单爬取BOSS直聘网岗位
阅读量:4568 次
发布时间:2019-06-08

本文共 1088 字,大约阅读时间需要 3 分钟。

用BeautifulSoup简单爬取BOSS直聘网岗位

  • 爬取python招聘
import requestsfrom bs4 import BeautifulSoupdef fun(path):    r1 = requests.get(url=path,                      headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3676.400 QQBrowser/10.4.3469.400'},                      )    soup = BeautifulSoup(r1.text,'html.parser')    div = soup.find(name='div',id='main')    info  = div.find(name='div',attrs={'class':'job-list'})    li = info.find_all(name='li')    f = open('boss直聘.txt','a',encoding='utf-8')    for i in li:        job = i.find(name='div',attrs={'class':'job-title'})        red = i.find(name='span',attrs={'class':'red'})        company = i.find_all(name="a")        em = i.find_all(name='p')        info = "%s|%s|%s|%s|%s"%(job.text,red.text,em[0].text,em[1].text,company[1].text)        f.write(info+'\n')    f.close()for i in range(1,11):    path = 'https://www.zhipin.com/c101010100-p100109/?page=%d&ka=page-%d'%(i,i)    fun(path)

此代码仅供学习使用。

转载于:https://www.cnblogs.com/xujunkai/p/11048246.html

你可能感兴趣的文章
Guava常用方法
查看>>
asp.net IsPostBack
查看>>
js实现两种实用的排序算法——冒泡、快速排序
查看>>
PTA——03-树3 Tree Traversals Again(25 分)【java语言实现】
查看>>
STL Vector 的遍历删除
查看>>
处理器管理与进度调制
查看>>
libpng warning: iCCP: known incorrect sRGB profile
查看>>
【智力题】过桥问题和倒水问题
查看>>
UPenn - Robotics 1:Aerial Robotics - week 2:Geometry and Mechanics
查看>>
使用navigator.userAgent.toLowerCase()判断移动端类型
查看>>
REMODE+ORBSLAM运行配置(2) REMODE和编译后的ORB ros工程利用节点实现通讯
查看>>
C#的基本语法
查看>>
CCCC2017大区赛补完
查看>>
深度学习UFLDL老教程笔记1 稀疏自编码器Ⅱ
查看>>
Windows常用命令集
查看>>
luogu P2073 送花
查看>>
CPU占用率呈正弦实现,及实时输出进程和线程的CPU占用率
查看>>
java学习第八天
查看>>
判断是否有人在操作某张表,并获取…
查看>>
第四周仿真与计算作业
查看>>