首页 > 编程语言 >头歌实验平台-Python-Scrapy爬虫之拉勾网招聘数据分析(第4,5关)

头歌实验平台-Python-Scrapy爬虫之拉勾网招聘数据分析(第4,5关)

时间:2024-05-25 12:25:09浏览次数:32  
标签:index plt 拉勾 Python matplotlib Scrapy pd path import

首先十分感谢在博主(Radish_c-CSDN博客)的帮助下,完成了这个实验的1-3关,然后第4-5关就卡住了,然后搜了好久,这个实验4和5平台上只有博主 (Radish_c-CSDN博客)这个需要更改命令行的答案,博主的原文章在这里

Python应用-Scrapy爬虫之拉勾网招聘数据分析-CSDN博客

Python应用-Scrapy爬虫之拉勾网招聘数据分析(4,5关)_最低薪资柱状图csdn-CSDN博客

so,更新了一个可以直接通过的第4关、第5关的代码

第4关

​
#********** Begin **********#
#1.导入基础包
import numpy as np
import pandas as pd
import matplotlib
# Force matplotlib to not use any Xwindows backend.
matplotlib.use('Agg')
import matplotlib.pyplot as plt
import re

#2.导入文档数据
path = r'step4/'
filePath = path+r'positions.csv'
df = pd.read_csv(filePath,encoding='gbk')
#3.分析数据
b1 = pd.DataFrame(df['salarylow'].value_counts())
b1.sort_index(inplace=True)
X = b1.index.tolist()
Y = list(b1.salarylow)
#4.画图
x = np.arange(len(X))+1
width = 0.5
fig,ax = plt.subplots()
ax.bar(x,Y,width)
for p in ax.patches:
ax.annotate(str(p.get_height()), xy=(p.get_x(), p.get_height()))
#********** End **********#
plt.savefig(path+r'/yourimg/'+r'bar.png') #存储图片

第5关

#********** Begin **********#
#1.导入基础包
import numpy as np
import pandas as pd
import matplotlib
#强制matplotlib不使用任何Xwindows后端(X Window图形用户接口)
matplotlib.use('Agg')
import matplotlib.pyplot as plt
import re
# 防止中文乱码
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['font.family']='sans-serif'

#2.导入文档数据
path = r'step5/'
filePath = path + r'positions.csv'
df = pd.read_csv(filePath,encoding = 'gbk')
#3.分析数据
c = pd.DataFrame(df['salarylow'].value_counts())
c.sort_index(inplace=True)
X1 = c.index.tolist()
Y1 = list(c.salarylow)

d = pd.DataFrame(df['salaryhigh'].value_counts())
d.sort_index(inplace=True)
X2 = d.index.tolist()
Y2 = list(d.salaryhigh)
x1 = np.arange(len(X1))+1
x2 = np.arange(len(X2))+1
#4.画图
plt.title('薪资走势图') #给图设置标题
plt.plot(x1, Y1, color='g', label='salarylow')
plt.plot(x2, Y2, color='red', label='salaryhigh')
plt.legend() # 显示图例
plt.xlabel('薪资')
plt.ylabel('职位数')
#********** End **********#
plt.savefig(path+r'/yourimg/'+r'plot.png') #存储图片

标签:index,plt,拉勾,Python,matplotlib,Scrapy,pd,path,import
From: https://blog.csdn.net/tpLxe_866426/article/details/139195465

相关文章

  • Python串口控制MS伺服电机(多圈角度)
    """多圈电机转动模式1"""defdecimal_to_hex_bytes(decimal_number,byte_size):#检查字节大小参数的有效性valid_sizes={"int8":1,"int16":2,"int32":4,"int64":8}ifbyte_sizenotinval......
  • Python筑基之旅-MySQL数据库(三)
    目录一、数据库操作1、创建1-1、用mysql-connector-python库1-2、用PyMySQL库1-3、用PeeWee库1-4、用SQLAlchemy库2、删除2-1、用mysql-connector-python库2-2、用PyMySQL库2-3、用PeeWee库2-4、用SQLAlchemy库二、数据表操作1、创建1-1、用mysql-connector-pyth......
  • Python筑基之旅-MySQL数据库(四)
    目录一、数据表操作1、新增记录1-1、用mysql-connector-python库1-2、用PyMySQL库1-3、用PeeWee库1-4、用SQLAlchemy库2、删除记录2-1、用mysql-connector-python库2-2、用PyMySQL库2-3、用PeeWee库2-4、用SQLAlchemy库3、修改记录3-1、用mysql-connector-python......
  • kettle从入门到精通 第六十三课 ETL之kettle kettle调用python脚本的两种方法
    kettle中不能直接调用python脚本,可以通过shell脚本和http进行调用pyton服务。一、shell脚本调用python脚本1、下面是一段简单的无参python脚本importosdefmain():#在这里编写Python脚本的主要逻辑print("Hello,thisisaPythonscriptcalledbyshell!")i......
  • Python中的异常处理:try, except, else, finally详解
    Python中的异常处理:try,except,else,finally详解在Python编程中,异常处理是确保程序健壮性和错误处理能力的重要机制。通过使用try,except,else,finally等关键字,Python提供了灵活的异常处理框架,使得开发者能够优雅地处理运行时错误和其他异常情况。本文将详细解析这些......
  • Python中别再用 ‘+‘ 拼接字符串了!
    大家好,在Python编程中,我们常常需要对字符串进行拼接。你可能会自然地想到用+操作符将字符串连接起来,毕竟这看起来简单明了。在Python中,字符串是不可变的数据类型,这意味着一旦字符串被创建,它就不能被修改。因此,当你尝试通过使用+来连接字符串时,实际上Python会创建......
  • Python异步编程之基础概念
    Python异步编程之基础概念在现代编程中,异步编程是一种重要的技术,尤其是在处理I/O密集型任务时,异步编程可以大大提高程序的性能和响应速度。本文将介绍Python异步编程的基础概念,帮助你理解其原理和应用。什么是异步编程?异步编程是一种并发编程模型,它允许程序在等待某些任......
  • SpringCloud + Python 混合微服务架构,打造AI分布式业务应用的技术底层
    文章很长,且持续更新,建议收藏起来,慢慢读!疯狂创客圈总目录博客园版为您奉上珍贵的学习资源:免费赠送:《尼恩Java面试宝典》持续更新+史上最全+面试必备2000页+面试必备+大厂必备+涨薪必备免费赠送:《尼恩技术圣经+高并发系列PDF》,帮你实现技术自由,完成职业升级,薪......
  • 深入解析Python并发的多线程和异步编程
    在Python编程中,多线程是一种常用的并发编程方式,它可以有效地提高程序的执行效率,特别是在处理I/O密集型任务时。Python提供了threading模块,使得多线程编程变得相对简单。本文将深入探讨threading模块的基础知识,并通过实例演示多线程的应用。1.多线程基础概念在开始之前,让我们......
  • 计算机毕业设计python+spark天气预测 天气可视化 天气大数据 空气质量检测 空气质量分
    摘  要近些年大数据人工智能等技术发展迅速,我国工业正努力从“制造”迈向“智造”实现新跨越。神经网络(NeuronNetwork)是一种计算模型,通过大量数据的学习,来发现数据之间的模式和规律,模仿人脑神经元的工作方式。随着算力的提升和算法的不断成熟图像识别技术已经完全融入到生......