1. 研究目的与意义
近年来,IT人才总体供不应求。从资质来看,IT人才呈金字塔分布,高中低端人才分别占比8%、 41%、51%。由于供需失衡或岗位吸引力不足,企业“招聘难”问题在高低两端尤其凸显。从地域来看,一线城市是我国IT人才供需的集中点。但近年来二线城市IT需求增长,承接过剩IT人才,一线城市向二线城市的反向人才流动趋势愈发明晰。对于本科毕业生来说,高校扩招导致毕业生总量迅速膨胀,其中IT相关专业毕业生占比达10%左右,我国IT人才储备日益丰富,缺口在逐年缩减,同时IT人才的就业观在逐步成熟。所以对近年来社会上软件类人才的需求情况的分析就显得格外重要。
在这个越来越信息化的社会,互联网上的信息量更是爆炸式的增长,但是在如此巨大的信息量中,我们想要找到我们需要的价值信息就非常困难了。网络爬虫就体现出它的价值,它可以获取大量数据,用于做数据分析。其中python语言的模块开发成熟,拥有Scrapy网络爬虫框架,爬取数据方便。
2. 研究内容和预期目标
本课题旨在爬取数据,处理、分析数据,主要研究内容:
(1)利用python爬虫库,发送GET请求,获取HTML,解析HTML,获取数据
(2)利用python的pandas、matplotlib、seaborn等库分析数据,对数据进行可视化处理
3. 研究的方法与步骤
研究方法:通过python3技术对人才数据进行采集、存储、清洗、分析、可视化等研究当前社会软件类人才需求情况,提供有价值的数据分析报告。
步骤:
1、分析目标网站网页的结构,设计出合理的爬虫方案
4. 参考文献
[1] Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun. Deep residual learning for image recognition [C]. In: CVPR, 2016.
[2] Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun. Identity mappings in deep residual networks [C]. In: ECCV, 2016.
[3] 罗伯托巴蒂蒂,毛罗布鲁纳托著,王彧弋译. 机器学习与优化[M]. 北京:人民邮电出版社,2020.
5. 计划与进度安排
1. 2024年2月20日-24日 下发毕业论文任务书
2. 2024年2月20日-3月3日 学生完成开题报告和外文翻译
3. 2024年3月6日-5月26日 撰写毕业论文
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。