网络爬虫技术在软件类人才需求调查中的应用开题报告

 2023-10-26 09:20:55

1. 研究目的与意义

近年来,IT人才总体供不应求。从资质来看,IT人才呈金字塔分布,高中低端人才分别占比8%、 41%、51%。由于供需失衡或岗位吸引力不足,企业“招聘难”问题在高低两端尤其凸显。从地域来看,一线城市是我国IT人才供需的集中点。但近年来二线城市IT需求增长,承接过剩IT人才,一线城市向二线城市的反向人才流动趋势愈发明晰。对于本科毕业生来说,高校扩招导致毕业生总量迅速膨胀,其中IT相关专业毕业生占比达10%左右,我国IT人才储备日益丰富,缺口在逐年缩减,同时IT人才的就业观在逐步成熟。所以对近年来社会上软件类人才的需求情况的分析就显得格外重要。

在这个越来越信息化的社会,互联网上的信息量更是爆炸式的增长,但是在如此巨大的信息量中,我们想要找到我们需要的价值信息就非常困难了。网络爬虫就体现出它的价值,它可以获取大量数据,用于做数据分析。其中python语言的模块开发成熟,拥有Scrapy网络爬虫框架,爬取数据方便。

2. 研究内容和预期目标

本课题旨在爬取数据,处理、分析数据,主要研究内容:

(1)利用python爬虫库,发送GET请求,获取HTML,解析HTML,获取数据

(2)利用python的pandas、matplotlib、seaborn等库分析数据,对数据进行可视化处理

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

研究方法:通过python3技术对人才数据进行采集、存储、清洗、分析、可视化等研究当前社会软件类人才需求情况,提供有价值的数据分析报告。

步骤:

1、分析目标网站网页的结构,设计出合理的爬虫方案

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun. Deep residual learning for image recognition [C]. In: CVPR, 2016.

[2] Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun. Identity mappings in deep residual networks [C]. In: ECCV, 2016.

[3] 罗伯托巴蒂蒂,毛罗布鲁纳托著,王彧弋译. 机器学习与优化[M]. 北京:人民邮电出版社,2020.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

1. 2024年2月20日-24日 下发毕业论文任务书

2. 2024年2月20日-3月3日 学生完成开题报告和外文翻译

3. 2024年3月6日-5月26日 撰写毕业论文

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。