1. 研究目的与意义
看电影现在已是人们生活中不可缺少的一部分,人们一般都会在无聊的时候去影院看一部电影,在心情烦躁或者休息娱乐的时候去看一场好电影。
因此,现如今的电影行业蒸蒸日上,发展趋势良好,但是也不乏有一些制作不精良的电影在影院上映。
电影很多,但是好的作品却越来越少,不好的却应接不暇。
2. 研究内容和预期目标
研究内容:本文主要研究影响人们给出的电影评分的种种因素,以电影评分为因变量,电影的导演、主演、电影类型、制片国家、语言、剧情为自变量,进行回归分析,给出一个电影评分的数据模型,从而可以对人们进行电影的选择给予一定的参考。
拟解决的关键问题:本文的关键问题在于中文分词,要对剧情进行文本挖掘,通过分词处理,统计出每个词组的词频,从而统计出含有什么样内容的剧情才会更加吸引观众。
写作提纲:第一部分:引言和文献综述(1)背景分析及其研究意义(2)文献回顾(3)研究方法、研究思路和结构安排。
3. 国内外研究现状
中文词法分析(中文分词、词性标注和命名实体识别任务)是中文信息处理的基础。由于其底层的位置,词法分析的输出将直接影响到上层任务的结果,因此一个优秀的中文词法分析系统是中文自然语言处理的必需品。目前业界已经有较多使用广泛的中文词法分析系统,如斯坦福大学的Core NLP,张华平博士打造的NLPIR(ICTCLAS)等。这些系统普遍采用手工特征作为输入,以对数线性或线性模型来进行拟合并预测。采用此方法的中文词法分析系统在过去的时间里一直表现良好,并且得到了广泛的应用。但无论是我国还是国际,多数是运用中文词法分析对电影评论内容进行情感分析,从而给出对票房的影响,如刘正山的在线评价、电影异质性与票房收入——基于2014~2015年177部国产电影数据的检验、叶子.的2017年国产片网络口碑与票房的关系研究,都是对挖掘大众评论对票房的影响,很少涉及到对电影剧情内容的文本分析,故本文准备采取这个切入点,给予一种新的思考方式。
4. 计划与进度安排
1.2022年11月10日——完成选题;
2.2022年11月30日前——完成开题;
3.2022年12月31日前——阅读大量资料并选取有用资料待用,积累最新信息;
5. 参考文献
1.李实,叶强,李一军,LawR.中文网络客户评论的产品特征挖掘方法研究.管理科学学报,2009,12(2):142—152
2.黄昌宁,赵海.中文分词十年回顾 [J]. 中文信息学报 ,2007,21(03):8-19.
3.何国斌,赵晶.基于最大匹配的中文分词概率算法研究 [J]. 计算机工程 ,2010,36(05):173-175.
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。