电影评论论文提纲

2022-08-28

论文题目:基于BERT-TextCNN-B的电影评论情感分析

摘要:改革开放40多年来,我国的经济呈现出稳步持续的增长趋势,与此同时,随着互联网技术的高速发展,社交网络已经逐步渗透到人们生活的方方面面,各种社交论坛、网站、APP等如雨后春笋般诞生,在满足人们各式各样的生活需求时,也为我们提供了商品评论、社交评论、服务评论等信息。这些评论中隐藏着评论者对评论对象的反馈,挖掘其中的情感倾向信息,能够给消费者提供购物参考,也能帮助商家优化产品、改进经营策略。因此,本文以电影评论为研究对象,通过分析其中的情感倾向,为购买提供决策支持,也从客观角度全面分析影片,总结正面或负面的反馈意见,指导电影行业朝着更好的方向发展。本文以《流浪地球》电影评论数据为基础,不仅从整体角度进行了评论信息的粗粒度情感分析,还从挖掘评论主题视角下进行了细粒度情感分析,主要研究内容包括:(1)数据采集与预处理:本文基于网络爬虫技术,利用Python爬取了豆瓣网、猫眼APP上《流浪地球》影评数据;预处理过程主要是去除重复性及无关性文本、纠正拼写、语法错误等,共得到12823条影评。此外还介绍了词向量技术——Word2Vec和BERT模型,为后续情感分析实验奠定基础。(2)粗粒度情感分析:本文分别分析了情感词典及规则模型的情感分类和BERT-Text CNN深度学习模型的情感分类:在基于情感词典及规则模型的分类中,以知网情感词典为基础词典,补充否定词词典、程度副词词典、连词词典、反问副词词典等四个辅助词典,筛选出候选情感词,采用SO-PMI算法构建了电影领域的情感词典,设计情感计算规则,按照情感得分值进行情感极性的二元分类;在基于BERT-Text CNN模型的分类中,使用BERT模型做文本向量化处理,作为Text CNN模型的输入,经参数调优后,进行了情感极性的三元分类;最后,引入贝叶斯理论,将情感值作为先验信息,提出了BERT-Text CNN-B模型,分类效果显著提高,准确率96.22%,精确率82,51%,召回率89.03%,F1值85.51%。(3)细粒度情感分析:本文首先利用LDA主题模型进行主题建模,提取评论中的主要主题以及相应主题所包含的属性词,又自定义主题与初始化属性关键词,采用Word2Vec词向量化技术,根据Cosine相似度计算实现属性词聚类,以词云图展示聚类结果,融合主题-属性词集合后,得到“题材”、“剧情”、“角色”、“画面”、“配乐”五个主题,基于BERT-Text CNN-B模型进行主题角度下的情感分类。

关键词:情感分析;情感词典;BERT;TextCNN;Word2Vec;LDA;电影评论;贝叶斯

学科专业:应用统计(专业学位)

摘要

Abstract

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究状况及意义

1.2.1 无监督分类方式

1.2.2 有监督分类方式

1.2.3 词向量技术发展状况

1.3 主要研究内容

1.4 论文组织结构

第2章 数据采集与预处理

2.1 数据采集

2.2 数据预处理

2.3 词向量技术

2.3.1 基于Word2Vec模型的词向量化

2.3.2 基于BERT模型的词向量化

2.4 本章小结

第3章 基于电影评论的粗粒度情感分析

3.1 基于情感词典及规则方法的情感分析

3.1.1 电影领域情感词典构建

3.1.2 情感值计算规则设计

3.1.3 实验结果与分析

3.2 基于BERT-TextCNN的情感分析

3.2.1 基于BERT-TextCNN的情感分类模型

3.2.2 基于BERT-TextCNN的情感分类

3.3 基于BERT-TextCNN-B的情感分析

3.3.1 基于BERT-TextCNN-B的情感分类模型

3.3.2 基于BERT-TextCNN-B的情感分类

3.4 本章小结

第4章 基于电影评论的细粒度情感分析

4.1 基于LDA主题模型的主题-属性词提取

4.1.1 LDA主题模型

4.1.2 基于LDA主题模型的主题词提取

4.2 基于自定义关键电影要素的主题-属性词构建

4.2.1 主题-属性词初始化

4.2.2 基于Word2Vec模型的属性词主题判别

4.3 主题-属性词集合对比与融合

4.4 基于主题-属性词集合和BERT-TextCNN-B的情感分类

4.5 本章小结

第5章 总结与展望

5.1 总结

5.2 展望

参考文献

致谢

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:监控管理论文提纲下一篇:教学个人资源管理论文提纲