管理科学论文提纲

2022-08-09

论文题目:基于文本挖掘的管理科学热点识别与演化分析

摘要:计算机科学已经进入了跨时代发展的阶段,人工智能和文本挖掘技术的成熟为深入分析挖掘科研文献的摘要长文本提供了新的手段和方法。目前,LDA主题模型在微博话题识别、新闻主题识别等领域表现出了优异的性能,但针对科研文献等领域的应用较少,已经有部分学者应用LDA主题模型对情报学、计算机科学等领域的学术期刊进行主题分析。在我国应用深层语义挖掘模型对管理科学领域的科学文献研究仍处于起步状态。本文率先将LDA主题模型应用于管理科学领域学术文献的主题挖掘中,进而探索我国管理科学领域主题的演化与发展。本文分析数据选取期刊中的摘要部分,摘要是学者对其论文的高度概括和总结,涵盖了文献的整体信息。与一般关键词共现分析方法相比,对摘要长文本进行主题提取可以在更大的程度上保留了文献原始信息,可以在一定程度上解决关键词无法很好的概括文献信息的问题。本文创新性的提出基于一阶差分的概率阈值设定和基于滑动时间窗口的数据切分方法。差分概率阈值设定有效的改善了主题筛选困难的问题,有效的识别相近概率的主题群,完善主题识别过程。本文提出的滑动时间窗口的数据切分,克服了不同时间区域内主题对齐困难,改善了主题断层问题。本文通过LDA主题模型在整体数据上完成热门主题识别工作,并基于滑动时间窗口的数据划分,分时间段分别构建模型,实现对热门主题的演化分析,包括主题强度的演化和主题内容的演化。通过LDA主题模型构建管理科学领域科学论文热点分析的量化模型,有助于发现我国管理科学领域前沿问题,探索我国管理科学学科的演化方向,进而能够明确我国管理科学未来研究的重点领域,实现对我国管理科学宏观的整体性的认知。

关键词:管理科学;LDA;热点识别;演化分析

学科专业:管理科学与工程

摘要

Abstract

第1章 绪论

1.1 课题背景与研究意义

1.1.1 课题背景

1.1.2 研究意义

1.2 国内外研究现状

1.2.1 管理科学研究现状

1.2.2 文本挖掘研究现状

1.2.3 研究现状综述

1.3 论文研究结构与方法

1.3.1 论文研究结构

1.3.2 论文研究方法

第2章 文本挖掘理论基础

2.1 文本预处理

2.1.1 中文文本分词

2.1.2 词性标注

2.1.3 停用词过滤

2.1.4 特征选择

2.2 主题模型

2.2.1 主题模型介绍

2.2.2 模型求解

2.2.3 评价体系

2.3 本章小结

第3章 热点主题识别与演化建模

3.1 数据选择与预处理

3.1.1 数据选择

3.1.2 数据预处理

3.2 热点主题识别建模

3.2.1 主题模型训练与调参

3.2.2 文档-主题矩阵与主题-词矩阵

3.2.3 一阶差分阈值设定法

3.3 主题演化建模

3.3.1 基于时间滑动窗口的子话题获取

3.3.2 子话题强度计算

3.3.3 子话题相似度计算

3.4 主题对齐与演化分析

3.5 本章小结

第4章 实验与结果评价

4.1 热点主题识别实验

4.1.1 超参数与主题数选取

4.1.2 基于概率值一阶差分的阈值设定

4.1.3 热点主题TOP-N排序

4.2 热点主题演化分析实验

4.2.1 基于滑动时间窗的数据切分

4.2.2 热点主题强度演化分析

4.2.3 热点主题内容演化分析

4.3 基于共词分析的对比分析

4.3.1 高频词抽取

4.3.2 共词分析

4.3.3 对比分析

4.4 本章小结

结论

参考文献

致谢

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:模糊数学论文提纲下一篇:初中美术教学素质教育论文提纲