智能问答技术在图书馆领域的应用建议

2022-09-13

随着信息时代的发展, 知识的共享性和传播性得到极大程度的开发。而作为公众重要基础设施之一的图书馆, 在越来越多的实体资源和电子资源面前, 需要提供更加简单、高效、快捷、全面的功能, 最大限度地为单个用户或用户群提供个性化信息服务, 才能充分为大众提供便利。

馆藏数字化资源的增加提高了用户需求的满足度, 但与此同时, 用户操作的难度也在提升:当用户没有明确的书目需求, 或是提出过于专业详细的学术需求时, 图书馆往往没有相应的问答系统为其提供引导和服务;部分现行图书馆具有相应的参考解答系统也只包含固定的FAQ问答, 无法达到精细化、个人化的服务目标。由于用户在问答情境下能更好地明确自己的需求, 因此图书馆行业智能问答系统的研究是必要的。

一、智能问答的发展现状

早期的智能问答 (Question Answering, QA) 技术以传统机器学习模型为基础, 根据文本特征及算法实现基本的文本词句分解。由于这种方法往往依赖特征提取的质量高低, 缺乏对数据深层语义信息的学习能力, 无法挖掘大量数据中的隐含特征, 因此存在着处理稀疏数据不好、回答准确率较低的问题, 需要进一步改善。目前的QA技术主要是结合知识库或深度学习, 实现对自然语言深度逻辑关系的理解。

基于知识库的QA技术能通过知识库丰富的存储对自然语言进行更深入的语义关联, 提高自然语言处理的准确率。知识库问答 (Knowledge Base Question Answering, KB-QA) 一般分为三部分:知识推理、知识获取和知识表示, 知识获取是目前研究的热点, 包括命名实体识别和实体关系抽取两方面。

基于深度学习的QA技术通过在多层神经网络训练效率的提高, 不仅能在语义角度实现自然语言的准确匹配, 还在情感分析等领域取得了重大发展, 将自然语言从浅层特征解析变为通过更加复杂的深度学习网络结构。利用卷积神经网络 (CNN) 算法, Kim进一步改善了问答系统中的语义分析与句子分类;基于双向长短时记忆 (Bi-LSTM) , Tan等认为结合注意力机制的深度学习模型结构, 能更好地优化答案筛选任务。神经网络的引入让基于深度学习的QA系统可以进一步探索语句内部逻辑联系和情感含义, 实现贴近人类思维的自然语言处理, 进而提供更准确的问答对匹配。综上所述, 智能问答系统在自然语言处理方面的成熟发展能帮助图书馆问答系统更有效地处理自然语言查询表达式、识别用户意图, 从而运用对应的检索策略在语料库中为用户提供更准确的检索结果, 帮助完成当前图书馆提供个性化服务的目标。

二、智能问答在图书馆领域的应用建议

在图书馆这一特定领域实现智能问答系统, 关键难点在于:

(一) 语料库的建设和完善, 具体包括

(1) 如何全面、高效地实现语料库初始真实数据的收集存储, 提高返回用户提问问题答案的全面性。 (2) 如何针对语料库真实数据进行有效问题的筛选, 提高返回用户提问问题答案的价值性。 (3) 如何进行用户研究、探索用户提问模式, 从而实现语料库问题的精选。

(二) 限定领域机器学习模型的选择

针对以上问题, 作者提出以下建议:

1. 人工处理语料库内容

首先应保证图书馆系统内问答数据的不断更新和补充, 缓解语料库容量不足带来的压力。其次可以进行人工语料筛选, 剔除对改善图书馆咨询服务没有价值意义的用户问题, 并且针对为用户提供的答案进行二次审阅, 纠正错误、完善正确信息、调整格式, 形成一套完整的问题-答案对语料库体系。在语料库建设趋向完善时, 可以考虑与更多的问答类网站进行对接, 建立大型语料知识库, 以便在满足用户基本咨询需求外, 还能为用户尚未明确表现的潜在需求提供相应的咨询引导。

2. 进行以用户为中心的研究

可以通过卡片分类法等进行用户提问模式的探索, 实现问题的性质分类和情感的分析分类, 改善语料筛选标准。问题的筛选分类直接关系着语料库的建设, 具有良好分类体系的语料库能够使机器学习模型更快捷地进行语义匹配, 降低时间损耗率。

3. 使用语料库对来打磨机器学习模型

图书馆系统区别于其他公共服务系统, 具有高度的个性化特征。因此简单地将机器学习模型套用于图书馆智能问答系统将严重削弱其效力。因此, 可以将图书馆问答语料库中的一部分问题对作为训练集, 用更贴合图书馆的数据对机器学习模型进行再构建, 使模型在原有架构的基础上将图书馆特征融入算法, 提高机器学习模型的适配性。结合深度学习技术, 可以简化问答系统的分析与判断时间, 实现系统的自主学习。

4. 建立反馈机制

通过设定必要的读者信息反馈机制, 将收集到的读者反馈信息自动回输到语料资源库中, 形成对答案语料资源库的有效补充, 据此建立动态化的最佳答案抽取模板, 为后续出现同样的问题时提供更为优化的语料元素。

三、展望

作者认为, 智能问答与人工智能的结合是未来发展的必然趋势。目前图书馆智能问答机器人的应用尚不广泛, 代表性的有2012年清华大学图书馆的智能机器人“小图”, 以及2018年2018年南京大学基于云端AI引擎设计的咨询机器人“图宝”, 后者已具备图书查询和简单咨询等交互能力和一定的自我学习能力。这说明未来的图书馆智能问答机器人不但可以从已有数据库中寻求最合适的答案, 而且可以通过学习形成语料库, 自我生成答案, 逐渐走向真正的人工智能, 进而推动全图书馆行业的智能化、数字化进程, 促进图书馆行业的健康发展。

摘要:随着信息资源的爆炸式增长, 图书馆的数字化转型已成必然之势。然而相对应的用户操作难度也随之增加, 现存图书馆问答系统无法满足用户的需求。本文通过介绍智能问答的发展现状论证了其应用于图书馆领域的可行性, 并针对目前图书馆智能问答系统建设存在的问题提出建议, 对其未来发展作出展望。

关键词:智能问答,图书馆,数字化,机器学习

参考文献

[1] 陈一峥.基于知识库的问答系统意图捕获[D].上海:上海交通大学, 2014.

[2] 荣光辉, 黄震华.基于深度学习的问答匹配方法[J].计算机应用, 2017, 37 (10) :2861-2865.

[3] 金丽娇, 傅云斌, 董启文.基于卷积神经网络的智能问答[J].华东师范大学学报 (自然科学版) , 2017 (5) :66-79.

[4] 张效祥.计算机科学技术百科全书[M].北京:清华大学出版社有限公司, 2005.

[5] KimY.ConvolutionalNeuralNetworksforSentence Classification[C]//EmpiricalMethodsinNaturalLanguage Processing, 2014:1746-1751.

[6] Tan M, Santos C D, Xiang B, et al. LSTM-based Deep Learning Models for Non-factoid Answer Selection[J]. Computer Science, 2015.

[7] 刘宝瑞, 郭宏娇.基于Deep QA的图书馆数字参考咨询问答系统研究[J].情报科学, 2017 (4) :106-111.

[8] 夏元昉.基于深度学习的问答系统技术研究[D].杭州:浙江大学, 2017.

[9] 冯升.聊天机器人问答系统现状与发展[J].机器人技术与应用, 2016 (4) :34-36.

[10] 郭金刚.面向数字图书馆中文自动问答系统的设计与实现[D].成都:电子科技大学, 2010.

[11] 来云.图书馆智能化咨询问答机器人系统设计与语料技术研究[J].现代情报, 2017 (11) :123-126.

[12] 阴红志, 张帆, 丁鼎, et al. AnswerSeeker:基于互联网挖掘的智能问答系统[J].计算机系统应用, 2010, 19 (1) :6-17.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:城市规划与规划环评融合的思考与实践下一篇:胺碘酮治疗急性心肌梗死合并室性心律失常临床疗效分析