探讨本体在图书馆AI交互体系构建中的应用

2022-09-12

一、引言

在1956年的达特茅斯会议上, “人工智能” (Artificial Intelligence) 这一概念便首次出现在人们的视野中。在这之后, 从1997年“深蓝”在国际象棋比赛中战平卡斯帕罗夫, 到2017年Alpha Go在围棋大赛中战胜世界冠军柯洁, 再到2018年Alpha Zero通过自我学习战胜Alpha Go。人工智能已经发展了60余年, 在引起全社会对人工智能广泛关注的同时, 也让各个领域都不断经历着人工智能技术带来的洗礼, 甚至成为当前全球科技创新和社会变革的重要驱动力。正如拉里·佩奇所说的那样“人工智能将是谷歌的最终版本。它将成为终极搜索引擎, 可以理解网络上的一切信息, 能准确地理解你想要什么, 给你任何需要的信息。”

二、研究背景

在大数据背景之下, 经历了云计算、物联网与“互联网+”等信息技术的不断革命之后, 传统意义上的图书馆正经历逐渐退出历史舞台的阶段。而智慧图书馆和数字图书馆的出现给予了人们对图书馆重新认知的机会。然而, 在人工智能时代将要来临之际, 如何把握这一技术变革, 将成为图书馆一个重要的发展节点。而如何在图书馆的交互体系中融入人工智能, 并开拓更多合理的应用路径, 进而实现更为便捷且更为个性化的图书馆服务, 也成了众多图情档学者们急需思考的问题。

三、图书馆AI交互体系构建

追溯人工智能技术在图书馆的应用可以发现, 其很早就已经进入了图书情报领域, 从早期的书目检索系统到电子文献的全文检索, 信息检索的本质在某种程度上已经体现出了人工智能。但是, 随着信息入口的门槛变低以及各领域信息呈现指数级增长, 精准彻底的信息检索不仅愈发困难, 还带来了更高的学习成本, 这显然背离了图书馆的服务宗旨。在这样的环境下, 构建图书馆AI交互体系成为了利用人工智能自我学习能力的途径之一, 同时也有望依靠这一体系进一步改变图书馆的知识服务结构和服务主客体行为。

由于以深度学习为基础的AI技术在图像识别和自然语言处理领域取得了重要成就, 其中CNN (卷积神经网络) 和RNN (递归神经网络) 技术以及Tensor Flow、Caffe、Torch等方便可用的工具日益成熟, 因此在图书馆交互体系构建方面具有较高可行性。但深度学习需要诸多的前提条件才可以按照预想实现, 比如大数据分析和语义理解等。在这种前提下, 深度学习和云计算技术相融合将会是必然, Hadoop、Spark、Open Stack等大数据计算和云计算技术将成为与深度学习技术相衔接的重点领域。

(一) 现有图书馆AI交互体系的构建情况

目前阶段来看, 图书馆AI交互体系主要集中于图像识别和自然语言处理两个方面。其中, 图像识别主要应用于读者身份认证识别、图书自助扫描、图书自动上架等服务中;而自然语言处理应用在智能图书馆机器人中的自动问答系统、图书文字识别、自动翻译等服务中。

纵观我国现有图书馆AI交互体系的构建情况, 基本都处于实验和初探阶段, 比如以清华大学图书馆设计的机器人“小图”为例, 其可以通过组织建立知识库来构建专家系统, 并使其具有学习、推理、判断、记忆以及上下文获取等功能。使读者在社交网络环境中, 能与“小图”进行自然交流和查询信息。

(二) 图书馆AI交互体系发展的瓶颈

和众多领域的AI交互体系一样, 目前图书馆的交互体系虽呈现百花齐放的态势, 但普遍存在三大问题。分别为:知识库过于单一、语义识别容错率低以及交互整合功能不完善。由于最后一个问题受硬件层级的影响, 因此不在本文的讨论范围内。而就前两个问题来说, 知识库过于单一体现在各家图书馆的馆藏资源与数字资源存在差异, 以及无法突破不同专业领域间的知识壁垒两个方面。而语义识别容错率低则体现在不同的AI交互体系间没有一个普遍认可的语义识别标准, 甚至在同样的知识库前提下, 由于人工设定自我学习算法不同, 进而导致与用户的交互过程中也存在一定差异。

四、本体在图书馆AI交互体系构建中的应用

(一) 本体在AI交互体系中的定义

一般来说, 在人工智能领域, 通常会引用在1993年Gruber所作的定义, 即“本体是概念体系的规范”。以此为基础, 可以将本体看作领域内的概念及概念与概念之间关系的一种描述, 而这种描述是明确的、规范的、形式化的并且具有共享性的。其中, “明确”可理解为对所采用概念的类型以及对其应用的限制具有明确的定义。而“形式化”指本体是可以被计算机读取的。而“共享性”则反映出本体应汇集某一领域所公认的知识集合, 即本体是基于团体而非个人的共识。

(二) 本体在AI交互体系构建中的作用

1. 构建不同组织和机构间AI交互体系的共同理解

在人与AI机器和AI机器与AI机器之间实现信息及其结构的共同理解, 是AI交互体系建设的重中之重。举例说明的话, 假设几个不同的AI交互体系中都包含有法律条款信息或者提供法务咨询服务。如果这些由不同单位构建的交互体系发布并共享了通用术语的本体, 那么从这些不同的体系中抽取并集合信息便可通过计算机代理轻易完成, 并整合为各AI交互建设单位擅长领域的知识库。再利用这些整合过的知识库作为AI交互体系的数据基础, 就能更为“拟人”地实现不同AI机器与图书馆用户的交互体验。

2. 明确学科与行业间的领域假设

鉴于目前图书馆内人工智能机器和设备的交互大多只能实现少数学科或少数领域的精准交互体验。因此当某一领域的知识发生变化时, 领域内的知识假设差异就会成为AI交互体系需要攻克的难题。而如果有关领域的知识在变化之后又被隐藏在程序代码中, 那么对于普通用户来说, 这些假设将变得难以发现和理解, 更难以修改。但是, 借助本体可以非常容易的使其非编码化并改变关于该领域的假设, 进而为AI交互体系整合多领域知识假设提供了解决思路。

3. 提供与知识地图相关的描述型元数据

就目前这一阶段来说, 图书馆数字资源的语义基础可以被元数据所提供, 并使其具备了基本的微观结构。但仅仅通过这种方式还无法完全解决信息系统的语义异构问题, 例如由于元数据方案的差异, 造成了微观结构的异构问题, 或者无法体现出存在于资源对象间的复杂关系。而在某种程度上, 可以把本体看作元数据。信息系统中尽管不同知识对象采用的元数据方案可能不同, 且存在于不同差知识对象间的关联又十分复杂, 但是本体却具备对其进行完整描述的能力, 进而从后台知识库入手, 为图书馆AI交互体系提供方法和模型。

4. 提供基于语义理解机制的AI智能代理

一般而言, AI智能代理的主要功能体现在, 其能够相对自主地管理用户个性化的信息代理库, 包括用户个人资料以及定制目录下的信息更新和通知。在收到基于信息用户需求的特殊指令后, AI智能代理便可以自动捕捉到信息的更新, 再根据用户的习惯进行自我深度学习, 找到并筛选出符合用户信息获取习惯的数据并将其下载到数据存储地存放起来, 同时, AI智能代理能分析到该用户所感兴趣的领域, 并在网络环境允许的情况下, 向信息用户智能建议与该领域更密切的知识内容。

以目前发展来看, 大部分图书馆的AI体系仍旧以知识库为核心技术, 在人工智能交互的功能上还停留在基础的语音识别、库内检索以及机械式的结果输出。因此, 利用本体实现一套基于语义的理解机制, 将对于实现感知和认知逻辑的情境推断产生积极作用, 并有可能改变现有的交互体验模式, 让其做到在内容与方式两方面皆符合用户个人的知识交流习惯, 进而实现更准确和定制化的知识服务。

(三) 本体在图书馆AI交互体系构建中的应用展望

1. 图书馆AI交互体系的神经网络模型用于新一代信息检索

在早前的研究中, 微软研究人员Mitra和Craswell已经探索把神经网络用于信息检索的前景, 而神经网络排序模型在信息检索中能够使用浅层或深层神经网络对搜索结果进行排序。通常情况下, 单一的搜索查询通常会包含少量的词语, 而根据特定的场景, 文档的长度也会相应变化, 从一些词语到上万个句段。而在这一过程中, 文本的向量表征会被信息检索的神经网络模型使用, 通常会需要大量的训练数据并包含大量需要调整的参数。因此不同于传统的在一个手工标注的特征集上训练机器学习模型学习排序的方法, 信息检索的神经网络模型通常可以将查询和文档的原始文本作为输入。因此, 本体在图书馆AI交互体系的神经网络模型中的应用可以为大量参数和训练数据在统一整合、处理以及异构间数据交换方面提供有效地数据保障。使得新一代信息检索在学习文本的恰当表征时, 提前获得大量的数据用以AI交互体系训练。

2. 图书馆虚拟馆员的导航指向服务和参考咨询

在国内外诸多AI交互体系中, 尽管清华图书馆的“小图”是个不错的例子, 但本质上讲, 其原理依然只是机器人, 通过语音命令、文本聊天来模仿人类的谈话。目前研发出的AI机器人, 其技术大多基于机器学习和自然语言处理, 尽管AI机器人内部的功能已被用于各种行业, 提供信息或执行任务, 还可通过自我学习以创建不同领域的算法, 再通过自然语言处理来模仿人类交谈。但是, 国内外大部分图书馆机器人依旧需要大量的数据训练才能将输入数据转换成所需输出值。即使最先进的图书馆机器人, 也无法胜任导航指向服务和参考咨询服务。准确检测用户的某些问题和评论, 也已被证明在现阶段不可行。

因此, 本体为图书馆AI交互体系构建提供了必要的数据支撑并扩充了自我学习的途径, 对图书馆虚拟馆员的实现提供了新的思路。也许在不久的将来, 读者可以通过语音向图书馆机器人发送查找图书问题或参考咨询问题, 智能机器人可以像真正的图书馆员一样对其针对性回答, 甚至将其引导到所查图书的书库书架, 将参考咨询的答案通过三维成像技术加以展示。

五、结论

正如吴建中馆长曾提出的观点, 图书馆可以借力人工智能在以下三个方面有所作为:一是加大自然语言检索的研究, 并探索图书馆学情报学方法在自然语言中的移植和实现途径;二是提升内容的智能分析能力;三是探索提升图书馆服务效能的研究与实践。由此可以展望, 人工智能对图书馆的主要影响方向将主要集中于图像识别、语音识别等智能识别, 对知识库的组织、分析等智能处理, 以及在检索、推荐、咨询等智能服务这三个方向。尤其在数字资源的处理与服务方面将衍生出更大的变革。在这种变革中, 数据作为人工智能与图书馆的基础, 始终扮演着重要的角色, 同时对AI交互体系中知识库的利用也是一大难题, 而借鉴本体对信息组织与检索的作用可以得知, 在图书馆AI交互体系构建过程中, 本体对于不同组织机构知识库达到共同理解和在不同专业领域间明确假设方面对数据和知识库提供了一种处理逻辑。而在提供有关语义描述的知识地图和基于语义的理解机制等方面也将提出一种新的解决路径。

摘要:智能识别、智能处理、智能服务是人工智能对图书馆的主要影响方向, 特别是在数字资源处理与服务方面将产生更大变革。但是, 未来人工智能在带动图书馆服务整体跃升的同时在其自身知识库以及交互体系构建方面却仍然存在一些难题。本文拟通过对现有人工智能在图书馆领域应用和发展的研究, 借鉴本体在知识管理、知识组织、知识检索和知识推理等方面的作用。浅谈本体在图书馆AI交互体系构建中可能存在哪些可行的应用并以当前图书馆AI交互应用为前提进行展望。

关键词:本体,图书馆,AI,交互体系

参考文献

[1] 吴建中.人工智能与图书馆[J].图书与情报, 2017 (6) :1-5.

[2] 初景利, 段美珍.智慧图书馆与智慧服务[J].图书馆建设, 2018 (4) :85-90+95.

[3] 茆意宏.人工智能重塑图书馆[J].大学图书馆学报, 2018, 36 (2) :11-17.

[4] 朱海涛, 刘斌.AI+技术对现代图书馆发展的影响及其应用[J].图书情报导刊, 2018, 3 (3) :49-53.

[5] 傅平, 邹小筑, 吴丹, 叶志锋.回顾与展望:人工智能在图书馆的应用[J].图书情报知识, 2018 (2) :50-60.

[6] 唐步龙.人工智能时代的图书馆发展思考[J].图书与情报, 2017 (6) :64-69.

[7] 孟玲.基于本体的数字图书馆语义知识库构建研究[J].图书馆学刊, 2015, 37 (7) :105-107.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:城管单位档案管理现代化和电子化发展探索下一篇:音乐类专业大学生就业情况调查研究——以枣庄学院为例