模型本体论范文

2024-07-14

模型本体论范文(精选12篇)

模型本体论 第1篇

目前市场上关于建筑信息模型BIM的相关软件种类颇多,尽管这些软件一直都在不断地改进和完善,并且美国也随着提出了关于实现BIM价值的三大宝藏———IFC/IDM/IFD,但是这对于我国各大企业应用BIM后的效果明显吗?答案很显然是否定的。那么针对这一现象该如何应对呢?本文从本体论的角度出发,对目前我国建筑信息模型系统(BIM)的应用作出思考并提出建议,希望对以后建筑业的发展有所帮助。

1 本文研究思路(见图1)

2 我国建筑信息模型BIM系统的发展现状

随着我国一些政策的相继出台及对BIM技术的不断研究,我国已有不少企业或单位开始不同程度地将BIM技术应用到了其项目中,比如北京奥运会水立方、万科金色里程、上海中心大厦、上海世博会国家馆等,都取得了显著的成效,为以后BIM更广泛和深入地应用起到了示范作用。但这些典型的工程在其应用BIM的过程中也都存在这样或那样的问题,如奥运会水立方在应用BIM技术过程中,各方没有限定统一的工作标准,在具体实施时也没有保证良好的交流渠道;而万科金色里程在应用BIM技术过程中,关于BIM的相关软件的线下服务及使用交流服务都没有进行完善就投入使用,这些都严重阻碍了BIM技术在我国建筑行业的应用发展。

3 本体论概述

本体论又称存在论、实在论,是专门对自然存在进行研究的理论,是形而上学的理论分支[1]。德国卡尔斯鲁厄大学的Studer等对本体进行了研究,认为本体是“共享概念模型的明确的形式化规范说明”[2]。

本体论是当前许多领域构建知识工程中的一种重要基本方法。在知识应用中,其主要用于分析一个领域中的类、关系以及它们所满足的约束,是解决知识工程中许多关键问题的核心工具。我们所广泛应用的Web语言XML(Extensible Markup Language,可扩展标识语言)就是对本体论的典型运用。在建筑工程领域,目前基于本体论知识的应用研究还比较少。本体论的应用对建筑工程领域发展尤为重要。

4 BIM系统在发展中存在的问题

4.1 BIM技术本土化问题

毫无疑问,在建筑工程中运用BIM利大于弊,但目前我国很多有关BIM的软件都是从国外引进的,不能对我国的具体工程进行具体分析,也没有相应的具体标准和规范来指导BIM的应用,所以不能完全恰到好处地运用到我国建筑工程中,以致于不能使所有运用BIM的建筑工程都达到预期的目标[3]。

4.2 BIM应用模式问题

目前,一些企业或单位在工程中对BIM的应用存在三大误区:(1)不能有效地将BIM运用到工程任务中,一味地追求新颖,把“用BIM做项目”当成了“做BIM”,以致于不能看到BIM所带来的效益,影响企业的发展以及BIM在建筑工程领域的推广;(2)企业没有“把BIM当回事”,只是让一些资历浅的员工来带领应用BIM技术,并没有切实地运用到具体工程中,以致于达不到预期的效果;(3)企业或单位盲目相信BIM,认为BIM可以解决一切,完全拒绝二维、抛弃传统做法,以致于适得其反[4]。

4.3 运用BIM在信息集成和共享方面仍存在障碍

虽然相比传统的建筑工程建设模式,运用BIM已经取得了很大的成果,在信息集成和共享方面也有了很大的突破,对各参与方也提供了很大的方便,并带来了利益,但是并不是无一缺点的,比如建筑生命周期的各个环节中,虽然利用BIM信息集成系统能快速得到和继续传递信息以及IFC标准对各软件的统一转化,但各个团队的标准(如业务标准,软件应用标准,信息模型的标准)仍然无法达到一致;由于各专业的局限性,那些过程性信息根本无法进行传递和共享,以致于丢失;当前基于的IFC的实现只是在数据的交换和共享阶段,对于那些各专业领域内的知识、规则和标准等都不能进行有效地组织和运用。

5 基于本体论解决我国BIM系统发展中的问题

1)根据我国的实时情况创建自己的BIM相关软件并制定出适合我国BIM的应用标准和规范。20世纪90年代初,美国的R.Fikes教授和T.Gruber教授等进行了名为“How Things Work”的研究计划。这项研究计划的目的是证明出面向科学工程的基于工程本体的“共享的可用知识库”,认为基于已有的知识能够创建出包容各门学科知识的知识库,而求解创造性解决方案的过程就是寻找知识间联系的过程,并且把这种方法在创新工程领域中称作是本体论方法。所以我们在本体论方法的指导下,应该在所引进的外国BIM技术的基础上,根据我国建筑的具体情况和要求创建出自己的BIM相关软件,并制定出适合我国的BIM应用标准和规范,完善BIM在我国建筑行业应用的流程。

2)以本体论为切入点,大力进行BIM专业教育和培训。BIM的出现确实给建筑业的发展带来了前所未有的帮助,但BIM并不能解决建筑工程领域中的所有问题,也并不是对所有的建筑工程都是有着相同的用法,而是要具体工程具体分析。从本体论出发,随着我国建筑业的不断发展,我们要知道,建设工程的本质无非就是全生命周期、绿色、低碳等,而每个工程的具体要求和目标都有所差别,要对具体工程具体分析,深入理解BIM,选择合适的人员在合适的阶段将BIM运用到合适的工程中。

3)构建本体,实现信息知识的集成和共享。事实上,仅仅只有IFC这样的技术数据标准是远远不够的,那些有着重要作用的过程性信息或者其他关联性信息并不能全部储存在BIM数据库中,也无法通过IFC标准来相互转化,以致于在传递过程中丢失且很难找回,所以还需要有较高层次的应用标准配合,来实现信息的集成和共享。构建本体最主要的作用就是解决知识的共享和重复利用,所以利用本体论将建筑领域知识建立成本体,构建本体模型,来实现模型系统中信息的共享和重复利用即集成与共享。根据不同工程进度、相关法律规定和技术标准将这些本体细分成施工本体、建筑本体、材料本体等,同时也建立不同的用户服务本体,为不同的用户提供针对性的服务模型[5,6],使这些模型中的信息在其所组成的系统中完全顺畅无阻碍的流向各个用户,实现真正意义上的信息的集成与共享。

6 小结

目前,建筑信息模型(BIM)系统在国内的发展缓慢,各参与方还远远达不到对其应用得心应手的程度,在各个专业人士对其广泛关注及深入研究的基础上,不妨从另一个角度出发,即从建筑最本质的要求及最初的目标来考虑问题,从而找出突破口,解决建筑信息模型(BIM)系统发展停滞不前的尴尬局面。

摘要:本文通过阐述本体论的概念及相关知识,分析建筑信息模型BIM系统在我国建筑过程中的应用现状,找出我国建筑信息模型BIM系统存在的问题,提出解决问题的几点建议,对我国未来建筑业有效的应用BIM具有重要意义。

关键词:本体论,建筑信息模型系统(BIM),应用

参考文献

[1]徐宝祥.本体论及其应用[M].吉林:吉林人民出版社,2004.

[2]雷琼.基于本体的异构数据集成研究[D].沈阳:东北大学,2005.

[3]王海渊,黄智生,黄佳进,等.本体技术在建筑信息模型系统中的应用[J].工业建筑,2015,45(6):186-189.

[4]何关培.“BIM”究竟是什么[J].土木建筑工程信息技术,2010,2(9):111-117.

[5]何关培.BIM三大应用现象藏隐忧[N].建筑时报,2013-12-16(7).

模型本体论 第2篇

从社会存在本体论到实践本体论--卢卡奇重建马克思哲学本体论评析

卢卡奇重建的马克思哲学的社会存在本体论,通过对三十年代原苏联哲学界建构的`具有明显自然本体论特征的马克思主义哲学体系之自然主义、机械主义、客体主义和教条主义等严重缺陷的批判,在很大程度上恢复了马克思新哲学的本真精神;但若与此后不久我国哲学改革所提倡的实践本体论相比,则显露出其由于未完全脱离近代哲学本体之实体性、本原性和事实判断性的影响而未充分彰显马克思哲学本体之关系性、本质性和价值判断性的现代意义.

作 者:朱宝信 作者单位:驻马店市卫生学校,河南,驻马店,463000刊 名:攀登英文刊名:ASCENT年,卷(期):200322(1)分类号:B1关键词:卢卡奇 马克思 社会存在本体论 实践本体论

本体论重兴之兆 第3篇

《论道》者,本体论也。此书问世乃本体论在中国重兴之兆。

本体论:对文化精神的探究

刨根问底是人的不可移易的本性。混茫无涯的宇宙中飘荡着林林总总的形状和色彩。面对这魔幻般的奇异景象,我们的祖先竭力寻求着隐于其后的稳定不变的原因。方法是追问,一环紧扣一环地问“……是什么?”追问之初就已认定,一定找得到一个终极原因,即“第一因”。这无疑是把答案预先埋伏在问题中,照康德和尼采的说法,找出的是先已塞入的。追问的努力创造了神话、哲学、宗教。

人类自以为聪明,自夸为“万物之灵”,却常常表现出一种可爱的愚蠢。即使在当代,不少人读中学时为证明一道数学题“无解”而得意,认为解决了这道题,也会对一些大物理学家证明量子力学中的若干问题“不可解”愤愤然,并把视线从经验科学领域“上升到”哲学领域,指斥他们为“不可知论”,何况真的在哲学上指出“现象界中的因果连环是找不到起点的”=“没有第一因”。

其实,何必由于刨根问底的热情遭挫折而沮丧呢!哲学史告诉我们,早在两千多年前的古希腊,就有巴门尼德另辟蹊径,从而引起了一场哲学革命。本体论诞生了。

本体论的主旨是“超越”。既然在现象界中找不到稳定不变的东西作为第一因,而确定的东西、起点又非有不可,否则失去了精神依托的人们会终日惶惶不安,于是只好超出现象界求之于本体(或直译为“存在者”、“存在体”、“所是的东西”)。那超越的方法初看起来玄之又玄,说破了其实也很简单——无非在语言(或思维)中找出路。在古希腊,就已经发现了两种超越途径。一是形式逻辑方法,发现的本体是“共相”(或称“一般概念”),如柏拉图《国家篇》中讨论的“理念”(又译“相”)。又一是辩证法,发现的本体是纯粹的思维规定(或称“范畴”),如巴门尼德讨论的“存在”、晚年柏拉图讨论的“通种”(又译“普遍类型”)。

二十五个世纪以来,本体论经历了三个主要阶段,以至现在流行的本体论有三个主要形态:

宇宙本体论:从独立于思维的宇宙中寻本体;

理性本体论:在理性中寻本体,以后演变到在人的社会存在中寻本体;

性灵本体论:在文化的非理性成份中寻本体。“性灵”一词用来表达人对文化的感受性。“埃斯特惕克”向来译为“美学”、“审美的”,似译“性灵学”、“性灵的”为好。

这三者是典型,实际的各种本体论可以看作它们的变体或混和配比。

在金先生的书中,本体论称为“元学”。元与玄这两个字在中国哲学语汇中常可替换使用。又可拼合为一词——玄元,加重所欲表达的观念的光辉,而且也“道成肉身”,化为老子,塑像于道观中供人崇拜。但是谈起“元学”,总给人以玄妙奥秘的感觉。我们先要破一种成见,以为本体论是认识论的基础。那么,本体论要建树什么呢?

金先生在《绪论》中指出:“每一文化区有它底中坚思想,每一中坚思想有它底最崇高的概念,最基本的原动力。”“不道之道,[儒道墨等]各家所欲言而不能尽的道,国人对之油然而生景仰之心的道,万事万物所不得不由,不得不依,不得不归的道才是中国思想中最崇高的概念,最基本的原动力。”(《论道》,15页,16页)这里说的道就是本体论的研究对象。人们谈中西文化比较研究,谈国民性研究,多歧路亡羊,在纷乱迷繁的文化现象中失去了对文化精神的把握。其实,道才是“羊”,是中华民族的民族精神。本体论要建树的,正是对文化精神的把握。而三种本体论表现了把握方向、方法和成就之不同。

试以象棋为喻说明之。象棋大师、象棋理论家代出不穷,各有创意,博取一时成功,得名获利。然而真伟大者乃象棋发明人。所谓象棋,是棋盘、棋子(分类、摆定位置、行走规则)的结构。所有的理论、战略战术、残局等等,一当象棋发明出来,都已内涵在其中,不过并未展开出来。它们的展开过程即成为象棋史。把理论、技术比作文化,把理论、技术的发现过程比作文化史、历史,那就可以从全部象棋理论、技术的发现过程不过是象棋内涵之展示,体会出文化现象史是文化精神的展示过程。

探求文化精神有多种途径,如历史哲学是从历史中寻求这精神,本体论则是从思维形式中寻求。这决定了本体论须用思辨方法,因而玄奥难懂。然而,就目标而言,并不那么玄乎其玄,拒人于千里之外。

本体论要探究的,实在不是宇宙中的最一般的自然规律。金先生说得极明白,这是创造文化的最基本原动力。把本体论看作认识论一环的学说,确实卑不足道。于是才有理性本体论兴起,谋取代替宇宙本体论。而后,由于逐步看到单用理性不能解释全部文化现象,强调非理性因素的学说才日益蔚为思潮,兴起了性灵本体论。在本世纪,这是十分明显的。金先生这本书中阐发的思想,具有多种因素。其文化背景是西方精神借无以抵挡的科学技术开路侵入中国,与中国的民族精神冲突、融合、逐渐形成并生长起一种新精神。黑格尔说过,“没有人能够真正地超出他的时代,正如没有人能够超出他的皮肤。”金先生的说法是:“在人事底立场上,我不能独立于我自己,情感难免以役于这样的道为安,我底思想也难免以达于这样的道为得。”(16页)“这样的道”虽指儒道墨所代表的昔日中国精神,按文化背景看,实则代表了生长中的新民族精神,至少可说是代表了新精神的某一生长阶段。这也许就是金先生说的“旧瓶装新酒”的含义罢。中国历史上曾有过印度精神的侵入,因而当代是三种精神的交融,远未形成归一的新精神,论道要在一个体系中安放下如此多的成分,难矣哉!有多种因素,且未必妥贴,是当然的事。这也正是此书有生命力之所在。

论道:新信仰的寻求

二十世纪的世界漫着“无家可归”的苦恼。随着物质产品日益丰富,人们懂得了“家”并不是设备齐全的屋子,即使这屋子有了一位温柔美丽贤淑的女主人也还不成其为“家”。家在何方?在精神,在真善美的和谐统一——不管称之为道、上帝或其他什么名字。

寻找精神归宿、家,是当代本体论兴起的原因之一。

当代西方正经历着世界历史上第三次腐化淫靡时期。历史纵然不会重演,仍常出现惊人的相似处。巴比伦时期,在人欲横流的奢靡之风中,一个受压迫的、流离失所的小民族——以色列,它的先知们在痛哭的模糊泪眼中找到了自己的信仰。罗马帝国时期,在富足、淫荡漫一切的同时,弥赛亚终于被精神上痛苦不堪的人们盼来了。那时真是教派林立,说明精神上的饥渴激起了何等强烈的探求冲动。当代西方因为科学技术发达,过着有史以来最富足的生活,同时,腐化、颓败的程度也是空前的,与此相应,精神空虚也是空前的——思想家们热烈讨论,群众中越来越多的人寻求宗教慰藉、加入教义迥异的五花八门的教派,便是明证。

寻找精神归宿——新信仰,现在还只是处于初期。大部分人仍沉迷于追逐物质福利,只有少数思想家和少数群众——精神上最敏感的那部分群众,在热切寻求精神安宁。迷茫是普遍的。更其可悲的是,当代西方青年,没有理想,没有精神上的追求,却自认为懂理想、有追求。明明是失落了,却自以为得到;明明迷了路,在无目标地乱窜,却自以为这才是正路,无目标才是真目标,有目标反是迂愚。一切都成了游戏,因而既无大悲,也无大喜。深沉有致的情感消逝了,人越来越浅薄轻佻。世界扭曲变形,文化成了招人厌恶的枷锁,人化为物质,成为一粒融入茫茫宇宙的微尘,仿佛在与宇宙合为一体——不是宇宙人化,而是人物质化——的过程中才有真解脱。但这解脱不是升华到文化的最高境界,达到真、善、美的和谐统一,即达到绝对;而是摒除一切价值乃至一切理性成分,彻底下降到只有肉欲、感觉、物质。于是,美学(性灵学)成了原本意义上的感觉学。那被特别看重的感觉又是受煎熬的痛苦感觉,夹杂若干由纵欲带来的瞬息即逝的快感,作为调剂,因而美学成了丑学。之后,随着心灵日益麻木,痛苦感日益减少,连丑学都不需要了。情感被情欲冲动取代,利益成为最高原则,力量成为最高仲裁者。这大概就是金先生对于人类感到悲观的时代背景罢(203页)?

当代西方人所处的“无家可归”的困境,曾由尼采所说“上帝已死”(此语出自黑格尔《精神现象学》,见中译本下卷,231页、255页前后)充分披露。旧的价值体系崩溃了,旧的对基督的信仰再也没有号召力了,家,没有了。西方的思想家们纷纷指出,二十世纪是相对主义时代,确实道出了真情。

然而,这里要强调的是另一面——示人以光明的一面。那就是对新信仰的寻求正在崛起。萨特、弗洛姆这两位当代思想家一生观点演变可以证明这一点,海德格这位哲学大师更是以“只还有一个上帝能救渡我们”表达了他呼吁西方人对这新信仰的期待。这信仰必定是新的,如尼采说过的,原来的上帝已被西方人亲手杀死,而且这一次不会复活了。而新信仰的来临(其寓言表达为新上帝出现),唯一途径是人类一齐期待——耶稣基督当年不就是经过地中海沿岸人民几个世纪的期待而降临的吗?

西方思想家的这些说法初看起来既神秘又反动,实际上却包含着深刻的真理。我们马克思主义者至多批评他们提供的精神之果有毒,至于他们指出人民精神饥渴、提出要寻求精神归宿,却无可厚非。鲁迅说过,希望是本无所谓有,也无所谓无的。这正如地上的路。地上本没有路,走的人多了,也就成了路。这里所包含的道理,与他们多么一致!我们应当发挥马克思主义,提供甜美的精神之果,吸引世人,让马克思主义成为人类之家。

新家的得到,要靠众人一齐努力,坐等是不行的。关键在于唤醒大家一齐希望、期待。哲学家的使命不是提供出新信仰,这超出了他们的能力,也超出了哲学的范围。哲学家所能做的,只是呼唤众人起来寻求。本体论研究的意义之一,正在这里。道,就是家。论道,就是寻家。由此看来,处于中西精神交融过程中的中国人惊叹旧家的毁失,努力寻觅新处境下的精神支柱,乃至刀兵相见,并不值得奇怪。研究本体论确乎有意义,将提供可供选择的种种途径。

道,原动力:意志?原始情欲?

有论者曰:金先生由《论道》表现的是新实在论。我曰不然。这本书开篇第一句话,也是整个体系的最高命题,乃是“道是式-能”。这与“一阴一阳之谓道”何等接近!金先生的思想不能归入新儒家,但是内中包含有中国传统精神的成分,却是无须怀疑的。其突出的表现是“能”概念及其在体系中的位置。

中国哲学与西方哲学在起源上有不少类似之处,突出点之一是:两方面都有一对基本概念,前者是阳、阴,后者是一、二。古希腊的毕达哥拉斯认为一(不妨称之为“本一”)、二成万物。二者中,本一是原因、动力,二是被动而不确定的。按后人的解释,本一是形式,二是质料。中国的《周易》也认为观念起于数。所谓“结绳记事”,就是用数表达各种事件。阳用—表示,阴用二(写作--)表示(若写作=,则为“上”,属于六书中的指事)。这是两方面相似处。

不同处则在于中国思想中的二(阴)不象古希腊的二、质料那样消极,它有能动性。《周易》里面说,“乾知大始”。乾即阳,为一。按熊十力先生的看法,“乾谓本心,亦即本体。”把乾看作能动的、给予形式的。这当然合古意。然而这句话下面有“坤作成物。乾以易知,坤以简能。”也就是说,坤(即阴,为二)的性质为“能”,以“作成物”。综上所述,中国哲学不同于西方哲学的,在于这一对基本概念中两者都有能动性,类似于西方哲学“质料”地位的坤(阴)多了个能动性,金先生自叙道:“我最初用英文字‘Stuff’表示,后来用‘质’〔按即质料〕这一字表示,最后才用周叔迦先生所用的‘能’字表示。”(14页)说明了他的立场从西方精神渐转向中国精神。

上面繁冗、枯燥的讨论并不是毫无意义的。改用“能”字实质上透露了在本体论中承认原始情欲的消息。也许金先生用这字时无此意识,然而作为时代精神最佳体现者的哲学,无论如何都要曲折表现时代潮流,是确定无疑的。毕达哥拉斯的“本一”有原始情欲的内涵——精液,但这属阳的一方,后来发展为“形式”概念,失去了情欲的意义。《周易》中乾、坤两个概念都有原始情欲的内涵:“夫乾,其静也专,其动也直,是以大生焉。夫坤,其静也翕,其动也辟,是以广生焉。”其中“专”读为“团”,象“收缩”貌。这不是直接把这两个概念同性器官、性行为和生育联系在一起吗!

可见,中、西两方的古代哲学都显示出与远古神话观念的联系。

但是,单从“能——坤”的关联来说金先生的“能”概念有原始情欲的意义,尚嫌皮相。还须从二十世纪非理性主义思潮兴起来看。

上世纪末在西方开始抬头的非理性主义在我国颇受訾议,看来,这大概因为对这一现象的历史、文化背景尚未有正确估计所致。在学术研究上,“设身处地,同情地倾听别人”,是很重要的原则。那么,非理性主义为什么会抬头呢?大体说来,由于西方社会异化日益严重,部分学者为克服异化而探其深层原因,得出如下结论:西方文化属于理性主义文化;异化乃是单纯理性化之必然结果;在理性主义方向上不可能克服异化。怎么办?答曰:另觅他途,即从非理性因素找出路;这就须溯至理性主义尚未兴起的前苏格拉底时代,寻求文化的原始动力。于是,对原始情欲的探求兴起了。

各个文化区的古代哲学,其基本概念都有原始情欲的含义。先民所感受到的人类创造文化的能力——那真的生命,便由这基本概念传达出来。这生命本属于人类,表现在文化中,却由人向外投射于宇宙,于是宇宙有了生命。那概念的名字便是“宇宙之道”,或简称“道”。理性主义兴起后,“道”的概念在累次解释中渐渐失去生命。生命是须通过观照才能发现的。现代重新发现原始情欲的途径,首先便是直觉、感受,表现形式是诗或神秘主义哲学。原始情欲或用“宇宙意志”表达,或由“酒神精神”(尼采)、“生本能”(弗洛伊德)等表达,并力图在哲学中取得本体论地位。哲学的正宗方法是思辨,于是原始情欲终于用打上叉的Sein(海德格)表达。

Sein(有)打上×,便有虚无主义之嫌。其实,大可不必惊诧于虚无主义。“无”(或称“本无”,以区别于“有、无”之无)是时下哲学中“物质”概念的另一个名字,可能是更恰当的名字。理性主义兴起后,有生命的道便被解释成无生命的“本无”,有与无(本无)之间划下了一条鸿沟。后果是“有”也被夺去了生命。当代虚无主义的积极意义在于揭示“有”的无生命性,主张把目光转向“本无”去发现生命。“本无”开始被赋予了原始情欲的意义。但是,真的生命不但不在“有”中,也不在“本无”中。也不在对立的二者之统一中。承认统一等于承认先有的割裂正当。真生命在割裂二者的鸿沟之消解,指斥那本不该有的割裂。割裂被归咎于理性主义。海德格采用给Sein(有)打×的方式表达他寻求真生命的努力,用意大概如此罢。

金先生并不主张虚无主义。虽然如此,他的“能”,概念却义蕴丰厚,足以从中引出新端绪的。他在书中直接使用“×”这个符号。实质上,“×”表达的是富有生命的原始情欲。“能”不过是“×”的名字(见20页)。道是最基本的原动力,“道是式一能”,而“能”不是物质(20页),也不是物理学中的“能量”或“质-能”(24—25页)。这样,金先生就为道恢复生命迈出了决定性的一步;在中西文化交融的过程中,把生命的气息吹进了冷冰冰的西方理性主义之中。

实证与思辨

在实证主义思潮盛行的情况下,重兴本体论有严重障碍。实证方法本身并没有毛病,自然科学和社会科学都须运用实证方法,它用到不适当的领域——本体论的领域,才会出毛病,堕入实证主义。可叹的是,不少反对实证主义哲学的人,自己谈哲学,也没有摆脱实证主义影响。

实证主义的病根在于缺少辩证法,而要讲本体论,非讲辩证法或诠释学不可。笛卡尔、斯宾诺莎、莱布尼茨等人的本体论,都用数学方法或形式逻辑方法,因而都有实证主义味道。

号称“现代社会学之父”的马克斯·韦伯,认为马克思谈资本主义时对精神方面注意得太不够,于是要“补充”马克思主义。应当承认,韦伯的许多论点是卓有见地的,一些说法对我国当前正在进行的现代化有参考价值。例如,他认为意大利资本主义发展的主要障碍之一是“劳动者普遍缺乏良心”——不择手段地索取报酬而仍然对工作不负责任,就很值得我们深思。不过,韦伯学说的价值是在社会学方面,韦伯本人对马克思主义的批评,并不正确。历史唯物主义不是社会学,而是本体论,卢卡奇理解作“社会存在本体论”是把握住了马克思主义的神髓。

韦伯探论宗教造成的伦理精神与社会生产发展间的联系,采用的是实证方法。这当然无可非议,而且他也确有贡献。我们在决策时应当参考。但是,用这些结论来否定一种本体论,就过分了。轻率侵犯其他学科的领域,往往出毛病。韦伯批评历史唯物主义,照例出了毛病。马克思确也强调实证研究。黑格尔学派解体过程中分成两大派,其中青年黑格尔派又分成思辨派与实证派。费尔巴哈启实证派之端,马克思力主实证研究,看来似乎与孔德实证主义趋向相同,实则颇异其趣。孔德是自然科学实证主义,马克思则强调对历史作实证研究,后来又从事经济学研究,而经济学是一门实证社会科学。这还只是表面上的区别。关键在于马克思继承了黑格尔的辩证法。不管作了多少实证研究,在论证共产主义必然取代资本主义时,实证方法必须让位于辩证法,否则得不出正确结论。正因为此,历史唯物主义属于哲学,是本体论,而不是一种社会学。

韦伯谈论宗教、道德等内涵的精神,与黑格尔所说的精神,相去甚远。韦伯的那些精神现象与生产关系等的相互作用中所有的规律,统属于“用”的层次。而黑格尔体系中精神是“体”。这是社会学与哲学根本界线之所在。今天一些讨论文化的学者之所以谈不清许多问题,根本原因在于未认识到这里有这样一条界线在,他们居然把文化精神当作文化现象之一,探讨起文化精神与文化现象之间相互作用规律来!他们没有看到,由现象到精神,乃即用显体且体用不二。讨论文化而不通本体论,终究只能做一些形态(现象)比较的工作,把握不住精神的。

把握马克思的历史唯物主义也类似于文化研究。皮相地看,历史唯物主义相当于社会学。这种看法的毛病在于只看到马克思对黑格尔辩证法的批判,忽视了继承的一面,或曰:不明白继承了什么。不少西方学者不是一方面赞扬马克思有丰富的社会学思想,即赞扬他实证得好,同时,另一方面又批评他未摆脱黑格尔影响,有思辨残余吗?其实,马克思的高明处正在于这思辨成分,即辨证法内核,而且又有大量实证研究来“即用显体”。

人类总要追求那无限的、绝对的东西,不管它起名作道、玄、无、存在、上帝、绝对。为什么呢?因为人类的本性,是精神本性,不在肉体,而在社会存在;道所标志的是社会运动的终极目的、人类最高理想。由此可见,追求无限、绝对,看来是玄奥的哲学思辨,实则为人类向理想社会迈进的踪迹。然而,人们的所见所闻都是有限的、相对的东西。无限不是有限的迭加,绝对不是相对的对立面。绝者,断也。绝对者,无对也,怎么能解释作与相对对立统一?无限、绝对是体,有限、相对是用。研究有限、相对须实证,而论到“即用显体”,则非思辨不可,非运用辩证法不可。辩证法实证化已久,大道隳已久,本体论重兴必使马克思主义雄风重振。金先生《论道》一书重版,意义岂容低估!

模型本体论 第4篇

关键词:本体论,数字档案馆,知识检索

随着电子政务的普及和信息公开制度的推进, 数字档案馆基于元数据的关键词检索目前已经逐渐不能满足用户的需求。本文试图建立一种“基于本体论的数字档案馆知识检索模型” (简称OKR-DA模型) , 它能够利用信息的语义知识, 能“理解”用户的检索需要, 通过本体知识、分析理解、概念提取与匹配等方法, 实现智能化的知识检索, 弥补传统检索的不足。

1 基于本体论的知识检索原理分析

知识检索的基本思想就是模拟扩展人类关于知识处理与利用的智能行为和认识思维方法, 它通过挖掘其深层含义, 充分精确地表达知识资源和用户需求, 进而在各类异构的数据库数据仓库知识库中进行检索, 返回最相关的结果的检索机制[1]。而本体是“共享概念模型的明确的形式化规范说明[2]”, 是领域知识规范的抽象和描述, 可以构造丰富的概念间的语义关系, 能够准确描述概念含义以及概念之间的内在关联;形式化能力最强, 同时具有高度的知识推理能力, 能通过逻辑推理获取概念之间的蕴涵关系。

基于本体的知识检索可以阐述为:在领域专家帮助下建立领域本体把收集来的数据按规定格式存储在关系数据库知识库等的元数据库中, 查询转换器按照本体把查询请求转换成规定的格式, 从元数据库中匹配出符合条件的数据集合, 检索的结果经过定制处理后返回给用户。其基本特征有:支持自然语言检索;支持语词、语义内容的处理, 实现同义词扩展检索和关联检索;具有概念推理和学习功能;具有强大人机交互接口。

2 OKR-DA模型设计目标与体系结构

2.1 OKR-DA模型设计目标

OKR-DA模型其目标在于实现基于档案领域本体的知识检索, 它能够利用本体进行推理, 即将本体所反映的语义关系应用到对档案信息资源的标引和检索中, 通过对相关信息的解析和推理在语义层面实现知识检索, 并以“虚拟案卷”等形式将结果返回给用户。

2.2 OKR-DA模型体系结构

OKR-DA模型体系结构采用目前最常见的J2EE应用所基于的模型-视图-控制 (model-view-control, 简称MVC) 体系结构。第一, 视图层主要通过JSP页面为用户提供友好UI接口, 采取Ajax框架, 用户检索请求的输入主要依靠表单提交完成, 利用树型结构jtree的API进行语义输出;第二, 控制层采用Struts框架, 完成页面流 (Page Flow) 的调度和数据流 (Data Flow) 的转发控制, 其中数据流包括用户输人数据流的语义输出数据流;第三, 模型层是整个OKR-DA模型的核心, 它以EJB的形式提供本体相关的通用程序接口, 包括本体建库、本体检索、本体推理。目的是要在Jena提供的数据层接口之上开发一个基础业务逻辑层。

3 OKR-DA模型模块设计

OKR-DA模型主要分成了4大功能模块:知识本体管理模块、语义标注模块、知识推理模块、知识查询处理模块, 如图1。

3.1 知识本体管理模块

知识本体管理模块包括本体的构建以及本体数据持久化两个功能。该模型本体构建是采用类或概念、关系、函数、公理、实例等本体建模元语确定档案知识领域实体间的关系, 本体持久化包括和数据库相关的各种操作, 如保存、更新、删除、加载、查询等。

3.2 语义标注模块

语义标注模块功能是把在本体中的知识点和资源之间建立关联, 表示这些资源是这个知识点的一个扩展描述。经过本体知识标注后的文档和知识构成一种关系, 从另一个角度说明了文档与本体知识的相关程度。语义标注的主要流程: (1) 首先将文档库中的所有格式文档提取出纯文本内容; (2) 分解所有纯文本内容为子句、句和段落; (3) 索引分解结果; (4) 通过领域本体知识计算相关度; (5) 归一化处理; (6) 对标注数据进行价值排序后, 将标注结果写入标注数据库。如图2所示。

3.3 知识推理模块

知识推理模块就是对初步获取的本体知识作一致性分析, 根据本体语义关系等来构造领域公理所蕴涵的产生式规则, 并将形式化的规则与定义好的本体类与属性结构和声明的事实断言按一定的搜索策略进行规则模式匹配, 再使用公理对类和类的属性、关系进行推理。其主要功能有:本体推理 (根据本体库即存事实由规则推理出新的知识) 、本体逻辑检测 (检测推理后的新的本体库是否有逻辑错误) 、本体推理路径回溯 (对于由检索块检索出的结果, 分析它的推理过程) [3]。

3.4 知识检索查询处理模块

知识的价值体现关键就是知识的检索与查询。OKR-DA模型中的知识检索查询处理模块在已设计好的本体论的基础上, 分析用户需求, 参照本体库, 进行语义映射, 实现相似度匹配, 抽取其中的核心关键字、约束条件等。并根据其关系推理, 进行扩展和关联检索, 即“虚拟案卷”检索, 重写查询语句, 最后检索知识库, 得到满足用户需求的知识项。该模块基本流程如图3所示。

4 OKR-DA实验方法及结果评价

4.1 OKR-DA实验实施平台

操作系统:Windows 7 homebasic;

硬件支持:Intel Core i3 CPU 2.40GHz 2GB内存;

开发工具:myEclipse6.5开发平台、SQL Server2000数据库、本体编辑工具Protégé4.0.2、语义解析工具Jena2.6、分词工具ICTCLAS、语义索引工具Lucene等。

Web服务器:Apache Tomcat6.0;

4.2 OKR-DA功能模块实现方法

(1) 知识本体管理模块:首先在Protégé4.0.2中借鉴骨架法和七步法, 对照《中国档案分类法》《汉语主题词表》等叙词表, 并结合以行业档案分类法及高校实际情况来构建高校行政类档案本体。再采用MySQL关系数据库来持久化本体数据, Jean通过一个数据库引擎接口实现了对本体模型的透明持久化。

(2) 语义标注模块:首先我们依靠基于Lucene开发的中间件产品Poi、Pdfbox和Textmining用于操作Word、Excel、pdf, 提取纯文本文件, 然后用ICTCLAS进行分词处理, 再借鉴陈叶旺等提出的文档语义标注改进方法[4]进行语义相关度计算, 最后根据档案的价值排序算法将标注文档排序。

(3) 知识推理模块:是基于TABLEAU和RETE算法的推理机制实现的。该模块使用Jena的推理机子系统来实现推理引擎功能, 再通过DIG接口提供对描述逻辑推理机的访问。并通过Derivation接口实现推理路径回溯。

(4) 知识检索查询处理模快:本模块采用关联搜索技术, 通过文件相似度算法, 找到与检索语义相关的所有实例集合, 实现“虚拟案卷”检索。再对各档案资料语义关联度计算, 对结果排序。从而实现智能的知识检索查询。

4.3 实验数据来源及结果评价

为了实验需要, 在构建高校档案本体时笔者收集了约1000份高校电子档案。本文针对不同类型, 选择不同的检索词分别采用基于传统关键词检索和基于本体的知识检索对这些电子档案进行检索。

实验评测后, 发现在查全率方面, 基于本体的语义检索的查全率明显高于基于传统关键词的检索。在查准率方面, 基于本体的语义检索与传统关键词检索相比有一定优势。

由于本模型还只是试验性模型, 存在不足之处也很明显。高校档案领域本体构建不完善、资源数量有限和推理算法简单, 使得部分语义实现功能没有在查询结果中得到很好体现, 这是以后工作要改进的内容。

通过对系统的运行测试和实验数据分析, OKR-DA模型能更准确表达用户的检索需求, 并进行知识推理及检索, 还能反映文件间的关联性语义检索, 能够更好地处理隐含概念获取, 在保证查准率的前提下, 有效地提高查全率, 改善了传统检索方式的不足, 提高了系统性能。

参考文献

[1]W3CHINA.ORG讨论区[EB/OL].[2008-05-18].http://bbs.w3china.org/dispb-bs.asp?boardid=2&id=39180.

[2]Gruber T R.A Translation Approach to Portable ontologySpecificati-ons[M].KnowledgeAcquisition, 1993 (5) :199.

[3]董慧, 余传明, 徐国虎.基于本体的数字图书馆检索模型研究 (1V) —历史领域知识推理机制[J].情报学报, 2006, 25 (6) :666-678.

文学本体论的思考 第5篇

西方自康德开始,发生了由实体本体论向存在本体论的转变。存在本体论放弃了事物背后的.绝对化本质的追寻,而执迷于存在的方式,其思维方式的置换正是哲学本体论向文艺学本体论转换的方法论依据和哲学前提。在形式和内容二分法的扬弃基础上产生了形式的一元论,以存在本体论为依据的西方现代形式主义文论研究,为中国80年代形式本体论的产生提供了直接的参照和摹本,中国审美观念加快了“向内转”的步伐。

作 者:杜书瀛 张婷婷 作者单位:杜书瀛(中国社会科学院文学研究所)

张婷婷(解放军艺术学院)

一种本体论的诗歌观念 第6篇

在西方哲学所建构的理性主义世界图景中,已经预设了本体的存在。这种超验的存在具有总体性,并且它对于一切现实的存在现象具有终极的解释力。用亚里士多德的话来说,本体本身蕴含着“最高原因的基本原理”。本体还具有绝对的价值,它是最真的,也是最善的。而提供具有终极价值意义的观念框架,其实就是本体本身所负载的使命。

而閱读灵宝市生于七十年代的诗人黑女的诗歌,能发现她诗歌中这种强烈的本体式的写作理念。《黑女诗稿》集中显示了她近几年的视域和思考问题的几个焦点,即灵魂和身体、记忆和现实、破碎的生存体验和总体性理念的建构等范畴间的关系问题。在上述几个问题的关系的处理上,黑女倾向于本体论的处理,即把“本质的”“中心的”“理念的”和“现象的”“外在的”和“材料的”作出区分,并将诗歌的和存在的意义归为根系性的前者。从而黑女的写作体现了一种对世界内在秩序的信任和对其本源性的终极的根据、尺度的寻找。本文即是在这样的认识上对黑女诗歌做细读式的批评,试图发掘在当代本质主义、宏大叙事和总体性思维等遭到普遍质疑的语境中,她这种写作的意义和有效性。

写作是一种寻根

《古诗十九首》其三第三、四句是:“人生天地间,忽如远行客”。它暗示人无法摆脱的非根系性的生存本质。在中国古典诗人中,出于对身世、命运、生命等的思索,这种慨叹被不同命运的诗人书写,并一贯地在诗歌的强音区发出声音。“对酒当歌,人生几何,譬如朝露,去日苦多”(曹操《短歌行》),“飘飘何所似,天地一沙鸥”(杜甫《旅夜书怀》),“山河破碎风飘絮,身世浮沉雨打萍”(文天祥《过零丁洋》),时代的变更并没有打断它的节奏,反而它在人类情感中的鸣响登峰造极。他们的声音,好像人类这种集体性的、强大的命运力量在诗人身上撞击出的回声。

《黑女诗稿》中对非根系性生存的不断告别,和对“寻根”的一再强调,就植根于这更为宏阔和深广的诗歌史的根系之中。她在为诗歌史注入自己的能量的同时,这样宏大、发达的根系也增强了她情感和意志的力量。她只是它的一部分。到这里,她才完成了她自己。

“根”在诗中有时被置换为“根部”(《困惑还是来得太晚》),有时是“根性”(《穷人》)、“根系”(《魔碾之途·雨》)。根是一个生命的归属和创造力量的来源。寻根,在对自性的溯源式追问和尝试中,寻找与自我同性的更强大的力量,这种力量并不吞噬个体的自我,反而使自我因它而得到壮大的信心和力量。

依靠信和热望而找到的根——比如基督、佛,是我们内在的终极存在吗?有没有更内在、更深层的根系存在呢,即有没有一些根系因为扎根于另一个更深大的根系,而弱化为一些根须呢?这些困惑并没有阻碍诗人对“根性”的求索,她说“写诗就是修行,诗歌就是我的宗教”(《后记》),我想依靠信和热望而找到的根,到目前不仅仅是一些宗教性的信仰活动,对美和完善、德性、智慧,进而具体化为对圣哲、贤达,和对人类艺术感觉的完善、艺术创造力的自由发挥,等等对这一切能够实现的相信和希望,当这些相信和期望在艺术领域中找到具体的艺术形式进而转换为艺术作品,并由于这内在的力量而形成真正的艺术史时,我想,不同的根、根性、根系就逐渐形成,并或隐或显的存在于人类历史中。并且,对生命的力量敏感的人会求索它,并扎根于它。

诗人嫁接的根、根系,大多时候并不是具有共同体、普适性质的精神体系,而是诗人在阅读和写作中,在“词语的挖掘机”、在“暗处”(《词语》),由相对稳定、发达的内在心灵和情感结构所建立起的完善的、自觉的内在体系。正如它的形成一样,它也只对诗人个体发挥它最强的作用力。并且,对诗人发挥作用的有时并不是一个根系,而是多个独立、发达的根系的交错力量。

在《黑女诗稿》中,我们依靠语言显示的诗人内在精神世界的波动和走向,隐约可以看到根系逐渐深入和发达的景象。

《黑女诗稿》的第一辑“我的简历”,是在对故乡、童年、长辈的触角般的探伸和询问中,到记忆的暗处,辨认出一个纵横交错的根络。重复的回忆活动和甄别,使一些影响更加确定,并使一些力量得以继承(《继承》)。而死亡、亲情和爱是这一辑的主题。

社会语境对于个体就是先在的根系性的庞大又复杂的存在,在《我出生那年》这首诗中,诗人把“我”的出生置于错综的语境中,这是科学技术不断推出新的研究成果,自然灾害带来的痛苦和伤害没有丝毫减弱的时代,并且代表人类智力高度发达的科技和研究成果,并没有对人内在的、主观心灵层面问题的解决表示热切的关注。根系的营养不良,“似乎决定我一生只将目光盯在∕精神和心灵上”(《我的简历》)。寻根,更像是寻找自己,寻找有根性的自己,是综合回忆中的片段并努力对它们进行焊接、塑造,消隐于未知的寻找最终的指向是此时此地的“我”。这个“我”因寻找而得到坚定的确立,同时又获得新的模糊。

在这辑诗中,对童年、故乡和父亲的追忆一再出现在阅读视线中。这似乎在暗示什么,或者是受到一种强烈力量的推动,它才反复出现。在追忆中,诗人仔细地对这些追忆的对象做了辨认和甄别。

我出生于1970那年麦收时节

这似乎决定我的一生只将目光盯在

精神和心灵上

——这是一种需要不断告别的贫穷

——《我的简历》

我来到父亲和弟弟的母校河南大学

(父亲生前写古体诗,零散地夹在书里)

细长的手指操着口琴(它显得那么小)

……

弟弟继承他的瘦,辞了公安局的事去南方做律师

(依然瘦,翻完卷宗要洗十遍手)

——《兰花图》

在追忆中,父亲瘦削、洁净,有一双充满艺术气质的手,诗歌和书籍是他这双手的珍惜。这些特点都显示了一位有精神洁癖的亲人和长者。这并非父亲的全部特点,可是诗人一次次的追忆却突出了这样的父亲。有一位这样的父亲,我们不仅对生活在他身边的人充满想象。这也是根的力量。当我们知道人或物起着根的作用时,我们便要对根的力量抱有期望。它主动完成对一些人的塑造和自我塑造。从而,根的力量也因得到继承保存和壮大。

nlc202309091406

他对着我吹了一段口琴:你是师范生

把曲谱说下来。作为校长

他看了我写的第一篇小说

——《父亲》

在《父亲》这首诗中,这种根性的力量显而易见,他灌注给“我”的是精神的血液,“我”汲取这个根系的养分,在逐漸独立后将自己与更深阔的根系焊接在一起。

在第二辑“二重奏”中,诗人提供了“一个人的非灵性生活”,在对生活充满智性的思索体会中,她尝试着让自身的一部分成为另一部分的根系。这是自身的知识型和生存理念在发挥作用。在《二重奏》中,“灵魂挖井,肉体探照”,“生活是一些断章和碎片∕我摸索到一架纺机∕使语言的梭子发出喧嚣”,结尾部分的“此时年届不惑∕所归有道,体貌皆好”,就是对内在根系的肯定。

诗人以“中草药”这种其功能未得到国际医药卫生普遍认可的事物为例,暗示了一种更为普遍的人类生存方式,“信者自知其有”(《强生饮》)。它像是中国流传的一句俗语的变体,“信则有,不信则无”,对无法用清晰的语言、科学手段加以展示和证明的事物力量,我们的态度是什么?宗教力量是这种力量的典型代表。对艺术创造力、乌托邦社会、正义、平等、充满爱和美的生存方式有力刻绘的圣人、艺术家和理念人,不断激励他们的或许就有“信者自知其有”的力量,这种力量增强了他们的主体性。

《软和柔软》这首诗,是坚硬的生存和柔软的心合成的“二重奏”。在这二重奏中,因为主体力量的克服,自身的一部分因为柔软而逐渐深入为另一部分的根系。“一生是硬的,从内部触摸它的人∕正在变软”,“手指硬,窗玻璃硬∕画上去的那颗心软”,诗人似乎暗示了一种稳定、发达的内在心灵和情感结构,当我们心灵空间足够开阔、博大,心灵构造开始渐渐成熟、发达时,我们与外物的关系便发生了难以言明的奇妙的变化。

对根性的寻找是无限的,当我们摸索到一株根系时,发现它只是衍生于更广大的根系之中。

他相信,这些林子的根处

还有根,因此他走动

——《雨水》

一座城市可能就植根于它的遗址之中——

我只身前往二里头

一场寻根因迷路断裂

——《二重奏》

“魔碾之途”这一辑中,自然和宗教的力量像是具有强大吸附作用的根系,吸引着“我”。鱼哭寺、村社、黄河、洛阳墓葬博物馆,它们能很快激起人的命运感和对回归的迫切希望。

这样的特点同样显现在其它几辑诗歌中。像一条暗河一样,流淌在“从彼到此”“百年之霜”这两辑诗中,牵引着诗人黑女的诗歌之思,不断地书写和表达。

诗和时代的相互挖掘

通过诗歌写作,和在写作中训练的视野和目光,黑女逐渐形成了自己表述情感和观念的语言方法。《黑女诗稿》集中显示了她近几年的视域和思考问题的几个焦点,即灵魂和身体、记忆和现实、破碎的生存体验和总体性理念的建构等范畴间的关系问题。相对于诗人萧开愚的“当代诗”的诗歌厘定,总体上来看,黑女属于“现代诗”写作者,在上述几个问题的关系的处理上,黑女倾向于本体论的处理,即把“本质的”“中心的”“理念的”和“现象的”“外在的”和“材料的”作出区分,并将诗歌的和存在的意义归为根系性的前者。

这种努力和当代人内在价值的长久缺席和自我认同感的缺乏有关,这些内在价值包括道德观、精神寄托、艺术热情等。诗歌在经历了80年代的否定、对抗性写作之后,到90年代,由于对抗对象的弱化甚至消失,自我主体的确认和建构也变得困难。黑女诗歌写作的针对性和方向性也由此可见。

“在存在主义哲学中兜了一圈之后,我又回到东方哲学中来。”直到,“灵魂之渴”将它干燥的唇深入“孔子的儒学”,诗歌写作的本体性的活水井才被发掘出来。同时一种美学和艺术精神也随之明朗,即物我合一、天地人自然浑融。而哲学精神则由西方的主客二分、主客对立向中国儒道思想偏转。值得一提的是,黑女的故乡和她现在的写作地——灵宝,处于其市境的函谷关,正是老子停下来著书立说的地方,《道德经》就在这里写就。因此不难想象传统儒道文化资源对诗人的地缘性影响。

而当今许多有识之士,面对世界性的启蒙反思的机遇,提出了中国传统思想文化的现代转化问题,试图具有针对性的发掘其对当今人类精神困境补益的一面,并把它放在世界的视野中,接受现代性的淬火式的批评,使其价值更经得住推敲,从而成为人类的一个精神资源向度。黑女的写作处在这样一个语境之中,因而她的诗和协调这些诗的时代,有一种相互挖掘的气氛,她的诗也成为这共同努力的方向中的一股个人努力。

【作者简介】梁小静,1988年生,河南洛阳人,文学博士在读,写诗和诗歌批评,目前从事新诗史尤其当代诗歌批评史方面的研究。

基于农业本体的用户兴趣模型研究 第7篇

关键词:农业本体,用户兴趣模型,Web日志挖掘

用户兴趣模型是实现个性化信息服务系统的关键。基于农业本体的用户兴趣模型有两种构建方案。一是直接用独立的本体表示用户兴趣模型。缺点是每次向信息源检索之前均要从本体库中检索兴趣概念关系。二是用户兴趣模型仅用本体的概念来表示,用户兴趣模型中并不存储兴趣概念之间的关系。

农业本体作为农业领域概念化模型,能够明确农业领域涉及的概念、概念的含义、概念间的关系,为简单的术语赋予明确的背景因素[1]。借助农业本体概念间的关系来扩充关键词组,在检索信息时,把关键词(本体概念)之间的关系考虑进来了,能有效提升系统的个性化服务水平,增加信息检索的查全率和查准率,提高个性化服务水平。

本文采用第二种方案构建用户兴趣模型。主要包括:用户兴趣模型的构建和表示、用户兴趣关键词的扩展、用户兴趣兴趣度的度量以及用户兴趣模型的修正等。

1 用户兴趣模型的构建和表示

构建用户兴趣模型的首要要素就是用户识别。在网络环境中对用户的识别有两种类型:一是基于匿名用户识别,常采用的办法主要是依据IP来区分,或依据IP与操作系统组合来区分或是服务器的Cookie技术,但是均不能百分百准确识别用户;二是基于非匿名用户识别。用户需在个性化信息服务系统注册成为普通用户。本文的用户识别主要针对注册用户,通过系统信息订制模块收集用户感兴趣信息关键词,表面上与传统的关键词信息订制方式相类似。

构建用户兴趣模型的第二个要素是兴趣关键词列表的构建。在用户注册时系统会提示选择信息订制内容,为保证订制内容(关键词)具有一定的代表性,供选择的订制内容是参照农业本体中概念来设置的,还可以保证基于农业本体扩展时,尽可能少的出现重复的兴趣关键词。从提高兴趣度方面考虑,当出现两个或多个概念上下位关系时,一律选择下位概念,并写入用户兴趣模型中。如同时订制了“蔬菜”和“西红柿”,系统会合并两个相近的兴趣关键词,只保留“西红柿”。

构建用户兴趣模型的第三个要素是兴趣关键词列表的表示。它不仅与兴趣关键词列表存储表示有关,还与关键词兴趣度大小计算有关。本系统对用户兴趣关键词列表描述为集合:U={(C,I,T,F)|C:关键词,I:为关键词兴趣度,T:为订制信息类型,F:为是否本体扩展,取值0或1,0表示没有扩展,1表示有扩展},初始时,关键词兴趣度缺省值为1。

2 用户兴趣模型关键词的扩展

用户兴趣模型初步建成后,需要对用户兴趣模型中没有扩展过的兴趣关键词借助农业本体技术进行扩展,形成了兴趣关键词(概念)组,增强了对用户兴趣的语义理解。具体的扩展过程如下:从用户兴趣模型中,读取没有扩展的兴趣关键词(概念)。假设没有扩展的兴趣关键词集合为key Word Set={key1,key2,….keyn},其中n表示没有扩展的兴趣关键词数量,keyi(1

当读取没有扩展的兴趣关键词西红柿时,基于以上本体对西红柿概念进行扩展,分别读取西红柿概念的同义概念番茄和下位概念新红宝、粉贵人、加州518、黄金粉王。扩展后的新概念按照集合U中元素的格式被存储到用户兴趣模型中,与原来的兴趣关键词集合构成完整的用户兴趣模型。

3 用户兴趣模型关键词兴趣度度量

用户关键词兴趣度是衡量协会级用户对关键词感兴趣程度大小的一个量化指标,也是动态修改用户兴趣模型的一个重要参考依据。影响兴趣度的因素有很多,但主要因素有三个文献[2]:兴趣关键词的检索频率,兴趣关键词浏览时间和检索兴趣关键词的时间跨度,考虑到农户的特殊性,仅考虑前两个,即兴趣关键词的检索频率,兴趣关键词浏览时间。不考虑检索兴趣关键词的时间跨度原因主要有:一是农业生产具有一定的季度性,在每年只有一季农作物生产的地区的农户可能关注某个订制信息(概念)的时间间隔有半年多久,但这不影响对该概念的兴趣,二是农户或农业组织并没有专职人员负责信息的审核、推送工作,由于其它农事影响系统的使用时,检索兴趣关键词的时间跨度必然加大,但并不影响对该概念的兴趣。

定义Frequency(C),用来表示用户对某个概念C的访问频率。它是通过用户检索过程中与概念C相关的浏览次数S(C)与浏览的总次数S的比值来计算的,具体公式如下:Frequency(C)=S(C)/S

定义Itime(C),用来表示用户对某个概念浏览的平均停留时间。这个定义取决于两个因素:用户停留的时间、页面长度。可用概念C所涉及的文档的停留时间Time(C)和概念C所涉及的文档的大小Size(C)的比值来表示:Itime(C)=Time(C)/Size(C)

显然,用户兴趣度与概念的访问频率成正比,访问的比重赿大,说明用户对该概念越感兴趣。同时也与概念的平均停留时间成正比,停留时间越长,说明用户对这个概念越感兴趣。

在一次检索中,概念C的访问频率是它所涉及的文档的访问频率之和,记作Frequency(C)计算公式如下:

其中,Doci是用户访问过的包含概念C的文档,Frequency(C)表示该用户对概念C的访问频率,N(Doci)为该用户访问文档Doc的次数;N为该用户访问资源的总次数。n为用户访问过的包含概念C的文档数量。

同样,一次检索中,用户对概念的平均停留时间,是用户浏览的所有包含概念C的文档的总时间与这些文档的大小的总和的比值,记为Itime(C),可用下列公式表示:

其中,Time(Doci)表示用户浏览文档Doci的停留时间,Size(Doci)表示文档Doci的大小,n为用户访问过的包含概念C的文档数量。对由于外来干扰影响用户在某一页面停留时间过长,并不能反映用户对这一文档的关注程度,可用本次计算时的平均停留时间来代替。

定义用户对概念兴趣度为计算为Interest Rate(C),可表示为:Interest Rate(C)=Frequency(C)(1-a)+a*Itime(C)/Total(ITime),其中a∈[0,1],为调结因子,可以根据实际情况动态改变概念C的访问频率和停留时间对兴趣度的贡献,Total(ITime)为本次计算所有兴趣关键字的停留时间总和。

4 用户兴趣词列表的维护

兴趣关键词数量经过农业本体概念扩展后会显著增加,用户检索的速度也会变慢,不利于用户模型的个性化和更新,需要对用户兴趣列表维护。本文采用过Web日志挖掘功能隐性改变用户兴趣模型,设定固定某个时段内,根据一定的规则修改或置换兴趣模型中的关键词的兴趣度。具体步骤如下:

步骤1、Web日志数据的过滤,去除不需要的信息的干扰。选取用户的ID、用户请求访问的页面及访问时间,其他属性可以去掉。

步骤2、提取用户名、请求访问的页面URL及访问时间存入数据库,实现数据存储的结构化,便于相关数据统计计算。

步骤3、遍历某个时间段内数据记录,载入访问的页面URL所对应的具体文档,通过规则表达式除去与分析无关的其它信息。

步骤4、对得到的语料进行中文分词,将文本转换一个词的集合A,并只保留所有兴趣关键词列表存在的兴趣关键词。

步骤5、保留下来的兴趣关键词则意味着该文档包含有兴趣关键词,用户对包含该概念的文档的访问次数就是用户对该概念的访问次数,包含该概念的文档访问时间和停留时间也就是关注该概念的访问时间和停留时间。

步骤6、上述过程得到的数据,根据兴趣度计算方法,修改用户兴趣模型中的各个兴趣关键词的兴趣度,从而得到用户兴趣模型的动态更新。

将用户反馈结果来修正用户兴趣模型的兴趣度,使用户的兴趣点再次聚焦。特别是具体到某一个农业协会,譬如蔬菜协会来说,他们可能真正关注是白菜和芹菜的农业生产,但经过农业本体扩展后,其用户兴趣模型中还可能出现他们并不关心的其它的青椒、黄瓜等蔬菜。经过修正用户兴趣模型的兴趣度后,可以去掉青椒、黄瓜等协会并不关心的关键词,向协会推荐他们需要的农产品信息。

5 总结

本文提出了一种基于农业本体的用户兴趣模型理论构建方法,详细介绍了用户兴趣模型的构建和表示、用户兴趣关键词的扩展、用户兴趣模型关键词兴趣度的度量以及用户兴趣模型的修正等。基于该模型构建的安徽农村信息精准推送平台和山东禹城农村信息精准推送平台在实践中检验说明,该兴趣模型能在语义层次上理解用户的兴趣,从而在检索时能获取较满意的查全率和查准率,提高了个性化信息服务系统的质量和水平。

参考文献

[1]钱平,郑业鲁.农业本体论研究与应用[M].北京:中国农业科学技术出版社,2006.

[2]胡宜敏.农业搜索个性化平台的研究与设计[D].合肥:中国科学技术大学,2009.

[3]石军,王儒敬,王志红.基于Web数据挖掘的一种个性化方法[J].计算机工程与应用,2006(7):137.

[4]潘红艳,林鸿飞,赵晶.基于ontology的个性化推送系统[J].计算机工程与应用,2005(20):176-199.

突发危机事件管理的元本体模型 第8篇

近年来,突发危机事件层出不穷,相关问题也引起了政府的高度关注。SARS疫情、汶川地震、日本核泄漏以及近期北京的“7.21”特大暴雨山洪泥石流等突发危机事件,都给社会带来了严重的损失,也对政府应对突发危机的应急管理能力提出了严峻的考验。只有快速地获取突发危机事件信息,利用这些信息进行准确地决策,并把决策高效地执行下去,才能在第一时间将损失减少到最低。因此,如何构建一个统一的系统对突发危机事件进行管理,成为了值得研究和亟待解决的问题。

1 研究现状

突发危机事件管理的基础是对突发危机事件相关信息的管理,这主要包括应急反应需要哪些信息,以及如何表达这些信息两个方面。

从突发危机事件管理需要哪些信息的角度来看,不同的应急决策类型会需要不同的信息加以支持。总的来说,应急决策主要有基于预案和基于案例推理两种方式[1,2];也有学者将两者结合起来,运用CBR与基于规则推理技术构建了应对紧急事件的预案信息系统[3]。基于预案的推理主要关注突发危机事件信息和预案规则;基于案例的推理不仅关注本次危机事件的信息,也需要对以往突发危机事件的信息进行查询。

从如何表达突发危机事件信息的角度来看,早期突发危机事件相关信息大多以网页、数据库、预案等形式存在,突发危机事件信息的表达方式各异,存在着数据杂乱、决策制定时应用效率低的弊病,基于此,有学者提出利用本体来表示突发危机事件管理信息。本体是用来帮助程序和人共享知识的相关概念的明确的规范说明[4]。本体的作用主要体现在不同组织或者领域之间的信息交流、系统的集成和互操作以及在软件工程中的作用三个方面[5]。

王文俊等将事件本体的概念运用到应急事件中,建立了E2M模型[6]。E2M模型针对经典事件本体ABC模型无法刻画应急的业务过程、无法描述变化的连续性、未表示事件因果关系、没有对动作作进一步的细化的不足,将突发危机事件分成事件、过程、动作3个层次[7]。事件含有多个过程,前态经过一系列过程转入终态;每个过程包含多个行动,过程间可有先后关系;动作有动作的主体、受体、时间、空间,会产生变化状态。

温立等在E2M的基础上提出了DSE2M模型,对突发事件发生、发展和演化机理进一步研究[8]。该模型分为五个层次:事件层、阶段层、表示层、决策层和行动层。事件层识别突发事件并挖掘其相互之间的关系,表示层和阶段层从外部环境和内在状态展现突发事件生命周期阶段特征,决策层根据前三层的分析结果进行案例和预案匹配以获得满意方案,行动层引入角色来具体操作满意方案。

Frederick Benaben等在研究法国ISyCri项目时,也提出了危机特征描述和联动系统的本体元模型[9,10]。该模型包括四个主要部分:受灾系统、灾害特征、方案系统和合作进程,其中,受灾系统又分成了物体、自然系统、人员和社会团体四个子类,灾害特征则通过显著潜在危险、复杂性和破坏度三方面来描述。

总体而言,E2M模型主要从应急联动的角度来构建突发危机事件元本体,但是缺乏对决策信息的支持。DSE2M主要为决策的制定服务,挖掘事件之间的相互关系,搜寻匹配案例。ISyCri和E2M类似,也是对行动过程的描述,但更加关注行动过程中的合作。

2 突发危机事件管理的元本体模型

突发危机管理中处理的核心对象是事件,决策的许多知识也是来源于已有的事件信息,所以我们认为突发危机事件管理应以突发危机事件为主线来构建本体,这与李仕明等提出的“情景-应对”管理模式是一致的[11]。之前的E2M、DSE2M和ISyCri模型也都是以事件为核心进行表示的。但是这些模型都没有将决策的制定和决策的实施相结合,而本文认为,只有将这两者在一个统一的系统中联系起来,才能真正提高突发危机事件决策和执行的效率和效果,因此本文构建了一个能够同时支持决策制定和决策实施的突发危机事件管理元本体EMM(Emergency Management Meta-ontology),该系统同时支持平时的预测预警功能。

在决策制定方面,本文在DSE2M的基础上,进一步增强了对事件与事件之间关系的描述,增加了灾害链的推理分析和推荐行动方案,相比于单纯的相似案例匹配,进一步增强了对决策制定的支持。在决策实施方面,本文借鉴了ISyCri的受灾系统的分类,把实际存在的救灾队伍和物资等单独划分为Actuality类。另外,本文增加了对实施效果的评价,这一指标可以用来帮助分析评价各部门的救灾表现,帮助评价救灾资源的分配均衡情况。

本文基于现有研究,将辅助突发危机事件决策的元本体模型大致分成Emergency、Actuality、Time、Place和Quality五个大类,具体的层次结构和关系如图1所示,图中列出了辅助突发危机事件决策的元本体的一级子类和二级子类,实线表示母类-子类关系,虚线表示各类之间的关系。

2.1 类

2.1.1 Emergency

Emergency是对突发危机事件的描述,也是突发危机事件管理元本体的核心类,具体分为Situation、Event、Process和Action四个子类。Situation描述了事件所处的环境,它可以进一步分为从各个数据源采集到的各种环境信息SituationData和根据具体的环境信息得出的状态指标SituationIndicator两个子类,每个Situation都有自己的时间和地点对应,并且与特定的Process相对应。

Event代指突发危机事件,它包含了多个过程,但是Event和Process之间不存在映射关系,某些过程可以属于多个Event。比如,核辐射是日本地震事件中的一个被引发的过程,也是抢盐事件中的起始过程。Event和Process之间通过hasProcess联系起来。

Process代指各个突发危机事件的一个个过程,也是需要做出决策的最小单位。一个Process可以由多个Process引起,也可能导致多个Process。当Process开始时,它会有相应的Situation描述,会有不同的事件类型;当决策结束后,它会有一系列具体的Action。

Action描述了具体的应急行动。根据国家突发公共事件总体应急预案,运行机制主要包括预测与预警、应急处置、恢复与重建、信息发布四块内容。对应的Action可以进一步划分为Warning、Disposal、Restore和Publication四个子类,每个Action有具体的时间和地点,并且会涉及到行动的主体、客体以及利用的资源等。

2.1.2 Actuality

Actuality是对突发危机可用资源的描述,可以进一步分为Goods、NaturalSites、Agents和Source四个子类。Goods包括人造的建筑等;NaturalSites指自然界山川、河流等;Agents是实施行动的主体,根据国家突发公共事件总体应急预案,公安(消防)、医疗卫生、地震救援、海上搜救、矿山救护、森林消防、防洪抢险、核与辐射、环境监控、危险化学品事故救援、铁路事故、民航事故、基础信息网络和重要信息系统事故处置,以及水、电、油、气等工程抢险救援队伍是应急救援的专业队伍和骨干力量;Source是对突发危机事件信息来源的记录,包括传感器、数据库、新闻网页等。

Action和Situation都会用到某些Actuality。

2.1.3 Time

突发危机事件中会涉及到许多时间的表示,都用Time类记录。行动时,会有命令下达时间、实际开始时间、实际结束时间等;对于某一特定状态,也有开始时间和结束时间。这些行动和状态的时间段之间会有特定的关系,如之前、之后、交叉、同时开始、期间、同时结束、同步等,也都可以通过Time进行定义。目前W3C已经对Time的类、关系的定义方面做了大量的工作。

2.1.4 Place

Place记录了突发危机事件行动和状态发生的地点;另外,各类资源的位置也通过Place来表示。Place与Place之间会有包涵与被包含的关系,相邻、附近等概念也可以被定义。

2.1.5 Quality

Quality是对人类主观概念的描述,包含了突发危机事件管理中各种分类变量[12]。比如根据国家突发公共事件总体应急预案,灾害类型包括自然灾害、事故灾难、公共卫生事件、社会安全事件四类;各类突发公共事件按照其性质、严重程度、可控性和影响范围等因素,一般分为Ⅰ级(特别重大)、Ⅱ级(重大)、Ⅲ级(较大)和Ⅳ级(一般);行动效果也会有优、良、中、差之分。

2.2 关系

EMM中定义了类与类之间最为基本的关系,最主要的有:hasProcess,precedes,follows,hasType, hasSituation,hasSuggestions,isSimilarWith,hasRecommendation,mayCause,hasAction,hasResource,hasEvaluation,hasStatus,atTime,inPlace。总体来说,可以大致分为事件过程关系、事件描述关系、辅助决策关系、决策行动关系、状态描述关系。

(1)事件过程关系。

一个Event可以包含多个Process,一个Process也可以属于多个Event,一个Process可以由多个Process引起,也可能导致多个Process,很难确定原生灾害、次生灾害、衍生灾害;在事件发展的过程中,也很难简单地分为潜伏期、发展期、爆发期、恢复期、消失等等阶段。因此,本文没有采取DSE2M中阶段层和事件层的表达方式,而是将一个一个典型的过程作为单独的Process,通过follows和precedes将各个Process联系起来,而用hasProcess将Event和Process联系起来,这样为事件过程的描述提供了更大的灵活性。

(2)事件描述关系。

当Process开始时,它会有不同的事件类型Type,会有相应的Situation描述,根据这些信息,系统可以给出合适的辅助决策信息。

(3)辅助决策关系。

从突发危机事件管理模型中可以发现,辅助决策的主要有三种信息:预案推荐的行动方案、相似案例的历史处置信息以及基于知识发现的规则进行的演绎推理。

hasSuggestion可以根据Situation的描述,以及用规则形式保存在本体库中的应急预案,推理出需要采取的行动。isSimilarWith可以根据process的Situation描述,查找相似的process,在此基础上可以进一步查阅相似案例的处理方式和实施效果,为决策者提供相关信息。hasRecommendation和mayCause可以根据目前灾害的Type和Situation,结合关联规则,给出推荐的行动方案和可能引发的灾害,这些关联规则来源于对事件案例库中的大量数据进行数据挖掘,比如根据Process的precedes和follows形成的灾害网络推理得出灾害链的演化模型、根据Action的Evaluation得出处理特定灾害的推荐方案。

(4)决策行动关系。

hasAction是决策者根据辅助决策信息给出的最终的行动方案的记录。考虑到每一个具体的行动会有非常详细的执行描述,直接给出某某部门采取某某行动的表述方式不能很清晰明了地表示给出的行动方案,也不适合在事后查询时对行动方案进行表示,因此,本文用hasAction表示行动的概括性描述,而用hasResource对行动在实施过程中涉及的人员、物资进行表示。

hasResource是对Action的具体描述,主要用于联合行动时使用。它描述了参与行动的人员和所用物资;另外,Situation的描述也会涉及具体的建筑设施、信息来源等内容,也通过hasResource表示。hasEvaluation是事后对决策行动的评价,包括对决策质量和执行效果的评价。

(5)状态描述关系。

hasStatus记录了Situation的严重程度。在平时,监控系统的数字会转化为各种监控指标,以便更好地对突发危机事件进行预测预警,这些指标就用hasStatus来记录。

3 基于突发危机事件管理元本体的危机管理

突发危急事件虽然具有一定的偶发性,但依旧存在可预警、可准备的部分,因此,我们有必要将突发危急事件的管理范围从以往的应急为主转化为一个日常监控和应急处置相统一的系统。

在突发危机发生前,对Actuality的监控数据会用Situation的形式表示出来,并通过hasStatus转化为指标,以起到预测预警的作用;一旦进入警戒状态,相关部分就可以及时进行分析和准备;当突发危急发生时,根据Situation的描述,系统通过hasSuggestion、isSimilarWith、hasRecommendation和mayCause给出辅助决策信息,决策者通过hasAction、hasResource给出最终的行动方案,相关人员根据指示具体执行;危急结束后,对事件的类型、评价信息进一步完善,以便查取和重用,同时,对预案、关联规则进行管理,对本体库的规则进行维护。这样,一个从事前到事发到事后的全过程的管理构成了突发危急事件管理的全过程。

4 结束语

本文通过分析突发危机事件管理模型,明确了辅助决策信息的需求。本文建立的突发危机事件管理元本体EMM将这些辅助决策信息和原有的突发事件元本体结合起来,弥补了原有突发事件元本体预测预警缺乏、决策辅助效果差的不足。在建立元本体的过程中,本文以最小决策对象的过程为单位,并将不同过程联系起来,克服了之前突发事件元本体对事件过程划分死板的缺陷,使得对于过程关系的描述更加灵活和准确。

参考文献

[1]刘义刚.基于预案库的快速智能决策支持系统的研究[D].北京:北京理工大学,2001

[2]汪季玉,王金桃.基于案例推理的应急决策支持系统研究[J].管理科学,2003,16(6):46-50

[3]张建华,刘仲英.案例推理和规则推理结合的紧急预案信息系统[J].同济大学学报:自然科学版,2002,30(7):890-894

[4]T R GRUBER.A translation approach to portable ontology specifica-tions[J].Knowledge Acquisition,1993,5(2):199-220

[5]李华.基于本体的应急领域知识表示与复用研究[D].天津:天津大学管理学院,2008

[6]王文俊,刘昕鹏,罗英伟,等.应急事件Ontology语义模型及其应用[J].计算机工程,2005,31(10):10-12

[7]C LAGOZE,J HUNTER.ABC ontology and model[R].DC-2001:International Conference on Dublin Core and Metadata Applica-tions,2001

[8]温立,周书民,王延章.基于辅助决策的应急事件本体模型研究[J].情报杂志,2010,29(2):131-134

[9]F BENABEN,C HANACHI,M LAURAS,et al.A metamodel and its ontology to guide crisis characterization and its collaborative man-agement[R].Washington:Proceedings of the5th International ISCRAM Conference,2008

[10]S TRUPTIL,F BENABEN,H PINGAUD.Collaborative process de-sign for mediation information system engineering[R].Gothenburg:Proceedings of the6th International ISCRAM Conference,2009

[11]李仕明,刘娟娟,王博,等.基于情景的非常规突发事件应急管理研究——“2009突发事件应急管理论坛”综述[J].电子科技大学学报:社科版,2010,12(1):1-4

模型本体论 第9篇

在传统的过滤模型中常使用布尔模型[1]、向量空间模型[2]和概率模型[3]等进行相关性过滤, 这些方法速度快、可实现性好。但是, 这些方法对用户模板的表示和待过滤信息的表示中缺乏语义约束, 使得过滤结果不能完全反映用户的真正需求。为了使机器在一定程度上理解用户需求和待过滤信息, 提高过滤的准确性, 本体、语义理解、知识推理等技术被广泛使用[4,5]。但是这些方法一般都需要大量规则和领域知识的支持, 可用性不是很好。目前, 在对内容的处理上, 文献[6]利用“知网”建立了真实文本的概念关系图, 并在此基础上对文本的内容进行了基于理解的推理;文献[7]则是利用WordNet将文档表示为一个带有分值的概念节点集合来表示文档中的语义内容。在对用户的需求表述上, 文献[8,9]提出了以语义框架构造用户需求模型的方法, 利用已有的概念层次词典将用户的需求以一种语义框架的结构来表述, 这种语义框架其实就可认为是一种本体结构模型。文献[10]提出了以本体构造需求模板的方法, 以本体的形式定义需求中概念间的语义关联关系, 将向量空间模型中的特征向量定义为本体中的实例, 通过实例间的关联路径计算特征项间的语义关联, 但文献[10]对文本的特征项提取只是基于统计的方式, 缺乏对文本的语法语义分析。

本文将用户感兴趣的特定需求表示为用户本体模型UOM, 这不仅能很好地解决同义和多义问题, 还可以体现用户需求中各概念间的语义关系, 更好地表达复杂的用户需求和事件之间的复杂关系。本文首先对待过滤信息进行文本结构分析, 通过句群分析给出句子的语义结构、各组成成分之间的语义关系;然后将句子的特征项映射到UOM中去, 计算实例概念间的语义关联度;最后计算出文本与UOM的相似度。基于这些成果, 本文开发了基于UOM的文本信息过滤系统, 并在网络教学资源的智能按需服务系统中得到了实际运用, 实践证明此方法能更有效地为用户提供知识过滤服务。

1基于UOM的文本信息过滤过程

基于UOM的文本信息过滤的主要核心部分是UOM的构建, 文本结构分析及特征提取, 以及语义相关度的计算, 如图1所示。在UOM的构建上, 从用户给出的需求描述出发, 将对需求中贡献较高的特征词抽象为本体中的中心概念。将特征词间的语义关系定义为本体中的概念关联关系。在语义相关度的计算上, 首先进行过滤文本结构分析, 把过滤文本的特征项映射到UOM相应的实例概念中;然后根据实例概念在文本中出现的位置及本体模型的中心概念间关联关系, 计算实例概念的语义关联强度;最后计算出文本与UOM的相似度, 判断是否符合用户需求。

2UOM构建方法研究

2.1UOM的形式化描述方法

本文借鉴了文献[11]用四元组来描述本体的方法, 但对四元组的每一项进行了重新定义, 以符合UOM的实际需求。

定义1 UOM可以表示为一个四元组, 记作:

O=〈T, I, TD, IS〉 (1)

其中T为概念集, 包括本体表示中的中心概念集TC, 关系概念集TR, 记作:T= {TC, TR};I为实例集, 实例是概念表示的具体事物, 包括实例概念集IC和实例关系集IR, 记作:I={IC, IR};TD为概念定义集, 用来定义概念集T中的概念, 包括中心概念的定义CD和关系概念的定义RD, 记作:TD={CD, RD};IS为实例声明集, 用来声明概念集T中的实例, 包括中心概念的实例声明ISC和关系概念的实例声明ISR, 记作:IS={ISC, ISR}。

定义2 中心概念定义集CD可以表示为:

CD={tCi (q) } 1≤i≤|TC| (2)

其中tCiTC, q为中心概念对用户需求的贡献程度 (0≤q≤1) 。

定义3 关系概念定义集RD可以表示为:

RD={tRk (tCi, tCj, Rij) } 1≤k≤|TR| 1≤i, j≤|TC| ij (3)

其中tRkTR, tCitCjTC, Rij为中心概念tCitCj之间的语义关系对整个用户需求的贡献程度 (0≤Rij≤1) 。

定义4 中心概念实例声明集ISC可以表示为:

ISC={tCk (iCj, c) } 1≤k≤|TC| 1≤j≤|IC| (4)

其中tCkTC, iCjIC, c为实例概念对中心概念的相关度 (0≤c≤1) 。

定义5 关系概念实例声明集ISR可以表示为:

ISR={tRk (iRj, r) } 1≤k≤|TR| 1≤j≤|IR| (5)

其中tRkTR, iRjIR, r为实例关系对关系概念的相关度 (0≤r≤1) , 代表了实例关系对两个中心概念之间的关联强弱。

2.2UOM的构建过程

建立UOM的第一步是构建中心概念集TC。首先把用户需求描述中对需求贡献较高的特征词抽取为中心词, 再将这些中心词抽象成中心概念集中的中心概念tCi, 并确定中心概念对用户需求的贡献程度q。这样就可以得出中心概念定义集CD

第二步是将中心概念集转换成中心概念图。首先找到中心概念之间的概念关系, 形成概念关系集TR, 再将存在概念关系的中心概念 (tCi, tCj) 连接起来, 形成中心概念图, 最后根据概念关系对整个用户需求贡献的不同, 确定相应的贡献程度Rij, 进一步明确用户的具体需求和语义倾向。这样就可以得出关系概念定义集RD

第三步是将中心概念图中的中心概念实例化。可以从需求描述和正例文本出发, 从中找出这些中心概念对应的实例概念iCj, 并根据实例概念对中心概念之间的相关程度赋予相关度c。当实例概念与中心概念相同或同义时, 相关度为1。

第四步是将中心概念图中关系概念实例化。可以从需求描述和正例文本出发, 找出关系概念对应的实例关系iRj, 并根据实例关系对关系概念的相关程度赋予相关度r

由于语言表达的多样性, 有时候很难把两个实例概念之间的关系用实例概念的方式表达出来, 例如“安全问题是电子商务的核心和灵魂, 已成为用户和商家都十分关心的话题”。本文把这种难以实例化的语义关系叫作虚关系。采用虚关系来表达语言的多样性还简化本体模型的构建。虚关系相关度的确定是一个值得研究问题。通过实验分析, 用两个实例概念的距离的倒数1/d来描述虚关系的相关度比较合理。

这样就把一个用户需求描述用本体的形式表达了出来, 从而形成了UOM。根据教学资源的过滤需求, 创建了一个以“电子商务”为需求的本体模型, 具体需求描述为“企业在电子商务活动中面临的安全问题, 以及如何解决这些安全问题”。按照构建的过程, 首先根据用户需求描述构建中心概念图 (如图2所示) , 然后根据用户需求描述和正例文本扩展中心概念图的语义关系, 最终形成UOM, 如图3所示。

下面给出电子商务的本体模型部分描述O =〈T, I, TD, IS〉。其中概念集:T = {[TC], [TR]}={[企业, 电子商务, 安全问题, 安全技术], [运用, 面临, 使用, 解决]}。

实例集:I={[IC], [IR]}={[网络威胁, 安全隐患, 安全问题, 安全技术, 安全机制, 安全保障, 安全控制, ……], [面临, 涉及, 制约, 使用, 保护, 解决, ……] }。

概念定义集:TD={[CD], [RD]}={[企业 (0.1) , 电子商务 (0.8) , 安全问题 (0.8) , 安全技术 (0.8) ] , [运用 (企业, 电子商务, 0.05) , 面临 (电子商务, 安全问题, 0.8) , 解决 (安全技术, 安全问题, 0.1) , 使用 (电子商务, 安全技术, 0.8) ]}。

实例声明集:IS={[ ISC], [ ISR]}={[安全问题 (网络威胁, 0.9) , 安全问题 (安全隐患, 0.9) , 安全问题 (安全问题, 1.0) , 安全技术 (安全控制, 0.9) , 安全技术 (安全保障, 0.9) , 安全技术 (安全机制, 0.9) , 安全技术 (安全技术, 1.0) , ……], [面临 (面临, 1.0) , 面临 (涉及, 0.8) , 面临 (制约, 0.9) , 面临 (虚关系, 1/d) , 使用 (使用, 1.0) , 使用 (保护, 0.8) , 使用 (虚关系, 1/d) , 解决 (解决, 1.0) , 解决 (处理, 0.6) , 解决 (虚关系, 1/d) , ……] }。

3语义相关度计算

3.1文本结构分析及特征提取

对文本的句群、段落、篇章分析, 可以得到不同层次的文本特征。句群语境是语境的最小单位[12], 本文的特征提取算法也是建立在句群语境基础上的。

把文本分词后的特征词分别与本体模型的实例概念和实例关系进行匹配, 同时记录这些匹配的特征词在文本中出现的位置。由此得到该文本的特征向量。

T={wi (p, s, l) } i=1, 2, 3, … (6)

其中wi为匹配的每一个特征词, pwi所在段落, swi所在句子, lwi所在句子中的位置。文本与UOM的相似度就是根据这些特征向量来计算的, 如果特征词没有在特征向量中出现, 就不计入相似度。

3.2实例概念关联度计算

实例概念间的语义关联度计算方法如式 (7) 所示:

Sij=Rij×ci×r×cj (7)

其中两个实例概念 (iCi , iCj) 和实例关系iRk同时出现在一句话中, Rij为实例概念iCi和iCj对应的中心概念之间语义关系对整个用户需求的贡献, ci和cj分别为实例概念iCi和iCj对其中心概念的相关度, r为实例关系iRk对其关系概念的相关度。当实例关系没有出现时, 此时实例关系可由虚关系表示, r值为两个实例概念iCi和iCj在文本中距离的倒数。

对于孤立的实例概念不作统计, 对于在文本不同语句中出现的相同实例概念关系, 按以上规则计算叠加。

3.3文档相似度的计算

文本T与用户模型O的语义相似度计算方法如式 (8) 所示:

Sim (ΤΟ) =i=0nj=i+1nSij×qi×qj (8)

其中Sij为实例概念i和实例概念j的语义关联度, 由式 (7) 计算。qi为实例概念i所对应的中心概念的权重, qj为实例概念j所对应的中心概念的权重。Sim (T, O) 值越大, 说明该文本表达的语义与用户模型中定义的语义越接近。

4实验

本文除了描述了如前所述的“电子商务”本体模型外, 为了和文献[10]进行对比, 本文还描述了文献[10]中关于“伊拉克战后重建”的本体模型, 具体需求描述为:“相关新闻为关于伊拉克战后重建所面临的各种困难和挑战, 以及国际社会对这些困难提出的各种解决方案。与分析重建困难无关的关于伊拉克战后重建的新闻视为无关”。

通过搜索引擎百度和Google, 动态搜索到有关电子商务领域相关资源459篇, 其中与主题相关的172篇;搜索到的伊拉克战后重建方面的相关资源253篇, 其中与主题相关的41篇。

在实验中, 运用了基于向量空间的方法和文献[10]的方法与本方法进行了对比测试。为了探究虚关系在过滤中的作用, 对基于本体的方法分为两种情况讨论:复合关系和实例关系。复合关系中包含了实例关系和虚关系。过滤系统性能指标采用了在检索和过滤中广为应用的召回率和准确率及F1值, 测试结果如表1和表2所示。

实验结果表明:

(1) 基于统计的向量空间方法的效果最差。这是由于过滤样本都是围绕这个主题的, 用关键词很难区分。

(2) 基于UOM的过滤方法优于文献[10]的方法。这是由于相似度计算考虑了文本结构和概念间的语义关系, 对于那些相似文本中因分散存在的关键词而造成的假匹配, 可以给予很好的处理。文献[10]的方法只是把本体用于了用户需求的表示上, 而在具体计算文本相似度时没有考虑文本的结构和概念间的语义。

(3) 复合关系方法的F1值高于实例关系方法的F1值。虚关系的引入提高了召回率, 这是因为虚关系在一定程度上扩大了过滤结果集, 可以在UOM不完备的情况下, 仍然能查找到所需要的文本。但是虚关系却降低了过滤的准确率, 这是虚关系不是真正意义上的语义关系造成的。

5结论

本文将本体应用到文本过滤中, 把用户需求的语义信息通过UOM方式进行表达, 很好地提高了过滤系统的准确率和召回率, 在实际运用中也取得了较好的效果。可以得出以下结论:

(1) 用本体来帮助机器理解用户的真实意图是一种很有效的手段。

(2) 通过文本结构的分析, 分清各个关键词在句子中的角色, 与其它项的语义关系, 可以有效地提高过滤的准确率。

(3) 在语义相关度的计算中, 虚关系的引入有效地扩大了过滤结果集, 可以部分提高召回率。

(4) 基于UOM的过滤方法和基于语义框架过滤方法相比, 不需要领域知识库的支撑, 因此算法的执行效率要高, 具有较好的实用性。

由于UOM的完善程度会直接影响过滤效果, 下一步的研究重点可以围绕UOM自动构建和动态更新以及语义相关度算法, 进一步提高过滤效率和准确率。

摘要:随着互联网信息的快速剧增, 文本过滤技术成为互联网内容处理的关键技术, 对海量信息处理具有很重要的意义。目前研究热点是基于语义的过滤方法, 但是这些方法一般都需要大量规则和领域知识的支持, 可用性不是很好。为了使机器更好地理解用户需求和文本内容, 使过滤结果更能反映用户的真正需求, 提高文本过滤的准确率和召回率, 提出了基于用户本体模型UOM的文本信息过滤方法。该方法主要包括UOM构建、文本结构分析、文本概念提取和语义相关度计算等。基于UOM (User Ontology Model) 的过滤方法, 不仅可以表示复杂的用户需求, 而且还避免了领域本体的构建, 因而其有效性和实用性得到了很大的提高。通过在网络教学资源的智能按需服务系统中的实际运用, 表明此方法能更有效地为用户提供过滤服务。

关键词:文本过滤,用户本体模型,虚关系,文本结构分析

参考文献

[1]Yan TW, Garcia-Molina H.Index structures for selective dissemination of information under boolean model.ACMTrans.on Database Systems, 1994, 19 (2) :332-364.

[2]DL Lee, Huei Chuang, Seamons K.Document Ranking and the Vector-Space Model.IEEE Software.1997:67-75.

[3]曾春.信息过滤的概念表示与算法研究[D].北京:清华大学出版社, 2003.

[4]Liu Chingyung, Verscheure O, Amini L.Semantic Routing and Filtering for Large-Scale Video Streams Monitoring.Multimedia and Expo, 2005.ICME2005.IEEE International Conference on.2005:1408-1411.

[5]Schickel Zuber V, Faltings B.Using Hierarchical Clustering for Learn-ing the Ontologies used in Recommendation Systems.In The Thirteenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2007:599-608.

[6]陈晓明, 王洪, 张仰森.“知网”的知识扩展和推理研究[J].贵州大学学报, 2001, 18 (2) :97-102.

[7]Mustapha Baziz.Towards a Semantic Represehtation of Documents by Ontology-Document Mapping[J].Artificial Intelligence:Methodology, Systems, and Applications:11th International Conference, AIMSA2004, Varna, Bulgaria, September2-4, 2004:33-43.

[8]林鸿飞, 麻志毅, 姚天顺.基于语义框架的中文文本过滤模型[J].计算机研究与发展, 2001, 38:136-141.

[9]晋耀红.基于语义的文本过滤系统的设计与实现[J].计算机工程与应用, 2003, 7:22-26.

[10]袁兴宇, 王挺, 周会平, 等.以本体构造中文信息过滤中的需求模型[J].中文信息学报, 20 (3) :63-69.

[11]王洪伟, 吴家春, 蒋馥.基于描述逻辑的本体模型研究[J].系统工程.2003, 21 (3) :101-107.

模型本体论 第10篇

以往, 航天企业的型号任务少、周期长, 同类基础产品的需求数量有限, 则产品按照单一型号需求进行研制就能够满足任务的要求[1,2]。目前, 随着众多重大航天科技工程的全面启动, 中国的航天业已经发展到了一个新的高度, 航天型号产品研制面临着需求转型, 其在性能, 可靠性, 数量等方面的要求均有大幅度的提升, 航天企业为适应此种变化, 提出建设产品体系的大胆创新和改革, 实现从“以型号研制为中心”向“型号研制与产品研制并重”的方向转变。因此构建型谱模型, 发展产品工程变得更加重要[3,4]。

本文将重点介绍基于近年来知识工程领域的本体相关理论, 构建产品型谱本体模型。并且在面向航天型号产品的PDM系统即AVIDM系统中, 实现对产品型谱本体模型的构建、管理和使用。

2 概述

航天产品型谱是用最少数目的不同规格的航天产品, 构成能满足可预见到的全部使用要求的航天产品系列, 是产品通用化和系列化两种标准形式的有机结合与发展, 因此航天产品是产品工程的顶层规划和核心, 其规划了航天产品的发展和应用方向, 是航天产品工程的核心要素。目前航天各个单位, 研究所几乎都有自己的产品库, 甚至有的已经拥有了简单的产品型谱。而在航天内部, 各个分系统单位之间, 以及分系统和总体单位之间常有合作和工作对接, 各个单位之间需要准确无误的沟通, 因此, 将航天型谱进行统一, 准确, 无歧义的表达就显得尤为重要。

造成语义歧义的主要表现形式为同一个概念在不同的地方由不同的术语或名词表达, 同一个名词在不同的系统中表示的含义不同。本文将引入本体思想及相关技术, 提出一种产品型谱的表达和构建方法, 使得航天产品型谱能够完整和无歧义的表达, 为航天型号产品研制生产, 尤其是跨单位之间的合作提供有利的信息支持。

3 本体技术

3.1 概念

本体 (ontology) 最初是哲学领域的一个概念。随后, 随着人工智能的发展, 本体在人工智能领域被赋予了新的定义.1993年Gruber将本体定义为“本体是共享的概念模型的形式化的规范说明”。Perez等人利用分类法将本体组织分为五个基本元语[5,6]:

(1) 类 (classes) 表示对象的集合, 一般表现为框架结构, 包括概念的名称以及彼此之间的关系, 还有自然语言对概念的描述;

(2) 关系 (relations) 表示概念之间的交互作用, 定义为笛卡尔积的子集:R:C1×C2×···×Cn, 最典型的是子类关系;

(3) 函数 (functions) 它是一种特殊的关系, 某一个元素可以由其前面的元素唯一确定, 定义为:F:C1×C2×···×Cn-1→Cn;

(4) 公理 (axioms) 表示原理的集合, 及永真断言;

(5) 实例 (instances) 表示本体概念的一个实现。

按照本体对领域的依赖程度可以分为四类, 如图1所示:顶级本体、领域本体、任务本体和应用本体。其中领域本体是用于对特定领域知识的概念及其关系进行精确描述的一种专门的本体。本文使用本体技术对产品型谱进行建模, 建立产品型谱领域本体模型, 从而实现对产品型谱进行无歧义, 规范化表达[7]。

3.2 本体语言

本体描述语言用来使用户能够将本体要表达的对象的内容编写为清晰的, 形式化的描述, 良好的本体描述语言需要满足:良好定义的语法和语义, 有效的推理和表达以及表达的方便性等要求。本体语言中, OWL (Web Ontology Language) 由于其具有良好的描述逻辑, 并且语言简单, 表达直观而易于被使用者所接受。OWL基于资源描述框架 (Resource Description Framework, RDF) /XML, 更接近机器层识别的语法, 同时相比较其它本体描述语言, 增加了很多用于描述概念属性和类型的词汇, 如概念之间的不相交性 (disjointness) 、基数 (cardinality) 和枚举类型 (enumerated classes) 等。按照描述能力的大小, OWL可以分为以下三类:OWL Lite、OWL DL、OWL Full, 其关系如图2所示[8]。

由于OWL Lite的表达能力太低从而不能满足产品型谱的表达要求。而OWL Full的表达能力太强, 目前尚没有推理软件能够对其进行推理。因此本文选择表达能力居中的OWL DL预研来描述产品型谱。

4 产品型谱本体模型

4.1 构建流程

本体的建立方法可以分为两大类, 一类是本体新建, 即从现有的产品资源库中根据一定的方法来构建全新的本体, 另一类是本体复用, 即通过继承或映射已有的本体, 从而形成新的本体, 这是一种快速构建本体的方法。本文主要研究前者本体新建的方法。虽然目前尚没有一套标准的本体构建方法, 但是在构造本体时, 需要遵守一些基本原则, 最有影响的是Gruber于1995年提出的5条基本原则[9]:明确性和客观性、完全性、一致性、最大单项可扩展性和最少约束。本体构建是一个步步求精, 多次重复的过程, 并且本体模型不存在一个单一绝对正确的本体, 不同的构造者用不同的构建方法会构造出不同的本体。产品型谱本体模型构建过程如图3所示。

在构建开始, 需要明确为什么要构建, 构建后的本体模型的作用范围是什么?产品型谱是具有一系列特定要求、经过优化的产品系列, 其作用主要是可以帮助用户单位清理已有的规格化的产品, 并且优化合并现有产品规格, 促进产品快速成熟。从长远看, 产品型谱构建工作也有利于分析未来型号和技术发展需求, 引领后续产品研发。

在领域本体中, 由于各领域要表达知识的侧重点不一样, 因此各领域本体的元组表现形式也不一样, 产品型谱的构成需要满足可预见到的全部使用要求的产品系列, 其包含一系列的产品的相关概念及其相互关系, 因此将其定义为四元组:{C, P, A, I};其中, C指产品概念术语的集合;P指概念之间的关系集合; A-为原理集合, 此处为OWL DL语言标准;I指实例集合。

航天产品型谱模型的部分概念如图4所示, 主要分为实体概念和属性概念两类, 前者用来描述产品的相关术语名称, 后者则用来描述产品型谱中的实体概念以区别于其它实体概念的特征。

产品型谱模型的关系如下表所示, 主要分为三种基本关系:类属关系、实例关系和属性关系。具体描述如表1所示:

关系构建完成后, 将产品型谱模型的四元组用本体描述语言OWL DL加以描述, 最后可形成产品型谱本体模型。

5 系统实现

在神舟软件公司自主研发的AVIDM系统中, 实现了上述航天产品型谱本体模型的构建和管理, 系统基本上可以分为三个层次, 如图5所示。

(1) 界面层用于提供用户和机器的交互界面, 便于用户建立、编辑和应用产品型谱模型。

(2) 推理层基于内置的一些产品型谱规则, 对产品型谱进行有效的推理。

(3) 语义层使用相应的语法表示产品型谱模型。

以下为相关的系统界面示意图, 如图6所示为AVIDM系统中构建产品型谱相关实体概念和属性概念界面;图7所示为产品型谱使用查询界面。

6总结

以发展的眼光来看, 通过建立产品型谱, 从而促进产品快速成熟, 为航天跨单位的产品的规划、开发、生产和推广提供指导是非常重要的。通过对产品型谱的研究和应用, 将能够有效的形成产品资源, 促进航天领域产业化发展。本文所论述的基于本体技术构建产品型谱是产品型谱管理当中的重要一环, 其功能使得产品型谱信息能够准确的、无歧义的表达。文中介绍的AVIDM产品已经实现了上述功能, 取得了令人满意的效果。

摘要:在分析了航天企业产品生产的发展趋势和特点的基础上, 提出了构建航天产品型谱的必要性。通过分析本体理论及方法的优势, 提出了使用本体技术和方法构建航天产品型谱模型, 阐述了航天产品型谱模型构建的详细步骤, 并使用本体描述语言进行描述, 最终能够使得航天产品型谱模型信息完整、无歧义地表达。最后介绍了基于航天自主研发的AVIDM系统中产品型谱模型的实现方案, 通过构建和使用航天产品型谱, 从而促进了产品快速成熟, 并引领后续产品的研发。

关键词:产品型谱,本体,AVIDM

参考文献

[1]沈慧, 明新国, 严隽琪等.产品型谱管理技术初探[J] (Research strategy of product portfolio management) .机械设计与研究.2008 (4) :72-77.

[2]朱毅麟.对产品化与产品型谱的再认识[J] (Research product structure model of the PDM system) .航天标准化.2006 (4) :22-24.

[3]石锐.航天产品型谱建设探索与实践[J] (PDM product data management introduction) .质量与可靠性.2012 (5) :26-30.

[4]王文峰, 刘伟亮, 杨烨宙.卫星系统级、单机级产品型谱管理过程实践[J] (The simple analysis of product data management in aviation corporation) .质量与可靠性.2012 (5) :20-26.

[5]Gomez-Perez A, Fernandez-Lopez M, Corcho O.Ontological engineering[M].London:Springer-Verlag, 2004.

[6]Preze A G, Benjamins V R.Overview of knowledge sharing and reuse compo-nents:ontologies and problem-solving methods[M].Stockholm:the IJCAI-99 Workshop on Ontologies and ProblemSolving Methods, 1999:1–15.

[7]Jannach D, Shchekotykhin K, Friedrich G.Automated ontology instantiation from tabular web sources-the allright system[J].Web semantics:science, services and agents on the World Wide Web, 2009, 7:136–153.

[8]Ebrahimipour V, Rezaie K, Shokravi S.An ontology approach to support fmea studies[J].Expert Systems with Application, 2010, 37:671–677.

模型本体论 第11篇

一、问题的提出

“文章千古事,得失寸心知。”

从事作文教学的时间越长,越觉得困惑。长期以来,我们在传统教学观念的驱使下,使作文教学常常陷于顾此失彼的尴尬境地:要么以“知识”代替一切,过分强调阅读、范文和指南;要么以“生活”代替一切,过分强调观察、立意和选材;要么以“技巧”代替一切,过分强调构思、布局和表达;要么以“思维”代替一切,过分强调形象、抽象和灵感。凡此种种,不一而足。作文教学基本形成了“传授知识技巧——阅读借鉴范文——模拟仿写训练”的固定程式。学生在作文中的创新精神非但没有得到释放,反而更加萎缩了 。由此形成了学生作文中普遍存在的应付、抄袭、千篇一律等不良现象: 1999年高考作文中许多考生编造虚假的“伤残情结”,是多么让人触目惊心!

许多教者不由得 “望文兴叹”:作文,路在何方?!

二、基于语言和思维关系问题的思考

传统的中学作文教学主要是两种模式:“八大块”模式和“思维训练模式”。 “八大块”模式包括主题、题材、结构、表达方式、语言、文风、文体和修改等。这种教学模式主要是以“文”为本,静态的解析文章本身的构成要素,而忽略了文章写作过程中的主体素质及行为方式。

“思维训练模式”打破了这种“就文论文”的模式,转向以“人”为本,把“作文主体”(学生)这个最活跃、最富于能动性和创造力的因素作为研究的主要对象,探寻作文过程本身的规律。思维能力无疑是人智力结构的最关键因素,思维训练由此成为作文教学的核心。

作文的确是一个将无序的客观写作对象转化为有序的精神产品(文章)的思维过程。1987年,荷兰提尔堡国际写作专题讨论会的研究报告认为:写作并非只是一门课程,在写作与思维之间存在着并生的关系。作文教学把训练的重心从文体训练转向写作过程本身的训练即思维训练,这是作文教学改革的一大突破。问题在于,这两种模式在强调各自训练重点的同时,都不同程度的忽视了语言训练。这样,就造成了学生在作文时的“眼高手低”状况:尽管有奇思妙想,却不能使之着陆在语言表达上;说起来头头是道,写起来却语无伦次。语言素质直接成为扼制学生作文能力及其创造性的瓶颈。

总括来说, 作文教学要解决的问题不外乎是语言和思维的关系问题——这一人类面临的最古老、也是最有争议的热门话题。我们的作文教学改革之所以总是“沧海难为水”,就是没有冷静的探讨这一问题,没有把语言上升为本体来认识。这样,我们的作文教学中就始终存在着较为突出的重内容而轻表达、重思维训练而轻语言训练的情况。

事实上,包括写作活动在内,人的一切思维和情感活动都必须借助语言才能进行。现代生理学和心理学的研究成果表明:人脑右半球在没有左半球语言中枢配合的情况下,虽然也可以进行相当独立的学习、记忆和思维活动 ,但这种活动只能在形象材料(输入图象材料)上进行。可见,真正有意义的思维必须借助于物化的语言来进行。斯大林曾批评把思维和语言完全割裂的观点,他指出:“不论人的头脑中产生什么样的思想,以及这些思想在什么时候产生,它们只有在语言材料的基础上、在语言术语和词句的基础上才能产生和存在。”①

西方现代语言学家早在19世纪末20世纪初,就开始强调语言的本体性意义。 英国著名理论批评家伊格尔顿指出:“意义不仅是某种以语言‘表达或者‘反映的东西:意义其实是被语言创造出来的。我们并不是先有意义或体验,然后再着手为之穿上语词;我们能够拥有意义和体验仅仅是因为我们拥有一种语言以容纳体验。”②存在主义美学家海德格尔更认为语言是“存在的寓所”,是一种“诗意语言”,他说:“当人思索存在时,存在就进入语言。语言是存在的寓所。人栖居于语言这个寓所。用语词思索和创作的人们是这个寓所的守护者。”③这就是说,语言不再被看作是表达的工具,而成为人类存在的基础或存在方式。

现代语言学的研究成果成功揭示了语言的丰富性、复杂性和神奇魅力,标志着语言已从“工具论”概念转向“本体论”概念。这给我们的作文教学以许多有益的启示。对于文章来说,社会生活内容和作者的思想感情都是依靠语言存在的,它是语言的物化形态和艺术产品。一切写作活动最终都要通过语言来作文章。离开了语言素质的培养,作文教学中的思维训练必然成无本之末而流于形式。事实已经证明,学生的语言素质低下直接影响了作文水平的提高。子曰:“言之无文,行而不远。”语言,是作文走向本体论的必然选择。

作文的本体性指归,将矫正我们在作文教学中的 “浮冰”现象,化开写作主体与文章载体之间的“死结”,使思维训练落到实处;通过提高语言素质来提高思维水平和写作能力,以达到作文教学的真正目的。

以往,我们总是出于“文以载道”的传统观念,试图使文章真的成为“经国之大业,不朽之盛事”,而给作文负载了太多的教化内容。背负沉重的作文在努力完成这些教化使命的同时恰恰迷失了自我——语言。作为一个教者,我们应扪心自问:我们对作文的语言有几多关怀?

三、作文的本体化:建构修辞文本

作文本体化的意义在于,语言成为写作行为的范型和专注对象,这样,就克服了传统作文教学模式重视语言所表述的内容、方法而忽略语言本身的弊端。但是,由作文的特殊品格所决定,语言本体的存在仍然不能游离于写作的主体(作者)、客体(内容)和载体(文章)之外,而且正是语言的本体性决定了它们之间更加紧密的互相依赖关系。如下图所示:

正是这种互赖关系,使修辞成为作文的主要行为方式和目标过程。“修辞,简单地说,就是指组织并调整话语以适应特定语境中的表达要求,或者为造成特定语境中的表达效果而组织并调整话语。”④修辞作为作文本体性的直接归宿,它的魅力在于:把作文看成是为造成特定语境中的表达效果而组织和调整话语的修辞现象,修辞的效果直接体现了作者的生活和思想情感形式;而且在更深广的意义上,以修辞为本体目标的作文正显示了作者的思维智慧及创造性。

把语言作为本体的作文过程,其实质就是,在一定题旨下建构一组具有一定关联性和层第性的“修辞文本”。所谓“修辞文本”,就是“专指那些运用特定的表达手段而构成的具有特定的表达效果的言语作品,这个言语作品可以是特定语境中的一个词或几个词构成的一个句子,也可以是由两个或两个以上的几个句子构成的语句群,还可以是只表达某一特定主旨的篇什。”⑤

把作文看成是建构修辞文本的过程,并不排斥作文的基本写作程序和要素,而恰恰是为了突出这些程序和要素的语言形态,使所有的写作行为修辞化。我国现代修辞学的奠基人陈望道先生在《修辞学发凡》中所提出的“修辞以适应题旨情境为第一义”的著名观点,可以看作是建构修辞文本的基本原则。这一原则观照下的作文教学,集中表现为以下三个方面:

(一)适应题旨情境。所谓题旨,陈望道先生将其解释为“一篇文章或一场说话的主意或本旨”。并且认为“写说便是为了发挥这个意旨起见”,运用修辞来表现种种“复杂的景象的一种工作”。⑥所谓适应情境,就是在建立修辞文本的过程中要适合作者的主观心境和客观社会环境。

朱自清先生的名作《荷塘月色》是在1927年这样一个“风雨如晦”的特殊时代背景下,创造的一幅“像笼轻纱的梦”般的境界。作者在淡淡喜悦和淡淡哀愁的交织中,传达出自己“到底惦着江南”的“颇不宁静”的心情。为了表现这种既想超脱又超脱不了、宁静又不宁静的复杂微妙的心情,作者建构了一组“别有风味”的修辞文本:用自言自语般“新而不失自然”的“不欧化的口语”(朱自清语)时时牵动“渺茫的歌声”般的心绪;用叠词不间断的泛起情思的微澜,使画面富于立体感、渗透感又氤氲着缥缈的乐感和浓浓的诗意;用比喻和拟人使客观景物出神入化的呈现了作者的“内心视像”;特别是用通感打通了视觉、听觉和幻觉,把肺腑深处很难传达的“心语”和感受转换成了另一种具体可感的形象,把读者带入一种幻境 。

西方现代著名语言学家维特根斯坦有句名言:“想象一种语言就意味着想象一种生活形式。”⑦适应题旨与情境的修辞文本建构,充分发掘了语言本身的诗意特性和审美潜质。但是这种诗意特性和审美潜质必须置于特定的语言环境中,才能激发表情达意的效应。正如著名修辞学家张弓所说:“修辞是在一定语境下,一定上下文里具体利用语言因素以构成语言的艺术手法,这是创造性活动,而语言的一切因素只是修辞的材料、条件而不是修辞本身。”比如,“我真傻,真的”这句话在日常生活中本是很普通的用语,但在鲁迅小说《祝福》中成为祥林嫂经历丧夫失子巨大打击后,充满原罪感的“受伤记忆”的絮语,是走向绝望的箴言。鲁迅先生用反复的修辞手段,深刻地表现了封建社会残酷与麻木,给读者以强烈的艺术震撼力。

(二)适应语体风格。所谓语体,就是在修辞的作用下,为适应不同的语言环境和交际目的而建构的语言风格类型和表达特点体系。作为修辞学的一个重要范畴,语体是一种客观存在。一种语体确定的本身,就意味着作文修辞文本建构过程中,在摄取语言材料、手法而造成所需格调、气氛时,有了可靠的标准和依据,有助于提高修辞适应题旨情境的自觉性。比如,从语体的角度分析词语,就能指出词语材料在其本身词汇意义之外所附丽的语体色彩显示的特有表达功能,多视点考察、把握这种特有的表达功能,就可以大大提高我们在选词修辞上的自觉性和能动性,提高语言运用水平,如“花朵”—“祖国的花朵”、“长城”—“钢铁长城”、“吃”—“吃不准”等等。语体一般分为谈话语体、科学语体、艺术语体、政论语体和事务语体等。

古人说:“文章以体制为先。”作文之前,须先定“体”,这是自古以来的作文定律。不同的文章体裁对语言色彩和风格自然有不同的要求。文体主要包括格式和语体两个部分。格式是文章的外在构架和体式,是文章的载体。所以,语体是文体的核心因素,它在根本上决定着文体的性质。

中学作文教学中,语体训练无疑是最有价值和实效的。学生的修辞能力主要是从语言实践中获得。任何具体语言总是与某种语体规范相适应,掌握了这种语体,才算获得了这个领域的语言能力。我们的中学作文应努力打破艺术语体训练为主的格局,走向语体训练的多元化和科学化。特别是要把同一题材的不同语体在作文中配合训练,提高学生在特定语境中综合利用各种语体功能的水平,以适应社会发展对不同语体及作文综合素质的要求。

(三)建构特定模式。所谓模式,就是具体的可以借鉴的格式。不同的语体特点必然要求建构特定的修辞文本模式,一般分为平实型和审美型两种。平实型文本的“语言具有确定性,准确、明晰、朴实、简明,一般不用夸张、双关、隐喻、象征、借代等文学语言,有利于直接表达思想感情和应用目的。”⑧而审美型“无论是传达还是接受,都是以形象作为中介,实现主体心理感受和生命体验的形态转换,具有独异的、特殊的情感色彩。”⑨但是,在作文实践中,修辞文本模式表现为突出的互渗、相融现象,比如,许多议论性的文章经常利用审美型修辞文本来增强说服力和感染力,如《劝学》用了“群喻排比”的文本模式。特别是作者在设喻方式上运用自如,灵巧多样,有时用同类事物正面设喻,从相同角度反复说明问题,强调观点,如“积土成山,风雨兴焉;积水成渊,蛟龙生焉”;有时从反面设喻,形成鲜明的对照,如“不积跬步,无以至千里;不积小流,无以成江海”;有时单独设喻,有时连续设喻;有的同类并列,有的正反对照;有的只设喻而把道理隐含其中,有的先设喻再引出道理,真是铺锦列绣,错综多变。文本随着用对比的铺排和连续转换,形成了整齐而富于变化的句式,使文章错落有致,文采斐然。而大量的短句排比,使文本既富于论辩色彩,又在一种深厚的文学韵味中流动着音乐的节奏感。仿佛荀子作为一代雄辩奇才,站在历史的舞台上,正给我们口若悬河、滔滔不绝的演讲:终身学习,学会学习!这就不难理解,《劝学》为什么会千百年来为人们传诵不衰!

修辞文本建构的艺术魅力可见一斑。

————————

参考文献:

①斯大林:《马克思主义与语言学问题》,人民文学出版社1950年10月版第38-39页。

②伊格尔顿:《二十世纪西方文学理论》,陕西师范大学出版社1986年版第76—77页。

③海德格尔:《关于人道主义的信》,引自《存在主义哲学》,商务印书馆1963年版第87页。

④王一川:《修辞论美学》,东北师范大学出版社1997年5月第1版第85页。

⑤吴权礼:《修辞心理学》,云南人民出版社2002年1月第1版第37页。

⑥陈望道:《修辞学发凡》,上海教育出版社1979年9月新1版第6页。

⑦维特根斯坦:《哲学研究》,三联书店1992年版第15页。

⑧、⑨王朝彦:《文笔训练》,华中理工大学出版社1999年10月第1版第186—187页。

模型本体论 第12篇

随着21世纪信息技术的不断发展和普及, Web站点已经逐渐成为了人们生活中不可或缺的一部分, 为人们的工作和学习带来了巨大的便利。然而, 随着互联网上的信息量急剧增大, 传统Web站点的这种大众化“one-size-fits-all”运营模式, 已经无法满足不同背景下的用户的个性化需求。个性化信息推荐系统就是在这个背景下, 应运而生, 并且迅速成为近年来研究的热点。

传统的协同过滤推荐系统通过关键字来建立用户兴趣模型[1]。由于关键字的模糊性, 所产生的用户兴趣模型不能够准确地代表用户的兴趣以及不同的事物在目标域中的关系, 除此之外还存在冷启动和数据稀疏性等问题, 极大地降低了推荐系统的性能。

为了进一步提高个性化推荐的准确度, 近年来国内外研究者对此进行了深入的研究, 尝试了各种方法。其中, 本体的引入无疑是个性化推荐领域一个质的飞跃。

Pretschner and Gauch[2]是利用本体建立用户兴趣模型和提供个性化文档访问的先行者。他们利用域本体组织文档, 根据用户的浏览历史建立用户兴趣模型。最后, 根据文档所对应的本体概念的当前兴趣值, 实现个性化文档访问。Xing and Tan[3]提出了用户本体的定义, 同时设计了一系列统计方法来根据域本体产生用户个性化本体。在建立用户兴趣模型的时候, 每一个概念和关系都被赋予了一个特定值。

在国内, 熊馨等[4]也研究了基于概念分层的个性化推荐算法;潘红艳等[5]设计并实现了一个基于Ontology的个性化推荐系统, 把零散的关键词组织成一个网状结构, 提供了一个Web用户特征的抽象视图, 并且半自动地实现了本体的构建;陈俊杰等[6]提出了一种基于本体的个性化模式库建模方法, 通过树图和空间图相结合的方法来建模, 在空间图中建立本体节点的个性化服务。陈一峰[7]等针对用户兴趣模型中本体构建和模型更新的难点和不足, 提出一种基于本体论的用户兴趣模型构建方法。

然而, 目前很多基于本体的个性化推荐的研究普遍存在一定的缺点, 比如:忽略了本体概念间关系的重要性, 没有对用户兴趣本体的概念兴趣度随着时间进行遗忘等。

为了解决上述缺陷, 本文基于用户兴趣本体提出了一种新用户兴趣模型, 并对推荐算法进行了进一步改进。我们根据域本体挖掘用户兴趣本体从而建立用户兴趣模型。同时, 当用户的兴趣随时间发生改变时, 用户兴趣模型能够根据激活扩展推断理论[8]自动进行更新。然后, 论文通过计算用户兴趣模型的相似性, 而不是用户对不同事物的评分, 产生了协同个性化推荐列表。为了证明推荐系统的有效性, 在论文中同样分析了用户兴趣模型的稳定性。

1 系统基本结构

为了集成本体知识进协同过滤推荐, 提高个性化推荐系统的性能, 本文提出了基于本体用户兴趣模型的个性化推荐系统框架。如图1所示。

当一个用户登录到系统, 根据用户ID获取用户个性化信息及用户兴趣模型。通过用户兴趣模型的相似度算法计算获取目标用户的K-Nearest最相似用户列表。最终, 参考这些用户的喜好, 产生了推荐列表。这个框架最重要的特征是:当一个用户通过购买、评论、评分等方式与项目进行交互时, 推荐框架将会主动捕获对不同系统项目的用户兴趣的改变, 同时根据激活扩展理论进行相应的用户兴趣模型的更新。

2 本体用户兴趣模型

2.1 相关定义

定义1用户兴趣本体是用户目标领域的域本体的一个子集, 作为基于现有分类的用户兴趣分类结构本体。本文使用ODP建立用户兴趣本体。

定义2概念语义相似度指本体树中的两个概念之间的内在意义的相似度, 反应了它们的语义关系。在分类本体树中的概念是按自上而下分级组织。一般而言, 两个概念之间的距离越小, 概念间的语义相似度越大。本文概念语义相似度计算公式如下:

其中, Ci和Cj是分类本体树种的任意两个概念, LCA (Ci, Cj) 为Ci和Cj最近的一个共同的祖先概念, depth (Ci) 表示概念Ci在本体树中的深度。

定义3用户兴趣度指对于一个概念的用户兴趣的程度。它是由一个数值进行表示。数值越大, 用户兴趣度越高。用户兴趣度会随着用户对项目的评分而不断的改变。评分被划分为5个等级, 分别是{非常满意, 满意, 一般, 不满意, 非常不满意}, 对应的评分分别为{5, 4, 3, 2, 1}。

定义4用户兴趣模型激活扩展更新是指当用户兴趣本体中的某一个概念对应的项目由于用户评分、购买等方式被激活, 需要重新计算概念兴趣度时, 由于概念间相互联系, 与该概念相关联的概念节点也将被激活, 然后根据与邻近概念的语义相似度, 激活蔓延到附近的本体网络节点。当用户兴趣本体中的每一个概念节点被激活, 整个激活扩展过程, 也就是用户兴趣模型的更新过程也就完成了。

2.2 用户兴趣模型

用户兴趣模型是提供个性化推荐的关键和基础, 是在特定域中的用户兴趣偏好的正式表达。具体形式如下:

其中, PI代表用户个性化信息, 包括用户兴趣模型的身份标识, 用于在用户登录之后选择对应的用户兴趣模型。C={C1, C2, …, Cn}为用户兴趣本体的概念集合, D={D1, D2, …, Dn}是用户兴趣度的集合。S=[Sij]n×n是一个矩阵, 包含所有集合C中的成对概念语义相似度。Sij代表概念Ci和概念Cj的语义相似度, 也就是说:Sij=Sim (Ci, Cj) 。Tcc代表概念C的创建时间, 本文中Tcc被统一设置为用户对应用户兴趣模型的创建时间, 也就是用户第一次登录系统的时间。Tcu代表概念C包含的项目最近一次被访问的时间。

2.3 用户兴趣模型的更新

2.3.1 用户与项目间交互引发更新

当一个新用户登录系统时, 系统会为他创建一个初始的用户兴趣模型。由于缺少用户偏好信息, 该初始用户兴趣模型的所有概念的用户兴趣度被置为1。随着用户与系统项目之间的不断交互, 用户的兴趣偏好逐渐形成, 用户兴趣度也随之改变, 用户兴趣模型得到持续更新。

更新算法在初始化时需要建立激活栈、完成栈, 并把所有概念节点的激活值Activation (Ci) 清零。其中, 更新时被激活的概念节点将被压入激活栈中, 而经过激活完成更新后的概念节点则被压入完成栈中, 保证每个概念节点在一次激活扩展过程中只被更新一次。

用户兴趣模型被看成是一个语义网络, 用户兴趣度根据激活值被更新。在算法的每次循环过程中, 用户模型的每一个概念的初始激活值被清零。包含特定项目的概念被激活, 添加进激活队列。对于每一个被激活的概念Ci, 激活值Activation (Ci) 被设成用户评分RatingScore (i) 。当一个概念把激活传递给领近概念, 该概念将会从激活队列中移除。激活值的传递大小与概念之间的关系权重成正比。起始概念和目标概念之间的关系的权重等于这两个概念之间的语义相似度。被激活的领近概念将被添加进激活队列。这个过程将一直重复下去直到没有邻近的概念要处理。经过激活扩展之后, 用户兴趣模型的用户兴趣度被规范化。规范化的影响可以确保随着用户兴趣模型的不断更新, 所有的兴趣度的总和基本保持不变。

从更新算法的描述中可以看到, 算法通过相邻的概念节点激活迭代传递, 保证激活值被扩展到每一个概念节点, 且在同一个激活过程中, 每个概念节点仅被激活一次。此外, 迭代的顺序并不会影响激活过程的最终结果。

2.3.2 用户概念兴趣度遗忘

将个性化本体中的概念节点进行遗忘, 以适应用户兴趣变化, 提高推荐的准确度。遗忘因子公式[9]为:

其中Dnow表示当前日期, Dcreated表示概念节点在个性化本体中被创建的时间, Dvisited表示概念节点最近被更新的时间, 取Dnow-Dvisited作为半衰期 (用户兴趣遗忘一半的天数) 。

2.4 用户兴趣模型的稳定性

用户兴趣模型的稳定性表示初始用户兴趣模型, 经过一定时间的激活扩展更新之后, 能够表达在目标域的用户长期稳定的兴趣偏好, 形成一个稳定的K-最相似用户列表。在本文中, 提出了一个计算用户兴趣模型的稳定性的公式, 具体如下所示:

其中, t表示更新的次数, qu (t, t+1) 表示用户兴趣模型第t次更新与第t+1次更新K-最相似用户列表中同时出现的用户的数量。Nu表示系统所有用户的数量。

所有用户兴趣模型的整体稳定性大小等于所有用户兴趣模型的Stability (t) 的加权平均。当Stability (t) 接近于1, 则代表经过持续更新之后, K-最相似用户列表基本不变, 趋于稳定。

3 个性化推荐

3.1 获取K-Nearest用户列表

协同推荐技术根据目标用户的K-Nearest最相似用户的喜好建立推荐项目列表。在常规的K-Nearest用户列表生成过程中, 与目标用户的相似度大小是通过皮尔逊相关系数进行计算的。在本论文的用户兴趣模型中, 两个用户之间的相似度大小则是通过兴趣度的欧式距离进行计算的, 并不涉及用户对项目的评分。计算公式如下:

其中, u、v分别代表两个不同的用户。C代表用户兴趣本体的所有概念的集合。Du (Ci) 和Dv (Ci) 分别为u、v用户对概念Ci的兴趣度大小。

根据式 (4) 的计算结果产生了K-最相似用户列表。由于用户兴趣模型中用户兴趣度的更新不仅与项目评分有关, 还涉及到概念之间的语义关系, 因此式 (4) 用户相似度计算公式也可称为基于本体的K-最相似用户生成公式。

3.2 建立推荐

在产生K-Nearest用户列表之后, 我们还需要根据相似用户的喜好准确地预测目标用户对尚未交互项目的评分。预测公式如下:

其中, 代表目标用户对目标项目的平均评分, Neighborsu代表K-最相似用户集合, 代表v用户的平均评分, UserSimilarity (u, v) 代表u、v两用户之间的相似度, rv, i代表用户v对项目i的评分。

根据式 (5) 的计算结果, 可以得到top-N个性化推荐列表。

4 实验和结果分析

4.1 实验方法和数据

评定推荐系统算法性能的指标主要有MAE平均绝对误差、推荐多样性、冷启动性能。在实验中, 我们把传统K-Nearest算法和本文的基于本体的改进K-Nearest算法在这几项指标上分别进行了比较。同时, 分析了新的用户兴趣模型的稳定性。

实验采用Group Lens提供的MovieLens数据集, 包括6 000多用户对4 000多部电影的100万条评分, 该数据集是一个评分数据集, 用户可以给电影评5个不同等级的分数 (1~5分) 。出于评估的目的, 论文把实验数据平均分成4份。对于每一份, 65%的电影评分组成了训练集, 剩余的35%形成实验的测试集。

4.2 实验过程和结果

MAE通过计算预测评分和用户真实评分的平均绝对误差来衡量预测的准确性。

其中, pu, i代表推荐系统的用户u对项目i的预测评分, ru, i则代表真实评分, N为所有用户的评分的总数, k为K-Nearest算法的k的取值。

如图3所示, 基于本体的KNN算法的MAE明显小于标准KNN算法。

(2) 多样性

多样性指推荐系统所具备的把不同的项目推荐给不同用户的能力。它反映了个性化推荐系统根据不同用户产生个性化推荐集合的能力[10]。

其中, N代表推荐集合的大小, qu, v (N) 表示u, v用户推荐集合中相同项目的数量, N为所有用户对的数量。整体多样性等于所有用户对多样性的加权平均。

如图4所示, 基于本体的KNN推荐算法的多样性明显优于标准KNN算法, 也从另一个侧面说明了本体KNN推荐算法具有很好的个性化推荐性能。

(3) 冷启动问题

冷启动问题指当一个新的项目被用户很少评分的情况下, 不能被推荐系统准确地进行推荐。为了演示基于本体的方法能有效地处理新项目的问题, 我们对评分等于或少于20的新项目划分为4个等级, 分别为50, 10, 15, 20, 分别进行推荐并计算MAE。

我们设置最相似用户数k为20, 结果如图5所示:即使是对于非常少评分的项目, 基于本体的KNN算法仍然能够在预测的准确度上明显地优于标准KNN算法。

(4) 用户兴趣模型的稳定性

设置最相似用户数k为20, 得到的用户兴趣模型的稳定性分析结果如图6所示。

从图中可以看出, 随着迭代更新次数的增加, 用户兴趣的稳定性值在起初增长缓慢, 然后快速增长。当迭代更新次数达到13时, 稳定性值的增长速度明显放缓, 最后趋于稳定。实验结果显示, 经历13次迭代更新之后, 一般用户兴趣模型就能表现用户的稳定偏好了。

5 结语

在不牺牲精确度的前提下提高推荐的多样性对于个性化推荐系统来说是一个很大的挑战。本文引入本体知识准确地描述用户和项目并建立个性化推荐。根据用户兴趣本体建立了用户兴趣模型, 基于激活扩展理论提出了自动更新算法, 并进一步描述了使用用户兴趣模型执行协同过滤推荐的过程。实验结果表明新的推荐算法相比传统协同推荐方法, 无论是在推荐的准确性、多样性还是在处理冷启动的性能方面都有了明显的提高。最后, 论文还对用户兴趣模型的稳定性进行了详细分析。在本文的基础上, 下一步可以考虑进一步改善用户兴趣模型, 减小模型的存储和更新难度, 从而达到提高个性化推荐服务器的性能、更方便应用的目的。

摘要:针对传统个性化推荐系统用户兴趣模型创建和更新的不足, 无法准确地感知用户特定背景下的语义信息和用户兴趣随着时间的变化, 基于用户兴趣本体提出一种新用户兴趣模型, 并通过激活扩展理论描述该用户兴趣模型的更新算法。同时, 改进了推荐算法, 结合协同过滤进行个性化推荐。实验结果表明, 该模型能够有效反映用户兴趣, 新的推荐算法在MEA、多样性、冷启动处理、稳定性方面都具备很高的性能。

关键词:领域本体,个性化,用户兴趣模型,协同推荐

参考文献

[1]Tan A H, Teo C.Learning user profiles for personalized information dissemination[C]//Proceeding of Internation Joint Conference on Neural Networks, 1998:183-188.

[2]Pretschner A, Gauch S.Ontology based personalized search[C]//Proceedings of th 11thIEEE International Conference on Tools with Artificial Intelligence, 1999:391-398.

[3]Jiang X, Tan A H.Ontosearch:A full-text search engine for the semantic web[C]//Proceedingsof the 21-National Conference on Artificial Intelligence, 2006:1325-1330.

[4]熊馨, 王卫平, 叶跃祥.基于概念分层的个性化推荐算法[J].计算机应用, 2005, 25 (5) :57-62.

[5]潘红艳, 林鸿飞, 赵晶.基于Ontology的个性化推送系统[J].计算机工程与应用, 2005, 20 (8) :176-180.

[6]陈俊杰, 刘炜.一种基于本体的个性化模式库建模方法[J].计算机研究与发展, 2007, 44 (7) :1151-1159.

[7]陈一峰, 赵恒凯, 余小清, 等.基于本体的用户兴趣模型构建研究[J].计算机工程, 2010, 36 (21) :46-51.

[8]Anderson J R.A spreading activation theory of memory[J].Journal of Verbal Learning and Verbal Behavior, 1983, 22 (3) :261-295.

[9]蒋萍, 崔志明.智能搜索引擎中用户兴趣模型分析与研究[J].微电子学与计算机, 2004, 21 (11) :24-26.

上一篇:导向标识设计下一篇:支架计算分析