心理学分类研究论文

2022-05-08

以下是小编精心整理的《心理学分类研究论文(精选3篇)》,供大家阅读,更多内容可以运用本站顶部的搜索功能。〔

心理学分类研究论文 篇1:

基于认知心理学地理知识分类及其教学策略研究综述

摘  要:从认知心理学角度,我们把地理知识分为陈述性知识和程序性知识两大类,为了更好地进行地理教学,需要地理教学工作者对不同的地理知识采取不同的教学策略。本文主要对近几年与此相关的研究进行综合评述,并在此基础上,对当前研究的不足、发展前沿及未来可能的发展方向进行了阐释。

关键词:地理;知识分类;陈述性知识;程序性知识;教学策略

一、引言

现阶段,我国经济社会快速发展,对人才的教育也更加重视,地理,作为一门覆盖面较广,综合性较强的学科,在日益变化的社会发展进程中也需要进行变革,这将对地理教育提出更高的要求,要广大地理教育着找到适用于学生的教学策略,给学生讲授与生活息息相关的地理知识,使其具有良好的地理素养。但在此过程中,不同类型的地理知识就需要不同的教学策略,这样才有利于学生更好的学习地理知识,当代认知心理学家安德森从信息加工的角度,把知识分为两类,即陈述性知识和程序性知识,处理好二者关系,地理知识的教学才会如鱼得水,游刃有余。

二、目前研究取得成果

1 地理知识的分类

我国顾明远主编的《教育大辞典》按三类将知识进行分类:按来源分为直接知识和间接知识;按照反映内容可分为自然的、社会的和思维的知识;按照反映深度分为反映事物本质属性和内在联系的理性知识和反映事物外部属性和外在联系的感性知识0

我国认知心理学家皮连生教授将广义的知识分为两大类和三亚类,两大类即陈述性知识和程序性知识,三亚类是指除陈述性知识之外,还有一类是策略性知识0。而本文主要是对地理陈述性知识和地理程序性知识的相关研究综述。

2  陈述性地理知识的教学策略的研究

关于陈述性地理知识的概念或者阐释,研究者们似乎都有统一或者相似的介绍。吕宜平在《不同知识类别的地理教学策略》错误!未找到引用源。中,以不同知识类型的地理教学策略为研究基点,提出了地理陈述性知识的一般教学策略:联结;组织;展开,和具体的教学策略:语言直观;板书简练;使用直观教具等。并认为广泛应用多媒体对地理陈述性知识的讲解十分有利。

严云辉在《高中地理学习策略研究》错误!未找到引用源。这篇报告中也指出了陈述性地理知识的习得策略、保持策略和有效提取策略并且用很详细的例子进行了策略的应用阐述,在保持策略中提出多种感官协同记忆策略、适当过度学习策略、精细加工策略以及组织策略,运用精细加工策略,对学习的材料做有意义的添加和构建,从而帮助自身更好地理解并掌握陈述性地理知识。

3  程序性地理知识的教学策略研究

对于程序性地理知识的教学策略研究,专门进行知识分类及其教学策略进行研究的学位论文以及相关的期刊论文都为数不多。

其中,华中师大的许桃春在《高中地理程序性知识教学研究》错误!未找到引用源。一文中将地理程序性知识教学策略分为习得策略、巩固与转化策略和自动化策略,习得策略包括注意与预期教学策略、激活原有知识教学策略和选择性知觉形成新命题网络的教学策略;巩固与转化策略包括促进程序性知识的理解和促进程序性知识的转化;自动化策略包括变式练习和迁移应用——设计情境性。

李鑫林在《地理程序性知识的教学策略》一文中指出“地理程序性知识的学习具有明显的获得过程,需要学生亲身经历和反复训练,在操作和实践过程中熟练地掌握行动技能,完成由陈述性知识向程序性知识的转化;但一旦达到熟练程度,整个程序本身将得到进一步的精致和协调,不仅不容易遗忘,而且能熟能生巧、甚至终生受益。因此有助于帮助学生掌握程序性知识,并推动学生的学习技能向认知策略的转化。”错误!未找到引用源。

4  陈述性地理知识与程序性地理知识转化的教学策略研究

在地理教学中,一般的陈述性地理知识都是知识点较多而杂,更偏向于知识教学,学生若不能理解,就只能死记硬背,从而导致学生学习压力大,因此这就需要教师把陈述性地理知识转化成程序性地理知识,最终有利于其地理能力的提高和地理素质的形成。

关于陈述性地理知识与程序性地理知识转化的教学策略研究中,舒用建和孙青的《陈述性地理知识转化为程序性地理知识的教学策略》一文专门从把陈述性地理知识转化成程序性地理知识教学的必要性,以及二者在教学特征和教学模式上的差异方面进行论述,提出了把陈述性地理知识转化为程序性地理知识教学的策略,并进行案例展示,该策略主要包括四个方面:夯实陈述性地理知识基础;精选具有典型的和具有针对性的例题展示解题思路;提供近情境以及远情景变式练习;将地理知识运用于解决生活中的地理问题上,提高运用能力。

二、存在问题

本文主要对国内的陈述性地理知识和程序性地理知识的相关研究进行的阐述,其中:对地理陈述性知识及其教学策略的研究,主要存在以下不足:针对地理学科的特色性不强,可操作性较差;研究偏重于理论,缺少实际的可以运用的具体地理教学策略;提出的教学策略是否科学、可行,有待实践的验证。

对地理程序性知识及其教学策略的研究,主要存在的不足有以下几个方面:只限于表面的地理教学策略研究;教学策略的提出的角度不清晰;教学策略通常较为概括和抽象,教学策略缺乏实际的案例设计。

地理教学策略是一个不斷改进的过程,在新课标的要求下,需要结合学生自身学习发展特点以及不同地理知识分类来进行地理教学策略的研究。综上所述,基于认知心理学地理知识分类及其教学策略的大部分研究都还停留在理论研究阶段,并且针对地理学科的特色性不强,未能对其研究进行实证研究和教学实验等,如何基于认知心理学地理知识分类进行灵活而有效的教学设计和教学实践,这将成为再次方面研究的新方向。

参考文献:

[1]顾明远主编.教育大辞典[M].上海:上海教育出版社,1998:2016.

[2]皮连生.知识分类与目标导向教学——理论与实践[M].上海:华东师范大学出版社,1998:8.

[3]黄莉敏.基于地理知识分类的具体教学策略[J].科教文汇(中旬刊),2008(11):167-168.

作者简介:

刘思青(1996年10月),女,汉族,甘肃张掖,学生,在读硕士,西藏大学,学科教学地理。

作者:刘思青

心理学分类研究论文 篇2:

自然语言理解心理学在短文本分类中的实证研究

〔摘 要〕目前对文 本分类研究多数集中在对大规模语料基础上的特征选择或分类器算法的研究。本文是建立在 训练样本少且样本长度短的基础上,根据人脑对自然语言理解的心理学原理“人们总是根据 已知的最熟悉的、最典型的例子进行判断,只有在该方法不奏效的时候才使用频率这一概念 ,并且使用的是十分简单的频率”从该角度进行短文本分类的实证研究。以心理学中的“熟 悉原理”、“典型原理”等为模型建立特殊词库和典型案例词库,改进了传统文本分类的实 验步骤,同时提出了该方法的优势和局限性。

〔关键词〕文本分类;短文本;特 征选择;自然语言;心理学

Research of Natural Language Und erstanding of

Psychology in the Short Text Classification Sheng Yu Liu Junxi Guo Jinlan Long Yi

(Department of Computer,Shanghai University of Political Science and Law,Shan ghai 201701,China)

〔Key words〕text categorizat ion;short text;feature selection;natural language;psychology

目前绝大多数信息均表现为文本方式,如何在浩如烟海而又纷繁芜杂的文本中掌握最有 效的信息始终是信息处理的一大目标。由于分类可以在一定程度上解决信息杂乱的现象,方 便用户准确地定位所需的信息,因此已成为一项具有较大实用价值的关键技术,是组织和管 理数据的有力手段。

目前已有的文本分类的方法很多,典型的有朴素贝叶斯分类器、基于向量空间模型的分类器 、基于实例的分类器和支撑向量机建立的分类器等。笔者在查询了2006年后的中国期刊网数 据库发现,研究多集中在特定的应用平台上如何改进上述算法。同时多数研究是建立在数量 巨大的训练样本和过高的向量维数基础之上才能够达到理论上的精确程度。然而,在现实应 用中,考虑到工作效率或工作条件限制,不会也没有足够的资源去构建一个庞大的训练集, 这就会使上述研究效果大打折扣。

文本分类的现状和困境或许同这样一种思想有关:人工智能并不是要重现人脑理解事物的过程,只要达到计算机辅助人类的目标即可,因此人工智能领域里很少关注心理学原理和现象 。对于这样的观点笔者认为研究心理学并把它运用到分类中来并不是要重现和人脑一模一样 的思考方式,而是从人脑学习语言和分类的心理学原理中获得启发,对文本分类的步骤以及 算法加以改进,提高分类的准确率和速度。千百年来人脑已经成为大自然最为精巧的作品之 一,一个3岁孩童就能够做出的判断是高性能计算机很难做到甚至做不到的,更为奇妙的是 当一个人创造出前所未有的新词语、新说法的时候另一个人能够马上理解这种说法的含义, 这就不得不引起我们的思考,语言的背后是否存在着一定的规则,这种规则帮助我们去理解 以前从未学习过的新用法,正因为对人脑工作原理还有太多不清楚的地方,才导致了人工智 能领域研究的诸多困难,其中包括文本自动分类,关注这个领域的研究成果将从方法论上指 导人工智能的前进。本文正是从这一角度展开,并结合心理学中已有的成果通过实验得出有 效证明。

1 文本分类实验背景

本文实例基于一个学校计算机实验室维护系统,目的是为了方便实验室维护人员借鉴以往案 例迅速准确的判断出机器故障并提供相应的解决方法,是一个基于案例的决策支持系统。该 系统包括以下组成部分:用户报修模块、报修记录(案例)自动分类模块、维护反馈模块、 以往案例查询(包括关键字查询和分类查询)模块。本文分类训练集主要来自用户报修的真 实的中文文本集。该类语料有如下显著特点:

(1)文档案例长度短。文档来自机器使用者的报修记录,文本长度普遍较短,最长为94字 ,最短为4个字,如“无法启动”。

(2)训练样本数目少。共收集到作为训练样本的案例98个,同许多动则上千的训练集相比 ,样本数目较少。

(3)问题类型集中。人工确定的类目数为21个,98个案例在21个类目中分布并不均匀,例如在“主机无法启动”同“病毒导致文件夹乱码”两类中集中了较多案例,而有些类别暂时 还没有案例出现,只是事先安放的空类目。

(4)自然语言。案例报修者多采用自然语言,词语不规范现象大量存在,例如对计算机主 机的描述有“主机”、“机子”、“开机”、“机器”等。

(5)词语使用的规律性。虽然词语不规范大量存在,但这种不规范也是有一定规律可寻的 ,原因是人们使用词语的习惯是有规律性的,使得不规范用词量锁定在一定的范围里,也正 是利用这一点为后文词库的建立提供了有利条件。

2 传统实验中采用的分类步骤和方法

传统的文本分类大致可分为3个步骤(如图1所示):文本的向量模型表示,文本特征选择 和分类器训练。

根据图1中的步骤,在初次实验尝试中先对98个案例(训练集)进行预处理,采用CSW汉语 中文分词组件[1]进行分词,并标注词性,先通过对词性的筛选过滤掉一部分对分 类贡献较小的词语,只保留名词、形容词、动词、副词,然后进行特征选择。特征选择函数 采用的是陈克利(2003),提出的在TF*IWF*IWF基础上的改进算法[3],刘华也曾 在其文章中使用过[5-6]:

公式1 TF*IWF*IWF基础上的改进算法

其中,W(wi,Cj)代表Cj类中第i个特征 w的权重;pij=Tij/Lj,Lj是类Cj含有的所有词的次数 之和;Tij是词i在类Cj出现的次数;=∑jpij/m,其中m为类别数;N(wi)表示训 练语料中出现词wi的次数,N是训练语料中所有词出现次数之和;n≥1。

该算法认为词的权重受3个因素的影响:(1)该词在当前类中的出现频率。算法用开n次方根的方法有意识的削弱了词频对权重的影响。(2)该词在总语料中的出现频 率。该算法认为总语料中出现频率越低的词专指度就越高,权重也应该越大;反之专指度就 越低,权重也应该越小。(3)该词在不同类别之间出现频率的差异。单单频率无法说明问 题,还要参考该词在各个类中的分布情况,分布越不均匀,权重越大;分布越均匀,权重越 小。

经初步计算后发现对部分词语使用该算法可以正确赋予权重,例如在“无线话筒报修”类中 ,词语“话筒”可以得到高权重,这与事实相符;而有些特征则词例如对分类有重要意义的 词语“主机”权重却比而对分类意义不大的词“要”权重还低。后经分析原因主要有以下几 个方面:

(1)分词组件。由于使用的CSW分词组件是面向大众化的分词组件,不具有专业性,且由于 使用自然语言,所以很多词语的切分还不准确,例如将“学生机”切分为“学”和“生机” 。词语切分的错误直接会影响到词频,从而影响权重。

(2)根据词性筛选,很多对分类无贡献或贡献很小的词语依然大量存在。

(3)最主要的原因是训练样本数少,样本在各个类别中分布不均匀。陈克利提出的算法思 想是弱化词频的作用,强调一个词语“在各类别之间分布越均匀,其重要性就越小;反之其 重要性就越大”这一判断在训练样本足够多的情况下才能够成立,他本人的实验平台达到“ 每个领域的语料都在300万字以上”,常用词如“要”、“部分”这类词语被充分使用,并 均匀分布在各个类中,因此能够区别于专业领域词语,但在训练样本数量较少加之样本长度 短的情况下,一些常用词语也呈现出不均匀分布,因此被赋予了较高的权重,这显然是不符 合实际情况的。

这类短文本在我们的生活中也随处可见,具有普遍意义。例如人们熟知的E-mail或是网上大量文本形式的商品信息——这些商品信息的内容通常只包含商品名称,偶尔有简单的描述。 所有这些信息都属于所谓的“短文本”。对这些简单的数据,使用传统的分类算法效果并不 好。要让效果的进一步提高不能单纯依靠算法改进,因此我们从另一个角度——人脑对自然 语言理解并分类的过程重新审视这个问题。

3 文本分类实验的改进

3.1 自然语言理解的心理学原理应用

文本分类作为人工智能的一个领域,可以从人脑对自然语言理解过程中得到一些启发。根据 《自然语言理解的心理学原理》一书中提到的人脑对词语加工理论中有以下值得借鉴之处:

3.1.1 不规则词语单独存储

人脑将不规则的词形变化单独存储于心理词典中,即采用枚举法来加工。根据这一原理,为 解决自然语言中具有重要作用但又是不规范词语带来的麻烦,可以在文本分类实验中构造一 个“非规范词词典”,这个词典不同于在文献[2]中所提到的专业词库,而是将不规范用 词存储于该词典中,用意是将不规范用词看成是词语的不规则变化,利用枚举方法列出这些 词语,这在训练样本少且样本长度短的情况下是可以实现并有效的。因为短文本中的词语数 量较少,误删特征词的机率比较大。使用这种方法后可以避免将这些重要词语误删除。

3.1.2 熟悉效应和典型效应

Smith、Shoben与Rips(1974)发现人们对使用频率高的词语更为“熟悉”,使用频率越高的 词语,反映速度也就越快。典型效应是指人们对同一类别中的“典型案例”的反应要快于“ 非典型案例”。根据熟悉效应和典型效应,可以抽取训练集中发生频率高的类目中的典型文 本,找出其中的典型描述,将这些词语构成“典型案例词库”。

3.1.3 共现频率和启动效应

在语义实验中先向被试呈现一个词,如果后面呈现的词语同前面呈现的词语之间有语义联结 ,后面的词语启动速度就会加快。例如在呈现“奶油”之后,被试对同一范畴的“面包”一 词反应加快了,但对不同范畴的词语“护士”反应没有加快。这是由于同一范畴词语由于共 现频率高能提高词语的辨别速度。

根据启动效应和共现频率,在文本分类实验中在“典型案例词库”中将一些共现频率高的词 语联系起来。例如案例中出现“主机”一词初步判定属于“主机”故障类中的某一种,接下 去同“主机”共现频率较高的词语将排在后面等待匹配,因为词典中词语的“典型”性,这 种匹配方法命中率高、速度快。

3.2 实验步骤的改进

根据前面所提到的传统文本分类步骤的缺点以及自然语言理解的心理学原理,改进后的实验 步骤如图2所示,在传统的分类步骤中加入一个“非规范词词典”和“典型案例词库”的判 别:

(1)训练集预处理。对98个案例进行分词以及词性的标注,这部分同传统分类 方法一样。

(2)选出“父类词”和“子类词”组成典型案例词库。实验中的类目分为两级,上级类目 称为“父类”,下级类目就称为“子类”。父类词指的是一旦出现就可以归入父类的词语。 子类词指的是最终可以决定案例子类的词语。由父类词和子类词组成的数据表格式如表1所 示(部分),归入相应的子类是本实验的最终目标。

表1 典型案例词库格式

序号父类名称子类名称父类词子类词1子类词2子类词31主机保护卡问题主机保护卡2主机主机无法正常启动主机启动重启不亮3显示器显示器蓝屏显示器蓝屏4显示器显示器蓝屏蓝屏蓝屏

(3)待分类文档预处理。将待分类文档进行分词和词性标注,将不规范用词用 “非规范词词典”中的词语替代。

(4)父类词匹配。将待分类文档中的每个词同父类词字段进行匹配,匹配成功则为文挡标 注该父类词,一个文档可能同时属于多个父类。

(5)子类词匹配。如果文挡被分入至少一个大类中,接下去就要进行子类词的匹配。因为 父类词只能归到父类级别,并不一定能找到相应的子类,而子类才是文挡最终的归宿。子类 词就是可以决定该文档最终类别的词语。一个文档也可能属于同一大类下的多个子类。

(6)如果一个文档没有找到合适的大类或者在大类下没有找到合适的子类,那么再使用分 类器进行分类。

3.3 实证研究

用一个实例来说明以上步骤。用户输入报修记录“机器无法正常启动,提示保护卡出错”。

(1)文档分词。分词结果(省略词性和标点)为“机器、无法、正常、启动、提示、保护 卡、出错”共7个词语。

(2)不规范用词替换。将不规范词“机器”替换为“主机”。

(3)父类词匹配。将以上7个词语同表1中的父类词字段进行匹配,将该文档归入“主机” 父类。

(4)子类词匹配。缩小范围,用文档的7个词语匹配所有属于“主机”父类下的子类词,“ 启动”和“保护卡”被匹配成功,因此该文档归入2个子类:保护卡问题类、主机无法正常 启动类。一旦匹配成功,将不再使用分类器。

4 优点和不足

就如前面介绍过的那样,在训练样本数量少且样本长度短的情况下,传统的文本分类算法并 不适合。改进后的实验步骤在传统的分类方法之前加入了两道工序,也就是同“非规范用词 词典”和“典型案例词库”的匹配过程,大大降低了重要词语因算法缺陷带来的误删,提高 了匹配的准确性,而样本少和长度短等对分类不利的因素在这里恰恰成为“典型案例词库” 建立的有利因素。

由于“典型案例词库”汇集了对分类最有影响最典型的词语,这类词语量相对比较少而出现 频率又比高,所以匹配的成功率和速度也得到了很大的提高。多数待分类文档经过这道工序 就能够顺利归类,个别没有找到合适类目的文档再使用传统的分类算法,这样可以减少归类 时间。但是这种方法也有其局限性,主要体现在以下几个方面:

(1)典型案例词库的建立只有在训练样本数量少且长度短、分类集中的情况下才具有可行 性。如果是大规模训练样本且内容十分分散的话,这种词库的建立将由于十分庞大而变得不 可行或者毫无优势。

(2)典型案例词库的词语选择。本实验中的典型案例词库是由人工参与形成的,这对于期 望全过程自动分类的人来说就不十分理想。但笔者设想可以先通过人工参与形成初始特殊词 库,再通过案例积累和反馈机制,也就是将待分类文本进行归类后无论分类正确与否,都将 其作为一种新的经验反馈到典型案例词库中,词库也应该根据反馈做出调整,长时间未曾出 现词语应该从该词库中去除,使用频繁且对分类有意义的词语可以添加进去。整个训练过程 由人工转为半自动再转为全自动。这就好比人脑从最开始的被动学习到最后的主动学习,这 是一个通过不断纠正反馈的过程。

5 小 结

由于语言的智慧性,能够理解自然语言是计算机是否具有真正智能的重要标志。抛开对语言的认知加工的原理,对自动分类的开发设想是不现实的。本文着重使用人脑在理解分类时的 一些已知规律,虽然这些规律知识其中很小一部分,但却是考虑从根本上去解决问题的方法 。当我们将这些零散的规律理清脉络并逐一实现的后,或许离真正的人工智能就并不遥远了 。

参考文献

[1]CSW中分词组件[EB].http:∥www.vgoogle.net

[2]刘晓志,黄厚宽,尚文倩.带专业词库的特征选择[J].北京交通大学学报,2006,(4 ):97-100.

[3]陈克利,宗成庆,王霞.基于大规模真实文本的平衡语料分析与文本分类方法[A].Advancesin Computation of Oriental Languages[C].北京:清华大学出版社,2003.

[4]李伯约,赛丹.自然语言理解的心理学原理[M].北京:学林出版社,2007.9.

[5]刘华.基于关键短语的文本分类研究[J].中文信息学报,2007,(7):34-41.

[6]刘华.基于文本分类中特征提取的领域词语聚类[J].语言文字应用,2007,(1):1 39-144.

[7]伍建军,康耀红.文本分类中特征选择方法的比较和改进[J].郑州大学学报:理学 版,2007,(6):110-113.

[8]孙晓霞,郑玉明.廖湖声.一种基于特征词句子环境的文本分类器[J].计算机应用 研究,2007,(2):116-119.

[9]张申亚.文本分类技术中的特征选择算法研究[J].信阳农业高等专科学校学报,200 7,(9):125-127.

[10]刘霞,卢苇.SVM在文本分类中的应用研究[J].计算机教育,2007,(1):72-74, 77.

[11]宋东风,张志浩.短文本数据的自动分类[J].电脑与信息技术,2007,(2):36-3 8,57.

[12]陈文亮,朱靖波,朱慕华,等.基于领域词典的文本特征表示[J].计算机研究与发 展,2005,42(12):2155-2160.

作者:盛 宇 刘俊熙 郭金兰 龙 怡

心理学分类研究论文 篇3:

分类的样例观及其研究进展

摘要:分类研究近年来已成为认知科学研究的一个重点,样例观是基于相似性表征的,自从产生以来获得了很大发展。该文对于样例观及其近年来出现的样例模型进行了比较全面的介绍,然后介绍了心理学界针对样例观的争论,最后提出各种分类模型的整合是未来样例观的发展趋势。

关键词:分类;样例观;样例模型;研究进展

基金项目:全国教育科学“十二五”规划2011年度教育部重点课题(DBA110186)。

分类是人们重要的认知活动。分类可以使人们能够对客观世界形成概念,有条理地建构大脑中的知识结构;分类还可以使人们能在一定程度上推知某一事物的未知特征,并做出进一步的特征预测,从而趋利避害。分类研究已经成为认知领域研究的一个热点。心理学分类研究最早开始于赫尔(Hull)1920年对概念的研究,以赫尔为代表的共同要素说曾在较长时期内产生过影响,直到二十世纪五十年代才衰落。1956年至二十世纪七八十年代,主要源自人工概念研究的假设检验说一直占主导地位。但是自分类的样例观提出以来,假设检验说便逐渐衰落,目前样例观已经成为分类研究领域颇具影响力的理论。

1 样例观的基本观点

梅丁(Medin)和谢弗(Schaffer)于1978年探讨了人工概念和自然概念的几个重要区别,发现自然类别之间并没有明确固定的划分界限,其边界是模糊的,类别形成是一种基于相似性的模糊决策过程,第一次提出比较明确的样例观的概念[1]。样例观是以相似性为基础的类别表征理论。样例观认为概念表征仅由那些实际的、一个人能看见的事实组成,人们主要根据新样例与记忆中存储的先前碰到的一个或多个实例的相似程度来对新样例的范畴隶属进行判别。

1.1 类别是由一组实例或样例组成的,而不是对这些实例的任何抽象概括

样例观认为,人们在认知系统中存储的是一系列具体的例子和情景,而不是抽象的原型。概念的表征包括了各种具体样例,概念的形成过程就是积累样例来表达概念的过程。概括地讲,概念在头脑中是以样例的形式表征的。举例来说,对“猫”的概念表征,不是一个可以概括所有“猫”的定义,很多情况下,没有抽象的概念,而是这个人记得的一系列猫。当遇见一个新动物时,这一动物拥有和你曾见过的1个或2个你已经知道是“猫”的动物很相似,因为你会把这个新动物判定为“猫”。

1.2 样例通过某些相似性原则而彼此组合起来

样例观认为,人们的头脑中储存着一个个的样例,一类事物的类别表征并不是单独的样例或者表征的概括,而是一个个样例表象的集合,对新样例的分类要以它与这些贮存样例的相似性为依据。样例观有两个重要假设:第一,新样例与类别表征的相似性是它们特征相似性的乘性函数。因此,在所有特征上较好匹配的例子比仅在一些特征上较为匹配的例子有更高的相似性。一个很不熟悉的特征会导致很低的相似性,即使其它特征能较好匹配。第二,分类决策是由新例子与大脑中贮存的各个类别的样例表征的相似性决定的。

1.3 类别化和其它一些现象可以通过在特定线索条件下从记忆中提取实例的机制来解释

为了对某一客体进行归类,人们会将其与类别中所有的样例进行比较,而并非仅仅只与原型进行比较。根据原型理论,当需要将新的客体归入己知的不同类别时,人们只需要将该客体与各个类别的原型进行比较即可;而样例观则认为,在这种情况下,人们需要将该客体与各类别的所用成员进行比较,从而判断该客体属于哪个类别。

1.4 当在记忆中不能找到完全的匹配时,与线索最接近的临近目标常常被提取出来

样例观认为,样例与其能够归属的所有可能的类别都具有联结。根据样例观,人们保持有关于人们所碰到的所有客体样例的表象,其中每一个都与许多类别有着或多或少的权重关系,因此每个人的类别结构都不完全相同。样例观同时认为,具体样例并不固定于任何一个具体的类别结构中,每个样例或表象可以在人们的类别结构中转移,在不同时间内会成为不同类别的成员。例如,知更鸟多数时间都是“鸟”这一类别的成员,但知更鸟这一具体样例也可以在其它不是“鸟”的类别中存在。

2 样例模型

样例观自产生以后便得到了迅速的发展,近年来出现的各种各样的样例模型是这一发展的体现。下面介绍几个有代表性的样例模型。

2.1 情景模型

最早的样例模型是梅丁和谢弗提出的情景模型(Context Theory,CM)[1]。后来的样例模型基本都是情景模型的延伸或是用它作为一个更复杂模型的基本组成。情景模型最初的重点是分类决策过程,主要用于两维类结构分类:某一项目成为某一类(比如A类)成员的可能性等于那一项目和每个A类成员相似性的总和除以项目与所有记忆里找到样例的相似性的总和,相似性参数被表征为选择性注意和遗忘特征。该模型通过设置相似性参数捕捉了选择性注意,被注意的维度值和未被注意的维度值不一样。被试经常选择注意高预测性维度,因为利用这一策略可以达到最优完成。项目和样例的相似性是一个项目维度值和样例的相似性的相乘的函数。

2.2 泛化情景模型

最初的情景模型运用于二维的刺激,诺索夫斯基(Nosofsky)在1986年构建了一个概括性更强的可应用于分离的或者整合的多维变化的刺激的样例模型——泛化的情景模型(Generalized Context Model,GCM)[2]。分离的维度(比如大小和亮度)可以被分别加工(如,注意只关注一个维度而不关注其他的);整合的维度(比如饱和度和亮度)在心理上融合,使人们不能只注意维度中的一个方面。

根据这一模型,分类是通过比较新项目和记忆中已经对其类归属进行编码的旧项目来进行的;和记忆中已知类的样例越相似,分入那一类的可能性越大。这一分类过程一般包括这样三部分:首先,人们必须计算出新项目和所有其它样例的相似性,在GCM里通常用距离计算来完成;其次,根据心理相似性而不是距离相似性确定距离的权重大小;第三,一旦拥有了和已知样例的全部相似性,人们就可以据此决定新项目的类归属。

2.3 MINERVA2模型

欣特曼(Hintzman)1986年提出的MINERVA2模型是一个更强调个别样例作用的样例模型[3]。这一模型认为,新旧样例储存在不同级的记忆系统里。旧样例储存在二级记忆系统,而新样例储存在一级记忆系统。两级记忆系统之间通过以下两种简单操作进行沟通:一是提取线索或者探测刺激从一级记忆系统传送到二级记忆系统,并和所有记忆痕迹相比较。这种比较是一个并行的过程。记忆痕迹被激活的程度取决于探测刺激和记忆痕迹之间的相似性。二是二级记忆系统根据比较结果给一级记忆系统一个反馈。反馈包含两个方面:反馈强度和反馈内容。反馈的强度取决于记忆痕迹被激活的程度,记忆痕迹和探测刺激越相似,相似的痕迹越多,反馈的强度越大。假如有几个痕迹被强烈激活,那么反馈的内容反映的就是这几个痕迹之间的共同属性[4]

其实,CM、GCM模型也可以从样例表征中计算出抽象表征,它们和MINERVA2都认为,没有任何抽象信息(如类别信息)是独立于样例信息的。但是MINERVA2模型更强调个别样例的作用,以CM等为代表的样例模式似乎更强调总体的相似性。一些研究发现了样例模式的解释力存在不足,提出分类时简单的样例回忆也许能成为样例模式更合理的选择。

2.4 基于样例的随机运行模型

诺索夫斯基1997年提出了一个基于样例模式的随机运行模型(example-base random walk model,EBRW)[5]。该模式整合和扩展了两个成熟的样例模式——GCM模式和一个非常成功地解释了熟练技能的学习和获得的自动化的实例模式。GCM模式虽然具有强大的解释力,但是理论缺少一个预测反应时的机制;技能获得的实例化模型虽然很成功地解释了大量的数据,但是缺少作为分类和记忆模式核心的相似性的机制。EBRW结合了这两种理论提出了一个新的自动化的感知分类的理论。以前所有多维感知分类的模型的一个局限是没有提供分类的时间过程的解释。因为反应时提供了一个理解认知表征性质和决策过程的窗口,因此解释这一数据是模式的一个很重要的方向,它可以模拟分类刺激的时间。

EBRW直接预测了大量的分类现象。例如,如果刺激与其它类别成员非常相似而与供选择的类别成员不相似,他们会被很快地分类。在EBRW中,这种刺激可以很快地分类因为他们倾向于只回忆起它们类别的样例。同样,因为有较高的相似性,这些样例被强烈激活;被强烈激活的样例可能很快地被回忆起。因此,随机运行的计算器将一直并很快地向类别边缘移动。正如另一个例子,EBRW证明了常见的刺激会更快地得以分类的现象,常见的刺激是那些经常出现的刺激。因为,当一个常见刺激出现的时候,它将会强烈地激活它的先前的记忆,这种激活随频率和相似性而增加;然后随机运行的计算器将一直并很快地向类别边缘移动。

2.5 扩展的情景模型

兰贝特斯(Lamberts)提出了一个扩展的情景模型(extended generalized context model,EGCM)[6]。朗贝以人脸示意图为实验材料,设计完成了2个实验。要求被试完成标准的二择一的分类任务,在迁移阶段设置了不同的反应时限来研究有时间限制条件下的快速分类问题。实验结果表明,反应时限影响了泛化水平和特征的加权分配。在短时限条件下,被试的泛化水平较高,特征加权更容易受特征本身的显著性的影响;而在无时间约束条件下,特征加权基本上只取决于范畴的结构。在此基础上,兰贝特斯对GCM做了进一步扩展,提出了EGCM模型。与CM、GCM和EBRW不同,EGCM模拟了感知的分析过程。

在大量的研究中,兰贝特斯曾做过有关于小说分类的研究。他用一个反应信号程序测试被试的分类准确性,要求被试在不同的时间内进行反应。准确性依赖于在不同反应时间内维度的有效性和他们对分类的预测性。例如,被试能准确地对一个有圆形舷窗和长外壳的船进行分类,因为这些特征具有很高的预测性和源于知觉显著性的有效性。相反,在较短的反应时间内被试不能准确地对同一类别中的另一艘船进行分类,因为它有一个菱形的舷窗和长形的外壳。这个样例的特征对相反的类别具有预测性[7]。EGCM用一个等级参数成功地模拟了与时间有关的分类准确性。这个参数大体上说明了一个维度被多快地加工(并且由知觉显著性决定)。在维度上的注意权重反应了这些维度对分类准确性的预测程度。

自提出以来,EGCM得到一系列实验的支持,充分显示了其理论的合理性。从CM到EGCM,人们发现对相似性的分析已经从样例的整体细化到单个的特征维度,这反映出分类研究有不断向认知加工的微观过程深入的趋势。同时,作为一个分类模型,EGCM重点刻画的是分类认知的知觉分析阶段,而对记忆提取和类别决策过程缺乏深入的分析;而且它也遇到了一些难以解释的实验现象,如有的实验中某些刺激维度的加工较少受时间限制的影响。这些表明EGCM仍有待于进一步的修正和改进[8]

2.6 ALCOVE模型

克鲁施(Kruschle)1992年提出的ALCOVE模型(Attention Learning Covering Map)是一个联合了基于样例的表征和错误驱动学习的联结主义的类别学习模型[9]。ALCOVE是运用范围最广也是最成功的基于样例的类别学习模型。该模型和GCM模式类似,假设刺激能被表征为多维心理空间上的一个点,每一个输入的节点编码了一个独立的心理维度;节点的激活表明了那一维度上刺激的权重值。

根据ALCOVE,人们通过记忆中储存的个别样例表征类,形成了样例和要学习类的联系。样例被表征为多维空间上的一个点,当一个客体出现时,它激活了和它相似的每个样例。相似性是空间距离的衰减函数,每个类被激活的程度取决于客体和储存样例的相似性。以这个模型结构为例,假设这个模型的任务是学习红色刺激为一类,蓝色刺激为另一类(大小与类别成员无关)。当一个样例出现在模型中(例如,一个大的红色刺激),输入刺激根据其维度的值被激活。在这个例子中,对颜色和形状进行编码的输入节点会根据刺激是蓝色还是红色、是大还是小的会有不同的激活值。对输入节点的激活之后会激活隐藏的节点和样例单元。对一个样例单元的激活是在隐藏单元表现出来的输入刺激和样例的相似性的一种联结。这种相似性是用GCM模型的相似函数来估计的。如果样例单元和输入刺激非常相似,它就会被强烈的激活,然后这些单元激活类别节点。

ALCOVE不但优于早期的样例模式,而且在对数据的解释力上也优于其他基于规则的类别学习模式。因为它运用了和其他规则学习不同的样例表征,所以学习效果优于其他基于规则驱动的模式。但是,ALCOVE并不是完美无缺的。ALCOVE不能应用于被试产生新的表征维度的情景,仅能用于刺激被表征为多维相似性空间上的一个点的条件下,而且假设在学习过程中基本的维度是保持不变的;否则,在学习过程中就得重新编码刺激。

3 对样例观的争论

人类类别学习的早期模式是以规则为代表形式的抽象表征或原型,近年来的模式却强调样例记忆或多重表征水平。样例模式自从提出以来,在一定范围内获得了极大的成功,得到了许多实验支持。在分类、推理、语言学等许多研究领域被证明是非常有意义的,但是同时也面临着挑战。里普斯(Rips)1989年的实验对样例观提出了质疑。实验要求被试想象一个3英寸的圆形物体,被试分为类两组,一组是相似性判断组,一组是分类组。对相似性判断组,问题是“这个物体更像萨饼还是更象25美分硬币”。对分类组,问题是“这个物体更可能是比萨饼类还是25美分硬币类”。结果是相似性判断组被试认为这一物体和硬币更相似,而分类组判断这一物体更倾向于一个比萨饼类[10]。里普斯的实验说明了分类判断和相似性判断存在分离,在分类任务中规则运用高于相似性判断。

众多研究表明单一表征不能解释人类复杂的认知行为,单一分类模式也不能适用于所有的分类活动。人们逐渐开始关注对规则和样例相似性关系的研究,分类模型正向着整合的方向发展。

4 样例模式的发展趋势——模式的整合

如前所述,过去的几十年里分类研究产生了一些重要的变化,早期的研究重点在于符合简单逻辑规则的完好定义的类的学习,后来转向逻辑定义不完好的类别,因为真实世界里这样的类似乎更平常,对于逻辑定义不完好的类别,没有现成的可用的分类的逻辑规则,类界限往往是模糊不清的。在上述转移发生的同时,解释分类的理论模型也在发生转变,从早期的假设检验模型到后来的样例、贝叶斯和联接主义的分布式记忆模型,后来的这些模型和规则模型的不同主要在于分类过程所需的信息加工过程不同,虽然这些新的模式解释了大量的分类现象,但是问题依然存在,比如,多数的样例模式是基于单维注意的,被认为是最成功的样例模式ALCOVE就是如此,不能预测特殊样例的记忆优势。在这种情况下,人们又开始重新审视看起来似乎是陈旧的、过时的假设-检验模式,根据这一模式,虽然逻辑定义不完好的类别不能通过简单的逻辑规则学习,但是也许可以通过形成不完美的规则和储存违背这些规则的少数的例外这样的方式来学习。

4.1 “规则加例外”模型

诺索夫斯基等在1994年提出了一个整合了的具有规则和样例两种机制的样例模式——“规则加例外”模式。学习假设为是依靠假设检验过程的简单逻辑规则的抽取过程,同时也运用规则之外的少数例外 [11]。诺索夫斯基等1998年又进一步发展了这一模式,使得其能用于连续维度的样例[12]。莫雷等用和诺索夫斯基1998年研究同样的实验材料,探讨在类别学习中,规则和样例的使用情况。结果发现,当归类情境的潜在规则清晰且易于掌握时,被试会倾向于首选规则策略进行归类;当潜在规则较难以掌握时,被试则倾向于选用样例策略进行归类;当同时可以运用不同规则时,被试会选用更概括、更有普遍性的规则而放弃较具体、适用范围较窄的规则[13]

4.2 ATRIUM模型

埃里克森(Erickson)和克鲁施克(Kruschke)1994年提出了一个整合了规则和样例编码的联结主义模型(Attention To Rules and Instances in a Unified Model,ATRIUM)[14]。这一模型认为在人类类别学习以及语言获得这两个领域,长期以来一直存在规则和样例记忆的争论。比如在联结主义模型大量运用的语言获得领域,没有明确的规则和原理能解释英语动词过去时的获得。普拉萨德(Prasada)等人1993年提出了一个相对较为满意的解释:过去时的获得既需要规则——估算规则变化动词,也需要样例记忆——估算不规则变化的动词[15]

ATRIUM模型的构建用了一个联合了基于样例和基于规则的联结主义模型。该模型首先联结两个模型的竞争机制。呈现的刺激是在两个模型中同时得到加工。在规则模型中根据刺激落在边界的位置,相应的规则节点被激活,每个规则节点都和其余所有的规则类别节点通过习得的权重值联结着;样例模型也同样收到输入的刺激,这个刺激被看成是心理空间中的一个点,它容易激活附近的样例,对距离较远的样例不容易激活,每个样例节点也都通过习得的权重值联结着。最后的输出是规则模型输出和样例模型输出的竞争。出门节点的输出是由模型的贡献率决定的,输出的概率可以通过将每个输出类别的节点激活与所有输出节点的激活的比率标准化后产生。在ATRIUM中,学习是竞争的,使用规则就降低了使用样例为表征策略的学习能力,反之亦然。

ATRIUM和RULEX不是相互排斥的,而是互为补充的。RULEX侧重包含样例策略的学习规则,而ATRIUM侧重多重规则模块和随机选择机制。

上述研究说明了人类也许拥有规则和样例两个系统来进行分类,单一的规则和样例模型都不能真正描述人类的归类行为。单一的理论和样例模型已经很难解释真实世界里人们复杂的认知活动,未来样例观发展的一个重要方向是各种样例模型之间以及样例模型和其它理论模型的整合。

参考文献

1 Medin D L,Schaffer M M.Context theory of classification learning.Psychological Review,1978,85(3):207-238.

2 Nosofsky R M.Attention,similarity,and the identification-categorization relationship.Journal of Experimental Psychology:General,1986,115:39-57.

3 Hintzman D L.“Schema abstraction” in a multiple—trace model.Psychological Review,1986,93:411-428.

4 禤宇明,傅小兰.样例理论的发展及其争论.心理学动态,2001,9(4):295-301.

5 Nosofsky R M,Palmeri T J.An exemplar-based random walk model of speeded classification.Psychological Review,1997,104(2):266-300.

6 Lamberts K.Categorization under time pressure.Journal of Experimental Psychology:General,1995,20:161-180.

7 Lamberts K.The time course of categorization.Journal of Experimental Psychology:Learning,Memory,and Cognition,1998,24:695-711.

8 张阔,阴国恩.评介一种新的知觉分类模型:EGCM.心理科学,2003,26(1):124-127.

9 Kruschke J K.ALCOVE:An exemplar-based connectionist model of category learning.Psychological Review,1992,99(1):22-44.

10 Rips L J.Similarity,typicality,and categorization.In:Vosniadou S,Ortony A.Eds.Similarity,1989.

11 Nosofsky R M,Palmeri T J,McKinley S C.Rule-pluse-exception model of classification learning.Psychological Review,1994,101:53-79.

12 Nosofsky R M,Zaki S R.Dissociations between categorization and recognition in amnesic and normal individuals:An exemplarbased interpretation.Psychological Science,1998,9:247-255.

13 莫雷,陈战胜.规则策略和样例策略在归类过程中的运用.心理学报,2003,35(1):29-36.

14 Erickson M A,Kruschke J K.Rules and exemplars in category learning.Journal of Experimental Psychology:General,1998,127:107-140.

15 Prasada S,Pinker S.Generalisation of regular and irregular morphological patterns.Language and Cognitive Processes,1993,8:1-56.

The Research Progress of Exemplar-based Categorization Theory

Cao Rui

(Tianjin Academy of Educational Science,Tianjin 300191)

Key words:categorization;exemplar-based theory;exemplar-based model;research progress

作者:曹瑞

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:流域可持续发展论文下一篇:高中生创新教育论文