机器学习方法范文

2024-06-04

机器学习方法范文(精选12篇)

机器学习方法 第1篇

1 机器学习发展史

统计学习理论创始人之一的Vapnik将机器学习归结为如下四个阶段。

1.1 学习机器的产生

第一个学习机器的模型是F.Rosenblatt在1962年提出的感知器。它借鉴了神经生理学领域中感知器的思想, 将其模型表示为一个计算程序, 并通过简单的实验说明了这个模型的结果可以进行推广和泛化。感知器通过给定的样本构造一条判断准则来区分不同类别的数据, 因此可以用来解决模式识别问题。

1.2 学习理论基础的创立

1968年, Vapnik和Chervonenkis提出VC维和VC熵来解决模式识别问题。利用这些概念学者发现了大数定律和关于收敛速率的非渐近界。1989年, Vapnik和Chervonenkis提出的经验风险最小化原则、正则化理论、解决密度估计问题的非参数方法, 以及算法复杂度思想, 都对学习理论的发展产生了深远的影响。

1.3 神经网络的产生

1986年, Le Cun和Rumelhart各自独立地提出了后向传播方法。该方法采用连续的Sigmoid逼近函数代替了感知器神经元中的不连续符号函数, 使人们可用任何基于梯度的方法来逼近预期函数。它的出现标志着学习机器历史进入了一个新纪元。

1.4 统计学习理论的创立

为了根本解决传统统计学理论中过学习等弊端, Vapnik于20世纪60-70年代创立了统计学习理论。与传统统计学相比, 它是一种专门研究有限样本下机器学习规律的理论, 不仅考虑了对渐近性能的要求, 并且追求在有限信息下获得最优结果, 在理论研究和实际应用中都取得了良好效果。

2 机器学习策略分类

在众多机器学习策略中, 可从不同角度, 根据不同原则对其

果。进行分类。本文按照分类原则提出的先后顺序以及所用推理策略的繁简程度将其分为以下两大类。

2.1 传统策略

⑴机械式学习。该方法是一种最简单、原始, 也最基本的学习策略。它通过记忆和评价外部环境所提供的信息达到学习的目的。学习系统要做的工作就是把经过评价所获取的知识存储到知识库中, 求解问题时就从知识库中检索出相应的知识直接用来求解问题。

⑵指导式学习。该方法通过由外部环境向系统提供一般性的指示或建议, 把它们具体地转换为细节知识并送入知识库。在学习过程中要反复对形成的知识进行评价, 使系统的知识库不断完善。

⑶归纳学习。该方法应用归纳推理进行学习。归纳推理指从足够多的事例中归纳出一般性的知识, 是一种从个别到一般的推理。常用的方法有枚举归纳、联想归纳、类比归纳、逆推理归纳和消除归纳等。

⑷类比学习。类比是人类认识世界的一种重要方法, 也是诱导人们学习新事物、进行创造性思维的重要手段。类比学习就是通过对相似事物进行比较所进行的一种学习。

⑸基于解释的学习。该方法通过运用相关领域知识, 对当前提供的实例进行分析, 从而构造解释并产生相应知识。

2.2 现代策略

⑴基于神经网络的学习。神经网络由神经元单元及其间带权重的连接组成, 每个单元的状态由与其相连接其他单元的输入共同决定。该方法使用样本来训练网络, 产生网络的内部表示, 并用来识别新样本。

⑵基于统计学习理论的学习。Vapnik创立的统计学习理论针对有限样本统计问题建立了一套新的理论体系, 不仅考虑了对渐近性能的要求, 并且追求在有限的信息条件下获得最优的结果。其典型代表SVM, 具有许多传统统计学方法不具备的优点。

⑶强化学习。该理论是在上世纪80年代, 基于试错方法、动态规划和瞬时误差方法形成的。

⑷集成学习。该方法集成若干单分类器的分类结果来综合决定最终分类, 可取得比单分类器更好的性能。其主要方法有Bagging、Boosting、Stacking、朴素贝叶斯集成、决策树集成、人工神经网络集成、K-近邻集成、在线集成等等。

⑸主动学习。该方法模拟人的学习过程, 选择标记部分样例加入训练集, 迭代提高分类器的泛化性能。

摘要:近年来机器学习方法在诸多领域得到成功的应用与发展, 已成为计算机科学的研究热点之一。本文介绍了机器学习的定义、发展历史与学习策略分类, 并对目前存在的问题与挑战进行了分析与展望。

关键词:机器学习,计算机科学,学习机理,策略研究

参考文献

[1]闫友彪, 陈元琰.机器学习的主要策略综述[J].计算机应用研究, 21 (7) :4-13, 2004.[1]闫友彪, 陈元琰.机器学习的主要策略综述[J].计算机应用研究, 21 (7) :4-13, 2004.

机器学习高数学习心得 第2篇

大部分同学都害怕高数,高数学习起来确实是不太轻松。其实,只要有心,高数并不像想象中的那么难。虽然有很多人比我学得更好,但在这里我也谈谈自己在培乐园补习高数(机器学习相关)的一些拙见吧。

首先,不能有畏难情绪。很多人说高数非常难学,有很多人挂科了,这基本上是事实,但是或多或少有些夸张了吧。让我们知道高数难,虽然会让我们对它更加重 视,但是这无疑也增加了大家对它的畏惧感,觉得自己很可能学不好它,从而失去了信心,有些人甚至把难学当做自己不去学好它的借口。事实上,当我们抛掉那些 畏难的情绪,心无旁骛地去学习高数时,它并不是那么难,至少不是那种难到学不下去的。所以,我觉得要学好高数,一定不能有畏难的情绪。当我们有信心去学好 它时,就走好了第一步。

其次,课前预习很重要。培乐园每次课前都会发预习讲义,要求学员预习。其实每个人的学习习惯可能不同,有些人习惯预习,有些人觉得预习不适合自己。但对我而言,学习高数,预习是必要的。每次上新课前,把课 本上的内容仔细地预习一下,或者说先自学一下,把知识点先过一遍,能理解的先自己理解好,到课堂上时就会觉得有方向感,不会觉得茫然,并且自己预习时没有 理解的地方在课堂上听老师讲后就能解决了,比较有针对性。另外,我一般在预习后会试着做一下课后题,只是试着做一两道简单的题目,找找感觉,虽然可能做不 出,但那样会有助于理解。

然后,要把握课堂。我认为,把握好课堂对高数学习是很关键的。课堂上老师讲的每一句话都有可能是很有用的,如果错过了就可能会使自己以后做某些题时要走很 多弯路,甚至是死路。老师在上课时会详细地讲解知识点,所以对于我们的理解是很有帮助的,尤其是有些机器学习相关的 知识点,我们课余看一小时,也许还不如听老师讲一分钟理解得 快。并且,老师还会讲到一些要注意的但书上没有的东西,所以课堂上最好尽量集中精神听讲,不要错过了某些有价值的东西。

此外,要以教材为中心。虽然说“尽信书不如无书”,但是,就算教材不是完美的,我们还是要以教材为中心去学习高数。教材上包含了我们所要掌握的知识点,而 那些知识点是便是我们解题的基础。书上的一些基本公式、定理,是我们必须掌握的。并且,书上很多原理的证明过程体现的数学思想对于我们的思维训练是很有益 处的。我觉得,只有将教材上的基础知识融会贯通了,把基础打好了,知识才能稳固。也许,将书上的知识都真正理解透彻了,能够举一反三了,那么不用再看参考 书,不用做习题去训练,都能以不变应万变了。当然,做到这一点不容易,我也没有做到。但是,把教材内容尽可能地掌握好,是绝对益处多多的。

最后,坚持做好习题。做题是必要的,但搞题海战术就不必要了。就我的体会而言,如果只是想考试考好,不想去深入研究它的话,做好教材上的课后题和习题册就 足够了,当然,前提是认真地做好了。对于每一道题,有疑问的地方就要解决,不能不求甚解,尽量把每一个细节都理解好,这样的话做好一道题就能解决很多同类 型的题了。同时,做题不能只是自己一个人冥思苦想,有时候自己的思维走进了死胡同是很难走出来的,当自己做不出来的时候,不妨问问老师或者同学,也许就能 豁然开朗了。对于做完的题目,觉得很有价值的,最好是把它摘抄到笔记本上,然后记录一下解题的要点,分析一下题目所体现的思维方式等等,平时有时间就翻看 一下,加深一下记忆。

机器学习渐入佳境 第3篇

赢得200万大奖的机器学习

随着此类技术的进步和推广,市场需求也将逐渐看涨。“在过去,程序员可以针对一个问题编写代码,再进行测试和运行,并在以后人工调试和改进,如此反复进行循环测试,”美国斯坦福大学人工智能实验室主管Sebastian Thrun教授说,“这样的问题在于,软件将变得越来庞大,越来越难以管理。由此产生了一种趋势,即让软件具备自动调节和适应能力,这将是未来计算领域发生的一项重大革命。”

在美国国防部高级研究计划署(Defense Advanced Research Projects Agency)最近主持展开的一项竞赛中,Thrun教授通过采用几种新的机器学习技术的软件,来驱动一辆汽车在沙漠中自动驾驶了132英里的路程,从而为斯坦福大学赢得了200万美元的奖金。在新技术的帮助下,这辆汽车能识别并记忆它所行驶过的路面特征。机器学习技术还使Thrun教授的研究团队极大地提高了工作效率,据说他在过去需要花半个月来完成的人工编程工作,现在只需要一天时间就能让软件自动完成。

让软件训练软件

卡耐基.梅隆大学的自动学习和探测中心主管Tom Mitchell说,对人类而言很容易完成的一些任务(例如语音和图像识别),要交给计算机来处理往往有较大的难度,因为很难用软件规则来将这些任务解释和交代清楚,但机器学习技术的运用可以明显改善这种情况。在机器学习技术的应用案例中,经由人工编写和标记的测试平台来“训练”软件,并分析和记录软件运行结果的对或错,不断对其进行校正,最终将成熟的软件派发出去解决现实中的问题。

为了试验这种概念,Mitchell用两种学习算法来相互进行基本训练,以让二者共同工作的效果好于单独使用其中一种。例如,一种搜索引擎算法通过分析网页上的词语来对其进行分类,而另一种算法则分析指向该页面的超链接中的词语,这两种算法共享对同一个页面的分析线索,并汇集出更准确的分析报告。试验结果表明,这种联合训练方案能明显降低错误率。它所取得的突破是:软件的训练平台不是由人工编写的,而是由另一种软件完成的。

填补人工编程的盲区

加州大学伯克利分校的Stuart Russell教授正在试验一些编程语言,程序员们经常用它们来为某些任务编写代码,这些任务很容易理解和编码,但也容易产生许多无法处理的盲区和缝隙。为了填补这些缝隙,该试验引进了诸如人工神经网络的机器学习技术。

Russell已经将其“局部编程”概念运用在一种称之为Alisp(Lisp语言的扩展)的语言中。“举例来说其原理:如果我想告诉你如何到达机场,但我手上没有地图,哪该怎么办呢?”Russell说,“我将编写一个程序,告诉计算机来如何到达目的地:‘沿着这条街持续走下去,穿过所有的路口,直到在一个斜坡处进入高速公路。在高速公路上一直走到有机场出口的路牌处,下了高速再驶入普通街道,直到机场。’在这个流程的编码过程中,将会产生大量无法处理的缝隙,但它仍然将是个非常有用的导航软件。”在每个缝隙处,程序员都会指定相应的学习算法,但Russell的研究目标是有朝一日让系统在每个缝隙处自动选择最佳的算法。

已经商用的机器学习技术

计算技术对机器学习自然化的提升,激发了纽约州立大学Yann LeCun教授的灵感,他发明了一种称之为“回旋网络”的人工神经网络系统,据称它与传统的神经网络相比,能用更少的资源和工作量来更好地完成图像识别等任务。通过大量的神经网络,软件必须接受数量庞大的不同情况下的训练,以让其适应多种不同情况——目标的不同位置和不同大小、不同的视角和背景等等,而这是项艰巨的挑战。

LeCun发明的技术如今已被用于银行门禁中的模式识别阅读器和机场的监视系统,它将监测目标的每个图像分解成小块区域(例如鼻子、眼睛等),然后再拼接起来,生成高水平的特征信息,这种系统更加灵活,并且减少了训练的次数。

软件也可“物竞天择”

与此同时,研究还推进了机器学习的一个分支——基因编码学(Genetic Programming,GP)的发展,这种技术让软件的发展遵循像达尔文的生物进化论一样的规律。事实上,对同一种问题的解决,往往会有多个不同版本的程序,甚至会同时出现成百上千个版本,而这很容易让人们混淆。其中的绝大多数是比较弱的,但进化程序将从其中选择两个最优的出来,并将二者组合成更优秀的新一代程序。在没有人工参预的情况下,这种进化过程将持续进行数百代,并且每次都使程序得到优化和提升。

斯坦福大学的电子工程学教授John Koza是GP研究的先驱,他用这种概念来设计电路、控制器、光学系统和天线等设备,结果与那些取得专利的传统设计方法等效或优于后者。他完全用GP创建的一个控制器设计最近还获得了一项专利。

不过,有点像生物进化过程一样,GP的研究进展非常缓慢。即使到了计算机速度超前发展的当前,GP在解决复杂问题的过程中所用得上的计算资源仍然是杯水车薪。在那项专利设计工作中,Koza教授在他的笔记本电脑上所做的工作量只有几个小时,而完成控制器设计的GP进程则在由1000个Pentium处理器节点组成的集群环境下持续了1个月之久。

机器学习发展及几种学习方式 第4篇

机器学习从新兴阶段至今经历了二三十年, 它是一门涉及概率论与统计学、逼近论与算法复杂度理论、凸分析等多门学科交叉的学科。机器学习能够通过先验学习获取经验, 自动分析数据获取规律, 重新组织已有知识、结构, 并不断完善自身性能, 让计算机在无事先明确编程的情况下作出正确响应。机器学习研究的是如何让计算机模拟或实现人类活动, 如何通过识别和使用现有知识获取新技能, 也是人工智能的核心和重要标志。机器学习主要使用归纳、综合的辩证逻辑方法, 而不采用演绎。其应用已十分广泛, 遍及人工智能的各个领域, 例如:计算机视觉、数据挖掘、生物特征识别、自然语言处理、证券市场分析、语音和手写识别、搜索引擎、DNA序列测序、医学诊断、战略游戏、检测信用卡欺诈和机器人运用等。

二、机器学习算法

(一) 基于学习方式的分类。根据如何处理数据、经验或者环境, 机器学习算法可分为以下几种学习方式。

1.有监督学习。输入数据被称为训练数据, 基函数模型包括代数函数或概率函数或人工神经网络, 采用迭代计算方法, 并且有已知的结果被标记, 学习结果为函数。它根据训练数据模型作出预测, “错的数据”被训练, 直到结果能够达到一定的正确标准。监督性学习常用于解决分类和回归问题, 监督学习算法包括逻辑回归、反向神经网络。典型的方法有BN、SVM、KNN、CBR。

2.无监督学习。输入数据无标记信息, 结果不确定, 它采用聚类方法, 对数据的结构和数值进行归纳, 学习结果为划分的类别。典型的无监督学习有聚类、发现和竞争学习等。该算法用于解决Association rule learning和聚类问题, 代表的无监督学习算法有K-均值算法、Apriori算法和SOM算法。

3.强化学习。其也称为增强学习, 它将环境反馈的信息作为输入数据, 是一种基于统计和动态规划技术的学习方法。适用于解决机器人控制问题, 相关算法有Q-learning、Temporal difference learning算法。

监督学习或无监督学习的方法通常用于模拟商业决策时。半监督学习属于监督学习, 也是当下研究较多的机器学习方法。如图像分割, 数据分类问题。图像或数据中的一小部分信息被做了标记, 作为监督信息训练新数据。典型方法有Co-training、EM算法等。而强化学习多数用于机器人控制或其他控制系统的开发。

(二) 机器学习基本模型。在机器学习过程中, 一是考虑外部环境提供给系统的质量。外部环境代表了外界信息源, 是以某种形式表达的外界信息集合。学习的过程是将外界信息转变为知识的过程, 它先从外界环境获取信息, 然后将获得的信息加工成知识, 并将知识放入知识库。环境向学习系统提供的信息质量优劣, 直接影响学习部分实现的难易。二是知识库。因为知识库中存放了指导执行动作的原则, 加上不同的知识库, 表达方式特点不同。所以选择的表示方式不仅要求表达能力强、易于推理, 还要能够易于完善及扩展。机器学习模型中的执行环节是使用库知识完成特定任务的过程, 并把信息结果反馈给学习环节, 用于进一步的学习。

三、机器学习的发展

机器学习是人工智能研究的一个重要分支, 其发展大体可分为以下四个时期。

(一) 20世纪五六十年代属于机器学习发展的热烈时期。研究的是“无知识”的学习。研究的目标是自组织与自适应系统。研究的方法是修改系统的控制参数和不断提高系统的执行能力。代表性工作是:塞缪尔 (Samuel) 的下棋程序。但这种“没有知识”的学习结果有限, 满足不了人们对机器学习系统的期望。

(二) 机器学习发展的第二阶段处于20世纪六七十年代。其研究的目标是模拟人类的概念学习过程, 采用图结构或逻辑结构描述机器内部学习过程。代表性工作有Winston的结构学习系统和Hayes-Roth等的基本逻辑的归纳学习系统。但这类学习系统只能对单一概念进行学习, 不能投入实际应用。该阶段也称为机器学习的“黑暗时期”。

(三) 20世纪七八十年代是机器学习发展的复兴时期。这一时期, 探索不同的学习策略和方法, 学习开始从单个概念扩展到多个。学习系统与各种应用结合起来取得了很大成功。示例归约学习和自动知识获取成为了机器学习研究的潮流。

(四) 机器学习的最新阶段始于1986年。这个时期, 人们对机器学习的研究达到了高潮。该阶段中的机器学习有了更多的研究方法、手段和环境, 出现了人工神经网络学习、符号学习、基于行为主义的强化学习和进化学习等。在算法研究方面, 集成学习能够有效地提高模型的推广能力, 成为了20世纪90年代后机器学习研究的一个热点。时至今日已有很多集成学习算法, 如:Bagging算法、Boosting算法及Arcing算法等。

四、结语

机器学习计划 第5篇

机器学习计划是一项涉及诸多领域,内容非常广泛的计划,其中包括算法设计、数据预处理、特征选择、模型评估等等。下面将针对机器学习计划设计阶段中的主题进行详细阐述。

一、算法设计

机器学习计划的核心在于算法设计,即如何选择和设计合适的算法来解决问题。在实际应用中,机器学习的算法大致可以分为监督学习、无监督学习和强化学习三类。监督学习是指在已知结果的情况下,学习如何将输入数据映射到输出结果中;无监督学习则是在没有标记的情况下,从数据中学习出一些有用的特征;强化学习则是在与环境交互的过程中,让机器逐渐学习如何获得最大的奖励。

在算法设计中,需要考虑的因素很多,包括数据规模、数据类型、数据质量、计算能力等等。不同的算法适用于不同的场景,需要根据实际需求进行选择和调整。在此基础上,还需要考虑如何提高算法的精度和速度,以实现更好的性能。

二、数据预处理

数据预处理是机器学习计划中非常重要的一环,它对机器学习的结果直接影响非常大。数据预处理包括数据获取、数据清洗、数据转换等环节,旨在将原始数据转换为机器学习可用的数据。在这个环节中,需要考虑的问题有很多,比如数据的格式、数据的噪声、数据的缺失等等。

为了提高机器学习的效果,数据预处理需要根据不同的应用场景选择合适的方法。比如,在图像识别任务中,需要对图片进行裁剪、旋转、缩放等处理;在文本分类中,需要对文本进行分词、去停用词、提取关键词等处理。不同的数据预处理方法可以使机器学习更好地理解和利用数据。

三、特征选择

特征选择是机器学习中非常关键的一步,它可以提高模型的准确性和泛化性能。在特征选择中,需要对原始数据进行筛选和加工,保留与分类结果相关的特征,放弃与分类结果无关的特征。

特征选择有很多方法,比如过滤法、嵌入法、封装法等等。过滤法是指在特征选择前,先对数据进行筛选,去除无关因素;嵌入法是指把特征选择融合到模型训练中,一步到位;封装法是指通过计算每个特征子集的分类性能,来决定哪些特征是重要的。这些方法都可以用来选择出合适的`特征,提高机器学习的准确性和泛化性能。

四、模型评估

模型评估是机器学习计划最后的一步,也是最为关键的一步。模型评估可以有效评估机器学习算法的学习效果,发现算法中存在的问题和不足之处。

在模型评估中,需要考虑的指标有很多,比如准确率、召回率、F1值、AUC等等。不同的指标可以反映出机器学习模型在不同角度上的性能。同时,我们还需要根据实际情况选择不同的评估方法,比如交叉验证、留一法等等。

向动物学习的新型机器人 第6篇

大家不要被这个漂亮家伙给欺骗了,它其实不是一只真正的鸟,而是一只仿真机器鸟。它的骨架是用碳纤维材料制作的,它的身体是发泡塑料,它的内脏则是电子元件。

德国设计者对海鸥的飞行方式进行研究,利用其生物学原理,设计制造了能像海鸥一样飞行的机器鸟——“智慧鸟”。这个远程控制的机器鸟可以像真鸟一样起飞、飞行和降落。

“智慧鸟”的翅膀宽度为15.6厘米,比真正的海鸥要大一些,但它的重量不足0.5千克。就像它所模仿的鸟一样,这只机器鸟的翅膀被分为两部分,从而获得了飞行能力。内侧的翅膀部分提供推力,外侧的翅膀部分提供动力。一个小型马达控制外侧翅膀部分,可以根据外部风的情况实时调整翅膀的角度。

“智慧鸟”利用尾巴的角度变化来决定它是上升还是下降。尾巴同时还提供一部分推力。通过控制“智慧鸟”的头部,可以使它以全身的力量进行旋转,而这在很大程度上提高了它的可操作性,使它看起来就像一只真正的海鸥。

斑马鱼机器人

由美国和意大利科学家发明的这个约1.5米长的机器人,不仅模仿了斑马鱼的外观,而且还模仿了斑马鱼尾巴的运动。实验显示,当斑马鱼机器人的尾巴动起来时,其他斑马鱼就会被吸引过来;当它的尾巴不动时,其他斑马鱼就会离开。

水母机器人

如果科学家能够完善水母机器人的构造,那么,未来某一天,就会有一支由水母机器人组成的无敌舰队在海上巡逻。如果给它们装上特定的传感器,它们还可以调查海洋生物分布,监测海水质量,甚至使用过滤器在发生漏油事件后帮助清理海水中的油污。

水母机器人通过简单的动力装置,可在不消耗大量能源的情况下移动较长的距离。最近,美国科学家开发了一种硅胶水母机器人,它的“肌肉”是由包在碳纳米管中的金属丝制作的,在金属丝的外面涂了一层金属铂。当铂与水中的氢和氧接触时会产生热量,使金属丝收缩,从而让水母机器人“游动”起来。

由于海水中有大量的氢和氧,所以水母机器人可以通过海水实现能源的自给。它们可以在水中自由地漂浮几个月甚至几年。

昆虫机器人

受昆虫的启发而制作的机械人“代尔夫特蝇”,是最具特点的飞行机器人之一。它就像一只蜻蜓,用两组翅膀飞行。

“代尔夫特蝇”重2.8克,翅膀宽约1米,可以以每秒近5米的最高速度飞行3分钟。“代尔夫特蝇”由远程控制。它还携带有小型摄像头,可以将录像信息无线传输到地面的电脑里。

“代尔夫特蝇”的设计用途是飞入坍塌楼房的缝隙中搜寻被困人员。比它更轻的后续产品“代尔纳诺蝇”目前也在设计之中。

水黾机器人

科学家早就开发出了像水黾一样可以在水面行走的机器人,但他们还想复制昆虫在水面上跳跃的能力。研究发现,水黾之所以能够完成这种动作,是因为它们的腿具有超强的疏水性,使得它们可以利用水的表面张力在水面上“跳蹦床”。

为了防止微型机器人下沉(尽管它的重量只有约11克,但仍然比真的水黾重1000倍),中国科学家用疏水的泡沫镍制作机器人的脚。这种机器人一次可以跳35厘米远,其应用前景非常广泛,包括水质监测。

变色机器人

有些动物可以改变自己身体的颜色,这样做既可以达到伪装的目的,也方便同类之间进行交流。科学家综合了海星和章鱼的这一特征,模仿制作了一款变色机器人。

这种柔软的可爬行的机器人是用硅橡胶制作的,在它的身上布满了装有各种颜色液体的管子,可以通过控制液体的颜色使它同周围的环境融为一体。相反,也可以通过液体发光让它引起人们的注意。后一应用可以在搜救工作中发挥作用,使那些身陷困境的人们能注意到机器人。

鸵鸟机器人

鸵鸟拥有又长又轻的腿,这使得它们以每小时64千米的速度奔跑很长距离而不用消耗太多的能量。这种身材瘦长的鸟类启发美国科学家研发了一种擅长跑步的机器人。

由美国国防部资助的这种拥有一双快腿飞鸵的“快跑者”机器人以每小时35千米的速度奔跑,很可能被应用于未来的战争中。这种可快速移动作业的机器人将来也会被用于救灾。

蟑螂机器人

当蟑螂和壁虎受到惊吓时,它们通常会快速跳离它们所在的平台,用后腿抓住平台的边缘,像摆钟一样摆动身体至平台的背面,然后逃走。

在灾区进行搜救工作的机器人的先决条件是:能够在任何环境下移动。而美国科学家发明的蟑螂机器人就能够以与蟑螂和壁虎相同的方式在平台边沿摆动。

机器狗

大多数机动车都不能在泥泞的、冰雪覆盖的公路或陡坡上行驶。但是,很多动物靠腿就可以轻松地做到这一点。正是模拟动物的这个特点,科学家制造了一只四条腿的机器狗。

机器狗的长和高均约90厘米,重约110千克。因为比狗重得多,所以它可以在负载150千克的情况下行走、奔跑和爬坡。美国军方希望用它充当驮畜,让它在机动车不能行驶的地方运送物资。

机器狗由一个连接着50个传感器的电脑控制,以帮助它保持身体平衡,并在它偏离路线时为它指路。机器狗的四肢由一个液压系统控制,发动机为其提供能量。这是科学家模拟哺乳动物移动四肢的方式设计的。机器狗的最高时速为每小时6.5千米,充一次电可行走19千米以上。

机器狗现在通过远程遥控,但新版本的机器狗预期可以减少对人类操控的依赖。最新推出的样品其外形更像驴,运行起来更安静,并且使用了新的科技,可以自己寻路或者跟在士兵的后面走。

鼩鼠机器人

伊特鲁里亚鼩鼠的胡须是大自然中最灵敏的器官之一(几乎所有的哺乳动物都利用胡须作探测器,以提高自己的触觉)。受此启发,英国科学家研发了一种鼩鼠机器人,它可以用“胡须”来感知周围的环境。

机器学习方法 第7篇

模式识别、机器学习和深度学习代表三种不同的思想流派。模式识别是最古老的, 而且在现在术语中也是相对过时的一种说法;近些年, 机器学习发展迅速, 并且在相关领域的实际应用中取得较好的效果, 是当下计算机领域的热门技术, 不少初创公司为之兴起。而深度学习是继机器学习之后, 又一个崭新的研究领域, 现在还处于科研的初期阶段, 人们甚至都很难预测深度学习未来的影响力。

当下, 三者之间有以下发展态势:

(1) 机器学习就像是一个真正的冠军一样持续昂首而上;

(2) 模式识别一开始主要是作为机器学习的代名词;

(3) 模式识别正在慢慢没落和消亡;

(4) 深度学习是个崭新的和快速攀升的领域。

2 模式识别:智能程序的诞生

模式识别出现于上世纪七八十年代, 它主要是研究如何让计算机实现智能化, 比如对数字“3”的识别。在经过大量的测试和研究之后, 计算机科研人员通过构建程序, 进一步实现了五十年代一直被人们向往和崇拜的人工智能, 例如将“3”与“B”或者“8”区分开来。最初, 人们并不在意智能技术是如何实现甚至如何操作的, 只要减少人工操作就满足了大多数人的需求。不过, 如果你的算法对图像应用了一些像滤波器、边缘检测和形态学处理等一些高端的技术后, 模式识别相关专家就会对它产生极大的兴趣, 光学字符识别就是通过这些专家研究诞生的。因此, 把模式识别称为70年代, 80年代和90年代初的“智能”信号处理是合适的。决策树、启发式和二次判别分析等就是在这个时期研发出来的。而且, 在这个时代, 模式识别是计算机科研领域的“大红人”, 成为科研人员争相研究的技术。

2 机器学习:从样本中学习的智能程序

2.1 机器学习概念

机器学习是一门多领域交叉学科, 涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为, 以获取新的知识或技能, 重新组织已有的知识结构使之不断改善自身的性能。

2.2 机器学习发展状况

到上世纪九十年代, 随着模式识别计算方法的成熟和人们对人工智能的认识也越来越深入, 科研人员逐渐发现大数据的重要性。就是通过大量相关数据的采集积累, 用数据取代在图像方面非常有经验的专家。因此, 科研人员搜集大量的人脸和非人脸图像, 再经过某一个算法的计算, 然后经过计算机程序的自动识别计算, 等着计算机完成对这些图像的学习, 这是机器学习的研究思路。

“机器学习”是人为将大量相关数据输入计算机程序中, 计算机按照设定有规律有计划地消化学习这些数据, 发现总结出其中隐含的信息。计算机的学习要远远超过相关科研人员学习讨论得出的结论的准确性, 而且会通过数据来真实地说明事实存在但是人类很难发觉的信息。计算机的速度和精确度是人为很难达到的。

步入21世纪, 机器学习的技术水平逐步成熟, 成为计算机科研领域的重点研究对象。机器学习的应用范围也开始扩大, 不只是识别单纯的字符、图像, 逐渐向高新科技产业发展。比如实现机器人的学习、操作、行动, 以及在生物工程中, 对大量基因数据的分析, 还有在金融市场中, 通过分析大量数据变动, 做出市场预测等。机器学习不再是计算机科研人员的热门话题, 也成为机器人专家等各种运用到机器学习的领域争相研究的对象。

3 深度学习:一统江湖的架构

3.1 深度学习概念

深度学习是想通过模仿人脑的思考方式, 建立类似于人脑的神经网络, 来实现对数据的分析, 按照人的思维做出相关解释, 形成人们易于理解的图像、文字或者声音。

深度学习分为有监督和无监督学习两种类型, 学习模型根据学习框架的类型来确定。例如, 卷积神经网络就是一种深度的监督学习下的机器学习模型, 而深度置信网就是一种无监督学习下的机器学习模型。

3.2 深度学习现状及未来发展

如今的计算机领域, 随处可以看到一个夺人眼球的技术——深度学习。而在深度学习的模型中, 研究热度最高的是卷积神经网络, 是一种能够实现大量图像识别任务的技术。

深度学习的重点是对模型的运用, 模型中需要的参数是通过对大量数据的学习和分析中得到的。在深度学习的研究中, 还有大量的问题需要考虑解决。面对庞大的网络系统, 一个高维度的模型需要获得并且学习大量数据, 还要有对大数据的强大运算和分析能力。图像处理器就是类似于这样具有强大处理能力的工具。

深度学习作为目前炙热的科研项目, 存在很多急需要解决的问题。现在, 又还没有一本完整的关于深度学习的研究书籍甚至是学习指南, 相关的理论知识并不成熟, 现实操作中问题重重。虽然深度学习具有很强大的市场前景, 对人类的诱惑力很大, 但大家并不能仅沉迷于其中, 改变世界的进步手段仍然还有许多。不过, 只要人们通过不断增加机器学习技能, 深度学习的未来发展空间会非常广阔。

人们应该敢于思考和创新, 不受深度学习的框架限制, 勇于对这些框架进行调整改变, 进而得到协同当下工作的算法方式。未来, 通过人们对深度学习领域的深入了解, 相信深度学习一定会给人类带来现在难以想象的惊喜。然而, 伟大的发明定要有强大的专业知识、坚定的信念和一颗不屈不挠的心, 随着市场开发的加快, 这个美好的愿景一定会实现。

4 其他相关术语

(1) 大数据:大数据是个丰富的概念, 例如包含大量数据的存储, 数据中隐含信息的挖掘等。通过对大数据的学习和分析, 企业领导者从中可以得到很多决策性意见。大数据与机器学习的结合在前几年就已经开始出现, 并且结合范围越来越广泛。现在, 甚至软件项目开发中的普通员工都会接触到大数据、云计算这些服务。

(2) 人工智能 (Artificial Intelligence) :人工智能是上世纪五十年代提出的概念, 但同时也是最模糊不清的。相关专家认为:人工智能是研究人类智能活动的规律, 构造具有一定智能的人工系统, 研究如何让计算机去完成以往需要人的智力才能胜任的工作, 也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。

5 结语

深度学习、机器学习和模式识别是关于智能学习领域的三个先后发展的技术, 这三者相似但关注的重点有所不同。相信随着人们创造力的不断提升和科技水平的不断进步, 深度学习和机器学习会带给人们越来越多的惊喜。

参考文献

[1]杜明, 周而重.机器学习在模式识别中的应用研究[J].科技信息, 2009 (9) :37-38.

[2]郑胤, 陈权崎, 章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图像形象学报, 2014 (2) :175-184.

[3]郭丽丽, 丁世飞.深度学习研究进展[J].计算机科学, 2015, 42 (5) :28-33.

[4]郭亚宁, 冯莎莎.机器学习理论研究[J].中国科技信息, 2010 (14) :208-209, 214.

移动机器人定位方法概述 第8篇

随着工业自动化的发展, 生产加工的自动化程度越来越高。机器人技术的出现和发展使传统的工业生产面貌发生根本性的变化。移动机器人的定位是其执行其他任务的前提和基础, 也是评价机器人性能的关键指标之一。

移动机器人定位是指机器人通过感知获取环境信息, 经过相关的信息处理而确定自身及目标位姿的过程。自主移动机器人导航过程需要回答3个问题:“我在哪里?”, “我要去哪里?”和“我怎样到达那里?”。移动机器人定位技术就是要解决第1个问题。准确来说, 移动机器人定位的目的就是确定机器人在其运动环境中的世界坐标系的坐标。

根据机器人定位过程, 可分为相对定位和绝对定位。但在机器人定位过程中, 单独地使用其中任何一个定位方式都不能很好地解决移动机器人的定位问题。因而, 在目前的定位技术中主要是将两者结合在一起, 完成对移动机器人定位。本文对相对定位技术和绝对定位技术分别进行概述。

1 移动机器人相对定位研究

移动机器人的相对定位也称作位姿跟踪。假定机器人的初始位姿, 采用相邻时刻的传感器信息对机器人的位置进行跟踪估计。相对定位法分为里程计法和惯性导航法。

1.1 里程计法 (Odometry)

在机器人的导航技术中, 里程计法是使用最为广泛的定位方法。在移动机器人的车轮上装有光电编码器, 通过对车轮转动的记录来实现对机器人的位姿跟踪。在位置跟踪中, 机器人的当前位置是根据对它的以前的位置的知识而更新的, 而这需要假定机器人的初始位置已知, 并且机器人姿态的不确定性必须小。通过这种方式来实现机器人定位的方法也成为航位推算法。航位推算是一个累加过程, 在这个逐步累加的过程中, 测量值以及计算值都会累积误差, 使得定位精度不断下降。因而航位推算法只适用于短时间运动的或者短距离位姿跟踪。为了限定定位的不确定性, 我们在航位推算法的基础上采用一些绝对的信息。为此, 我们可以将航位推算法与其他传感器信息结合进行定位。

1.2 惯性导航法 (IN:Inertial Navigation)

在惯性导航法中, 我们采用陀螺仪和加速度计来实现定位。使用陀螺仪测得旋转速度的值, 使用加速度计测得加速度的值。机器人的位置信息可通过将测量值进行一次积分和二次积分得到。但在这个对测量值的积分操作中, 会引入惯性导航信息的时间漂移, 所以惯性导航法也不适合长时间的精确定位。但是, 惯性导航法能够及时地在检测到出现侧向误差时立即加以校正, 而这弥补里程计法最主要的缺点与不足。但是, 由于高精度的陀螺仪相当昂贵的价格, 会大大增加移动机器人的成本, 所以还不能够广泛使用。

2 移动机器人绝对定位研究

移动机器人的绝对定位又称为全局定位。完成机器人的全局定位需要预先确定好环境模型或者通过外部传感器直接向机器人提供外界位置信息, 计算机器人在全局坐标系中的位置。全局定位的主要方法有: (1) 导航信标 (Navigation Beacon) ; (2) 图形匹配 (Map Matching) ; (3) 全球定位系统定位 (Global Positioning Systems, GPS) (4) 概率定位。信标定位利用人工路标或自然路标和三角原理进行定位。地图匹配定位首先利用传感器感知环境信息创建好地图, 然后将当前地图与数据库中预先存储好的地图进行匹配, 最后计算出机器人在全局坐标系中的位姿。GPS是用于室外移动机器人导航与定位的技术。概率定位即基于概率地图的定位, 这个新的研究领域称为概率机器人学。概率机器人学的关键思想是用概率论来表示不确定性, 即概率机器人学不给出当前机器人方位的一个单独的最好估计, 而是将机器人方位表示为对所有可能的机器人位姿的一个概率分布。由于在许多现实应用中, 概率算法胜于别的技术, 因而概率机器人学理论能成功应用于机器人定位问题。在概率定位中, 最重要的是马尔科夫定位和卡尔曼滤波器定位。它们不仅能够实现全局定位和局部位置跟踪, 而且能够解决机器人的“绑架”问题。

2.1 马尔可夫定位 (Markov Localization, ML)

马尔可夫定位中, 机器人通常不知道它所处环境的确切位置, 而是用一个任意概率密度函数表示机器人位置。它持有一个可能在哪里的信任度并跟踪任意概率密度函数跟踪机器人的信任度状态。信任度是指机器人在整个位置空间的概率分布。在马尔可夫定位中, 地图的表示方法为栅格地图, 即机器人导航环境被划分为很多的栅格。其中每个栅格的值在0~1之间, 表示机器人在该栅格的信任度, 所有栅格信任度之和为1。信任度值的计算是马儿可夫定位的关键。

2.2 卡尔曼滤波器定位 (Kalman Filter, KF)

马儿可夫定位模型在机器人位置方面可以表示任何概率密度函数, 但通用性不强并且效能很差。卡尔曼滤波器定位算法是马尔可夫定位的一个特殊情况。卡尔曼滤波器不适用任何密度函数, 而是使用高斯代表机器人信任度、运动模型和测量模型。因为高斯简单地由它的均值μt和协方差σt来定义。在预测和测量阶段这两个参数更新。于是产生了与马尔可夫定位算法相比更为有效的算法。然而, 卡尔曼滤波器所作的假设限制了初始信任度以及高斯的选择。因而必须以一定的近似自导机器人的初始位置。

3 结束语

综上所述, 本文主要介绍了当前自主移动机器人定位方法, 对相对定位和绝对定位做了概述, 对以后研究自主移动机器人的定位具有较高的参考意义。

摘要:介绍了当前自主移动机器人的定位方法研究现状, 对相对定位和绝对定位做了概述, 对绝对定位中主要的研究方法做了介绍, 并对概率机器人学所采用的主要定位方法做了介绍。

关键词:移动机器人,相对定位,绝对定位,概率机器人学

参考文献

[1]朱莹, 洪炳镕.基于CBL的双目视觉自主机器人定位[J].哈尔滨工业大学学报, 2004 (07) .

[2]杨晓敏, 吴炜.图像特征点提取及匹配技术[J].光学精密工程, 2009 (09) .

[3]刘洞波.移动机器人粒子滤波定位与地图创建方法研究[D].湖南大学博士论文, 2012.

[4]李群明.室内自主移动机器人定位方法综述[J].机器人ROBOT, 2003 (11) .

[5]S.Se, D.Lowe, J.Little.Vision-based global localization and mapping formobile robots.IEEE Transactions on Robotics.2005 (21) .

[6]蔡自兴, 王勇.基于角点聚类的移动机器人自然路标检测与识别[J].智能系统学报, 2006 (03) .

机器学习方法 第9篇

由于机器人系统是一个高度复杂、高度耦合的非线性系统,设计其控制器存在的一个严重的问题是我们往往并不知道准确的数学模型,因此利用传统的控制理论很难实现对机器人的高精度跟踪控制。近年来,迭代学习控制理论的发展为机器人的控制提供了一种有效的方法。

迭代学习方法适合于具有重复运动性质的被控对象,该方法是一种仿效人类的学习行为提取经验的过程,采用的是一种“在重复中学习”的策略[1],它以系统的实际输出与期望输出的偏差修正不理想的控制信号,产生新的控制信号,使得系统的跟踪性能得以提高,如此迭代若干次后,系统的输出就会逼近理想的期望轨迹,并且整个控制过程要求快速完成[2]。最早提出迭代学习控制思想的是日本学者Arimoto,之后,许多学者提出了形式多样的迭代学习控制律,并在一定的假设下,分析得到了迭代学习控制的收敛性条件。学习速度是评价一个学习算法优劣的一项重要指标。本文提出一种改进的D型迭代学习律加速了学习的速度。

1迭代学习方法

考虑如下形式的非线性系统[5]

(1)式中,x(t)∈Rn,u(t)∈Rr,y(t)∈Rm分别为系统的状态、控制和输出向量;f、B、C为适当为数的向量或矩阵。假定系统是可重复多次运行的,要求在时间区间t∈[0,T]内系统输出y(t)精确地跟踪期望输出yd(t),则第k次运行时,系统地迭代学习动态方程可表示为

输出误差为

对系统(1)式,Hauser提出的迭代学习控制律由(4)式给出:

从(4)式可以看出该迭代学习控制律中没有包含系统的输出误差yd-yk,而yd-yk同样是反映系统跟踪性能的可利用信息,所以将它引入迭代学习控制律中有可能进一步改善原迭代学习控制律的迭代效果;在实际系统中,系统地输出信息往往比输出的微分信息更容易获得,所以若在(4)式中引入输出误差信息或许可以补偿由于输出的微分信息的测量噪声所带来的不良影响。另外,为了加快迭代过程中的迭代速度,在学习律中引入收敛因子。基于以上两点考虑,提出下面的改进D型迭代学习控制律:

(6)式为(5)式的变形形式。

2方法的敛散性

定理1对(1)式表示的非线性系统,在t∈[0,T]中满足下列条件:

(A 1)f(t,x)关于x满足全局一致Lipschitz条件即存在使得

(A 2)每次运行时的初始状态误差δxk(0)k≥0为一收敛到零的序列

(A 3)存在惟一的理想控制ud(t),使得系统的状态和输出为期望值;

(A 4)在t∈[0,T]中C(t)存在,且B(t),C(t)有界。

若取(5)所示的改进学习律,则对于任意给定的初始控制uo(t)及每次运行的初始状态xk(0),所得的序列xk(t)k≥0,yk(t)k≥0,及uk(t)k≥0对t一致地收敛到xd(t),yd(t)和ud(t)的充分条件为谱半径

其必要条件为

证明:令

由(5)式得

由(12)式得

于是有

令为

其中,x∈CN[0,T]为系统动态方程式(1)在给定初值x(0)时的解。

令P:为

下面对Qk做出估计,若x(t)为动态方程(1)的解,由条件(A 1)与式(12)可得

由Bellman-Gronwell引理知,存在M1>0使得

由条件(A 4),(14)式和(18)式知,存在M2>0使得

同理有

根据式(16),式(19),条件(A 2)知:若P之谱半径为

则一致成立.

下面证明必要性取

据(19)式和(20)式得

因此有

于是若P(O)的谱半径ρ(P(0))≥1,则存在δu0(0)≠0,使得

3开环迭代学习控制在机器人操作臂的轨迹跟踪控制中的应用

考虑具有n自由度刚性操作臂,其动力学方程[4]如下所示

(21)式中q为关节位置,M(q)为操作臂n×n惯量矩阵,V(q,q﹒)是n×1的离心力和哥氏力矢量,G(q)是n×1重力矢量,u∈Rn是操作臂关节输入

将(21)式化成状态方程的形式可得

并取系统输出为

则可得

若令

则(21)式可化为

另外,对比(1)式和(25)式可知:

3.1开环迭代学习控制律的推导

假设由(25)式给出的机器人操作臂的动力学模型满足定理1所提到的条件,并且设

将(26)式代入(6)式可得此时的迭代控制律为

若将矩阵Γ(xk),p(xk)分块为:

(28)式中

则(27)式可化为

若令

将(30)式及(23)式代入(29)式可得应用于机器人操作臂的轨迹控制使得开环迭代学习律,即:

而收敛条件也可化为

(32式)式表明,对机器人操作臂而言,影响算法收敛性的只有

3.2利用迭代律中仅含有关节角加速度的仿真研究

采用下面的迭代式

取λ=M,对两转动关节操作手模型来仿真。二关节操作手动力学模型为

令期望的位置轨迹为:

则期望的加速度为

采样周期为10ms,初始条件为

获得仿真曲线如图1。

由图1可见,算法的收敛速度很快,在第二次循环后,实际轨迹就基本上接近了期望轨迹。

下面将提出的算法的收敛性能及速度与D类算法作一比较:

D类算法的形式为[3]:uk+1(t)=uk(t)+Γ(t)[q˙d(t)+q˙k(t)]

机器人参数及初始条件取值同上面仿真一样,结果如图2。

比较图1,图2可见,D类算法迭代初期跟踪误差较大,经过16次迭代才基本实现完善跟踪。所以本文所讨论的算法较D类学习算法收敛速度大大地提高了。

5 结论

本文提出了一种迭代学习控制算法应用于机器人轨迹跟踪,对算法进行了理论分析和试验研究。并且与 D类算法进行了比较,结果表明提出的算法具有更快的收敛速度,并且初始迭代误差小,利用过程的关键信息较充分。

摘要:针对机器人轨迹跟踪控制,提出了一种改进的D型迭代学习控制律。通过推导得出在机器人操作臂轨迹控制中的开环迭代学习控制律,得出的控制律除了利用机器人的关节位置及关节速度信息外,还引入了机器人的关节角加速度。另外,利用控制律中的机器人关节角加速度构成的学习律在二关节操作臂上进行了试验并且与Arimoto等提出的D型学习律进行了比较,结果表明所提出的控制律具有较高的学习速度。

关键词:迭代学习控制,轨迹跟踪,机器人,收敛

参考文献

[1]石成英,林辉.迭代学习控制技术的原理、算法及应用.机床与液压,2004,29(9):80—83

[2] Arimoto S,Naniwa T,Suzuki H.Robustness of P-type learningcontrol with a forgetting factor for robotic motions.Proc Of29th Conf.On Decision and Control,Honolulu,Hawil,USA,1990,141

[3] Arimoto S,Kawamura S,Miyazaki F.Bettering operation of dynamicsystems by learning:A new control theory for servomechanism ormechatronic systems,in:Proc of the 23rd IEEE Conf.on Decisionand Control,USA,1984,1064—1069

[4] Gopinath S.Iterative Learning Controller for Robotic Manipulator,MTech thesis Dept Elect.Eng,Ind Inst.Tech,Delhi,2001

机器学习的主要策略与基本结构 第10篇

1 机器学习的主要策略

学习是一项复杂的智能活动, 学习过程与推理过程是紧密相连的, 按照学习中使用推理的多少, 机器学习所采用的策略可分为:机械学习、类比学习、示例学习、解释学习以及基于神经网络的学习。

1.1 机械学习

机械学习也称记忆学习, 它是通过记忆和评价外环境所提供的信息来达到学习目的的。在这种学习方法中, 学习环节对外部提供的信息不进行任何变换, 只进行简单的记忆。虽然机械学习在方法上看似很简单, 由于计算机的存储容量相当大, 检索速度又相当快, 记忆精确、无丝毫误差, 所以也能产生人们难以预料的结果。机械学习的典型代表是西蒙的西洋跳棋程序。该程序用极大极小博弈树搜索来选择走法。学习环节记忆了棋局态势和倒推得极大极小值。在下棋过程中, 只要碰到过去出现过的棋局, 就可以直接采用原来的走棋方案。

1.2 类比学习

类比学习系统只能得到完成类似任务的有关知识, 因此, 学习系统必须能够发现当前任务与已知任务的相似点, 由此制定出完成当前任务的方案, 因此, 它比上诉两种学习策略需要更多的推理。

1.3 示例学习

示例学习也称为实例学习, 它是一种从具体示例中导出一般性知识的归纳学习方法, 这种学习方法给学习者提供某一概念的一组正例和反例, 学习者从这些例子中归纳出一个总的概念描述, 并使这个描述适合于所有的正例, 排除所有的反例。

1.4 解释学习

解释学习是一种分析学习方法。这种方法是在领域知识的指导下, 通过对单个问题求解例子的分析, 构造出求解过程的因果结构, 并获取控制知识, 以便于以后将其用于类似问题的求解。解释学习在获取控制性知识、精华知识、软件重用、计算机辅助设计和计算机辅助教育等方面有较多应用。

1.5 基于神经网络的学习

神经学习也称为联接学习, 它是一种基于人工神经网络的学习方法。利用神经网络解决问题, 一般分为训练和工作两个阶段。训练阶段的主要目的是要从训练样本中提取隐含知识和规律, 并存储在网络中, 供工作阶段解决问题使用。神经学习是指神经网络的训练过程, 其主要表现为联接权值的调整。

2 机器学习系统的基本结构

一个学习系统不仅与环境和知识库有关, 而且还应该包含学习和执行两个重要环节, 它们之间的关系如图1所示。

该图给出了学习系统的基本模型, 它由四部分组成。其中, 环境是以某种形式表达的外界信息集合, 它代表外界信息来源;学习环节是将外界信息加工为知识的过程, 它先从环境获取外部信息, 然后通过对这些信息的分析、综合、类比、归纳等加工形成知识, 最后把所形成的知识放入知识库中;知识库是以某种形式表示的知识集合, 用来存放学习环节所得到的知识;执行环节是利用知识库中的知识完成某种任务的过程, 并把完成任务过程中所获得的一些信息反馈给学习环节, 以指导进一步的学习。

2.1 环境与学习环节

环境中信息的水平和质量是影响学习系统设计的第一个重要因素。所谓信息的水平是指信息的一般化程度, 或者说是指信息适用范围的广泛性。而信息的一般化程度又是相对于执行环节而言的。高水平信息的一般化程度比较高, 能适应于更广泛的问题。低水平信息的一般化程度比较低, 只适用于个别问题。无论环境中信息的水平是高是低, 这些信息与执行环节所需要的信息水平往往是会有差距的, 学习环节的任务就是要缩小这一差距。如果环境提供的是高水平信息, 学习环节就是要补充遗漏的细节, 以便于执行环节能将其用于更具体的情况。如果环境提供的是低水平信息, 学习环节就要由这些具体实例归纳出适用于一般情况的规则, 以便执行环节能将其用于更广的任务。

2.2 知识库

知识库的形式和内容是影响学习系统设计的又一个因素。知识库的形式是与知识表示方式直接相关的。知识的表示有多种形式, 如特征向量, 一阶逻辑语句、产生式规则、语义网络和框架等。这些表示方式各具特点, 在选择表示方式时要兼顾以下几方面:表达能力强、易于推理、容易修改知识库、知识表示易于扩展。对知识库中的内容, 其初始知识是非常重要的。学习系统不可能在没有任何知识的情况下凭空获取知识, 它总是先利用初始知识去理解环境提供的信息, 并依次逐步进行学习。学习系统的学习过程实质上是对原有知识库的扩充和完善过程。

2.3 执行环节

执行环节是整个学习系统的核心, 它与学习环节之间是相互联系的。学习环节的目的就是要改善执行环节的行为, 而执行环节的复杂度、反馈作用以及透明性又会反过来对学习环节产生一定的影响。

复杂度。不同复杂度的任务, 所需要的知识是不一样的。一般来说, 一个任务越复杂, 它所需要的知识就会越多。

反馈。所有的学习系统都必须有从执行环节到学习环节的反馈信息。这种反馈信息时根据执行环节的执行情况, 对学习环节所获知识的评价。学习环节主要根据这些反馈信息来决定是否还需要从环境中进一步获取信息, 修改、完善知识库中的知识。目前, 学习系统所采用的评价方式主要有两种, 一种是由系统自动进行评价, 另一种是由人来协助未按成评价。所谓自由系统自动完成评价, 是指把评价时所需要的性能指标直接建立在学习系统中, 然后由系统由系统对执行环节得到结果自动进行评价;所谓由人来协助完成评价, 是指由人提出外部执行标准, 然后观察执行环节相对这个标准的执行情况, 并将比较结果反馈给学习环境。

透明性。所谓透明性是指从系统执行部分的动作效果可以很容易地对知识库的规则进行评价。可见, 执行环节的透明性应该越高越好。

摘要:学习是人类获取知识的重要途径和人类智能的重要标志, 而机器学习则是机器获取知识的重要途径和机器智能的重要性标志。机器学习一直是人工智能研究的核心课题之一。本文主要本文讨论了机器学习的一些基本概念、主要策略和结构。

关键词:机器学习,系统,模型

参考文献

[1]李长河.人工智能及其应用[M].北京机械工业出版社, 2006.

机器学习方法 第11篇

关键词:学习《评估标准——机械设备》认识

0引言

中国资产评估准则体系包括职业道德准则和业务准则两部分。本次发布的新准则之一《评估准则一机器设备》属于业务准则范畴。通过学习,笔者认为评估师在执行该准则时应重点关注的几点变化和要求:

1注意与机器设备有关的“评估假设”。明晰评估结论成立的条件

假设是由于认识客体的无限变化和认识主体有限能力的矛盾,人们不得不依据已掌握的资料对某一事物的莱一特征或全部事实作出合乎逻辑的推断。对所研究的事物作出合乎逻辑的假定说明就叫假设。资产评估假设是指对资产评估过程中某些未被确切认识的事物,根据客观的正常情况或发展趋势所作的合乎情理的推断。资产评估假设也是资产评估结论成立的前提条件。

《评估准则一机器设备》发布之前,评估人员对于机器设备的评估应该作哪些假设不该作哪些假设往往不是很清楚,为了避免日后的产生法律纠纷滥用假设情况屡见不鲜。评估师滥用假设现象也引起有关部门的关注,2006年建设部、中国人民银行、中国银行业监督管理委员会就发布了[2006]8号文,题为“规范与银行信贷业务相关的房地产抵押估价管理有关问题的通知”。随即,中国房地产估价师与房地产经纪人学会发布了《房地产抵押估价指导意见》,其中第十九条就规定:“房地产估价师不得滥用假设和限制条件,应当针对房地产抵押估价业务的具体情况,在估价报告中合理且有依据地明确相关假设和限制条件。”可见,客观合理做出评估假设是评估师需要研究的课题。

《评估准则一机器设备》的发布,为我们指明了与评估机器设备有关的几种评估假设。准则在第三章“操作要求”第十三条明确规定:“注册资产评估师应当根据机器设备的预期用途,明确评估假设。包括:①继续使用或者变现:②原地使用或者移地使用;③按现行用途使用或者改变用途使用。

关于对继续使用或者变现假设的应用,评估师应该认识到:一台机器设备,如果作为企业整体资产的一部分,所能够实现的价值与该机器设备作为资产单独销售可能是大不同的。因为前者所能够实现的价值取决于该设备对整体的贡献,后者只能实现该设备单独销售的变现价值,因而要求注册资产评估师应当根据机器设备的预期用途,明确评估对象是继续使用还是拟变现,从而做出合理评估假设。

关于对原地使用或者移地使用假设的应用,评估师应该认识到:有的机器设备不需要安装,可以移动使用(如车辆、可移动使用的其他机器设备)。有的机器设备则需要以某种方式安装在土地或建筑物上,移动这些资产将可能导致机器设备的部分损失或完全失效。同时设备的移动也会对某些机器造成损伤或完全报废,设备原有的安装、基础的价值可能失去。一般来说,原地使用的机器设备价值比移地使用的机器设备价值要高。因而要求注册资产评估师应当根据机器设备的预期是否移地使用,做出合理评估假设。

关于对按现行用途使用或者改变用途使用假设的应用,评估师应该认识到:机器设备是否按现行用途继续使用,对机器设备的价值评估也有很大影响。如果机器设备拟改变用途使用,其所生产的产品、工艺等可能发生变化,会导致一些专用设备报废,或者要对这些专用设备进行改造,或者需要添加一些新的配套设备才能适应新产品或新工艺的要求;可见:按现行用途使用的机器设备价值比改变用途的机器设备价值要高。因而要求注册资产评估师应当根据机器设备的预期是按现行用途使用或者改变用途使用,做出合符实际情况的假设。

2资产评估师应关注机器设备的经济性贬值

在过去的评估实务中,当评估师采用成本法评估机器设备时,较多的采用下面的评估公式:

评估值=重置价值×成新率

目前看,重置价值的估算问题较少。成新率的估算却问题较多,公式中的成新率应该是综合成新率,是在全面考虑机器设备的实体性贬值、功能性贬值、经济性贬值之后得出。但在大多数时候,评估师往往只考虑机器设备的实体性贬值,按年限法计算成新率。即:成新率=已使用年限÷(已使用年限+尚可使用年限)。在确定尚可使用年限时,往往忽略一些国家宏观经济政策可能给机器设备寿命带来的影响。《评估准则一机器设备》的发布,发出了要求注册资产评估师应关注机器设备的经济性贬值的强烈信号。准则第十一条指出:“注册资产评估师执行机器设备评估业务,应当考虑机器设备所依存资源的有限性、所生产产品的市场寿命、所依附土地和房屋建筑物的使用期限、国家的法律、法规以及环境保护、能源等产业政策对机器设备价值的影响。”

目前,我国正在把科学发展观引入各个行业,要求构建和谐社会、和谐的人居环境。我国有的地区工业发达,带来了经济的高速增长,但是同时也带来了能源的大量消耗和环境的严重污染两大社会问题。为了节约能源,保护环境,实现可持续发展,国家颁布了《节约能源法》和《环境保护法》及一系列产业政策,这些政策对机器设备的使用进行了严格的规定和限制。对机器设备的能耗和环保方面提出了更高的要求。如淘汰类的单机组30万千瓦以下的旧式燃煤发电机组,对其锅炉、发电机组的评估,就不能按正常的市场价格标准进行评估,应重点考虑产业政策对其价值的影响,如果是正确定下马或拆迁的,则其价值接近于残值。因此作为资产评估师,平时应加强学习,随时关注国家产业政策的变化,提高自己的专业判断能力。当下,对涉及能源,环境保护政策而将淘汰类行业的专用机器设备评估业务,应高度关注机器设备的经济性贬值,合理估计环境保护、能源等产业政策对机器设备价值的影响。

3机器设备评估准则允许现场调查中采用抽样方式

评估师对评估对象所做的现场调查是注册资产评估师赖以形成评估结论的基础,所调查的内容应该支持注册资产评估师形成评估结论。评估师应当根据评估对象的具体情况合理确定现场调查内容。但是,由于客观条件的限制,注册资产评估师在执业过程中,对评估对象调查或勘测的程度,所获得信息的真实性、完整性等都会受到不同程度的影Ⅱ自。过去,由于实际工作中机器设备种类繁多,工作原理及技术指标差异很大,逐台进行机器设备现场调查工作量很大有时甚至难以实施,评估的现场调查阶段是否可以采用抽样方式进行,国家和行业主管部门过去也没有明确。而在现实中抽样方式已经在一些行业,特别是在大型评估业务中普遍运用,且现场调查的抽样方式也得到了有关各方的基本认可。所以抽样方式是符合评估实践的。对此,《评估准则一机器设备》予以了明确。准则第十六条规定:“注册资产评估师执行机器设备评估业务,应当对机器设备进行现场逐项调查或者抽样调查,确定机器设备是否存在、明确机器设备存在状态并关注其权属。如果采用抽样的方法进行现场调查,注册资产评估师应当充分考虑抽样风险。因客观原因等因素限制,无法实施现场调查的,注册资产评估师应当采取适当措施加以判断,并予以恰当披露。”这样规定,区分批量评估和单件评估的差异,解决了多年来在大型评估业务中困扰评估师和监管部门的问题,也符合评估对象的特殊性问题。当然,评估师必须了解到,任何抽样方法都存在抽样风险。如果评估师采用抽样方法进行现场调查,应当充分考虑抽样风险。在制定抽样方案时,应当对抽样风险进行测算。评估师应具体观察每一个评估对象的状况,对所抽取样本及样本以外的机器设备进行一定的假设和推断。同时,也要在评估报告中进行恰当的披露。

4结束语

机器学习方法 第12篇

近年来由于基因组计划的迅速推进, 蛋白质序列数据呈现指数级增长, 目前已超过13, 000, 000条[1], 而已通过实验方法得到功能注释的蛋白质不到1%[2], 对这些蛋白质的功能进行注释已成为分子生物学研究的中心任务之一。因为数据量巨大, 仅通过人工的手段对这些蛋白质的功能进行注释已不可能, 因此, 发展快速有效的计算方法显得非常紧迫和重要。

目前, 已有大量的计算方法用于预测蛋白质的功能, 这些方法主要可分为六类[1]。第一类为基于序列信息的蛋白质功能注释方法。它或者将靶标蛋白质的全序列到已知功能的蛋白质数据库中进行相似性搜索, 利用搜索得到的序列相似性最高的蛋白质对靶标蛋白质进行功能注释[3];或者仅对靶标蛋白质的局部序列或功能位点残基进行相似性搜索而进行功能注释[4]。第二类为基于结构信息的蛋白质功能注释方法。它通过将靶标蛋白质的三维结构与已知结构和功能的蛋白质或SCOP、CATH及The Structure Function Linkage Database等数据库中的结构进行相似性比对以对靶标蛋白质进行功能注释[5];或通过对蛋白质的局部结构特征, 如clefts和pockets的几何结构、表面电荷等, 进行相似性搜索以进行功能注释[6]。第三类为基于模块的蛋白质功能注释方法。这些模块通常由一些与功能直接相关的、并形成特定空间结构的氨基酸残基组成, 这类方法通过与这些已知模块进行相似性比对以对蛋白质进行功能注释[7]。第四类为基于进化轨迹的蛋白质功能注释方法。这类方法通过对比对序列进行系统发生分析, 找到功能关键性残基, 并把它们映射到蛋白质结构中, 得到三维结构模块, 并通过相似性比对搜索为靶标蛋白质进行功能注释[8]。第五类为基于集成学习的蛋白质功能注释方法。这类方法通过集成前四类蛋白质功能注释方法以提高模型的预测准确率[3]。第六类为基于网络结构的蛋白质功能注释方法。基因或基因产物构成网络结构的各个节点, 节点间的连线表示其相互关联, 暗示它们具有功能上的相似性。这种网络结构不仅可以考虑节点间序列、结构和进化上的相关性, 还可以加入节点间如蛋白质-蛋白质相互作用、基因共表达、系统共发生及文献中共同存在等功能关联信息。

2 新型机器学习介绍

目前虽然已提出了大量的用于蛋白质功能注释的计算方法, 但是蛋白质的功能多样性对蛋白质功能注释工作提出了更大的挑战[1]。研究表明, 大部分蛋白质含有多个功能结构域[9], 并具有多种功能, 如何对这些多功能蛋白质进行准确的功能注释显得非常重要和紧迫。目前通常的做法是通过构建多个二类分类器对这些多功能蛋白质进行注释[3], 但结果不尽人意, 所以构建更为快速科学的多功能蛋白质预测模型显得非常必要。Zhou (2007) 针对客观世界诸多真实的学习问题提出了多示例多标记学习 (multi-instance multi-label learning, MIML) 的概念 (图1) , 并把它成功应用于场景分类的学习问题[10]。研究发现, 其实含有多个结构域的多功能蛋白质的GO功能注释问题是个典型的多示例多标记学习问题。自Zhou (2007) 提出MIML学习的概念之后[10], 它已成为机器学习领域的又一热点, 涌现了很多优秀的MIML学习算法, 如MIMLBOOST、MIMLSVM、MIMLSVM+等, 并成功应用于场景分类、分本分类、图像分类、基因表达图谱注释和革兰氏阳性细菌蛋白质亚细胞定位等多个问题中。为了解决MIML学习过程中可能的信息丢失问题, D-MIMLSVM和MIML-kNN算法又被提出。另外, 为了探讨研究对象中示例与标记间的关联信息并用于提高模型的预测准确率, 又提出了MIMLRBF、M3MIML和MLMIL等算法。为了提高模型的预测性能, E-MIMLSVM+算法还在模型中整合了多个标记间隐含的关联信息。

3 结语

如果引入MIML学习思想, 针对多功能蛋白质构建新的功能预测方法, 并深入挖掘蛋白质结构域与功能间及蛋白质多个GO功能注释间隐含的关联信息, 以提高模型的预测准确率, 并应用于多种蛋白质及全基因组蛋白质的功能预测。这对全面快速进行蛋白质功能注释、了解蛋白质的生物学功能及其药物开发和疾病治疗都有着非常重要的作用。它将为蛋白质功能注释工作提供普遍适用的新方法, 为解决注释工作中面临的功能多样性难题提供新思路, 为大尺度全面开展蛋白质功能注释工作奠定基础。这对广泛理解蛋白质生物学功能, 药物的开发和疾病的治疗等具有非常重要的意义, 相信这也将是国际同行竞争的一个热点。

参考文献

[1]Erdin S, Lisewski AM, Lichtarge O:Protein function prediction:towards integration of similarity metrics.Curr Opin Struct Biol2011, 21:1-9

[2]Barrell D, Dimmer E, Huntley RP, Binns D, O'Donovan C, Apweiler R:The GOA database in2009--an integrated Gene Ontology Annotation resource.Nucleic Acids Res2009, 37 (Database issue) :D396-403

[3]Hawkins T, Luban S, Kihara D:Enhanced automated function prediction using distantly related sequences and contex-tual association by PFP.Protein Sci2006, 15:1550-1556

[4]Tian W, Arakaki AK, Skolnick J:EFICAz:a comprehensive approach for accurate genome-scale enzyme function infer-ence.Nucleic Acids Res2004, 32:6226-6239.

[5]HolmL, RosenstromP:Dali server:conservation mapping in3D.Nucleic Acids Res2010, 38 (Suppl.) :W545-W549

[6]Tseng YY, Dundas J, Liang J:Predicting protein function and binding profile via matching of local evolutionary and geometric surface patterns.J Mol Biol2009, 387:451-464

[7]Wallace AC, Laskowski RA, Thornton JM:Derivation of3D coordinate templates for searching structural databases:application to Ser-His-Asp catalytic triads in the serine pro-teinases and lipases.Protein Sci1996, 5:1001-1013

[8]Ward RM, Venner E, Daines B, Murray S, Erdin S, Kristensen DM, Lichtarge O:Evolutionary Trace Annotation Server:automated enzyme function prediction in protein structures using3D templates.Bioinformatics2009, 25:1426-1427

[9]Yeats C, Redfern OC, Orengo C:A fast and automated solution for accurately resolving protein domain architectures.Bioinformatics2010, 26 (6) :745-751

上一篇:中国语境下的英语教学下一篇:新课程下的作文教学