随机变量的分解论文

2024-07-14

随机变量的分解论文(精选12篇)

随机变量的分解论文 第1篇

关键词:随机变量,期望曲线,相关系数,随机变量的分解

0 引言

文献[1]通过在概率论中引入“零变量”概念,首次将高等代数中的向量空间理论应用于概率论的研究中,得出一些有意义的结果。本文在此基础上,将随机变量看成向量,在第二节利用文献[2-4]中有关向量分解的定理,得到了随机变量的分解定理。并在第三节中利用得到的分解定理,讨论了二维随机变量相关系数的几何意义,给出了未知分布的情况下,相关系数的一种估计方法。

1 随机变量的分解

我们的目的是将(ξ,η)中的一个变量表示成另一随机变量的函数与一个性质明确的随机变量之和。

引理[2]1设W是欧氏空间V的一个有限维子空间,存在V的一个子空间W⊥,有V=W茌W⊥,因而V中的每一向量η可唯一表示成η=ξ+ζ,这里ξ∈W,<ζ,W>=0。

引理2(ξ,η)是二维标准正态分布,φ(x,y)是其联合分布密度函数,则有:(1)E(E(η/ξ))=E(η);(2)对任一h(ξ)(E(h2(ξ))存在),有E(η-E(η/ξ))2燮E(η-h(ξ))2;(3)E(ξE(η/ξ))=ρξn,E(ξ(η-E(η/ξ))=0。

上述结果说明,当ξ=x时,E(η/(ξ=x))是η的中心,我们称E(η/(ξ=x))为η关于ξ的期望曲线。E(η/ξ)是所有h(ξ)(E(h2(ξ))存在)中,使得E(η-h(ξ))2达到最小。ξ与η的相关系数ρξn实际上是ξ与E(η/ξ)乘积的均值,ξ与η-E(η/ξ)不相关。

定理1设(ξ,η)是二维标准正态分布,φ(x,y)是其联合分布密度函数,若满足下列条件:(1)E(f2(ξ))存在,(2)ξ与ζ不相关,(3)ζ的均方误差最小,则η可唯一的表示为η=f(ξ)+ζ,其中f(ξ)=E(η/ξ)。

证明设V[f]=E(η-f(ξ))2,其中V[f]是以f(x)为未知函数的泛函。

推论二维标准正态分布(ξ,η)中的任一分量,可唯一分解为另一随机变量的具有二阶矩的函数与一个统计学性质好的随机变量ζ之和,其中ζ的性质如下:

2 相关系数的几何意义

令向量函数L(ξ)=aξ+b,由引理2知,E(η/ξ)是所有h(ξ)(E(h2(ξ))存在)中“最靠近”η的函数。利用最小二乘法,使得L(ξ)与期望曲线E(η/(ξ=x))最接近,得a,b到的最小二乘估计分别为

由随机变量分解定理及相关系数的几何解释,可得以下结论:

(1)相关系数ρξη是“最靠近”期望曲线(x,E(η/(ξ=x))(最小二乘意义下)的直线L(ξ)的斜率,称该直线η为关于ξ的回归直线。(2)由E(ξE(η/ξ))=ρξη知,ξ与n的相关问题即为ξ与f(ξ)=E(η/ξ)的相关问题。(3)在联合分布未知的情况下,寻找相关系数ρξη的估计值的新方法。若给定(ξ,η)一组样本值(xi,yi)(i=1,2,……n),则

3 结束语

在向量理论应用于概率论研究的基础上,将随机变量看成向量,利用向量理论中有关空间向量分解的定理,得到了如下结论:

3.1 二维连续型随机变量(ξ,η)中,分量η可唯一表示成η=E(η/ξ)+ζ其中ζ具有好的统计学性质。

3.2 相关系数ρξη是“最靠近”期望曲线(x,E(η/ξ=x))的一条直线的斜率,从而在联合分布未知的情况下,得到了ρξη的一种新的估计方法。

参考文献

[1]张同琦,李凤.向量理论在概率论中的应用[J].科学技术与工程,2010,10(2):377-379.

[2]张禾瑞,郝柄新.高等代数[M].北京:高等教育出版社,1999:310-318.

[3]刘泽文.相对论热力学向量理论[J].中国科学A辑,1994,(9):22-26.

很好的离散型随机变量(本站推荐) 第2篇

“离散型随机变量”的教学反思与再设计

一、教学内容解析

概率是研究随机现象的数量规律的.认识随机现象就是指:知道这个随机现象中所有可能出现的结果,以及每一个结果出现的概率.而对于给定的随机现象,首先要描述所有可能出现的结果.在数学上处理时,一个常用的、也很自然的做法就是用数来表示结果,即把随机试验的结果数量化,使得每个结果对应一个数,这样就可以通过实数空间(定量的角度)来刻画随机现象,从而就可以利用数学工具,用数学分析的方法来研究所感兴趣的随机现象.简言之,随机变量是连接随机现象和实数空间的一座桥梁,它使得我们可以借助于有关实数的数学工具来研究随机现象的本质,从而可以建立起应用到不同领域的概率模型,这便是为什么要引入随机变量的缘由.随机变量在概率统计研究中起着极其重要的作用,随机变量是用来描述随机现象的结果的一类特殊的变量,随机变量能够反映随机现象的共性,有关随机变量的结论可以应用到具有不同背景的实际问题中.随机变量就是建立了一个从随机试验结果的集合到实数集合的映射,这与函数概念在本质上(一种对应关系)是一致的,随机试验结果的范围相当于函数的定义域,随机变量的取值范围相当于函数的值域.

离散型随机变量是最简单的随机变量,随机变量和离散型随机变量是上、下位概念的关系.本节课主要通过离散型随机变量展示用实数空间刻画随机现象的方法.本节课的重点是认识离散型随机变量的特征,了解其本质属性,体会引入随机变量的作用.

二、教学目标解析

1.在对具体实例的分析中,认识和体会随机变量对刻画随机现象的重要性和建立随机变量概念的必要性,并会恰当地定义随机变量来描述所感兴趣的随机现象,能叙述随机变量可能取的值及其所表示的随机试验的结果;

2.在列举的随机试验中,通过对随机变量取值类型的分辨,归纳和概括离散型随机变量的特征,形成离散型随机变量的概念,并会利用离散型随机变量刻画随机试验的结果;

3.在举例、观察、思考、发现中经历将随机试验结果数量化的过程,渗透将实际问题转化为数学问题的思想方法,进一步形成用随机观念观察和分析问题的意识.

三、教学问题诊断分析

本节课学生学习的难点是对引入随机变量目的与作用的认识,以及随机变量和普通变量的本质区别.随机变量这个概念其实早已存在于学生的意识之中,而且在不少场合都已不自觉的“实际使用”,只是没有明朗化.学生学习这一概念就是把这些“实际使用的”规则、程序、步骤等进一步加以明确.所以,教师的责任就是为学生建立随机变量这个概念修通渠道.可通过学生熟悉的掷骰子的随机试验让学生体会随机变量概念的发生,在师生举例中来体会随机变量概念的发展,特别是诸如抛掷一枚硬币等试验,其结果不具有数量性质,怎么让学生自然地想到用数来表示其试验结果,并且所用的数又尽量简单,便于研究.教学中需多举试验结果本身已具有数值意义的实例,来发挥正迁移作用.通过多举例让学生理解:一旦给出了随机变量,即把每个结果都用一个数表示后,认识随机现象就变成认识这个随机变量所有可能的取值和取每个值时的概率.

另外,随机变量和离散型随机变量是上、下位概念的关系,从学习的认知方式看,下位学习依靠的主要是同化,上位学习依靠的主要是顺应,上位学习一般采用的思维方法主要是概括和综合,它主要通过改造(归纳和综合)原有认知结构中的有关内容而建立新的认知结构.因此,从这一角度来分析,学生对随机变量概念的学习和真正理解比离散型随机变量的学习要困难一些.故在随机变量的教学中,要特别重视学生举例,让学生在充分的自主活动中体验数学化的过程,体验将随机试验结果数量化的过程,体会随机变量对刻画随机现象的重要性和研究随机现象的工具性作用,从而来把握随机变量的内核.

四、教学支持条件分析

学生在必修3概率一章中学习过的随机试验、随机事件、简单的概率模型和必修1中学习过的变量、函数、映射等知识是学习、领悟和“接纳”随机变量概念的重要知识基础,教学时应充分注意这一教学条件;另外,为更好地形成随机变量和离散型随机变量两个概念,教学中可借助媒体列举和展现丰富的实例和问题,以留给学生更多的时间思考和概括.

五、教学过程设计

(一)教学基本流程

(二)教学过程

1.理解随机变量概念

问题1:抛掷一枚骰子,可能出现的结果有哪些?概率分别是多少? [设计意图] 以学生熟悉的随机试验为例,在复习旧知中孕育新知.

[师生活动] 画表一,指出试验结果分别有“1点的面朝上”、“2点的面朝上”、“3点的面朝上”、“4点的面朝上”、“5点的面朝上”、“6点的面朝上”,它们都是基本事件.为了研究这些事件,常常把它们分别与一个数字对应起来.比如,用数字1与“1点的面朝上”这个试验结果(样本点)对应,用数字2与“2点的面朝上”这个试验结果(样本点)对应,等等.师生共同填写数字,形成表二.

引导学生分析,像这样“用数字表示随机试验的结果”的量用X来表示,它可以取集合{1,2,3,4,5,6}的值,说明X是一个变量.

[设计意图] “用数字来表示随机试验的结果”实际上早已存在于学生的意识之中,而且在不少场合都已不自觉地“实际使用”,如射击比赛中会用“环数”去表示射击成绩,掷骰子时会用“点数”去表示掷出结果,抽奖时会先对奖券“编号”,随机抽取一部分学生时会用“学号”去代替等等,只是没有明朗化.因而,“用数字来表示随机试验的结果”可以通过教师有启发地提问,有意义地讲授进行,让学生觉得问题的提出,概念的发生、发展过程较为自然,能够从教师的讲授中感受数学是怎样一步步研究现实世界的.

问题2:在这里(指着表二),每一个试验结果用唯一确定的数字与它对应,这个对应关系是什么?

[设计意图]建立一个从试验结果的集合到实数集合的映射.让学生感悟:一旦给出了随机变量,即把每个结果都用一个数表示后,认识随机现象就变成认识这个随机变量所有可能的取值和取每一个值时的概率,从而感受把随机试验的结果数字化(成为实数)的必要性,体会引入随机变量的必要性.同时让学生感受概念的从无到有、自然形成的过程.

[师生活动] 启发诱导,引导学生发现在这里建立了一个从试验结果的集合到实数集合的映射.形成下表三:抛掷一枚骰子

让学生观察、思考:刚才,用数字表示试验结果的变量X,它根据什么在变化?让学生发现它的取值随试验结果的变化而变化,它的变化是有规律的,这是个特殊的变量,与随机试验的结果有关,在试验之前不知道会出现哪个值(即它的取值依赖于试验结果,因此取值具有随机性,即在试验之前不能肯定它的取值,一旦完成一次试验,它的取值随之确定).同时,教师指出:在这个试验中,我们确定了一个对应关系(也即建立了一个试验结果到实数的映射)使得每一个试验结果(样本点)都用一个确定的数字表示(即所有可能取值是明确的).在这个对应关系下,数字随着试验结果的变化而变化.像这种随着试验结果变化而变化的变量称为随机变量.随机变量常用字母表示.

问题3:随机变量这个概念与我们曾经学过的函数概念有类似的地方吗?

[设计意图]引导学生与曾经学过的函数概念比较,从而加深对随机变量概念的理解.

[师生活动]“类比”函数概念,领悟随机变量和函数概念在本质上都是一种对应关系,都是一种映射,随机变量把随机试验的结果映为实数,函数把实数映为实数,在这两种映射之间,试验结果的范围相当于函数的定义域,随机变量的取值范围相当于函数的值域.随机变量的取值范围我们称为随机变量的值域.如抛掷一枚骰子,随机变量的值域为;

引导学生利用随机变量表达一些事件,例如抛掷一枚骰子中,表示“1点的面朝上”; “3点的面朝上”可以用表示;表示“5点的面朝上”或“6点的面朝上”.

同时指出:通过映射把随机试验结果与实数进行对应,也就是,把随机试验的结果数量化,用随机变量表示随机试验的结果,这样“随机试验结果的集合到对应概率集合的映射”就可以用“随机变量的取值集合到对应概率集合的映射”来表示,即可把“对随机现象统计规律的研究具体转化为对随机变量概率分布的研究”.这样我们就可以借用有关实数的数学工具来研究随机现象的本质了.

接着,进一步指出:在学习《数学(必修3)》时我们曾经学习过概率、方差等概念,学过简单的概率模型,在今后的学习中,我们将利用随机变量描述和分析某些随机现象,进一步体会概率模型的作用及运用概率思想思考和解决一些实际问题.(体现章引言)

2.对随机变量的深刻认识(对对应思想——映射的体验)

问题4:你能再举些例子吗?(请学生列举随机试验,并将试验结果数量化,不必写出概率)

[设计意图] 让学生参与举例,体验将实际问题数学化(把实际问题数学化是学习数学极其重要的数学方法)和将随机试验结果数量化的过程.其意义在于两个方面:其一,学生通过寻找(寻找本身就是一个甄别随机与非随机的过程),选择自己感兴趣的随机现象,并学会用随机变量表示随机事件;其二,在将试验结果数量化的过程中体会随机变量在研究随机现象中的重要作用.同时进一步深刻理解随机变量的概念,领悟随机变量学习的重要性,进一步形成用随机观念观察和分析问题的意识.

[师生活动]教师关注学生的举例,关注其关键过程:随机试验中所有可能出现的结果有哪些?如何将试验的结果数量化?要求学生画表,体会映射的过程.教师给学生充分展示和交流所举例子的时间.同时,教师也参与举例(教材中有关于抽取产品、射击、浏览某网页等例子可以纳入进来),深刻体会将实际问题(随机现象)数学化(数字化)的过程,感受建立随机变量概念的重要意义.

对学生列举的试验结果没有数量标志的随机事件,诸如投掷一枚硬币的试验等,要引导学生分析比较,让学生体会对于同一个随机试验,可以用不同的随机变量来表示.但用哪两个数字来表示,主要是要尽量简单,合理,便于研究.如表四:抛掷一枚骰子

在学生举例中学习如何用随机变量去定义试验结果没有数量标志的随机事件(中间表示映射的一栏表格可以省略).

问题5:任何随机试验的所有结果都可以用数字表示吗?同一个随机试验的结果,可以用不同的数字表示吗?

[设计意图]让学生领悟任何随机试验的所有结果都可以用数字来表示(试验结果不具有数量性质的可以通过赋值,将其数量化),同一个随机试验的结果,可以用不同的数字表示,表示的原则主要是有实际意义,简单合理,便于研究.

3.形成离散型随机变量概念

问题6:随机变量的取值都是整数吗?你能否举个(些)例子,而随机变量的取值不是整数呢?

[设计意图] 关注学生的举例,借学生举出的例子,引导分析数学化之后的随机变量取值的集合的特征(一个新概念产生之后,我们应该端详它一番),分辨随机变量的类型,即某些随机变量的取值是离散的,而有些不是,从而给出离散型随机变量的概念.如果学生列举的都是离散型随机变量,则教师可启发点拨,启发后引导学生再举例,或给出以下问题7:

问题7:请仿照刚才的例子,分析下列随机现象,随机变量可以取哪些值?你能够一个一个列出来吗?

(1)某公交车站每隔10分钟有1辆汽车到站,某人到达该车站的时刻是随机的,他等车的时间;

(2)检测一批灯泡(相同型号)的使用寿命.

[设计意图]通过与前面列举例子的比较,引导学生发现这两个试验结果中,表示随机事件的随机变量的取值是一个区间,其值无法一一列出,以此形成离散型随机变量的概念.同时明晰在随机现象中随机变量的取值类型是丰富多样的,这也是对随机变量概念(外延)的进一步认识.

问题8:如果我们仅仅关心“某人等车的时间多于5分钟或不多于5分钟”两种情况,那该怎样定义随机变量呢?

[设计意图] 在研究随机现象时,为研究方便,有时需要根据所关心的问题恰当地定义随机变量.让学生明白恰当定义随机变量给我们研究问题带来方便.问(2)让学生选择自己关心的问题来恰当定义随机变量.

[师生活动]通过分析,让学生明白,在研究随机现象时,有时需要根据所关心的问题恰当地定义随机变量.

4.练习反馈(见教科书第45页)

下列随机试验的结果能否用离散型随机变量表示?若能,请写出各随机变量可能的取值并说明这些值所表示的随机试验的结果.

(1)抛掷两枚骰子,所得点数之和;

(2)某足球队在5次点球中射进的球数;

(3)任意抽取一瓶某种标有2500ml的饮料,其实际量与规定量之差.

[设计意图]在应用中巩固离散型随机变量的概念,并能熟练利用离散型随机变量刻画随机试验的结果.

5.小结回授

问题9:你能用自己的语言描述随机变量和离散型随机变量的定义及它们之间的区别吗?(学生回答后,可以再问:你能简单地说说引入随机变量的好处吗?)

[设计意图] 学生用自己的语言来概括本节课学到的知识,是一种“主动建构”,也真正体现知识学到了手.

[师生活动]引入随机变量后,随机试验中我们感兴趣的事件就可以通过随机变量的取值表达出来.认识随机现象就变成认识这个随机变量所有可能的取值和取每个值时的概率.也即把随机试验的结果数量化,用随机变量表示随机试验的结果,我们就可以借助于有关实数的数学工具来研究所感兴趣的随机现象了.

六、目标检测设计

生活中的随机变量问题 第3篇

同学们应该了解,经济生活包括金融(银行、保险、证券)和实业(设计、取料、生产、物流、销售)两方面.实际应用中,很多基本的不确定量(随机变量)的概率分布是依靠历史(经验与统计数据)来确定的.因此数学不是万能的,实际发生的(历史的、经验的)可量化的(数据)和不可量化的事物才是最重要的.

一、 假如你是保险公司的老板

例1 据统计,一年中,一个家庭万元以上财产被窃的概率为0.01,保险公司设计了一年期万元以上家庭财产保险,参加者需要交保险费100元,若在一年内,万元以上财产被窃,则保险公司赔偿a元(a>100),问a如何确定,可使保险公司获益?

解 设保险公司的收益为ξ,则ξ的分布列为:

所以期望Eξ=100×0.99+(100-a)×0.01=.

令Eξ>0,又a>100,所以100

即将a确定在区间(100,10 000)内(单位:元),保险公司有望获益.

二、 假如你是花店的老板

例2 春节期间,某鲜花店某种鲜花的进货价为每束2.5元,销售价为每束5元,若在春节期间内没有售完,则在春节结束后以每束1.5元的价格处理,据前5年的有关资料统计,春节期间这种鲜花的需求量X服从以下分布:

问该鲜花店今年春节前应进该鲜花20束,30束,40束,还是50束?

分析 售出一束鲜花能获利2.5元,处理一束鲜花则将亏损1元.由于鲜花的需求量X为随机变量,故应求出各种进货量下利润的期望.

解 若进货量为20,则由P{X≥20}=1,得利润的期望E1=1×20×2.5=50(元);

若进货量为30,则由P{X=20}=0.2,P{X≥30}=0.8,得利润的期望E2=0.20×(20×2.5-10×1)+0.8×30×2.5=68(元);

若进货量为40,则由P{X=20}=0.2,P{X=30}=0.35,P{X≥40}=0.45,得利润的期望E3=0.20×(20×2.5-20×1)+0.35×(30×2.5-10×1)+0.45×40×2.5=73.75(元);

若进货量为50,得利润的期望E4=0.20×(20×2.5-30×1)+0.35×(30×2.5-20×1)+0.3×(40×2.5-10×1)+0.15×50×2.5=69(元).

故利润期望的最大值为E3=73.75(元),因此鲜花的最佳进货量为40束.

三、 假如你想投资理财

例3 你有10万元,现有两种投资方案:一是购买股票,二是存入银行.买股票的收益主要取决于经济形势,假设可分三种状态:形势好、形势中等、形势不好(即经济衰退).如果形势好,则一年期可获利40 000元;如果形势中等,则一年期可获利10 000元;如果形势不好,则一年期要损失20 000元.存入银行的收益是利息,假设年利率为8%,即一年期可得利息8 000元.又设年经济形势好、中等、不好的概率分别为30%,50%和20%,试问该投资者应选择哪一种投资方案?

分析 购买股票的收益与经济形势有关(不确定),存入银行的收益与经济形势无关(确定).因此要确定选择哪一种方案,就必须先计算购买股票一年期收益的期望,然后与存入银行一年期的收益进行比较.

解 由题设,一年中购买股票在不同的经济形势下对应的收益与概率如下表所示:

初步看上表,可以得出:如果经济形势好或经济形势中等,则购买股票是合算的;但如果经济形势不好,则存入银行比较好.

下面通过计算来分析:如果购买股票,则其收益的期望E=40 000×0.3+10 000×0.5+(-20 000)×0.2=13 000(元);如果存入银行,则其收益为8 000(元).

因此,按期望收益最大原则,应选择购买股票.

点评 值得说明的是,这里是按风险决策中的期望收益最大准则选择方案,这种做法有风险存在.因为在实际生活中,经济形势好、中等、不好是无法给出准确概率值的.这只是一道理想化、简单化的数学题.

1. 从汽车东站驾车至汽车西站的途中要经过8个交通岗,假设某辆汽车在各个交通岗遇到红灯是相互独立的,并且概率都是.求:

(1) 这辆汽车在首次遇到红灯前恰好经过两个交通岗的概率;

(2) 这辆汽车在途中遇到红灯数ξ的期望.

2. 某大厦的一部电梯从底层出发后只能在第18,19,20层停靠.若该电梯在底层载有5位乘客,且每位乘客在这三层中的每一层下电梯的概率均为,用ξ表示这5位乘客中在第20层下电梯的人数,求随机变量ξ的分布列及期望.

3. 购买某种保险,每个投保人每年度向保险公司交纳保险费a元,若投保人在购买保险的一年度内出险,则可以获得10 000元的赔偿金.假定在一年度内有10 000人购买了这种保险,且各投保人是否出险相互独立.已知保险公司在一年度内至少支付赔偿金10 000元的概率为1-0.999104 .

(1) 求一投保人在一年度内出险的概率p;

(2) 设保险公司开办该项险种业务除赔偿金外的成本为50 000元,为保证盈利的期望不小于0,求每位投保人应交纳的最低保费.

1. (1) P=1-×1-×=;

(2) Eξ=8×=.

2. 依题意,ξ~B5,,ξ的分布列为:

Eξ=5×=.

3. 记投保的10 000人中出险的人数为ξ,则ξ~B(104,p).

(1) 记A表示事件:保险公司为该险种至少支付10 000元赔偿金,则发生当且仅当ξ=0,故P()=P(ξ=0)=(1-p)10 4.

又P(A)=1-0.999104,且P(A)+P()=1,故p=0.001.

(2) 依题意,该险种的总收入为10 000a元,总支出为(10 000ξ+50 000)元,故总盈利=10 000a-(10 000ξ+50 000)(元),总盈利的期望E=10 000a-10 000Eξ-50 000(元).

由ξ~B(104,10-3),知Eξ=10 000×10-3.

二维随机变量的分布函数 第4篇

二维随机变量的分布函数为求A, B, C的值。

本文由这道概率习题联想到了如下几个问题:二维随机变量的分布函数是否唯一;三元三次方程组解的唯一性。为了求解该问题, 我们将用到如下内容:

定义1:随机变量X和Y的联合分布函数F (x, y) 定义为下式:

F (x, y) 表示事件{X≤x}和{Y≤y}同时发生的概率, 式中x, y是两个任意实数。

性质1:二维随机变量 (X, Y) 的分布函数满足:

该题解为:根据二维随机变量分布函数的性质有:

故, 由 (5) 得。由 (5) 得, 代入 (4) 得:AC=AB

解得:。我们将其代入分布函数, 并取特殊:x=0, y=0, 经验证, 满足分布函数定义, 是我们要的解。那我们就想这个解是否唯一呢?又想去掉一个方程又会怎样?我们不妨把 (4) 去掉, 得到:

解得:, 是方程组的解, 且解不唯一。那么它满足分布函数要求吗?我们将其代入分布函数, 并取特殊:x=0, y=0经验证F (0, 0) <0, 故此解不是我们要的解, 舍掉。同理, 我们把方程 (3) 去掉, 得到:

解得:, 是方程组的解, 且解不唯一。那么它满足分布函数要求吗?我们将其代入分布函数, 并取特殊:x=0, y=0经验证F (0, 0) <0, 故此解不是我们要的解, 舍掉。同理, 我们把方程 (2) 去掉, 得到:

解得:, 是方程组的解, 且解不唯一。那么它满足分布函数要求吗?我们将其代入分布函数, 并取特殊:x=0, y=0经验证F (0, 0) <0, 故此解不是我们要的解, 舍掉。同理, 我们把方程 (1) 去掉, 得到:

解得:, 是方程组的解, 且解不唯一。那么它满足分布函数要求吗?我们将其代入分布函数, 并取特殊:x=0, y=0经验证, 故此解不是我们要的解, 舍掉。至此, 我们得到:原方程组解唯一, 且所有方程都不能去掉。并且说明二维随机变量的分布函数是唯一的。做到这我们想到:三元三次方程组要有什么条件才能得到唯一的解呢?

我们不妨设ABC=x, AC=y, AB=z则原方程组可化为四元一次线性方程组:

通过该方法把原方程组降次得到四元一次线性方程组, 故原方程组有唯一解只有当且仅当方程组有四个方程时, 才有唯一解。所以得到:二维随机变量的分布函数是唯一的。至于三元三次方程组要有什么条件才能得到唯一的解呢?就有待各位同行们去进一步的研究。

参考文献

[1]刘照升.概率论与数理统计.中国矿业大学出版社, 2011, 71~93.

[2]魏宗舒.概率论与数理统计教程.高等教育出版社, 1999, 102~179.

[3]杜红.线性代数.科学出版社, 2007.

[4]北京大学数学系几何与代数教研室代数小组.高等教育出版社.1999.

随机变量的分解论文 第5篇

人民教育出版社中数室 田载今

随机变量是因随机试验结果的变化而变化的量.由于随机试验的结果是事先无法确定的,所以表示随机试验结果的量要因结果的不同而变化,这样的量当然属于随机变量.随机变量的本质是定义在样本空间Ω上的一个映射,它把试验结果映为实数,即其中,且对任意实数x,由满足

R,的基本事件所组成的集合也是一个事件.

引入随机变量的概念,其作用不仅是把随机试验的结果数量化从而带来表示方法的简化,更重要的是把对随机现象统计规律的研究数学化,从而可以利用数学方法研究随机现象的规律性,其中对随机变量的概率分布的研究是实现这种转化的关键.

如果样本空间是可数的,即量的取值

或,则随机变也可以一一列出,这样的随机变量即离散型随机变量.离散型随机变量比连续型随机变量更容易理解,它是高中数学学习的主要随机变量类型.

一般地,关于离散型随机变量的教学目标大多规定为:

通过具体实例,归纳概括离散型随机变量的特征,得出离散型随机变量的概念;

体会引入随机变量的作用;

渗透将实际问题转化为数学问题进行随机分析的思想方法.

目前的高中数学教材中,离散型随机变量和离散型随机变量的分布列大都先后出现在两个小节中的内容.从教师教学用书中所附的教学设计案例和一般的实际教学过程看,将这两个内容分在两节课中学习是一般的教学安排.在这部分内容的第一课时中,通常只安排关于离散型随机变量概念的内容,而不涉及离散型随机变量的分布列.笔者认为,这样安排是有一定道理的:第一,离散型随机变量是基础概念,离散型随机变量的分布列是针对离散型随机变量而定义的,从逻辑关系上说两者有先后之分;第二,两个概念的第一次出现分在不同课时内,学习内容单一,目标明确,可以将其分别解决,避免认识不清而产生混淆,从而使基本概念学得更扎实牢固;第三,这样处理与现行教材的课文、练习、习题的安排顺序保持基本一致,便于学生自学和做作业.

兵法曰:兵无常态,水无常势.这就是说解决问题的方法不是一成不变的,应根据实际情况权衡利弊相机行事.同样地,教学有法,教无定法.一种教学设计难以方方面面都能兼顾,往往在保证了一些方面有利的同时,也存在另一些方面的不足.如前所述,引入离散型随机变量的概念,体会引入随机变量的作用,渗透将实际问题转化为数学问题进行随机分析的思想方法,是本部分的教学目标,三者是相互联系的一个整体(三位一体).如果只是引入离散型随机变量的概念,而不能较明显地体现为什么要引入它,则会影响对其作用和相关思想方法的体会.要体现引入随机变量的作用,渗透将实际问题转化为数学问题进行随机分析的思想方法,显然离不开对离散型随机变量的概率分布的研究,这是把对随机现象统计规律的研究数学化的关键.从这个角度看,如果能在同一课时中引入离散型随机变量后,紧接着出现分布列,使两者更密切地联系起来,可能更有利于教学目标的实现.

笔者考察实际教学发现,在一节课中仅讨论离散型随机变量,内容上显得比较单薄,时间上显得比较宽余,效果上显得比较拖沓,从提高教学效率考虑似还有潜力可挖.更重要的是,如果只引入随机变量而不涉及概率分布,这节课至多只能使人感到随机变量是对试验结果的一种数量化表示,而无法认识这种表示与随机度量(即可能性大小)的密切联系,这使得体会随机变量作用的效果大打折扣.在高中数学教材的向量部分,曾指出“如果没有运算,向量只是一个‘路标’,因为有了运算,向量的力量无限.”与此类似,如果不涉及概率分布,随机变量只是一种“表示”,因为有了概率分布,随机变量才能在研究随机现象时发挥作用.

笔者认为,将离散型随机变量和其分布列更紧密地联系起来,在实际教学中具有可行性.为说明这一点,笔者不揣冒昧地提出如下一种教学过程的设计草案,敬请读者指正.

离散型随机变量及其分布列第一课时的教学过程草案

一、描述随机变量

试验结果经常可以用表示计数或度量的量来表示,例如出现某种现象的次数,某物理量的长度,等等.即使是定性的试验结果,也可以数量化表示.例如掷硬币时,正面向上记为1,反面向上记为0.表示随机试验结果的量,其取值事先不能确定,它随着试验结果随机确定.一般地,随着试验结果的变化而变化的量叫做随机变量(random variable).随机变量通常用

表示.

二、考虑随机试验案例及相关问题

请看下面的随机试验,并考虑相关问题.

随机试验1 掷一枚质地均匀的骰子.

(1)用X表示掷出的点数,要表示试验的全部可能结果,X应取哪些值?

掷骰子时,掷出的点数可能是1,2,3,4,5,6中的一个,但事先不能确定,结果是随机产生的.用X表示掷出的点数,X的值应随机地取1,2,3,4,5,6中的某个.

(2)X取到每一个值的概率各是多少?

由古典概型可知,X取1,2,3,4,5,6中每一个值的概率都是下:

这可以列表表示如

(3)X<5表示什么?它对应的概率是多少?

X<5表示事件“点数小于5”,即事件“点数为1或2或3或4”.它的概率为

(4)如果多次重复掷一枚骰子,那么掷出点数的平均值最可能是多少?

每次掷出的点数无法事先确定,因此多次掷出的点数的平均值也无法事先确定.但是,我们可以依据“大量重复试验时频率稳定于概率”对此进行估计.由于点数1,2,3,4,5,6出现的频率都会稳定于,所以多次重复掷骰子时点数的平均值最可能是

随机试验2 同时掷两枚质地均匀的硬币.

(1)用X表示掷出正面的个数,要表示试验的全部可能结果,X应取哪些值?

掷两枚硬币时,掷出正面的个数可能是0,1,2中的一个,但事先不能确定,结果是随机产生的.用X表示掷出正面的个数,X的值应随机地取0,1,2中的某个.

(2)X取到每一个值的概率各是多少?

由古典概型可知,X取0,1,2中每一个值的概率可以列表表示如下:

(3)X<2和X>0各表示什么?它们对应的概率各是多少?

X<2表示事件“正面个数小于2”,即事件“正面个数为0或1”; X>0表示事件“正面个数大于0”,即事件“正面个数为1或2”.它扪的概率分别为和.

(4)如果多次重复这个试验,那么掷出正面个数的平均值最可能是多少?

每次掷出的结果无法事先确定,因此多次掷出的正面个数的平均值也无法事先确定.但是,我们可以依据“大量重复试验时频率稳定于概率”对此进行估计.由于点数0,1,2出现的频率分别会稳定于,和,所以多次重复试验时正面个数的平均值最可能是

三、引出离散型随机变量及其分布列

思考1 上面两个X是随机变量吗?它们的取值形式有什么特点?这些取值与试验结果有什么关系?

在上述试验及相关问题中,两个X分别表示“点数”和“正面个数”,它们都是表示随机试验的结果的量,都随试验结果的变化而变化,因此都是随机变量.这两个随机变量的所有可能取值都可以一一列出,即分别为1,2,3,4,5,6和0,1,2.每一列数都对应着一个试验的所有可能结果.

一般地,所有可能取值能够一一列出的随机变量,叫做离散型随机变量(discrete random variable).

思考2 上面两个表格的形式有什么特点?它们表示了什么内容?

上面问题中的表格,分两行列出随机变量X的可取值,以及各值对应的概率.它不仅表示出离散型随机变量X的变化范围,而且表示出各种变化的可能性大小,即从变化内容及其可能性这两方面全面地刻画了离散型随机变量X.

一般地,表示离散型随机变量X的所有可能值及取各个值的概率的表格

叫做X的分布列(distribution series).X的分布列也可以表示为

容易发现,由于概率的和

思考3 初步体会离散型随机变量及其分布列的作用.

从上面的问题可以看出,对于研究随机试验问题,例如估计多次重复试验结果的平均值,离散型随机变量及其分布列是非常有用的工具.由此可以觉察,引入随机变量给定量地表示和研究随机性问题带来方便;有了离散型随机变量及其分布列,就可以对许多随机试验的结果从变化范围和变化可能性两方面有更清晰的认识.

四、例题

此处例题为巩固与加深对离散型随机变量及其分布列的一般认识而安排,二项分布、超几何分布等内容安排在后续课时.

例 用随机变量X表示掷两枚骰子的试验结果,并写出X的分布列.

解:设X表示两枚骰子的点数之和,则X的分布列为

与随机试验的全部可能结果一一对应,所以它们所对应的,根据X的分布列,可以求出有关事件的概率.例如,五、小结

1.回顾离散型随机变量及其分布列的概念;

2.初步体会离散型随机变量及其分布列在研究随机试验问题时的作用.

前面已经说过,教学有法,教无定法.教材和教学的设计方案具有多样性,不同方案各有长短.选择方案的关键在于从实际出发,在保证重点,突出要实现的主要教学目标的前提下,力求教学效果的最大化.笔者提出上述意见及教学设计,只是一孔之见,意在抛砖引玉,能为改进教材和教学的讨论提供参考.

拟可加模糊测度随机变量 第6篇

关键词:K-拟可加模糊测度 随机变量 数学期望

众所周知,模糊测度与模糊积分不满足一般的可加性,而在实际应用中存在着大量的非可加集函数。考虑到非可加集函数的存在性,1987年日本著名学者Sugeno[1]提出并建立了拟可加模糊测度和积分,在此基础上文[2]对给定的K算子和t算子具体定义了扩张加法和扩张乘法的运算,并建立tK积分和Kt积分。文[3]在结合文[1]和文[2]的基础上,取算子K=t得到了K-拟可加模糊积分及其积分转换定理。文[4]中對此进行了进一步的讨论。文[5]证明了K-拟可加模糊积分是一种K-拟可加模糊测度,研究了这种K-拟可加模糊积分的可数可加性和绝对连续性等。本文是在已有这些理论的基础上,讨论了K-拟可加模糊测度随机变量,定义了它的分布函数和数学期望并给出了它们的一些性质,证明了K-拟可加模糊测度空间上的马尔可夫不等式。从而丰富了K-拟可加模糊测度的理论,拓展了K-拟可加模糊测度理论的应用范围,为进一步研究K-拟可加模糊测度提供了理论依据。

设X是任一非空经典集合,为X上的子集构成的σ-代数,(X,F)表示可测空间。本文以下涉及的可测与可积函数f,均是指在Lebesgue意义下的可测与可积函数,不再特殊指出。

多维随机变量的特征函数及应用 第7篇

一、特征函数的定义及例子

(一) 特征函数的定义

(二) 特征函数的计算

X的特征函数就是x的函数的期望, 此时的函数是由X构造出来的复值随机变量的期望.

例1.1 设随机变量X服从退化分布, 即P = {X = c} =1, 求X的特征函数.

N维随机变量的特征函数:定义:设有n维随机变量X = (X1, X2, X3, … , Xn) , 则称:

为n随机变量 (X1, X2, X3, … , Xn) 的特征函数, 其中t = (t1, t2, … , tn) ∈Rn.

二、二维随机变量特征函数的性质

性质1:设随机变量 (X, Y) 的特征函数为φ (t1, t2) , 则有:

(1) φ (0, 0) =1, 且对任意t1, t2∈R,

|φ (t1, t2) |≤φ (0, 0) =1.

(3) φ (t1, t2) 于实平面上一致连续,

其中 φ1 (t1) , φ2 (t2) 分别为X以及Y的特征函数.

性质2: 设a1, a2, b1, b2皆为常数, (X, Y) 为二维随机变量, 则随机变量 (a1X + b1, a2Y + b2) 的特征函数为:

性质3:设随机变量 (X, Y) 的特征函数为 φ (t1, t2) , a1, a2, b为任意常数, 则Z = a1X = a2Y + b的特征函数为

性质4: 两个二元分布函数恒相等的充分必要条件是他们的特征函数恒等.

三、相互独立随机变量的特征函数

(一) 推理过程

定理2.3 n个随机变量相互独立的充分必要条件为: (X1, X2, X3, … , Xn) 的特征函数为:

(二) 二维随机变量函数的应用

例设二维随机变量 (X, Y) ~N (μ1, σ12, μ2, σ22, ρ) , 其中 ρ ≠0, 检验上述性质的正确性.

解二维随机变量 (X, Y) ~N (μ1, σ12, μ2, σ22, ρ) 其中 ρ ≠ 0, 所以X与Y不独立, 由文献[1]、[2]得X + Y~N (μ1+ μ2, σ12;σ22+ 2ρσ1σ2) , 且X, Y, X + Y相应和特征函数为:

相应特征函数的一阶、二阶导数分别为:

上述性质得到验证.

参考文献

[1]张峰, 朱志峰.多维随机变量的特征函数及应用[J].中北大学学报 (社会科学版) , 2008, S1:51-53.

[2]邓誉.随机波动率模型下一篮子期权的定价[D].广西师范大学, 2010.

关于随机变量的几个基本问题 第8篇

关键词:阶梯函数,连续型随机变量,边缘分布

概率论是研究随机现象的科学,通俗地讲,就是研究某种现象或某个事件发生的可能性大小,比如投掷硬币,出现正、反面的可能性有多大;在路上,偶遇一个孕妇,那么此孕妇生男孩和生女孩的可能性又各有多大?这个可能性就是概率论学科要研究的最主要目标——概率,那么要如何研究事件的概率问题,这就需要把随机现象引入到一个合理有效、逻辑严谨的理论体系中,在这个过程中,随机变量就像一座桥梁或基石,在理论研究中起着无可替代的作用。随机变量从本质上看就是一个函数,或者更加清楚准确地描述为:从由随机试验的结果构成的样本空间到实数上的一对一或多对一的映射。正是由于随机变量的存在,随机现象的研究中才将高等数学引入到了整个理论体系中,使得概率论学科获得了巨大的进步。随机变量在我们的教学过程中,一般只讨论两种典型情形:离散型随机变量和连续型随机变量。在概率论的讲解过程中,可以发现离散型随机变量的定义浅显而直观,易于理解和接受,而连续型随机变量的定义则有些抽象了。对连续型随机变量的深层次理解,严重依赖于对高等数学相关内容的理解,尤其是对积分和各种函数知识的掌握。另外,无论是离散型随机变量还是连续型随机变量,我们的主要目标都要研究其概率的取值情况,也就是随机变量的概率分布情况,因此在本文中我们主要讨论的内容就是随机变量的分布函数的一些特点。通过对概率分布函数的详细分析,进一步加强对随机变量,尤其是连续型随机变量的认识,本文将几个关于概率分布的基本问题进行整理和归纳,其中第一个问题分别讨论了离散型随机变量和连续型变量的分布函数的基本特点;第二个问题讨论了一维、二维连续型随机变量在什么情况下,概率的取值为零;第三个问题讨论了二维连续型随机变量与边缘分布之间的关系。在下文中,我们将以上三个问题逐一加以讨论。

第一个问题:离散型随机变量的分布函数是阶梯函数,连续型随机变量的分布函数是连续函数。这个结论正确吗?其逆命题成立吗?

这里,我们首先要明确阶梯函数的定义。定义在区间[,]上的函数,如果存在有限个分点=0<1<…<=,在每个开区间(,+1),=1,2,…,1上取常数,则称之为阶梯函数。将此定义推广到无限区间上时,只要求满足在任意有限区间上如上定义(参见王梓坤(1996))即可。总之,无论有限情形还是无限情形,从图像上看,阶梯函数都会出现阶梯形状。故而,当离散型随机变量取有限个值时,容易知道其分布函数一定是阶梯函数;然而当其取值为可列多个值时,则不一定是阶梯函数了。

例:定义一个取值于(0,1)中的有理数的离散型随机变量X如下:

显然,此随机变量确定的分布函数在区间(0,1)上的有理数点处都发生跳跃,其图象无法形成阶梯形状,也就不是阶梯函数。另外,更多的例子可以在朱作宾(1984)中找到。

这个问题的反向结论则显然是成立的,即如果一个分布函数是一个单调上升且右连续的阶梯函数时,则与其对应的随机变量一定是离散型的,并且随机变量的取值点就是跳跃间断点。

那么连续型随机变量的情形又是怎样呢?连续型随机变量的分布函数是一个变上限积分函数,一定是连续的,但其反向,则不然。如果一个分布函数连续且在每一点都可导,那么其导数就是对应的密度函数,也就是这个分布函数一定是连续型随机变量的分布函数。然而,将此结论中的可导条件稍微弱化一点,改成几乎处处可导,则结论不成立。一个例子可以参见桂春燕(2015)。这个例子是基于康托尔集构造的,其过程比较繁琐,本文只介绍一下该例子的构造思想。其具体思路为:在非康托尔集上按特定规则定义为常数(该常数与点所在的区间有密切联系),而在康托尔集上定义为由非康托尔集上的常数序列确定的上确界(极限值)以保证连续,通过这种方法构造的函数在非康托尔集上可导且导数为零,在康托尔集上不可导,而康托尔集为零测集,也就是说,我们得到了一个几乎处处可导且导数几乎处处为零的分布函数,故这个分布函数不是连续型随机变量的分布函数。

第二个问题:一维连续型随机变量在任意一点的概率为零,这是一个显然的事实。那么这个结论推广到多维情形又如何呢?是否可以推广为二维连续型随机变量在任意曲线上的概率为零?

这个问题的本质是考虑一个二元可积函数在曲线上的二重积分问题,而在二维空间内曲线的测度一般为零,比如常见的幂函数、指数函数等初等函数确定的曲线,此时上述推广的结论是成立的。然而,数学常常会有让人惊讶的奇妙之处。事实上,曲线的测度不一定是零,一个有趣的例子就是皮亚诺曲线(可参见那汤松(1965))。关于此曲线的一种经典的构造方法是通过把一个正方形分割成4个小正方形,然后将小正方形的中心点相连,此过程不断重复递归,取极限后,可构造出一条曲线,该曲线可以覆盖整个正方形。这种语言描述显得有点不够严谨,赵明方(1965)给出了一类皮亚诺曲线的解析表达式,其具体定义如下:

在闭区间[0,2]上,令

从而可由x(t),y(t)构造出一条曲线:,赵明方(1965)证明了此曲线就是正方形[0,1]×[0,1]上的皮亚诺曲线,可以表示正方形中的任何一个点。因此,如果在某个正方形上定义一个服从二维均匀分布的随机变量,则其在对应的皮亚诺曲线上的概率为1。不过,这种曲线是极其特殊的,值得更进一步的研究和讨论。为避开这种特殊情形,我们可以限制曲线为可由一元参数方程确定的光滑曲线,此时光滑曲线的面积(测度)一定为零,那么我们的结论在光滑曲线上就一定是成立的,也就是说二维连续型随机变量在光滑曲线上的概率一定为零。

第三个问题:二维连续型随机变量的边缘分布是否一定对应连续型随机变量?反之,如果边缘分布都对应连续型随机变量,其二维随机变量是否一定是连续型的?

这一个问题的前半部分的答案是肯定的。事实上,假设二维随机变量(X,Y)的密度函数为(x,y),则的边缘分布为

故存在一个非负函数满足连续型随机变量的定义。然而,其反向结论则不成立,可见下面的例子。

例:假设随机变量服从参数为1的指数分布,,则二维随机变量(X,Y)的分布函数为:

此时,从而不存在一个满足二维连续型随机变量的定义的非负二元函数,即(,)不是二维连续型随机变量。

以上几个问题,是概率论教学过程中需要留意的几个小问题,这些问题因为都是在非常规情形下出现,往往容易忽视,故而在学习研究概率论的过程中,要始终保持谨慎认真的态度,既要对知识有直观的认识,又要严格对待理论体系的严密逻辑。

参考文献

[1]王梓坤.随机过程通论.北京师范大学出版社,1996:73.

[2]朱作宾.关于离散型分布函数的一个问题.安徽师大学报(自然科学版),1984:19-21.

[3]桂春燕.连续的分布函数与连续型随机变量的关系.安庆师范学院学报(自然科学版),2015.21(1):101-102.

[4]..那汤松,张德英,曹治平.皮亚诺曲线.数学通报,1964:43-46.

随机变量的分解论文 第9篇

在传统机械系统可靠性设计过程中,不确定性变量一般可用经典概率理论模型———分布函数来描述,研究者们已提出了不少高效可靠性分析及设计方法。但受试验条件、时间和经济等因素影响,某些不确定性变量的分布函数不能精确获得,如运动副间隙、动摩擦因数等。这将导致传统可靠性分析及设计方法失效。有研究表明[1],可靠性分析及设计结果对分布函数参数一般较敏感。这类因信息量或知识不足导致的不确定性被称为认知不确定性,认知不确定性可随信息量或知识的增加而减小甚至消失[2]。

为克服传统可靠性分析及设计在处理认知不确定性方面的不足,学者们发展了较多非概率建模理论,如可能性理论[3]、证据理论[4]、凸集模型[5],以及概率建模理论———贝叶斯理论[6]。作为凸集模型的特例,区间模型[7]在实数轴上规定了认知不确定性变量可变区间的上下限。在工程应用中,仅有的信息为不确定性变量处于某个区间内的情况十分常见,如结构几何尺寸、运动副间隙、测量误差、计算误差等,基于区间模型的可靠性研究已有诸多报道。如Du等[8]提出了随机变量和区间变量混合型可靠性设计方法;江涛等[9]基于区间模型提出了非概率可靠性指标的一维优化方法;姜潮等[10]针对分布参数存在区间变量的混合不确定问题,提出了一种时变可靠性分析方法。为提高区间模型计算效率,Du[11]基于一次二阶矩法提出了一种高效的混合型可靠性分析方法;Jiang等[12]提出了序列非线性区间规划方法。

但上述文献均假设区间变量是相互独立的,而在实际工程中,某些区间变量存在一定的相关性,是非独立的,如描述结构几何尺寸的区间变量和结构质量的区间变量一般存在相关性,较大的几何尺寸区间变量意味着较大的结构质量区间变量,反之亦然;两个区间变量可单独取区间的最大值或最小值,但两者不同时为最大值或最小值;与几何尺寸区间变量和结构质量区间变量的相关性相反,某区间变量取值较大表明另一个区间变量较小。在一般常识意义上,本文将这三种情况的相关性分别称为正相关性、零相关性和负相关性。考虑区间变量的非独立性具有非常重要的研究意义,但目前关于非独立区间变量的可靠性研究较少。Du[13]针对机构运动副,基于物理关系式推导获得非独立区间变量描述模型———等式与不等式约束条件,提出了一种随机变量和非独立区间变量的混合型可靠性设计方法。Jiang等[14]采用多维度平行六面体区间模型,考虑了区间变量为独立或非独立的情况,提出了一种新的非线性区间规划方法,但该规划方法未考虑系统中同时存在随机变量和区间变量的混合情况。

本文针对系统输入变量存在随机变量和非独立区间变量混合的情况,基于条件概率法和椭球模型,提出了混合型可靠性分析模型及高效可靠性分析算法。为解决非独立区间变量对计算效率的影响,利用线性变换,将非独立区间变量转换为独立区间变量;为解决概率分析和区间分析双层循环计算效率低下难题,提出了序列迭代算法。

1 椭球模型

椭球模型属于凸集模型,最早由Ben-Haim等[5,15]提出。椭球模型可方便地描述非独立区间变量,在许多实际应用中,椭球模型较其他模型具有更多的优点[16,17]。

设Y=(Y1,Y2,…,YNY)T为区间变量矢量,区间变量个数为NY。由于在复杂机械系统中,区间变量的维度一般较高,而且区间变量之间的非独立关系往往不同(如某些区间变量服从正相关关系,而某些区间变量是相互独立的),因此,需根据不同的独立性特点,将区间变量归入不同的组。设经分组后,区间变量矢量可表示为Y=(Y1,Y2,…,YNg)T,其中Ng为组的数量,Yi为第i组区间变量矢量。基于分组后的区间变量,椭球模型可描述为

其中,S为区间变量可行域;Yic为第i组区间变量均值的矢量,计算式为(YiL和YiU分别为Yi的上限和下限矢量);Wi为第i个椭球模型的特征矩阵,为正定对称矩阵,它描述了第i个椭球的方向和长宽比。

因可行域S由Ng个椭球组成,故该模型也称为多椭球模型,单个椭球模型的变量不超过3个。多椭球模型可方便地描述具有不同独立特性的区间变量。如当某区间变量是独立的,则椭球模型可退化为区间模型;当两个区间变量存在相关性,则椭球模型可退化为椭圆模型。图1给出了3个区间变量构成的不同几何形状的可行域S:在图1a中,3个变量是相互独立的;在图1b中,Y3是独立的变量,Y1和Y2存在相关性,是非独立的;在图1c中,3个变量存在相关性,是非独立的。

因各个区间变量的单位不同,区间大小不同,不便于分析计算,故将区间变量转换为量纲一变量:

则分组后的区间变量矢量Y=(Y1,Y2,…,YNg)T转换为V=(V1,V2,…,VNg)T。

多椭球模型可相应地表示为

其中,(矩阵Ci为对角矩阵,对角线元素为相应的区间变量均值),称为量纲一特征矩阵。对V作正则化变换,将椭球模型转换为中心位于坐标原点、半径为1的球模型,引入线性变换

其中,Qi为正交矩阵,其列向量为的单位特征向量;Λi为对角矩阵,其对角线元素为相应的的特征值,且满足。将式(4)代入式(3),多椭球模型可描述为

2 可靠性分析模型

设系统极限状态函数为

其中,X=(X1,X2,…,XNX)T为随机变量矢量,随机变量的个数为NX;Y=(Y1,Y2,…,YNY)T为区间变量矢量,区间变量的个数为NY。

将区间变量的变换关系式代入式(6),则极限状态函数可写为G=g(X,E)。设G<0时系统失效,则系统失效概率Pf可表示为Pf=Pr{g(X,E)<0}。因未知区间变量V的概率分布,故不能获得准确的失效概率Pf。利用条件概率公式,可得失效概率Pf的最小值Pf min和最大值Pf max的计算公式:

其中,gmax(X,E)和gmin(X,E)分别表示在可行域S内极限状态函数的全局最大值和最小值。

由式(7)和式(8)可见,当系统极限状态函数的不确定性输入变量存在随机变量和区间变量时,系统失效概率的最小值和最大值分别为最大极限状态函数和最小极限状态函数的失效概率。相对于传统可靠性分析问题,该可靠性分析问题涉及双层分析循环:内循环为区间分析,在可行域S内搜寻极限状态函数的极限值;外循环为概率分析,求解最大极限状态函数或最小极限状态函数的失效概率。双层分析循环增加了可靠性分析问题的复杂性,降低了可靠性分析的计算效率,尤其当极限状态函数由计算机数值仿真模型(如有限元模型、流体动力学模型等)隐式表述时。为提高随机变量和非独立区间变量混合情况下的可靠性分析计算效率,本文提出了基于一次二阶矩法的高效可靠性分析方法。

3 可靠性分析方法

一次二阶矩法是一种针对不确定性输入变量均为随机变量的近似可靠性分析方法,它包括两个关键步骤:将随机变量转换为独立的标准正态随机变量;搜寻最大概率点(MPP),在最大概率点对极限状态函数作线性近似,最后求得可靠性指标。

因一次二阶矩法的计算效率和准确度令人满意,故在实际工程中已获大量应用,在此选用一次二阶矩法进行可靠性分析。在一次二阶矩法中,最大概率点u*的数学优化模型为

其中,U=(U1,U2,…,UNX)T为独立的随机变量矢量,服从标准正态分布,由随机矢量X经Rosenblatt变换获得。

e*为经变换后的区间变量最优点,由内层区间分析求得:

一旦寻得最大概率点,则系统失效概率的最小值和最大值分别为

其中,Φ(·)为标准正态分布函数。

图2给出了失效概率的计算流程,内层区间循环嵌于外层概率分析循环。由图2可见,概率分析和区间分析的算法效率共同决定了可靠性分析的整体计算效率,为此,本文提出了高效的序列迭代算法,该算法由随机变量迭代和区间变量迭代两部分组成。在随机变量迭代中,采用了高效的iHLRF迭代算法;在区间变量迭代中,将非独立区间变量转换为独立变量,对极限状态函数作二次近似,将区间分析问题转换为二次规划问题,最终利用梯度投影法,求得极限状态函数的极限值。

3.1 iHLRF迭代算法[18]

作为HLRF算法的改进算法,iHLRF算法引入了评价函数,用于调整每一步的迭代步长,解决了HLRF在处理高非线性响应函数时收敛困难的问题。因iHLRF算法收敛快速,并具有较好的稳健性,故在工程中被广泛应用。

设当前迭代步骤为k+1,则最大概率点的迭代公式为

其中,αk为迭代步长,dk为迭代方向,其计算式为

迭代步长αk通过求评价函数最小值获得,评价函数为

在实际应用中,为减小计算量,在确定αk时无需准确搜寻评价函数最小值,而只需满足评价函数足够小条件,迭代步长αk由以下计算式确定:

3.2 区间迭代算法

为提高效率,利用Karush-Kuhn-Tucker最优化条件(KKT条件)事先判断区间变量迭代初始点是否为优化点。若满足KKT条件,则跳过区间迭代;若不满足,则实施区间迭代。因在可靠性分析中工程师往往关心最坏的情况,即最大失效概率,故以下仅具体描述了求解Pf max的区间迭代算法。

基于式(5)给出多椭球模型的参数化表达式,将非独立区间变量E转换为相互独立的区间变量P,转换关系式表示为P=h(E),具体表达分以下三种情况:

(1)当i个椭球模型中有三个区间变量Ei1、Ei2和Ei3,则令Ei1=Pi1sinPi2cos Pi3,Ei2=Pi1sinPi2sinPi3,Ei3=Pi1cos Pi2,其中Pi1∈[0,1],Pi2∈[0,π],Pi3∈[0,2π];

(2)当i个椭球模型中有两个区间变量Ei1、Ei2,即椭球模型退化为椭圆模型,则令Ei1=Pi1cos Pi2,Ei2=Pi1sinPi2,其中Pi1∈[0,1],Pi2∈[0,2π];

(3)当椭球模型中只有单个区间变量,即椭球模型退化为区间模型,表明该区间变量是独立的,则Ei1=Pi1,其中Pi1∈[-1,1]。

将经上述变换后的区间变量代入极限状态函数g(U,E),g(U,E)可表述为g(U,P),则式(11)可重写为

其中,独立区间变量的可行域S由椭球形变为箱形,令PL和PU分别为构成箱形区域的上下限矢量,则S={Pi:PiL≤Pi≤PiU,i=1,2,…,NY},其中PiL和PiU分别为矢量PL和PU的第i个元素。

设l为区间迭代循环次数,在迭代初始时,令l=0,初始点pl=0=h(ek)。在区间迭代循环中,随机变量uk+1保持不变,故在以下给出的区间迭代算法中,省略随机变量。设当前区间分析循环次数为l,在当前迭代点pl,极限状态函数作二次泰勒近似,式(18)转换为二次规划问题:

其中,Hl为海森矩阵。因计算Hl需求极限状态函数的二阶偏导数,计算效率较低,故本文采用阻尼BFGS公式近似Hl。

如式(19)所示,二次规划问题的约束条件为区间约束,故可采用投影梯度法[19]高效地求得目标函数极限值。投影梯度法是最速下降优化法的改进型,当约束条件为简单形式时,如区间约束,将迭代方向投影于可行域的计算就非常方便,这使得投影梯度法可较高效地寻得最优点。投影梯度法包括以下步骤:在投影后的最速下降方向上寻得极限状态函数的第一个局部最优点;基于第一个局部最优点构成的低维空间,利用共轭梯度法或Schur直接法等求得最优点。设求得最优点为pl*,则区间变量的迭代公式为

其中,κl为迭代步长,为保证全局收敛性,利用回代法求解κl,即重复κl←κlρ,直至新迭代点满足Armijo条件,即

在此取ρ=0.8,η=1×10-4。

若新迭代点pl+1满足KKT条件,则区间迭代停止,令ek+1=h-1(pl+1),其中h-1(·)表示区间变量变换关系式的逆变换;否则,令l←l+1,继续区间迭代。

本文提出的基于一次二阶矩法的可靠性序列迭代算法的步骤可整理如下:

(1)输入初始点u0和e0,初始化迭代次数k=0,初始点均取为零向量;

(2)计算uk+1=uk+αkdk;

(3)判断ek是否满足KKT条件,若满足,则令ek+1ek,转步骤(7),若不满足,则进入下一步,实施区间分析;

(4)初始化区间分析迭代次数l=0,利用转换关系式,计算pl=h(ek);

(5)利用投影梯度法,求得最优点pl*,利用回代法,求得步长κl,计算

(6)判断pl+1是否满足KKT条件,若满足,则令ek+1=h-1(pl+1),进入下一步,若不满足,则令l←l+1,返回步骤(5);

(7)判断是否收敛。若|g(uk+1,ek+1)|≤ε1和‖uk+1-uk‖≤ε2(ε1和ε2为非常小的正常数),则迭代停止,令u*=uk+1,否则,令k←k+1,转步骤(2)。

图3给出了该算法的流程示意图。

4 算例

在MATLAB下,编写了本文提出的序列迭代算法的可执行程序。为验证本文提出的序列迭代算法的有效性和计算效率,在本节中给出了两个混合型可靠性分析算例。尽管两个算例的极限状态函数均以显式表达式给出,但都编写成了可执行程序,故对于调用函数,极限状态函数是隐式的。采用前向有限差分法计算极限状态函数关于随机变量和区间变量的梯度。

4.1 悬臂梁算例

某悬臂梁末端受外部载荷,水平方向分量为Px,垂直方向分量为Py,如图4所示。考虑两种失效模式,当梁承受的最大应力超出材料屈服强度σs,则认为强度失效;当梁末端位移大于末端许用位移D0,则认为刚度失效。极限状态函数分别为

式中,E为材料弹性模量。

已知臂长L=2000mm,矩形梁截面的宽度B和高度H均为随机变量,服从正态分布:B~N(55,2)mm,H~N(110,5)mm。材料屈服强度σs=295MPa,末端许用位移D0=65mm,材料弹性模量E=210GPa。载荷分量Px和Py为非独立区间变量,满足负相关关系,令Y=(Y1,Y2)T=(Px,Py)T(单位为N),其椭球模型为

图5给出了Px和Py满足负相关和独立关系时的不同可行域。

表1给出了两种失效工况的最大失效概率,并采用了蒙特卡罗法验证分析结果。为比较计算效率,表1给出了各分析方法调用极限状态函数的次数Nc。同时,表1给出Px和Py假设为独立区间变量时,Px∈[4200,4300]N和Py∈[2200,2300]N两种失效工况的最大失效概率。

由表1可见,本文提出的方法能较高效地求得两种失效模式的最大失效概率。在蒙特卡罗法中,将每个区间变量的可行区间等分为50份,在区间变量的组合值下取随机变量的抽样数为1×106次,则极限状态函数的调用次数为Nc=2.5×108。基于表1给出的蒙特卡罗法结果和相对误差百分比可见,提出的方法具较高的精度。由区间变量满足非独立和独立关系时的分析结果可见,区间变量的独立性对可靠性分析结果的影响较大,假设区间变量独立会导致较保守的分析结果。

4.2 悬臂圆筒算例

某悬臂圆筒受外部载荷如图6所示:集中力F1、F2、P和扭矩T。当最大等效von-Mises应力σmax超出材料屈服极限σs,认为悬臂圆筒强度失效,极限状态函数可写为

最大等效von-Mises应力位于悬臂圆筒根部截面上端点,其计算式为

其中,σx为该点处的正应力,表达式为

其中,c=d/2,M为该截面处弯矩,A为截面面积,I为截面惯性矩,计算表达式分别为

τzx为该点的切应力,表达式为

表2给出了各随机参数的分布函数及其参数。角度θ1和θ2为独立区间变量(单位:(°)),长度L1和L2为非独立区间变量(单位:mm),满足零相关性。

令Y=(Y1,Y2,Y3,Y4)T=(θ1,θ2,L1,L2)T,根据区间变量的独立性特征,将区间变量分为三组,即Ng=3,则Y=(Y1,Y2,Y3)T=(Y1,Y2,(Y3,Y4)T)T,椭球模型为

图7给出了L1和L2满足零相关和独立关系时的不同可行域。

表3给出了基于本文提出的方法计算获得的最大失效概率。由表3可见,本文提出的方法能较高效地求得悬臂圆筒的最大失效概率。为验证分析结果的正确性,在蒙特卡罗法中,将每个区间变量的可行区间等分为10份,在区间变量的组合值下取随机变量的抽样数为1×106,则极限状态函数的调用次数为Nc=1.0×1010。基于表3给出的蒙特卡罗法结果和相对误差百分比可见,本文提出的方法具有较高的精度。同样,由区间变量满足非独立和独立关系时的分析结果可见,区间变量的独立性对可靠性分析结果的影响较大,假设区间变量独立会导致较保守的分析结果。

5 结论

针对机械系统中不确定性输入变量同时存在随机变量和区间变量的情况,考虑非独立性区间变量,基于混合型可靠性分析模型,利用一次二阶矩法,提出了一种可靠性序列迭代算法。算例结果表明:该迭代算法的计算效率较高,计算精度较好;不考虑区间变量的非独立性可产生较保守的可靠性分析结果,可能导致过于保守的可靠性设计结果。

摘要:针对机械系统中输入变量存在随机变量和区间变量混合的情况,考虑区间变量的非独立性,提出高效混合可靠性分析方法。区间变量使可靠性分析问题变为双层优化问题。为降低双层优化和非独立区间变量对可靠性计算效率的影响,提出了高效序列迭代计算策略,基于椭球模型描述的非独立区间变量,提出将非独立区间变量转换为独立区间变量的方法,并利用二次泰勒近似方法,将区间分析问题转换为易求解的二次规划问题。算例结果表明,所提出的可靠性序列迭代算法具有较高的计算效率和精度;可靠性分析结果受区间变量独立性假设的影响,区间变量独立可导致较保守的可靠性分析结果。

连续型随机变量数学期望的求法探究 第10篇

一、Laplace-Stieltjes变换法

二、重期望公式法

例2设供货商每月向某经销商供应的货物量X服从 (10, 30) (单位:1万件) 上的均匀分布, 该经销商每月实际需要的货物量Y服从 (10, 20) (单位:1万件) 上的均匀分布。若该经销商能从供货商得到足够的货物, 则每1万件货物可获30万元利润, 若得不到足够货物则需从其他途径进货, 此时每1万件可获10万元利润。求该经销商每月的平均利润。

解:因每月利润Z取决于货物供应量X, 故由重期望公式得:

三、利用相同概率性质的随机变量分解法

例3在M/G/1排队系统[4]中, 顾客的到达是参数为λ的Poisson流, 顾客的服务时间独立同分布, 具有分布函数G (t) , t>0和有限均值α。到达和服务独立。证明对服务台忙期b的数学期望E (b) , 当λα小于1时, E (b) =α (1-λα) -1, 当λα大于或等于1时, E (b) =∞。

证明:设η表示忙期b中首个顾客的服务时间γ内到达的顾客数, 则E (η) =λα。称服务时间γ内到达的η个顾客ξ1, …, ξη为“特殊顾客”, 其后到达的顾客为“普通顾客”。因顾客类型和服务顺序不影响忙期b的长度, 为研究需要, 重新定义服务顺序为:服务完忙期首个顾客后, 立即服务ξ1和除ξ2, …, ξη外的“普通顾客”, 直到没有新到“普通顾客”时为止 (这段时间记为X1) , 接着开始服务ξ2和除ξ3, …, ξη外的“普通顾客”, 直到没有新到“普通顾客”时为止 (这段时间记为X2) , 如此下去, 直到最后开始服务ξη及其后所有新到的“普通顾客” (这段时间记为Xη) , 于是得到分解式b=γ+X1+…+Xη。由于b, X1, …, Xη都表示从一个顾客开始服务直到服务结束的一段时间, 故它们具有相同的概率性质, 分布相同, 且X1, …, Xη独立于γ和η。从而

E (b) =a+∑∞j=0E (X1+…+Xj) P{η=j}=a+λa E (b) 。证毕。

四、计算高维Markov过程平均吸收时间的方法

例4对两部件串联系统, 若部件1、2的寿命分别服从参数为λ1的负指数分布和分布函数为X2 (t) 的一般概率分布, 修理时间的分布函数为Yi (t) , i=1, 2, 部件修复如新。t=0时刻部件全新且同时开始工作。求系统的首次平均寿命。

解:定义状态1:系统工作;状态2:部件1在修理, 系统故障;状态3:部件2待修, 系统故障。设部件2寿命的危险率函数为λ2 (t) , 时刻t系统所处的状态为S (t) , ξ2 (t) 表示时刻t部件2的年龄, ηi (t) 表示时刻t部件i已用去的修理时间 (i=1, 2) 。令状态2, 3为吸收状态, 则{S (t) , ξ2 (t) , ηi (t) , t>0, i=1, 2}为带两个吸收状态的向量Markov过程。定义状态概率P1 (t, x) dx=Pr{S (t) =1, x≤ξ2 (t) <x+dx}, 则:

边界条件P1 (t, 0) =δ (t) , 初始条件P1 (0, x) =δ (x) , 这里δ (t) 为狄拉克函数。

注1:当X2 (t) =1-e-λ2t, t>0时, 可得E (X) = (λ1+λ2) -1, 与文[5]运用概率分析方法得到的结果 (n=2的情形) 完全一样。

五、结语

通过实例可以看到, 本文介绍的连续型随机变量数学期望的求法可以解决一些具体问题中的期望计算, 可为学习概率统计、随机过程及工程概率应用提供重要的参考, 因此, 理解和掌握这些方法是大有裨益的。

摘要:通过实例介绍了连续型随机变量数学期望的一些求法, 包括Laplace-Stieltjes变换法、重期望公式法、利用相同概率性质的随机变量分解法和计算高维Markov过程平均吸收时间的方法。

关键词:连续型随机变量,期望,求法

参考文献

[1]李贤平.概率论基础[M].第二版.北京:高等教育出版社, 1997.

[2]张波, 张景肖.应用随机过程[M].北京:清华大学出版社, 2004.

[3]徐传胜.离散型随机变量数学期望的求法探究[J].高等数学研究, 2005, 8, (1) .

[4]唐应辉, 唐小我.排队论——基础与分析技术[M].高等教育出版社, 2006.

离散型随机变量及其分布列常见题型 第11篇

例1 写出下列随机变量可能取的值,并说明所取值的实际意义.

(1)袋中装有5个同样大小的球,编号为1,2,3,4,5,现从该袋中随机取出3个球,记所取球的最大号码为[X].

(2)连续投掷一枚骰子两次,所得点数之和为[Y].

解析 (1)[X]可能取的值为3,4,5.

[X=3]表示最大号码为3,即取出的球为1,2,3号;

[X=4]表示最大号码为4,即4号球被取出,1,2,3号球中恰好取出两个;

[X=5]表示最大号码为5,即5号球被取出,1,2,3,4号球中恰好取出两个.

(2)[Y]可能取的值为2,3,4,5,6,7,8,9,10,11,12.

[Y=2]表示掷出的点数为(1,1);

[Y=3]表示掷出的点数为(1,2),(2,1);

[Y=4]表示掷出的点数为(1,3),(2,2),(3,1);

[Y=5]表示掷出的点数为(1,4),(2,3),(3,2),(4,1);

[Y=6]表示掷出的点数为(1,5),(2,4),(3,3),(4,2),(5,1);

同理,[Y=7]有6个不同的结果,[Y=8]有5个不同的结果,[Y=9]有4个不同的结果,[Y=10]有3个不同的结果,[Y=11]有2个不同的结果,[Y=12]有1个结果.

点评 学会用随机变量描述试验结果非常重要,它是下一步学习分布列的重要基础.

二、离散型随机变量的分布列

例2 设[S]是不等式[x2-x-6≤0]的解集,整数[m,n∈S].

(1)记“使得[m+n=0]成立的有序数组[(m,n)]”为事件[A],试列举[A]包含的基本事件;

(2)设[ξ=m2],求[ξ]的分布列.

解析 (1)由已知,可求得[S={x|-2≤x≤3}],故[m,n∈{-2,][-1,0,1,2,3}],则[A]包含的基本事件为(-2,2),(-1,1),(0,0),(1,-1),(2,-2).

(2)变量[m]的分布列为

则[ξ]的分布列为

点评 1. 求分布列一般有3个步骤:第一步确定变量的所有取值,第二步求出相应的概率,第三步列表.其中最难的是第二步,它需要综合运用我们此前所学的概率知识;

2. 该题第二问涉及变量函数分布列的求法,关键是通过函数关系找到新变量的取值,新变量每个取值的概率等于原变量相应取值的概率之和.

三、分布列的性质

例3 设随机变量[X]的分布列为[P(X=k5)=ak,][k=1,2,3,4,5.]

(1)求常数[a]的值;

(2)求[P(110

解析 (1)由已知条件得变量[X]的分布列为

故[a+2a+3a+4a+5a=1],解之,得[a]=[115].

(2)[P(110

[P(X=35)=115+215+315=25].

四、超几何分布

例4 在10件产品中,有3件一等品,4件二等品,3件三等品,从这10件产品中任取3件.

(1)记取出的3件产品中一等品的件数为[X],求[X]的分布列;

(2)求取出的3件产品中一等品件数多于二等品的概率.

解析 (1)[X]的可能取值为0,1,2,3.

[P(X=0)]=[C37C310]=[724], [P(X=1)]=[C13C27C310]=[2140], [P(X=2)]=[C23C17C310]=[740],[P(X=3)]=[C33C310]=[1120].

故[X]的分布列为

(2)记事件[A1]表示“一等品件数为1,二等品件数为0”,事件[A2]表示“一等品件数为2”,事件[A3]表示“一等品件数为3”.

则所求事件为[A1]+[A2]+[A3], 故所求概率为[P(A1)+P(A2)+P(A3)]=[C13C23C310]+[740]+[1120]=[31120].

点评 1. 求超几何分布的关键在于组合数的计算,理解起来并不困难;

2. 利用分布列求概率关键是要搞清楚所求事件与随机变量之间的关系.

【练习】

1. 一个人有[n]把钥匙,其中只有一把可以打开房门.他随意地进行试开,试过的钥匙放在一旁.记打开房门时,试过的次数为随机变量[X],则[P(X=k)]=( )

A. [kn] B. [1n]

C. [k-1n] D. [AkkAkn]

2. 若离散型随机变量[X]的分布列如下表所示,则[c=] .

3. 有甲、乙两个盒子,甲盒子中有8张卡片,其中2张写有数字0,3张写有数字1,3张写有数字2;乙盒子中有8张卡片,其中3张写有数字0,2张写有数字1,3张写有数字2.

(1)如果从甲盒中取2张卡片,从乙盒中取1张卡片,那么取出的3张卡片都写有1的概率是多少?

(2)如果从甲、乙两个盒子中各取出1张卡片,设取出的2张卡片上数字之和为[X],求[X]的分布列.

4. 袋中有10个白球,[n]个红球(2≤[n]≤9),试求:

(1)当取出2个球时,白球和红球各1个的概率[Pn]及[Pn]的最大值;

(2)当[Pn]最大时,从袋中随机取出4个球,记白球与红球的个数差的绝对值为随机变量[X],求[X]的分布列.

【参考答案】

1. B

2. [13]

3. (1)[3112]

(2)

[[X]&0&1&2&3&4&[P]&[332]&[1364]&[2164]&[1564]&[964]&]

4. (1)[Pn]=[20n(n+10)(n+9)],当[n=9]时,[Pn]取得最大值[1019].

(2)

随机变量的分解论文 第12篇

概率统计知识引入到高中教学后, 每一年的高考复习资料中都会涌现出一些与概率统计相关的新题型, 而这些新题一般分为两种形式.一种是在基本概念上深挖掘, 另一种是在高中其它相关知识中找联系, 从而更广泛和深入的考察学生的数学能力.本文将对一类连续型随机变量的密度函数与分段函数及含参数问题结合的概率统计综合问题作深入探讨.

引例 已知连续型随机变量x的分布函数为:

则该总体落在区间 (0.5, 1.5) 内的概率为 ( ) .

解析 1) 该引例问题中密度函数不是课本上介绍的正态密度曲线, 而是一个分段函数, 由于该函数是密度函数, 其图像应该始终在x轴上方 (或部分与x轴重合) , 且与x轴围成的面积恒为1, 否则f (x) 就不是总体密度函数, 因此解题方法应是“数形结合”.

2) 由题意中密度函数表达式可得其函数图像如图1, 落在 (0.5, 1.5) 内的概率即为阴影部分的面积, 利用对称性及梯形的面积可得Ρ (0.5x1.5) =34, 选C.

从引例中可以清晰的看到题目所涉及的考点.首先, 密度函数的定义及基本性质 (密度函数图像应该始终在x轴上方或部分与x轴重合, 且与x轴围成的面积恒成为1;其次, 总体在区间 (a, b) 内的概率是指:密度函数图像在区间 (a, b) 上与x轴所围成图形的面积.下面本文将引例问题扩展, 从而全面的探讨该类问题.

变式1 已知连续型随机变量x的分布函数为:

f (x) ={0x0x2ax0x1a1x2.

a=___, Ρ (x32) =.

解析 变式1从形式上与引例基本相似, 本例只是在密度函数的表达形式中加入了参数a, 因此首先应当确定a, 又由引例分析可得12×1×a+a (2-1) =1, 解得a=23, 由此可以得到密度函数f (x) 的图像如图2Ρ (x32) 即为图中阴影部分面积等于

23, 即Ρ (x32) =23.

不难看出, 变式1在问题的描述中增加了难度, 通过在引例的密度函数表达式中加入参量a将问题的考察范围扩大, 首先利用密度函数的基本性质求解参数a, 然后再求随机变量在区间 (a, b) 内的概率.

变式2 已知连续型随机变量x的分布函数为:

(Ⅰ) 试写出分布函数f (x) 的表达式;

(Ⅱ) 求该总体落在区间 (a, a+2) 内的概率.

解析 (Ⅰ) 由原问题可以找出题目中的参数有4个, k1, k, k2, a, 又随机变量x是连续型随机变量, 所以有:

limx1-f (x) =limx1-k1 (x+1) =f (1) =limx1+f (x) =2kk1=k

limx2.5-f (x) =limx2.5-2k=2k=limx2.5+f (x) =limx2.5+k2 (x-3) =-12k2k2=-4k.

又由密度函数的基本性质得

12× (1+1) ×2k+ (52-1) ×2k+12× (3-52) ×2k=1

k=211k1=211k2=-811.f (x) ={0x-1x3211 (x+1) -1x14111x2.5-811 (x-3) 2.5x3

其图像见图3.

(Ⅱ) 由于随机变量x的取值区间 (a, a+2) 以参数形式给出, 故应对a的取值进行讨论:

a≤-3, a+2≤-1, 由图3可知P (a<x<a+2) =0;

②-3<a≤-1, -1<a+2≤2, 由图4得阴影部分的面积:

③-1<a≤0.5, 1<a+2≤2.5, 由图5得阴影部分的面积:

Ρ (axa+2) =12×[211 (a+1) +411] (1-a) +411× (a+2-1) =111 (7+2a-a2)

④0.5<a≤1, 2.5<a+2≤3, 由图6得阴影部分的面积:

⑤1<a≤2.5, 3<a+2≤4.5, 由图7得阴影部分的面积:

⑥2.5<a<3, 4.5<a+2<5, 由图8得阴影部分的面积:

⑦a≥3, 图3可知P (a<x<a+2) =0.

变式2将问题的思维复杂程度从多方面加大加难, 首先问题中出现了众多参数需要确定才能继续问题探讨;其次对于密度函数表达式的确定, 用到函数的连续性, 并通过连续函数的定义求出k, k1, k2, 从而确定密度函数;第三总体落在某个区间 (a, a+2) 内的概率, 通过对参数a的取值范围的探讨, 进行有效分段, 并在a的不同取值区间上求出了P (a<x<a+2) 的解.

从上述3个问题的解析可以看出, 在高中阶段解决这类连续型随机变量的密度函数由分段函数构成的概率统计相关问题, 主要通过4方面进行思考:①由密度函数图像应该始终在x轴上方或部分与x轴重合, 且与x轴围成的面积恒为1, 确定密度函数解析式;②总体落在某个区间 (a, b) 内的概率为图中密度曲线在区间 (a, b) 上与x轴围成的面积, 但是如果题目中出现了参数, 我们应该在对参数的所有取值总体讨论清楚后, 结合题目的具体特点, 将参数的取值区间合理划分, 多法兼并, 不重不漏全面解答;③密度函数对应的随机变量是连续的, 即密度函数在其定义域内是连续函数;④充分利用“数形结合”才能得到完整的解答.

与连续型随机变量的密度函数相关问题还有很多, 而且方法也是千变万化, 这里只是通过引例这道高考复习题, 拓展出针对这一类问题的解题思路及讨论方法.

上一篇:第二语言/外语学习下一篇:牧区建设