解放军文职招聘考试第五讲 样本及抽样分布-解放军文职人员招聘-军队文职考试-红师教育
发布时间:2017-05-30 11:07:37第五讲 样本及抽样分布一 基本概念总体 含义1:研究对象的全体,例如一批灯泡。含义2:研究对象的某数量指标(例如灯泡的寿命,随机变量)X的取值全体,总体的分布是指随机变量X的分布。个体 组成总体的某个基本单元,例如一个个的灯泡,也指基本单元的数量指标。样本 从总体中抽取的n个个体,n又称样本容量。简单随机样本 样本中的n个个体相互独立,且与总体同分布的样本,简称样本。样本的实验结果称为样本观测值。样本空间 样本的所能可能结果。统计量 样本的不含任何参数的函数。二 重要统计量样本均值 (而称为样本均值的观测值)样本方差注:三、抽样分布统计量的分布:大多数情况下,针对正态分布样本而言,以下不说明均指正态分布。1、分布: 如果r.v X的密度函数为则称X服从参数为n的分布,记作又称自由度,指独立变量的个数。如果,则。定理5.1 如果,则与独立。例5.1 (993) 天平上重复称量重量为a的物品,每次称量结果独立同服从正态分布N(),若以表示n次称量的算术平均,则为使n的最小值应不小于自然数 16 。解:因为,故,。例5.2 已知且求a,b。解:同理例5.3 (983) 是N (0,)的样本,则a=,b= 时分布,自由度为2例5.4设总体X服从正态分布,从该总体中抽取简单随机样本,其样本均值为,求统计量的数学期望E(Y)。2、t-分布 如果与相互独立,则称服从自由度(参数)为n的t-分布,记作t (n)。定理5.2 如果则证明:由t-分布的定义知例5.5 (97.4)已知则统计量服从分布,参数为9。解:因为由t-分布的定义知例5.6 (944) 设,(A) (B)(C) (D)则服从t (n-1)的随机变量是(B)。注:(C)、(D)的分布自由度为n ,题中条件自由度为n-1,而(A)不符合定理2结论。例5.7(993)是正态总体样本,证明Z ~ t (2 )证:设,则,且三者相互独立,与S2独立。练习:1)设已知,则统计量服从 (t) 分布,参数为 n 。2)设,,,,求a = 。3、F-分布 设与相互独立,则称为服从第一自由度为n第二自由度为m的F-分布。定理5.3 设与相互独立,则例5.8 (013) 则统计量~分位数:(连续型)设有r.v ,对于满足的称为r.v 的上侧a分位数,显然对于标准正态分布的上侧a分位数而言,。类似地可以定义的下侧a分位数,即若则称为r.v 的下侧a分位数。显然和间满足,并且对于正态分布和t分布,由于它们是对称的,故。因此列分位数表时,一般正态分布和t分布(用表示t分布的上侧a分位数)只给出上侧a分位数表;而对于F-分布,由于有关系式,也只须给出上侧a分位数表:但对于分布,没有这些性质,必须同时给出与。注:实际计算时,可令,相应的自由度记为,这时可避免查下侧分位数。可加性:二项分布、泊松分布、正态分布和分布具有可加性。第六讲 参数估计一、矩估计若统计量T作为总体参数(或g( ))的估计时,T就称为(或g( ))的估计量。定义6.1矩估计量 设是总体X的样本,X的分布函数 依赖于参数,假定X的r阶矩为(或r阶中心矩)相应的样本矩记为 如下的k个议程(6.1)的解,称为未知参数的矩估计。例6.1 (971) 设总体X的密度是未知参数,是总体X的样本,求的矩估计。解:总体只有一个未知参数,只须建立一个(一阶矩)方程式建立方程例6.2 设是总体的样本,求a,b的矩估计。解:总体有两个未知参数,须建立两个方程。由于练习:设。二、最(极)大似然估计设总体X的密度函数是参数或参数向量,是该总体的样本,对给定的一组观测值,其联合密度是的函数,又称似然函数,记为:其中为参数集,若存在 使就称是的最大似然估计值,而是的最大似然估计量。注:1)对给定的观测值,是的函数,最大似然估计的原理是选择使观测值出现的 概率 达到最大的作为的估计。2)最大似然估计具有不变性,即若是的最大似然估计,则的最大似然估计为。但是,矩估计不具有不变性,例如假定的矩估计,一般情形下,的矩估计不是。例6.3 设总体X具有有是已知的正整数,求未知参数的最大似然估计。解:对给定的观测值,其似然函数为:当时,对数似函数为:(6.3)令的最大似然估计量为。注:在(6.3)式中,对求偏导数与无关的量均归为常数。例6.4 的最大似然估计量。解:又因为的最大似然估计量分别为根据极大似然估计的不变性,可知p的极大似然估计量为。例6.5 设的极大似然估计。解:总体密度为时。故对于样本观测值,似然函数为如果的估计取得过大,将变小(因为分母变大),如果取得太小,某,这时故的极大似然估计值为极大似然估计量为例6.6 某单位有M辆自行车,编号为,假定职工存取自行车是随机的,有人连续观测了几天,将其第i天看到的第一辆车的牌号记为,求M的极大似然估计量。解:设总体X表示每天存取的牌号,X取值,由于存取车是随机的,故其分布列为。这可以视为离散型均匀分布,同上题分析知M的极大似然估计量为例6.7 设某种元件的寿命,其中是未知参数,又设是X的一组观测值,求的最大似然估计值.解:似然函数对数似然函数,是的单调增加函数,越大越大,但如果大于某,则其值=0,故时达到最大.三、估计量的优良性质:以下假定的估计量(对的估计量也成立)无偏性:一致性:。注:一致估计具有不变性,即若的一致估计量,的函数,则的一致估计量。例6.8 设是总体X的样本,则 (C)(A)S是的无偏估计量. (B)S是的最大似然估计量.(C)S是的一致估计量. (D) S与相互独立的.解:的无偏估计量,无偏估计不具有不变性,因此一般情况下S不是的无偏估计量;尽管最大似然估计具有不变性,但一般情况下的最大似然估计量是一致估计具有不变性,故(C)成立;在正态分布情况下相互独立。例6.5续: 是否为的无偏估计(或是否具有无偏性),是否为的一致估计。解:当时当时而的无偏估计。故的一致估计。有效性:的无偏估计,若,称较有效。例6.9设从均值为,方差为的总体中分别抽取容量为的两个独立样本,样本均值分别记为,试证对于任意满足的常数。的无偏估计,并确定常数,使T的方差达到最小。解:即的无偏估计量,又而令故处达到最小值,即使T的方差达到最小。二、区间估计设是总体X的样本,总体参数为对给定的,若统计量,满足,就称随机区间的置信度为的置信区间(区间估计)。具体做法:构造样本的函数,其中的分布与无关,选择使再将上式转换成即可。例6.10 求的置信度为的置信区间,如果取得如下观测值:1.8,2.1,2.0,2.2,1.9,2.2,1.8,求的区间估计值。解:先考虑的区间估计,构造一个随机变量且,且其分布易求。,但上式还含有其他参数(称为讨厌参数),当已知为,的的置信区间为,在(934略)中,得到的的区间估计值为 [4.804,5.196]。当未知时,用s代替,就有,r.v其中,于是由t-分布的对称性。对于,由于故由分布的非对称性对于本例,给定的样本观测值算得,,故的区间估计值为:的区间估计值为:例6.11 (003) 假定0.5, 1.25, 0.8, 2.0是总体X的样本值,已知,(1)求;(2)求的0.95置信区间;(3)b的0.95置信区间。解:(1),(2),故,于是, (1)的95%置信区间为,由观测值算的,故的95%置信区间为。(3)由的严格递增值,及(1)知故由的95%置信区间为。第七讲 假 设 检 验统计假设:对总体的分布形式或分布中的某些参数所作的某种假设。检验:由样本构造合适的统计量,对统计假设正确与否所作的判断。一、基本概念:1、假设检验的一般步骤:1)将实际问题转化成统计假设检验问题。提出原假设 与备选假设注:如果,那么意味,意味且2)构造合适的统计量3)导出统计量的分布,对给定的显著水平,确定拒绝域4)根据样本观测值,计算统计量的值,判断是否落在拒绝域内,并对实际问题作出问答。2、检验类型:单边检验与双边检验;一个总体与两总体检验;均值与方差检验。3、两类错误。二、应用举例例7.1 某味精厂生产的味精每袋重X(克)服从,根据要求每袋重100克,由以往生产经验知X的均方差为基本稳定,现从某天包装的味精中随机抽取9袋,测得它们的重为99.3,98.7,100.5,101.2,99.3,99.7,99.5,102.1,100.5,试问这天包装的味精是否合格?解:是正态总体参数的假设检验问题,方差已知,参数将分成两部对应了实际问题中的包装合格与不合格(双边检验问题),即(包括)含等号的为原假设,于是由于方差已知,用统计量,即取=0.05拒绝域,经计算,接受原假设,认为包装机正常,包装合格。例7.2 灯泡的使用寿命服从分布,假定灯泡的额定寿命是960小时,从某批生产者的灯泡中随机抽验了10只,测得寿命为:950,960,960,950,950,960,940,970,950,960试问这批灯泡是否合格()?解:这是一个正态总体,方差未知,均值的单边假设检验问题,灯泡合格对应了,灯泡不合格对应了,于是其中拒绝域,临界值由观测值算得 原假设成立,这批灯泡合格。例7.3 某化工厂为了提高某种化学药品的得率,提出了两种工艺方案,为了研究哪一种方案好,分别用两种工艺各进行了10次试验,数据如下:假设得率分别服从,问方案乙是否比方案甲显著提高得率?(取=0.01)解:这是两个正态总体均值的检验问题。有显著提高:,无显著提高(单边检验)。对于两个正态总体均值的检验,大纲只给出两总体方差相等时的检验问题,故可以先进行方差相等的(双边)检验。,,而:接受原假设,即:再检验(单边)假设:查表: 拒绝域 而拒绝原假设,认为,乙方案的结果显著提高。注:两正态总体方差未知,但相等的检验统计量:独立,为比较的差的差衡量,故又如本例给出两总体的具体观测值,且,这时可令从而检验统计量其中,这就避开了检验方差是否相等的检验。
解放军文职招聘考试第六章样本及抽样分布-解放军文职人员招聘-军队文职考试-红师教育
发布时间:2017-05-30 11:07:06第六章 样本及抽样分布2、了解经验分布函数和直方图的作法,知道格林汶科定理;3、理解样本均值、样本方差和样本矩的概念并会计算;4、理解统计量的概念,掌握几种常用统计量的分布及其结论;5、理解分位数的概念,会计算几种重要分布的分位数。分布;分位数的理解和计算。6.0 前 言 5分钟前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象的统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。6.1 随机样本 25分钟一、总体与样本1.总体、个体在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究华北工学院男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。但在数理统计里,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在实验中,抽取了若干个个体就观察到了的这样或那样的数值,因而这个数量指标是一个随机变量(或向量),而的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标可能取值的全体组成的集合等同起来。我们对总体的研究,就是对相应的随机变量的分布的研究,所谓总体的分布也就是数量指标的分布,因此,的分布函数和数字特征分别称为总体的分布函数和数字特征。定义1:把研究对象的某项或几项数量指标的值的全体称为总体;总体中的每个元素称为个体。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。Ex1:考察一块试验田中小麦穗的重量:=所有小麦穗重量的全体(无限总体);个体 每个麦穗重对应的分布:Ex2:考察一位射手的射击情况:=此射手反复地无限次射下去所有射击结果全体;每次射击结果都是一个个体(对应于靶上的一点)个体数量化1在总体中的比例为命中率0在总体中的比例为非命中率总体由无数个0,1构成,其分布为两点分布2.样本与样本空间。为了对总体的分布进行各种研究,就必需对总体进行抽样观察。抽样 从总体中按照一定的规则抽出一部分个体的行动。一般地,我们都是从总体中抽取一部分个体进行观察,然后根据观察所得数据来推断总体的性质。按照一定规则从总体中抽取的一组个体称为总体的一个样本,显然,样本为一随机向量。为了能更多更好的得到总体的信息,需要进行多次重复、独立的抽样观察(一般进行次),若对抽样要求①代表性:每个个体被抽到的机会一样,保证了的分布相同,与总体一样。②独立性:相互独立。那么,符合 代表性 和 独立性 要求的样本称为简单随机样本。易知,对有限总体而言,有放回的随机样本为简单随机样本,无放回的抽样不能保证的独立性;但对无限总体而言,无放回随机抽样也得到简单随机样本,我们本书则主要研究简单随机样本。对每一次观察都得到一组数据(),由于抽样是随机的,所以观察值()也是随机的。为此,给出如下定义:定义2:设总体的分布函数为,若是具有同一分布函数的相互独立的随机变量,则称()为从总体(从分布函数)中得到的容量为的简单随机样本,简称样本。把它们的观察值()称为样本值。定义3:把样本()的所有可能取值构成的集合称为样本空间,显然一个样本值()是样本空间的一个点。二、样本的分布:设总体的分布函数为,密度函数为,()是的一个样本,则其分布函数(联合分布)、概率密度函数(联合概率密度函数)分别为:=; =()Ex3:设总体为其一个简单随机样本,则样本空间样本联合分布6.2 分布函数与概率密度函数的近似解 20分钟在概率论中,我们介绍了几种常用的分布函数与密度函数以及它们的性质,当时我们总假定它们都是先给定的,而在实际中,所遇到的用于描述随机现象的随机变量,事先并不知道其分布函数与概率密度函数,甚至连其分布类型也一无所知,那么,怎么样才能确定它的分布函数与密度函数呢?一般地,利用样本及样本值,建立一定的概率模型,用由此获得的概率统计信息来对总体的和进行估计和推断,这就是:一、经验分布函数。设()是来自总体的样本,()是样本的一个观察值,设这个数值由小到大的顺序排列后为: ,对 R 定义:称是总体的经验分布函数。显然,是单调非降右连续的跳跃函数(阶梯函数),在点处有间断,在每个间断点的跃度为,(=1,2,3, ,)且,=0,=1,它满足分布函数的三个性质,所以必是一个分布函数。一般地,随着的增大,越来越接近的分布函数,关于这一点,格列汶科(Gilvenko)在1953年给了理论上的论证,即:定理1.(Gilvenko-Th):若总体的分布函数为,经验分布函数为,则对 R,有:定理表明,以概率1致收敛于,即:可以用来近似,这也是利用样本来估计和判断总体的基本理论和依据。Eg4:某厂从一批荧光灯中抽出10个,测其寿命的数据(单位千时)如下:95.5, 18.1, 13.1, 26.5, 31.7, 33.8, 8.7, 15.0, 48.8, 48.3解:将数据由小到大排列得:8.7,13.1,15.0,18.1,26.5,31.7,33.8,48.8,49.3,95.5则经验分布函数为:二、利用直方图求密度函数的近似解:设()为来自总体的一个样本,其样本观察值为(),将该组数值分成组,可作分点:(各组距可以不相等),则各组为:(,],(,, ,(,,若样本观察值中每个数值落在各组中的频数分别为,,, ,,则频率分别为:, ;以各组为底边,以相应组的频率除以组距为高,建立个小矩形,即得总体的直方图。由上分析可知:直方图中每一矩形的面积等于相应组的频率设总体的密度函数为,则:总体(真实值)落在第组(,的概率为:。由Bernoulli大数定理可知:当n很大时,样本观察值(单个)落在该区间的频率趋近于此概率;即:( ,上矩形的面积接近于在此区间上曲边梯形的面积,当n无限增大时,分组组距越来越小,直方图就越接近总体的密度函数的图象。(这与定积分的意义具有同样的道理)。6.3 样本的数字特征 40分钟0、引言由第三章节知:随机变量的数字特征,能够反映随机事件的某些重要的概率特征,从第一节可知,样本也是一组随机变量(随机向量),为了详细刻划样本观察值中所包含总体的信息及样本值的分布情况,下面我们研究样本的数字特征。一、样本均值与样本方差(随机变量)设()是来自总体的一个样本,()是相应的样本观察值。定义1,称为样本均值。称为样本方差。称为样本标准差。样本均值与样本方差分别刻划了样本的位置特征及样本的离散性特征。二、样本矩设总体的分布函数为,密度为,若,则称为总体的阶原点矩;若,则称为总体的阶中心矩。把总体的各阶中心矩和原点矩统称为总体矩(数值) 表示总体的数字特征。特别地:=;是总体的期望和方差。仿此,下面给出样本矩的定义:定义2:设()是来自总体的一个样本,()为其样本值,则样本的阶原点矩(随机变量)定义为:,=1,2,3 ;样本值的阶中心矩(随机变量)定义为:,=1,2,3 ;由上述定义可知:样本均值、样本方差、样本均方差、样本矩都是关于样本的函数,而样本本身又是随机变量(随机向量),因此,上述关于样本的数字特征也是随机变量,其值分别为:;=;;; ;=1,2,3 ;这些值也分别称为样本均值、样本方差、样本标准差、样本阶原点矩、样本阶中心矩。特别地, ,但与却不同,由与的计算式可知:,当时,=,所以常把记为。并常利用来计算S(标准差)。Eg5:从某班级的期末考试成绩中,随机抽取10名同学的成绩分别为:100,85,70,65,90,95,63,50,77,86(1)试写出总体,样本,样本值,样本容量;(2)求样本均值,样本方差及二阶原点矩解:(1)总体:该班级的期末考试成绩;样本:(,,, ,)样本值:(100,85,70,65,90,95,63,50,77,86)样本容量: =10(2)(100+85+ +86)=78.1三、课后作业:1、仔细阅读P122-132;2、作业:P146 3,43、预习:抽样分布6.4 抽 样 分 布 100分钟0、引言有了总体和样本的概念,能否直接利用样本来对总体进行推断呢?一般来说是不能的,需要根据研究对象的不同,构造出样本的各种不同函数,然后利用这些函数对总体的性质进行统计推断,为此,我们首先介绍数理统计的另一重要概念 统计量。一、统计量(随机变量)定义1:设()是来自总体的一个样本,()是的函数,若为实值函数,且中不含任何未知参数,则称()是一个统计量。事实上 6.3中的样本均值、样本方差、样本矩都是统计量;再如是来自总体的一个样本,则都是统计量,而就不是统计量。由 6.1知:()是随机变量,而统计量是样本()的函数,所以统计量也是随机变量(随机变量的函数为随机变量)。我们把统计量的分布称为抽样分布。而统计量是我们对总体的分布函数或数字特征进行统计推断的最重要的基本概念,所以寻求统计量的分布成为数理统计的基本问题之一。然而要求出一个统计量的精确分布是十分困难的。而在实际问题中,大多总体都服从正态分布:而对于正态分布,我们可以求出一些重要统计量的精确分布,这就是:二、几种常用的抽样分布:(正态分布中的几种统计量的分布)把分布,分布,分布,统称为 统计三大分布 。1、正态分布由正态分布的性质,可得如下结论:定理:设相互独立,,,是关于的任一确定的线性函数(), 则也服从正态分布,即:。从而有:若()是来自总体的一个样本,为样本均值,则,由上述结论可知:的期望与的期望相同,而的方差却比的方差小的多,即的取值将更向集中。2、 分布1)、定义:设()是来自总体 的一个样本,则称统计量:所服从的分布是自由度为(指上式中所含独立变量的个数)的分布。记作:的概率密度函数为: ,其中:,显然, ,且,即符合密度函数性质。事实上,2) 分布的性质I、分布的可加性:设,,且与相互独立,则:+II、若,则,,事实上,因为,则:,,所以:;3) 结论:设()为来自总体的一个样本,,为已知常数,则:I ) 统计量 (当=0时也成立)II) 样本均值与样本方差相互独立,且统计量。对I,事实上若,则,所以;对II,参阅有关数理统计的课本。3、分布1) 定义:设,,且与相互独立,则称随机变量:所服从的分布是自由度为的分布,记为,分布又称为学生氏(Student)分布。分布的概率密度函数为: 。2) 分布的特点(性质)。I、关于=0对称;II、在=0达最大值;III、的轴为水平渐近线;IV、;即时,分布,一般地,当 30时,分布与非常接近。V、当较小时,分布与有较大的差异,且对有,其中。即分布的尾部比的尾部具有更大的概率。VI、若,则 时,3) 结论:I)设()是来自总体的一个样本,则统计量:,事实上,由,又,且与相互独立,则与相互独立,由分布的定义,所以II)设()是来自总体的一个样本,(是来自总体的一个样本,且它们是相互独立的,则统计量,其中,,,事实上,,,且与相互独立,所以:,即:;又,,且它们相互独立,由分布的可加性,则 。由分布的定义:4、 分布1) 定义:设,,且与相互独立,则称随机变量所服从的分布是自由度为的分布,记作:,其中:为第一自由度,为第二自由度。由定义,显然有:;若,则。的概率密度函数为:说明:先求出 的联合密度函数,再令,求出()的联合,注意到独立,所以的边缘密度函数,也即的密度函数。2) 分布的性质(特点)I.密度曲线不对称(偏态)II.若,且与独立,则:III.若,则IV.当时,当时,,注:(利用)3) 结论:设()是来自总体的一个样本,(是来自总体的一个样本,且它们是相互独立,则,事实上,,,由分布的定义,则:,四、分位数:定义:设为某变量的分布函数, 若有使,则称为此概率分布的分位数(分位点)。1、的分位数满足:。2、分布的分位数 满足:,由附表6查其值:当时,或。3、分布的分位数满足:,由附表5可查出其值。由于时,分布接近于,所以当时,可查分布分位数表,且满足:。4、分布的分位数满足:,由分布性质,有:=。5、分位数的其它表示法。1)若使,则称为的上侧分位数,显然:为原分布的1-分位数,这是因为。例:若,满足:,则2)若,使,;则称为的双侧分位数,显然,为的分位数,为的1-分位数。例:设,求,使得,解:五、课后作业:1、认真阅读P132-145;2、作业:P148 10,12,163、预习:参数估计的概念与点估计的求法。
解放军文职招聘考试第六章样本及抽样分布2-解放军文职人员招聘-军队文职考试-红师教育
发布时间:2017-05-30 11:27:23第六章样本及抽样分布[本章要求]1. 理解数理统计的思想方法,会用这种方法做题,以至于深入研究其它知识。2. 掌握本章介绍的u分布,分布,t分布和F分布。3. 掌握单个总体的t分布和两个总体的t分布。[内容提要与疑难解析]一、数理统计的内容及思想方法数理统计分为三个阶段,初级阶段也就是本科要学的内容,有参数估计、假设检验、方差分析、回归分析。中级阶段也就是硕士研究生要学的内容,有多元统计、正交设计、随机过程、时间序列分析。高级阶段也就是科研人员研究的问题有抽样理论、质量控制、可靠性理论、统计决策。数理统计是以概率为基础,以统计为手段利用抽样方法对样本进行测试,并根据对测试结果的分析研究得出总体情况的判断的一门科学。在研究样本时有的是在大规模生产线上抽样,有的是破坏性的研究,因此要避免浪费人力、物力及资源,必须用局部代替全局。用局部的各种值估计全局的各种值,用局部具有的性质代替全局的性质,这种作法可能会有误差,但大量取样时,这个误差不会太大,甚至于取样个数趋于无穷时,这个误差为零的概率为1。二、有关的概念1.总体、个体:研究对象的某项数量指标的值的全体。总体中每个元素称为个体。2.简单随机抽样:从总体中一个个体,称为一次试验。每个个体在一次试验中被抽到的机会均相等,而且从总体中抽取一个个体后,余下部分的分布和原总体的分布是一样的。当总体中有无限个个体时,认为是不放回取样 ;当总体中有有限个个体时,认为是放回取样。3.样本、样本值、容量:从总体中用简单随机抽样的方法抽出n个个体,这n个个体相互之间是相互独立的,即抽取第一个时不影响第二个,抽取第二个时不受第一个影响,同时也不影响第三个。每一个个体可以看作一个随机变量,因为看作第一个个体在总体中哪一个都有资格同时也都有可能被抽到,因此不是固定的。且每一个都与总体同分布,其他个体也是如此,这n个个体称为一个样本,容量为n,用来表示,当取得具体值时用表示,如同函数和函数值一样。但学习了一段时间之后,也就不区分了,一律用小写表示,表示双重含义,也就自然了。4.样本矩:定义为样本的k阶原点矩,k=1时称为样本均值,即,定义为样本的k阶中心矩,k=2时是方差的极大似然估计,称为不常用的样本方差而称为常用的样本方差。5.统计量:用样本作成的实函数形式(一般是连续函数形式),不含未知参数。上述的样本矩都是统计量。到参数估计和假设检验中,出现了含有未知参数的统计量,是否与统计量的本意相矛盾,其实是建立了除被估计参数之外不含有未知参数的统计量,这是权宜之计。三、几种统计分布1.u分布在中抽取一个样本,它们相互独立,且与总体同分布,故,,2. 分布在抽取一个样本,作平方和,相互独立, 也独立,于是分布的自由度为n。常用的是(n-1).3.t分布t分布是由标准正态作分子,分布除以其自由度后再开方作分母,即t=,其中,~(n),t的自由度为n。常用的是 ,两个总体的t分布,,,,, ,,,其中4. F分布, ,相互独立,则 ,上述四个分布的密度函数不必深究,知道其定义、性质、查表就可以。U分布和t分布关于y轴对称,分布和F分布只在x轴正方向。四、几种分布中应注意的问题1.单个总体中已知方差u的分布,为知方差时的t分布,表面看来只是与 s 的区分,其实是两个不同的分布,使用时一定注意条件。而且还要注意查表的不同,正态分布查表是 ,而t分布查表是 .2. 分布的期望和方差的推导过程。因为,,而 , ,=.,(相互独立,之间也独立),其中 , , 令,,故 ,3. 分布自由度的确定是根据分布中有无相互制约的随机变量而确定,例如,是由于中,;因此少了一个自由度,而,中没有这个约束条件,故自由度为n。分布自由度有如下性质,若与独立,其和+=4. t分布自由度超过45,可以用正态分布代替,分布当自由度超过45,由一个关系式转换成正态分布 。 。5. f分布当很大时,在表中不出现,可以倒数关系转换[典型例题]例1 在总体随机抽一容量为5的样本,(1).求样本均值与总体均值之差的绝对值大于1的概率。(2).求概率 (3). 求概率解 (1).X~N(12,4),(2).= (3).例2已知。解 由,可知由X分子是标准正态,分母是分布组成,即.例3 设为来自泊松分布的一个样本,分别为样本均值和样本方差,求 ,。解 ====例4 设在总体中抽取一容量为16的样本,这里均为未知,(1).求 其中为样本方差,(2).求。解 (1).==(2).,例5 设是一样本值,令=0,=,证明递推公式=证明 :,故 ,两边分别除以k得例 6 设总体X~是来自总体的一个样本,为样本均值,试问样本大小应取多大,才能使以下各式成立:(1).(2).(3).解 (1). =,(2). X~设故取n=255(3). ,查标准正态表0.95对应1.96,n,取n=16例7设且相互独立,记为前几个样本的均值与方差,求证:T=解 ,,