2009年寸金学院08本统计学考试

2009年寸金学院08本统计学考试,第1张

一 名词解释

1 样本统计量(课本P155)

是根据样本资料计算的反映样本数量特征的变量,它的值随着样本的不同而变化,因此是一个随机变量。

2 区间估计(课本P163)

是根据样本统计量,以一定的可靠程度去估计总体参数值所在的范围或区间。

3 离散系数(课本P87)

也称为变异系数,是指一组数据的变异指标与其相应的均值之比。

4 拒绝域(课本P184)

是指能够做出拒绝原假设这一结论的所有可能的样本取值范围。

5 参数

描述总体统计特征的指标称为参数,总体一旦确定下来,参数就是固定不变的常量

6 抽样误差(课本P156)

是指不包括登记性误差和系统性误差在内的随机误差,它衡量了抽样估计的精确度。

7 显着性水平(课本P163)

某一小概率事件发生地临界水平。

8 相关系数(课本P206)

是指在直线相关条件下,说明两个现象之间相关关系密切程度的统计分析指标,通常用r表示。

二、简答题

1 简述描述统计学和推断统计学的概念及其关系

答:(1)描述统计学是研究如何取得、加工整理和显示数据资料,进而通过综合、概括与分析得出反映客观现象的规律性数量特征的科学。

(2)推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对总体未知的数量特征做出以概率论为基础的推断和估计。

(3)两者的关系:描述统计学和推断统计学是现代统计学的两个组成部分,相辅相成、缺一不可。描述统计学是统计学的基础和前提,推断统计学是现代统计学的核心和关键。

2 如何理解显著性水平,抽样估计的置信度和置信区间之间的关系?

答:(1)显着性水平,即某一小概率事件发生的临界水平,以a表示;置信度表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体参数真实值的可能性大小,一般以1-a表示;置信区间是以样本指标估计总体参数的区间范围。

(2)在样本单位数等其他条件不变的情况下,显着性水平越高,抽样估计的置信度越低,抽样估计的置信区间越小。反之则相反。

3 方差分析的基本假设有哪些

答:方差分析有三个基本假设:

(1) 每个总体都应服从正态分布。即对因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。

(2) 各个总体的方差必须相同。即各组观察数据是从具有相同方差的总体中抽取的。

(3) 观察值之间是相互独立的。

4 为什么要计算离散系数

答:当对不同总体或样本数据的离散程度进行比较时,由于平均值不同、计量单位不同,因此不能直接比较离散指标的绝对数形式,如极差、平均差、标准差等,必须将上述指标与平均值对比,消除平均值不同和计量单位不同的影响,即必须计算离散系数。

5 简述中心极限定理

中心极限定理,是概率论中讨论随机变量和的分布以正态分布为极限的一组定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。中心极限定理的具体内容是:如果从任何一个具有均值μ和方差σ2的总体(可以具有任何分布形式)中重复抽取容量为n的随机样本,那么当n变得很大时,样本均值的抽样分布接近正态,并具有均值μ和方差

6 一组数据的分布特征可以从哪几个方面进行测定

三、单选题

1、英国的威廉配第是( B )的代表人物。

A、记述学派 B、政治算术学派 C、图表学派 D、数理统计派

2、某产品的生产需四道连续工序加工,若每道工序的产品合格率分别是94%、92%,96%、90%,求四道工序的平均合格率应采用( D )

A、简单算术平均法 B、加权算术平均法

C、调和平均法 D、几何平均法

3、根据某班考试成绩的一个样本,用95%的置信水平构造的该班学生平均考试分数的置信区间为75-85分则全班同学的平均分数(B)。。。。

A、肯定在这区间内B、有95%的可能在这区间内C有5%的可能在这区间内D、不在这区间

答案选项:B

4、如果一组数据是对称分布,则(C)则在平均数加减两个标准差之内的数据大概有

A、68% B、90% C、95% D、99%

选项答案:95%

5、从均值为50,标准差为8的总体中,抽出一个样本数量n=64,数学期望标准差分别为

A、50 ,8 B、50 ,1 C、50 ,4 D、8 ,8

选项答案:B

6、在假设检验中,如果所计算出的p 值越小,说明检验的结果( A )

A、越显著 B、越不显著 C、越真实 D、越不真实

选项:A越显著

7、为了调查某高校学生购书费用支出,从男生中抽出60名调查,女生中抽出40名……(D)

A、简答随机抽样 B、整群抽样C系统抽样D分层抽样

选项:分层抽样

8、设P为商品价格,q为销售量,指数∑p=……反映( C )

A商品销售额的变动、B、…… C、商品销售量变动对销售额影响程度 D…

答案:C

9、抽样调查中的抽样误差是:( A )

A、随机误差 B、系统性误差 C、代表性误差 D、登记性误差

答案:随机误差

10、显著性水平是( C )的概率或风险。

A、原假设为真时接受原假设 B、原假设为假时接受原假设

C、原假设为真时拒绝原假设 D、原假设为假时拒绝原假设

11、根据使用的计量尺度不同,统计数量可分为( A )

A、定类数据、定序数据、定距数据、定比数据

B、……

C、……

D、……

12、如果……现从均值为200,标准差为50的总体中抽出n=100的简单样本,求样本的数学期望和标准差。( A )

A、200,5 B、200,20 C、…… D、……

答案;A、200,5

13、在下列假定中, 哪一个不属于方差分析中的假定D

D各总体的方差等于0

14对于数值型数据,主要是用C来测定离散程度

C标准差

17、某企业按2000年不变价格编制的2005年的工业总产值指数为135%,这说明( B )

A、产量增长35% B、由于产量变动使产值增长35%

C、价格增长35% D、由于价格变动使产值增长35%

18、平均发展速度是( C )

A、定基发展速度的算术平均数 B、环比发展速度的算术平均数

C、环比发展速度的几何平均数 D、增长速度加上100%

19、一种零件标准直径15CM,对其是否符合标准要求进行检验时,应采取的假定形式为C

C、M0;u=15 M1:u 不等于15

四、统计学计算题:

1、 某汽车厂声称其生产的电瓶具有60个月,标准差为6个月的寿命分布,现假设质检部检验该厂声称是否正确,抽取50个样本,

(1) 假定厂商事正确的,试描述50个电瓶的平均寿命的抽样分布。

(2) 假定厂商事正确的,则50个样品组成的样本的平均寿命不超过57个月的概率是多少?

(3)假定50个样品组成的样品的平均寿命为57个月,请问该厂商的声称是否正确?

(3)答:不正确。

由(2)解得可知,P(X’ 50)=00002,则50个样品组成的样品的平均寿命为57个月的概率几乎为零,所以该厂商的声称不正确。

2、 某厂生产某产品,每天生产8000袋左右,按规定重量应为100克,现抽样取出25袋,测得25袋平均重量为10536克,方差为81,且服从正态分布,测在95%的置信水平下;

(1) 估计该种产品平均重量的置信区间(t2(24)=20639)

(2) 估计该种产品方差的置信区间(Z0975(24)=12401)

(3) 若已知产品重量的总体标准差。。。。。。。。

3、 某电梯最大载重量为18人,1350Kg,假定已知该酒店旅客及其携带的行李平均重量为70Kg,标准差为6 Kg,试问随机进入电梯18人,总重量超重的概率是多少?(写出表达式即可)

解:已知u=70, =6,n=18,电梯载重的最大平均重量为1350/18=75Kg,按照题意,要计算的是随机的任意18人平均重量超过75Kg的概率,用数学公式表示,即计算P(X’≥75)的概率,则根据题目可得:

P(X’≥75)=P( > )=P(Z> )

4、 某企业三种产品2004年和2005年的价格和产量资料如下:

产品名称 计量单位 产量 价格

2004年 2005年 2004年 2005年

甲 件 1000 1200 80 102

乙 双 2400 3000 150 190

丙 套 4000 4400 200 190

合计 --- --- --- --- ---

求三种产品的:

(1)产量总指数、价格总指数和产值指数。

(2)利用指数体系进行因素分析。

解:

标准值是指采用多种可靠的分析方法,由具有丰富经验的分析人员经过反复多次测定得出的比较准确的结果。

标准化值,一般用z来表示,可以将来自不同均值和标准差总体的个体数据转化为同一规格、尺度的数据。标准化值=(数值x-该数值所在数据的平均值)/该数据所在标准差。

标准化值的比较只有相对意义,没有绝对意义。

扩展资料:

一个总量的标准差或一个随机变量的标准差,及一个子集合样品数的标准差之间,有所差别。

简单来说,标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。

标准差应用于投资上,可作为量度回报稳定性的指标。标准差数值越大,代表回报远离过去平均数值,回报较不稳定故风险越高。相反,标准差数值越小,代表回报较为稳定,风险亦较小。

--标准值

统计学(statistics)是比较传统的学科,一般包括参数估计、假设检验、回归分析、生存分析、因子分析、时间序列、非参数统计等。

数据科学(data science):数据科学其实也会大量运用统计学的模型,但它更偏向于运用现代的机器学习(machine learning)模型,比如支持向量机、决策树、深度学习等,更偏向结局大样本(如互联网、人工智能)的问题,计算量非常庞大,通常借助于GPU等手段。

已上提问是统计学基本概念不清楚,

大数定律是数理统计学的理论基础,不是统计学的理论基础。

“社会统计学与数理统计学的统一”理论的重大意义

王见定教授指出:社会统计学描述的是变量,数理统计学描述的是随机变量,而变量和随机变量是两个既有区别又有联系,且在一定条件下可以相互转化的数学概念。王见定教授的这一论述在数学上就是一个巨大的发现。

我们知道“变量”的概念是17世纪由著名数学家笛卡尔首先提出,而“随机变量”的概念是20世纪30年代以后由苏联学者首先提出,两个概念的提出相差3个世纪。截至到王见定教授,世界上还没有第二个人提出变量和随机变量两者的联系、区别以及相互的转化。我们知道变量的提出造就了一系列的函数论、方程论、微积分等重大数学学科的产生和发展;而随机变量的提出则奠定了概率论和数理统计等学科的理论基础和促进了它们的蓬勃发展。可见变量、随机变量概念的提出其价值何等重大,从而把王见定教授在世界上首次提出变量、随机变量的联系、区别以及相互的转化的意义称为巨大、也就不视为过。

下面我们回到:“社会统计学和数理统计学的统一”理论上来。王见定教授指出社会统计学描述的是变量,数理统计学描述的是随机变量,这样王见定教授准确地界定了社会统计学与数理统计学各自研究的范围,以及在一定条件下可以相互转化的关系,这是对统计学的最大贡献。它结束了近400年来几十种甚至上百种以上五花八门种类的统计学混战局面,使它们回到正确的轨道上来。

由于变量不断地出现且永远地继续下去,所以社会统计学不仅不会消亡,而且会不断发展状大。当然数理统计学也会由于随机变量的不断出现同样发展状大。但是,对随机变量的研究一般来说比对变量的研究复杂的多,而且直到今天数理统计的研究尚处在较低的水平,且使用起来比较复杂;再从长远的研究来看,对随机变量的研究最终会逐步转化为对变量的研究,这与我们通常研究复杂问题转化为若干简单问题的研究道理是一样的。既然社会统计学描述的是变量,而变量描述的范围是极其宽广的,绝非某些数理统计学者所云:社会统计学只作简单的加、减、乘、除。从理论上讲,社会统计学应该复盖除数理统计学之外的绝大多数数学学科的运作。所以王见定教授提出的:“社会统计学与数理统计学统一”理论,从根本上纠正了统计学界长期存在的低估社会统计学的错误学说,并从理论上和应用上论证了社会统计学的广阔前景。

生物统计学分析的第一步是资料的收集和整理。收集资料主要有调研和开展生物学试验两种方法,而资料的整理主要通过对原始资料的核查、校对,制作次数分布表和次数分布图来完成。生命科学领域的试验资料一般都具有集中性、离散性及分布形态三个基本特征:集中性主要利用算术平均数、中位数、几何平均数等反映;离散性主要通过标准差、方差、变异系数等特征数进行度量;分布形态则主要借助偏度和峰度体现。本章首先介绍总体与变量等最基本的生物统计学名词术语,继而结合实例,应用软件来阐明实验原始数据整理的具体方法,并对实验数据的特征进行统计分析,全面阐明数据资料的整理分析方法。

在科学试验与调查中,常常会得到大量的原始数据,这些对某种具体事物或现象观察的结果称为资料(data)。这些资料在统计分析前,一般是分散的、零星的和孤立的,是一堆无序的数字。为了揭示这些资料中所蕴含的科学意义,需要对其进行必要的整理分析,揭示其内在的规律。

21 常用统计学术语

为了更好地学习和理解后续章节的生物统计学知识,首先必须掌握以下几组生物统计学基本概念。

211 总体、个体与样本

总体(population)是指研究对象的全体,其中的每一个成员称为个体(individual)。依据构成总体的个体数目的多寡,总体可以分为有限总体(finitepopulation)和无限总体(infinitepopulation)。例如,研究珠母贝的壳高,因为无法估计出珠母贝的具体数量,可以认为珠母贝是无限总体。

总体的数目往往非常庞大,全部测定需要耗费大量的时间、人力和物力,甚至根本无法完全测定每一个个体;另外,有时候数据的获取过程对研究对象具有破坏性,如要测定贝壳硬度,需要压碎贝壳。因此,只能通过研究总体中的一部分个体来反映总体的特征。从总体中随机获得部分个体的过程,称为抽样(sampling)。为了使抽样的结果具有代表性,需要采取随机抽样(randomsampling)的方法,如对一个生物的总体,机会均等地抽取样本,估计其总体的某种生物学特性。简单的随机抽样的方法有抽签、抓阄、随机数字表法等。从总体中抽取的一部分个体所组成的集合称为样本(sample)。样本中个体的数量称为样本容量、样本含量或样本大小(samplesize),通常记为n。如果n≤30,则该样本为小样本;n>30,该样本则为大样本。例如,2009年3月,某珍珠养殖场为了调查2007年繁育的100万只马氏珠母贝生长情况,随机取10笼,共227只马氏珠母贝。这里需要研究的100万只马氏珠母贝是总体,其中的每只珠母贝则是个体,随机抽取的全部227只马氏珠母贝是一个样本。该样本的样本容量为227,远大于30,属于大样本。

212 变量与常量

变量是研究对象所反映的指标,如海水中叶绿素a的含量,动物的体重、体长,鱼的摄食量,酶活力,细胞的直径,DNA分子的大小等。变量通常记作X或Y等大写的英文字母,而变量的观测值可以标记为x,称为资料或数据。例如,测量一批鱼的体长X,我们可以随机抽取10尾鱼作为一个样本,测量它们的体长(x,cm),得到10个观测值142、154、136、158、155、161、149、153、148、157,这里体长是变量X,而这10个观测值就是样本数据x。按照其可能取得的值,可将变量分为连续型变量(continuousvariable)和离散型变量(discretevariable)。连续型变量是指在某一个区间内可以取任何数值的变量,其测量值可无限细分,数值之间是连续不断的。例如,50~60cm的水稻株高为连续变量,因为在该范围内可取出无数个值,同样,分子运动速度、鱼的体重、贝类的壳高、酶活力的大小、DNA分子的大小等都属于连续型随机变量。连续型变量需通过测量才能获得,其观测值称为连续型数据(continuousdata),也称为度量数据(measurementdata),如长度值、时间、重量值等。如果变量可能取值的数值为自然数或整数,这种变量称为离散型变量,其数值一般通过计数获得,如鱼、贝的怀卵量等。离散型变量的观测值称为离散型数据(discretedata),也称为计数数据(countdata)。如果变量的取值,在一定的范围内是一个相对稳定的数值,那么这种变量称为常量(constant)。例如,在一个小的时空范围内,重力加速度是一个常量。常量的取值是一个常数,具有相对稳定性。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/langman/519500.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-02
下一篇2023-07-02

发表评论

登录后才能评论

评论列表(0条)

    保存