初级统计师考试辅导之统计学的基本范畴

初级统计师考试辅导之统计学的基本范畴,第1张

统计学的基本范畴

范畴是反映事物本质和普遍联系的基本概念。各门科学都有自己特有的范畴,理解了这些范畴,就把握住了该门科学体系之间纽结。统计学的基本范畴主要有统计总体、总体单位、样本、标志、指标和指标体系等。

一、统计总体与样本

统计总体(Statistical population)是统计调查研究对象的全体,它是由客观存在的,具有某种共同性质的许多个别事物构成的整体,简称总体。构成统计总体的个别事物叫做总体单位(Population unit),简称单位。例如,对工业企业进行调查,全国的工业企业是总体,每一个工业企业则是单位。统计总体具有三个特性,即同质性,大量性和变异性。

1、同质性。同质性是指一个总体的所有单位起码在某一点上具有相同的性质,否则,某些或某个单位就不能被纳入到一个总体中。换言之,总体是由具有某一共同性质的基本单位所组成;工业企业之所以成为总体,是因为每个工业企业都是从事工业生产和经营活动的基本单位,具有相同的经济职能。

2、大量性。这一特性是指统计总体应由许多个别单位组成,少数单位或个别事物不能构成总体。这是由统计方法和统计研究目的决定的。统计方法为统计研究目的服务,统计研究如果不进行大量观察、分析和研究,就不能从普遍联系中发现数量的规律性。举例说,要研究某市职工的工资水平,若只观察少数几个职工的工资就达不到目的,因为这少数几个职工的工资可能偏高或偏低,不能代表该市全体职工的工资水平。如果观察许多职工的工资,就可以降低或抵消偶然性的偏差,计算他们的平均工资,就可以反映该市职工工资的一般水平。职工工资差别越大,需要观察的职工人数就越多;要提高观察的职工工资的代表性,就要增加观察的职工人数。由此可见,统计总体的大量性是相对的。

3、变异性。变异性是指构成总体的单位在同质性之外的其他方面要有差异,否则,就没有必要进行统计分析了。例如,即使在严格控制的生产条件下,所生产出来的产品其质量也会有差异,正是由于存在这样的差异,才需要我们运用统计方法去寻找统计规律性。反之,如果各个总体单位要研究的特征都没有差异,那么只要随便抽取一个单位加以观察即可知道整个总体的状况,也就不需要统计了。

统计研究最终是要确定总体的数量特征,但是有时总体的单位数很多,甚至无限,不可能或无必要对每个总体单位都做调查。这时,就要借助样本来研究总体了。所谓样本(Sample)就是按照一定的概率从总体中抽取并作为总体代表的一部分总体单位的集合体。也有学者称总体为母体,样本为子样。但是,绝对不允许将统计总体叫做“全及总体”,样本叫做“样本总体”,这类叫法十分不规范。

样本是统计学中非常重要的概念,对这一概念的理解要注意三方面问题:其一,构成某一样本的每一单位都必须取自某一特定的统计总体,不允许该总体之外的单位介入该总体的样本。其二,样本单位的抽取应是按一定的概率进行的,而具体样本的产生应是随机的,因此必须排除人的主观因素对样本单位抽取和样本生成的干扰。其三,样本是母体的代表,带有母体的信息,因而能够推断母体;然而,样本只是母体的一个子集,且具有随机性,故由样本去推断总体会产生代表性误差。其实,如何从母体中抽取子样,怎样控制样本对总体的代表性误差,是推断统计学研究的主要问题。

二、统计标志与指标

统计标志(Statistical Characteristic)是表明总体单位特征的名称,简称为标志。总体由单位构成,单位是标志的承担者,单位的标志形成了统计研究的基础。一些场合,例如在设计调查方案时,将标志称为项目。标志的具体表现称为标志表现。

标志按其反映的单位特征的不同,分为品质标志和数量标志。品质标志表明单位的属性特征,其标志表现一般用文字或语言表述。例如,在某校学生总体中,一个学生是一个单位,学生的“性别”是一个品质标志,该标志的具体表现-“男”或“女”就是用文字表述的。数量标志表明单位的数量特征,其标志表现都用数值表述。例如,在上例中,学生的“年龄”是一个数量标志,该标志的具体表现-“21”、“22”等就是用数值表述的。

标志按其标志表现的变异情况,分为不变标志和可变标志。若在一个总体中所有单位的某一特征的具体表现都相同,该特征就是一不变标志。例如,在教师总体中,“职业”这一特征就是一不变标志,其具体表现都是“教师”。前者,我们曾谈到总体的同质性,其实,这种同质性说白了就是指构成总体的所有单位至少要有一个不变标志。若在一个总体中所有单位的某一特征的具体表现不尽相同,该特征就是一不变标志。例如,在教师总体中,“基本工资”这一特征就是一可变标志,其具体表现可能是“300元”、“400元”等等。在一个总体中,如果不存在可变标志,或者说,所研究的总体在各单位之间不存在任何差异,那就无须调查,做统计研究了。可以说,总体的同质性是问题研究的前提,而总体单位的变异性则是问题研究的本体。

对统计指标(Statistical indicator)通常有两种理解和使用方法:一是统计指标是用来反映总体数量状况的基本概念。例如,年末全国人口总数、全年国内生产总值、国内生产总值年度增长率等。二是统计指标是反映总体数量状况的概念和数值。例如,1998年我国的年末总人口为1248亿、人口自然增长率为0953%、国内生产总值为795528亿元等。统计指标简称为指标。

指标与标志的关系如同总体与单位的关系,指标是由标志过渡而来的。通过实际调查取得了反映个体单位的标志表现,再对这些标志表现加以综合就形成了相应的指标。尽管品质标志的标志表现不是数量,但对其累计可获得反映总体单位数的统计指标。数量标志的标志表现是数值,对这些数值进行综合就可以得出反映总体标志总量的统计指标,当然也可获得总体单位数的指标。

统计指标按其所反映的内容或其数值表现形式,可以分为总量指标、相对指标和平均指标三种。总量指标是反映总体规模的统计指标,通常以绝对数形式表现,故又称其为绝对数,如人口总数、国内生产总值等。总量指标按其所反映的时间状况不同又可分为时期指标与时点指标。时期指标又称为时期数,它反映的是现象在一段时间区间内的总量,如产品总量、总产值、商品零售额等。时期数通常可以累积,从而得到更长时间区间内的总量。时点指标又称为时点数,它所反映的是现象在某一时刻上的总量,如年末人口数、年末商品库存额等。时点数通常不能在时间纵向上累积,但有时可在空间横向上累积。相对指标是两个绝对数之比,亦称为相对数,如经济增长率、股票价格指数等。平均指标又称为平均数或均值,它所反映的是现象在某一空间或时间上的平均数量状况,如人均消费水平、某种股票一周平均价格等。

现象的复杂性和联系性决定了不能只用一个指标,而应该用若干指标去描述总体的数量状况。统计指标体系(System of statistical indicator)就是由若干单个指标所组成,并能反映现象复杂性和联系性的统计指标群。在社会经济统计中,指标体系可分为宏观的和微观的。例如,反映整个国民经济和社会发展的统计指标体系就是宏观的,而反映一个企业或事业单位的统计指标体系就是微观的。

“社会统计学与数理统计学的统一”理论的重大意义

王见定教授指出:社会统计学描述的是变量,数理统计学描述的是随机变量,而变量和随机变量是两个既有区别又有联系,且在一定条件下可以相互转化的数学概念。王见定教授的这一论述在数学上就是一个巨大的发现。

我们知道“变量”的概念是17世纪由著名数学家笛卡尔首先提出,而“随机变量”的概念是20世纪30年代以后由苏联学者首先提出,两个概念的提出相差3个世纪。截至到王见定教授,世界上还没有第二个人提出变量和随机变量两者的联系、区别以及相互的转化。我们知道变量的提出造就了一系列的函数论、方程论、微积分等重大数学学科的产生和发展;而随机变量的提出则奠定了概率论和数理统计等学科的理论基础和促进了它们的蓬勃发展。可见变量、随机变量概念的提出其价值何等重大,从而把王见定教授在世界上首次提出变量、随机变量的联系、区别以及相互的转化的意义称为巨大、也就不视为过。

下面我们回到:“社会统计学和数理统计学的统一”理论上来。王见定教授指出社会统计学描述的是变量,数理统计学描述的是随机变量,这样王见定教授准确地界定了社会统计学与数理统计学各自研究的范围,以及在一定条件下可以相互转化的关系,这是对统计学的最大贡献。它结束了近400年来几十种甚至上百种以上五花八门种类的统计学的混战局面,使它们回到正确的轨道上来。

由于变量不断地出现且永远地继续下去,所以社会统计学不仅不会消亡,而且会不断发展状大。当然数理统计学也会由于随机变量的不断出现同样发展状大。但是,对随机变量的研究一般来说比对变量的研究复杂的多,而且直到今天数理统计的研究尚处在较低的水平,且使用起来比较复杂;再从长远的研究来看,对随机变量的研究最终会逐步转化为对变量的研究,这与我们通常研究复杂问题转化为若干简单问题的研究道理是一样的。既然社会统计学描述的是变量,而变量描述的·范围是极其宽广的,绝非某些数理统计学者所云:社会统计学只作简单的加、减、乘、除。从理论上讲,社会统计学应该复盖除数理统计学之外的绝大多数数学学科的运作。所以王见定教授提出的:“社会统计学与数理统计学统一”理论,从根本上纠正了统计学界长期存在的低估社会统计学的错误学说,并从理论上和应用上论证了社会统计学的广阔前景。

统计学是关于认识客观现象总体数量特征和数量关系的科学。

它是通过搜集、整理、分析统计资料,认识客观现象数量规律性的方法论科学。

由于统计学的定量研究具有客观、准确和可检验的特点,所以统计方法就成为实证研究的最重要的方法,广泛适用于自然、社会、经济、科学技术各个领域的分析研究。

扩展资料:

统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里士多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”、“政治算数”和“统计分析科学”三个发展阶段。

所谓“数理统计”并非独立于统计学的新学科,确切地说,它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而是属于数学的范畴。

统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。

描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。

推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。

变量(variable):每次观察会得到不同结果的某种特征。

分类变量(categorical variable):观测结果表现为某种类别的变量。

顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。

数值型变量(metric variable):又称定量变量,观测结果表现为数字的变量。

均值(mean):均值也就是平均数,有时特指算术平均数,这是相对其他方式计算的均值,求法是先将所有数字加起来,然后除以数字的个数,这是测量集中趋势,或者说平均数的一种方法。

中位数(median):也就是选取中间的数,要找中位数,首先需要从小到大排序,排序后,再看中间的数字是什么。

众数(mode):众数也就是数据集中出现频率最多的数字。

任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。

即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。

在具体进行取样时,必须根据研究目的的不同,选择不同的取样方法。

①单纯随机取样法先把每个个体编号,然后用抽签的方式从总体中抽取样本。这种方法适用于个体间差异较小、所需抽选的个体数较少或个体的分布比较集中的研究对象。

②分区随机取样法将总体随机地分成若干部分,然后再从每一部分随机抽选若干个体组成样本。这种抽样法可以更有组织地进行,而且中选的个体在总体的分布比单纯随机取样更均匀。

③系统取样法先有系统地将总体分成若干组,然后随机地从第一组决定一个起点,如每组15个元素,决定从第一组的第13个元素选起,那么以后选定的单位即28,43,58,73等等。

④分层取样法根据对总体特性的了解,把总体分成若干层次或类型组,然后从各个层次中按一定比例随机抽选。这种方法的代表性好,但若层次划分得不正确,也不能获得有高度代表性的样本。

参考资料:

——统计学

统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。

通俗点讲,统计学就是利用统计数据,对其进行描述,分析,总结,或利用统计数据对未来进行预测,推断得出新的统计数据,他们分别是描述统计学和推断统计学,统计数据就是统计学里的一个概念

统计学:通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考统计学基本理论研究有:概率极限理论及其在统计中应用、树形概率、Banach空间概率、随机PDE’S、泊松逼近、随机网络、马尔科夫过程及场论、马尔科夫收敛率、布朗运动与偏微分方程、空间分支总体的极限、大的偏差与随机中数、序贯分析和时序分析中的交叉界限问题、马尔科夫过程与狄利克雷表的一一对应关系、函数估计中的中心极限定理、极限定理的稳定性问题、因果关系与统计推断、预测推断、网络推断、似然、M——估计量与最大似然估计、参数模型中的精确逼近、非参数估计中的自适应方法、多元分析中的新内容、时间序列理论与应用、非线性时间序列、时间序列中确定模型与随机模型比较、极值统计、贝叶斯计算、变点分析、对随机PDE’S的估计、测度值的处理、函数数据统计分析

统计学的作用与意义如下:

统计学为我们提供一种独一无二的角度观察世界,统计学是衡量我们看法是否准确的标尺,判断我们观念是否正确的试纸,统计学的力量远远大于常人对他的理解。

在统计学上,分析数据是统计学的核心,而不是采集数据。因为是应用数学的一个分支,被广泛的应用在各门学科之上。从自然科学、社会科学到人文科学,统计甚至被用于工业、商业和政府信息决策。统计的作用:因为它来自应用,所以它在应用过程中发展和成长。

随着经济社会的发展,各学科相互融合的趋势和计算机技术的飞速发展,统计学的应用领域、统计理论和分析方法也将不断发展,在各个领域显示出其生命力和重要作用。

应用统计学研究的主要目标:

培养具有扎实的数学基础和经济学素养,掌握统计学和经济学的基本理论和方法,具有较强的计算机应用能力,能熟练地运用现代统计分析方法进行数据分析,能在政府、金融及管理部门从事统计调查、质量或风险控制等开发应用和管理工作的应用型专门人才等。

统计学属于科学的主要范畴,即统计学类。中国将统计分为两个专业方向:经济统计和应用统计。经济统计是一门提供科学调查、收集经济信息、描述和分析经济数据、预测和监督社会经济运行过程的科学。

应用统计学主要是通过描述性统计等技术,调查收集观测对象的数据信息,分析观测对象的特征,发现事物的规律,预测和监督,实现社会经济的良性运行。

‍‍

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。

另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文 statista (国民或政治家)。 德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了"城邦政情","政治算数"和"统计分析科学"三个发展阶段。所谓"数理统计"并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属於统计学的范畴,而属于数学的范畴。

‍‍

本书的主要内容在于介绍统计学中关键的七个概念:

作者认为,这七个关键概念支撑起了整个统计学——统计学七支柱。因此作者对这七个概念做了详细的介绍,阐述了概念的意义,形成和发展,很好地帮助了不了解统计学的人理解、入门统计学。

Aggregation,可以翻译为聚集、聚合。其主要思想是: 把数据集中的个体值进行统计汇总,概括出的信息可以超越个体。统计学的整体概括大于各部分的加总。

用简单的说法来理解Aggregation,就是“平均数”。对事物进行观测,往往会因为环境、测量人员等因素,产生完全不同的结果。但是这种差异,又不能通过人力完全消除。这时候该怎么去使用测量数据,就是一个见仁见智的问题了。

作者举例说明了这个情况:16世纪人们发现了指南针的指向的“南极”与真实的南极有差异(磁偏角),而这个差异,在不同的地方测量会有不同的结果。那么,该用什么值来代表自己的测量结果呢?有的人选择“中间的值”,有的人选择“最大值和最小值的一半”。

当需要对观测数据进行概括,就必须对原始信息做取舍,这就是“平均值”的价值所在。而“平均人”的概念,更是应用了aggregation的概念。通过调查某一地区所有人的身高、体重,求得平均值后,可以与其他地区进行比较。而这些平均值,很可能根本不能对应一个真实存在的人,只是一个“平均人”,但是正是走了平均的概念,很多社会科学才能进一步发展。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/langman/507092.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-01
下一篇2023-07-01

发表评论

登录后才能评论

评论列表(0条)

    保存