您好,欢迎访问三七文档
统计学原理主讲教师:李媛中国矿业大学徐海学院第一讲认识统计学1统计学:数据的科学2统计学的分科3统计数据4统计学在经济和管理中的应用5统计学中几个重要的概念1统计学:数据的科学什么是统计?我国学者给出的严谨定义:“统计”一词有三种涵义——统计工作、统计资料和统计学。统计工作(统计活动):是对社会经济现象的数量特征进行资料的搜集、整理、分析工作的总称,它是一种社会调查研究活动。统计资料(统计信息、统计数据):是统计工作的成果。包括数字资料也包括文字资料。统计学:关于统计过程的理论和方法的科学。•定义1统计学是数据的科学,它是从数据中获取信息的一种方法,它包括数据的收集、分类、概括、整理、分析以及解释。案例(1)《统计学》难吗?现在要学习统计学这门课程,有同学可能会担心课程很难学。为了消除大家焦虑,我给大家提供一份05级学生的成绩列表(包括平时成绩、期末考试成绩、实验成绩、总评成绩等),那么大家从这些数据中可以得到什么信息呢?从这些数据中可以得到什么信息?这取决于我们的研究目的。1)不及格率2)同学们的最终成绩分布情况3)平均成绩4)平时成绩容易得到吗5)期末考试成绩怎么样6)实验成绩如何7)平时成绩与期末考试成绩有没有关系8)平时成绩与实验成绩有没有关系9)期末成绩与实验成绩有没有关系10)我能学好统计学吗(毕竟这是05级学生的成绩)这是一个典型的统计问题,我们将原始的数据进行了简单的分组、汇总、分析,并用图表的形式展示了出来,这是描述统计学的功能。定义2描述统计学是以便利化和信息化的方式对数据进行整理、汇总、显示的统计学分支。描述统计学的一种形式是图表显示方法;另一种形式是利用数值方法对数据进行汇总。我们用到的平均数、不及格率就是这样一种方法。对问题7)、8)、9)的回答需要对数据进行相关分析。案例(2)专营协议能签订吗在过去几年,不少大学和各种各样的公司签订了专营协议,协议约定该学校在校园里只能销售该公司的产品。一所共有50000名学生的大学向百事可乐公司提出了签订专营协议的要约,该协议将授予百事可乐公司下一年在这所大学的所有校园便利店的专营权,以及以后各年优先签订协议的选择权。作为回报,校方将收取百事公司35%的校园销售收入,此外,每年还一次性收取200000元的费用。百事可乐公司方面可以有两周时间的考虑。百事可乐公司的管理层迅速回顾了他们所掌握的信息。用一听355ml作为单位来测量。每年可销售40周;平均每周销量21000听;每听平均卖1.9元RMB,包括0.38元的成本;市场占有率不确定,估计大大低于50%。如果市场占有率达到了25%,那么这项专营权可以使公司每周售出84000听,这样:收入总额:84000听/周*40周*1.9元/听=6,384,000元学校抽走35%,所以这个数字要乘以65%:65%*6,384,000元=4,149,600元收入总额:(84000*40)听*1.9元/听=6,384,000元学校抽走35%,所以这个数字要乘以65%:65%*6,384,000元=4,149,600元扣除每听0.38元的成本(1,276,800元)和一次性支付给学校的200,000元,百事可乐公司得到的净利润为:4,149,600-1,276,800-200,000=2,672,800元百事可乐目前的年利润是40周*21000听/周*1.52元=1,276,800元如果目前百事可乐公司的市场占有率为25%,则该项协议的潜在收益为2,672,800-1,276,800=1,392,000元上述分析存在的唯一问题是:市场占有率百事可乐公司不知道软饮料每周在学校的销售情况。而且,别的公司也不可能告诉百事可乐公司它们的销量。于是百事可乐公司安排了一个员工来为它调查未知的信息。这个员工在学校里随机抽取了500个学生,让他们记录下在未来的7天一共在学校里买了多少听软饮料。当然,我们对这500名学生的回答并不是很感兴趣,我们想要了解的是学校50000名学生的平均软饮料消费量。而对每一个学生进行调查是极其费时费力的。统计方法的存在让我们不必逐人调查。我们可以从抽取相对来说很少部分的学生作为样本(该样本容量为500),利用样本信息,我们就可以推知所有50000名学生软饮料的消费量了。据此可以对百事公司的年利润做出估算。为了实现这一目标,我们需要用到统计学的另一个分支——推断统计学。定义3推断统计学是利用样本数据信息对总体特征做出推断的统计学分支。从这两个案例我们现在初步了解统计学通常应用于两种类型的问题:1、概括、描述以及探索数据;2、利用样本数据推断被选取样本的数据集的性质。2统计学的分科统计学的分科描述统计学推断统计学从研究方法的角度分类2、3、4、5章6、7章第8章国民经济核算——有学者称之为核算统计学,这章不做要求。3统计数据统计数据的分析是统计学的核心内容,统计的目的就是从数据中获取信息。统计数据不一定是数值型的。前面的两个例子中成绩和每个学生每周购买软饮料数量是数值型的,性别却不是数值型。我们把统计数据分为定量数据与定性数据两种类型。定义4定量数据表示事物的数量或个数。定量数据用数值标度度量。例如,中国历年的国内生产总值、全国总人口数、经济增长速率、不及格率、平均成绩等等。定义5定性数据没有量的解释,它们只能分类。定性数据一般用文字来表述,例如性别、民族、婚姻状况、评价等级等。为了研究方便,我们经常给定性数据加上“数值标签”,但这些“数值”往往只是做排序处理或计算频数之用。例1:【婚姻状况】可能是单身、已婚、离婚、丧偶.这些数据就是定性数据。我们也可以用以下规则来记录婚姻状况。单身1已婚2离婚3丧偶4给每个类别指定其他的数字也是可以的。例如单身7已婚6离婚11丧偶3和上面的编码方式同效。如果编码:单身1已婚2离婚3丧偶4某人调查了20个人的婚姻状况,记录如下:11211313231113112423统计得出:编码组别人数(人)比重(%)1单身10502已婚4203离婚5254丧偶15合计——20100例2【评价教师的等级】取值是不好、一般、好、很好、优秀。这种取值作用在于排序,我们给这种取值编码时,注意保持取值的顺序。方式1:不好1、一般2、好3、很好4、优秀5方式2:不好6、一般18、好23、很好45、优秀88这里出来数值保持顺序外,数字是任意规定的,所以我们不能计算和解释差距。4统计学在经济和管理中的应用•统计学的应用领域•统计学的应用领域案例3股市一瞥8月26日涨1.97%,收盘价4.67元8月27日涨1.27%8月28日涨停29、30日仍在上涨,30日收盘价5.70抚顺特钢估算:抚顺特钢一周上涨22.05%如果买进10000股,需要46700元收益=46700元*22.05%=10300元净收益=10300元-手续费600元=9700元月20日号百控股涨停接下来两天又是两个一字涨停案例4没有硝烟的战场原标题[2013中国股民压力指数地图:西部地区贵州股民压力较小]中国有这样一群人,他们似乎刚参加了一场战争,并铩(sha,一声)羽而归。他们比较焦虑,精神状态普遍不佳,因从事的活动影响到了身体健康。他们,是中国股民,他们中近七成在股市中亏损,四成被“腰斩”。这是金融界网站于2013年7月1日发布的2013中国股民压力指数的结果。共收集9282份有效样本,其中27%的被调查者是职业股民,76%的被调查者股龄超过5年。中国股民的目标明确,只有不到4%的股民是在“打酱油”的,多数(43.37%)都希望通过炒股奔小康,但他们战绩不佳,接近七成股民亏损超10%,其中被“腰斩”的股民占四成。导致他们中的大多数人(48.58%)认为炒股很丢人,并羞于承认自己是股民。对炒股比较认可的股民不到14%。投资有风险,入市须谨慎!!股市中指标不是万能的,但不懂指标是万万不能的!!什么是指标?方才的五彩线是什么?方才的红绿柱又是什么?这都是我们统计学要回答的问题!案例5海关进出口贸易统计(部分)5统计学中几个重要的概念定义6统计总体是根据一定目的确定的所有研究事物的全体。定义7总体单位是构成总体的个别单位。定义8样本是取自总体的子集。定义9标志是用来说明总体单位特征的名称。定义10指标是说明总体的综合数量特征的。一个完整的指标包括指标名称和指标数值两部分。定义11变量是可以取不同值的量。**第四节统计学中的几个基本概念一、总体与总体单位二、标志与指标三、变异与变量四、统计指标与统计指标体系一、总体与总体单位(1)概念统计总体是根据统计任务的要求,由客观存在的,在同一性质基础上结合起来的许多个别事物的整体。(2)种类•有限总体:总体中的单位数是有限的。•无限总体:总体中的单位数是无限的。构成总体的各个单位称为总体单位。•同质性:构成总体的各个单位至少具有某种相同的性质。构成全国所有油田这个总体的各个单位经济职能是相同的,都是进行原油生产和加工的。•大量性:总体是由许多单位组成的,仅仅个别或少数单位不能形成总体。全国所有油田构成的总体,是由许多油田而不是个别油田组成。(3)总体的特点•差异性:构成总体的各个单位在诸多方面是不同的。(1)概念:标志是说明总体单位特征的名称。(2)种类如果总体单位是一位学生,性别、籍贯、是否近视是品质标志。•数量标志:说明总体单位量的特征,是用数值表示的。这些具体的数值统计上称为标志值。年龄、身高、以百分制表示的学习成绩是学生这个总体单位的数量标志。二、标志与变量1、标志•品质标志:说明总体单位质的特征,不能用数值表示,只能用文字描述。按特征不同分2、指标•指标,也称统计指标,是说明总体数量特征的名称及数值。•一个完整的指标包括指标名称和指标数值两部分,它体现了事物质的规定性和量的规定性两个方面的特点。3、指标和标志的区别(难点)(1)标志是说明总体单位特征的,而指标是说明总体特征的。(2)指标都能用数值表示,而标志中的品质标志不能用数值表示。(3)指标数值是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得。如:某职工月工资2000元。“月工资”是数量标志,它的值可直接通过调查获得。(4)作为一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。4、指标和标志的联系(难点)(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的。(2)指标和数量标志存在一定的互换关系。由于研究目的或范围的变化,原来的总体(总体单位)变成总体单位(总体),相应的指标(标志)就变成标志(指标)。7月份,社会消费品零售总额12253亿元。三、变异与变量•变异是指标志在各总体单位之间的不同具体表现。即标志在总体单位之间表现的差别现象。•这种差别可以是品质上的差别,也可以是数量上的差别。有变异现象的数量标志称为变量。•变量的数值叫变量值。•如某企业职工的工资有1200元、1400元等,1200元、1400元等就是变量值。•变量值按其数值是否连续,有离散变量和连续变量之分。离散变量:连续变量:变量值只能是整数。例如:职工人数、机器设备台数等。其数值在整数之间可以插入小数。例如:工资、资金、体重等。问:下列变量中,属于离散变量的是()A.棉花产量B.棉花播种面积C.单位面积棉花产量D.植棉专业户数E.农业科研所数DE•下列各项中属于连续变量的有()A.厂房面积B.职工人数C.原材料消耗量D.设备数量E.产值ACE四、统计指标与指标体系•统计指标是说明总体数量特征的名称及数值。•数量指标:反映总体某一特征的的绝对数量。这类指标主要说明总的规模、工作总量和水平,一般用绝对数表示。其特点是指标数值随总体范围的扩大(缩小)而增大(减小)。•质量指标:反映总体的强度、密度、效果、工作质量等。这类指标一般用相对数和平均数表示。其特点是指标数值大小不
三七文档所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
本文标题:矿大徐海统计学引言
链接地址:https://www.777doc.com/doc-331232 .html