因变量为分类变量,自变量有分类有连续可以做什么

因变量为分类变量,自变量有分类有连续可以做什么,第1张

logistic回归主要分为三类,一种是因变量为二分类得logistic回归,这种回归叫做二项logistic回归,一种是因变量为无序多分类得logistic回归,比如倾向于选择哪种产品,这种回归叫做多项logistic回归。还有一种是因变量为有序多分类的logistic回归,比如病重的程度是高,中,低呀等等,这种回归也叫累积logistic回归,或者序次logistic回归。

二值logistic回归:

选择分析——回归——二元logistic,打开主面板,因变量勾选你的二分类变量,这个没有什么疑问,然后看下边写着一个协变量。有没有很奇怪什么叫做协变量?在二元logistic回归里边可以认为协变量类似于自变量,或者就是自变量。把你的自变量选到协变量的框框里边。

细心的朋友会发现,在指向协变量的那个箭头下边,还有一个小小的按钮,标着ab,这个按钮的作用是用来选择交互项的。我们知道,有时候两个变量合在一起会产生新的效应,比如年龄和结婚次数综合在一起,会对健康程度有一个新的影响,这时候,我们就认为两者有交互效应。那么我们为了模型的准确,就把这个交互效应也选到模型里去。我们在右边的那个框框里选择变量a,按住ctrl,在选择变量b,那么我们就同时选住这两个变量了,然后点那个ab的按钮,这样,一个新的名字很长的变量就出现在协变量的框框里了,就是我们的交互作用的变量。

然后在下边有一个方法的下拉菜单。默认的是进入,就是强迫所有选择的变量都进入到模型里边。除去进入法以外,还有三种向前法,三种向后法。一般默认进入就可以了,如果做出来的模型有变量的p值不合格,就用其他方法在做。再下边的选择变量则是用来选择你的个案的。一般也不用管它。

选好主面板以后,单击分类(右上角),打开分类对话框。在这个对话框里边,左边的协变量的框框里边有你选好的自变量,右边写着分类协变量的框框则是空白的。你要把协变量里边的字符型变量和分类变量选到分类协变量里边去(系统会自动生成哑变量来方便分析,什么事哑变量具体参照前文)。这里的字符型变量指的是用值标签标注过得变量,不然光文字,系统也没法给你分析啊。选好以后,分类协变量下边还有一个更改对比的框框,我们知道,对于分类变量,spss需要有一个参照,每个分类都通过和这个参照进行比较来得到结果,更改对比这个框框就是用来选择参照的。默认的对比是指示符,也就是每个分类都和总体进行比较,除了指示符以外还有简单,差值等。这个框框不是很重要,默认就可以了。

点击继续。然后打开保存对话框,勾选概率,组成员,包含协方差矩阵。点击继续,打开选项对话框,勾选分类图,估计值的相关性,迭代历史,exp(b)的ci,在模型中包含常数,输出——在每个步骤中。如果你的协变量有连续型的,或者小样本,那还要勾选hosmer-lemeshow拟合度,这个拟合度表现的会较好一些。

二元logit回归

1打开数据,依次点击:analyse--regression--binarylogistic,打开二分回归对话框。

2将因变量和自变量放入格子的列表里,上面的是因变量,下面的是自变量(单变量拉入一个,多因素拉入多个)。

3设置回归方法,这里选择最简单的方法:enter,它指的是将所有的变量一次纳入到方程。其他方法都是逐步进入的方法。

4等级资料,连续资料不需要设置虚拟变量。多分类变量需要设置虚拟变量。

虚拟变量ABCD四类,以a为参考,那么解释就是b相对于a有无影响,c相对于a有无影响,d相对于a有无影响。

5选项里面至少选择95%CI。

点击ok。

统计专业研究生工作室原创,请勿复杂粘贴

互联网使用降低了使用者对婚姻的满意度,从而降低生育意愿。“网上社交活动提高了人们认识异性的可能性,增加了出轨等行为,对婚姻的满意度产生一定的负向作用。而婚姻状况则是影响居民生育的一个重要因素。”

上网究竟是如何在潜移默化之中影响居民生育意愿的?增加生育焦虑;改变生育观念;刺激消费,挤压生育养育预算;网络社交和娱乐部分替代生儿育女的效用满足……这些影响机制被一一揭示。上网的人比不上网的人生育意愿降低约105%《互联网使用会影响居民生育意愿吗?》一文使用中国家庭追踪调查(CFPS)数据以及相匹配的城市统计数据,实证分析了互联网使用对居民生育意愿的影响。该文使用的微观个体数据为北京大学中国社会科学调查中心公布的2018年中国家庭追踪调查数据(2018 China Family Panel Studies,CFPS2018)。根据女性生育年龄的合理性,研究剔除了小于20岁与大于45岁的女性样本,由于男性的生育年龄可以延续至更大岁数,研究保留全部男性样本,成人问卷数据匹配家庭与少儿问卷后得到样本量为10342个。

该研究使用“生育意愿”和“实际生育行为”两个指标刻画被解释变量,该研究的核心解释变量是“个体互联网使用情况”,同时,研究纳入了一系列个体特征、家庭特征作为控制变量。研究使用Poisson回归模型进行估计。

研究显示,控制了影响生育意愿的其他因素和内生性问题后,分析结果表明,使用互联网的居民比不使用者的生育意愿降低了约105%。同时,考虑到个体之间存在差异,该研究将互联网使用与一系列虚拟变量(学历、收入、经济水平等)的交互项放入回归,研究异质性。分析结果表明,居住在经济发达城市、低学历、低收入的互联网使用者生育意愿降幅更加明显。对此,研究者分析道,造成以上差异的原因可能是,经济发达城市的互联网使用人群更容易接受新兴观念冲击,受教育程度低的人群因自身认知水平限制更有可能受到互联网上非主流文化的影响并改变自己的生育观念。

“恐育”信息影响生育互联网中较为常见的“生育焦虑”信息引发了研究者的关注。《互联网使用会影响居民生育意愿吗?》一文用“搜索指标”来代理互联网上相关信息的传播热度,通过爬虫技术获取了相应年份城市层面关于“丁克”“堕胎”“避孕”“人工流产”4个关键词的百度搜索指数。考虑到不同城市网民规模的不同,研究将获取的搜索指数除以城市互联网用户数以校正搜索指标,并分别用互联网使用对这4个搜索指数进行回归,再用各搜索指数对生育意愿进行回归。回归结果显示,互联网使用对4个搜索指数具有正向作用,可见个体的互联网使用促进了他们对丁克、堕胎、避孕和人工流产等生育负面话题的关注。各搜索指数对生育意愿都具有显著的负向作用,说明互联网使用者会受到互联网上负面信息的影响而降低生育意愿。《上网为什么会影响个人生育意愿?》一文则将互联网与各类传统媒体进行了横向对比,以考察互联网对生育意愿的影响是否具有特殊性。

新研究发现,上网越久人们越不想生孩子。那么,互联网究竟是怎样影响人们的生育意愿的?

  中国互联网络信息中心(CNNIC)发布的第50次《中国互联网络发展状况统计报告》显示,截至2022年6月,我国网民规模为1051亿,网民人均每周上网时长为295个小时,网民使用手机上网的比例达996%。

 

 近期,有研究指出,不断扩展的互联网应用可能带来生育水平下降的问题,这为理解我国低生育率问题提供了新的思路和视角。

  今年5月,北大核心期刊《人口研究》同期刊发了两篇有关互联网与生育意愿关系的研究文章,题目分别为《互联网使用会影响居民生育意愿吗?》、《上网为什么会影响个人生育意愿?》。前文作者为邱磊菊、冯宜强、史宇鹏、孙宝文,来自中央财经大学中国互联网经济研究院、信息学院、经济学院。后文作者为陈卫民、万佳乐、李超伟,来自南开大学人口与发展研究所、南京农业大学金融学院。

  这两份研究都通过实证分析发现,上网会降低居民的生育意愿。如,《互联网使用会影响居民生育意愿吗?》一文分析表明:上网时间每增加1%,个体的生育意愿降低169%。

  那么,上网究竟是如何在潜移默化之中影响居民生育意愿的?

  增加生育焦虑;改变生育观念;刺激消费,挤压生育养育预算;网络社交和娱乐部分替代生儿育女的效用满足……这些影响机制被一一揭示。

  上网的人比不上网的人生育意愿降低约105%

  《互联网使用会影响居民生育意愿吗?》一文使用中国家庭追踪调查(CFPS)数据以及相匹配的城市统计数据,实证分析了互联网使用对居民生育意愿的影响。

  该文使用的微观个体数据为北京大学中国社会科学调查中心公布的2018年中国家庭追踪调查数据(2018 China Family Panel Studies,CFPS2018)。根据女性生育年龄的合理性,研究剔除了小于20岁与大于45岁的女性样本,由于男性的生育年龄可以延续至更大岁数,研究保留全部男性样本,成人问卷数据匹配家庭与少儿问卷后得到样本量为10342个。

  该研究使用“生育意愿”和“实际生育行为”两个指标刻画被解释变量,该研究的核心解释变量是“个体互联网使用情况”,同时,研究纳入了一系列个体特征、家庭特征作为控制变量。研究使用Poisson回归模型进行估计。

  研究显示,控制了影响生育意愿的其他因素和内生性问题后,分析结果表明,使用互联网的居民比不使用者的生育意愿降低了约105%。

  同时,考虑到个体之间存在差异,该研究将互联网使用与一系列虚拟变量(学历、收入、经济水平等)的交互项放入回归,研究异质性。分析结果表明,居住在经济发达城市、低学历、低收入的互联网使用者生育意愿降幅更加明显。

  对此,研究者分析道,造成以上差异的原因可能是,经济发达城市的互联网使用人群更容易接受新兴观念冲击,受教育程度低的人群因自身认知水平限制更有可能受到互联网上非主流文化的影响并改变自己的生育观念。

  此外,研究还利用2015年10月出台的全面两孩政策这个外生冲击构成的准自然实验来检验互联网使用对生育意愿的影响。

  研究将2014年与2018年中国家庭追踪调查数据(CFPS)匹配成面板数据,将2014年视为“政策实施之前”,2018年视为“政策实施之后”。其中,2014年使用互联网的个体为实验组,不使用互联网的个体为控制组,利用双重差分方法(DID)对因变量生育意愿进行估计。

  结果显示,全面两孩政策显著提高了居民的生育意愿,但使用互联网的个体比不使用互联网的个体受全面两孩政策的影响较小,即互联网使用削弱了全面两孩政策对生育意愿的提升作用。

  研究进一步探究了互联网使用与实际生育行为之间的关系,研究匹配2016年与2018年中国家庭追踪调查数据(CFPS)的样本构建面板数据,使用2016年“个体互联网使用情况”作为核心解释变量,对被解释变量“生育行为”进行回归。

  结果表明,给定其他变量的情况下,使用互联网的个体生孩子的概率比不使用互联网的个体低43%;在使用互联网的群体中,每周上网时间每增加1%,生孩子的概率降低17%。

  “恐育”信息影响生育

  互联网中较为常见的“生育焦虑”信息引发了研究者的关注。

  《互联网使用会影响居民生育意愿吗?》一文用“搜索指标”来代理互联网上相关信息的传播热度,通过爬虫技术获取了相应年份城市层面关于“丁克”“堕胎”“避孕”“人工流产”4个关键词的百度搜索指数。

  考虑到不同城市网民规模的不同,研究将获取的搜索指数除以城市互联网用户数以校正搜索指标,并分别用互联网使用对这4个搜索指数进行回归,再用各搜索指数对生育意愿进行回归。

  回归结果显示,互联网使用对4个搜索指数具有正向作用,可见个体的互联网使用促进了他们对丁克、堕胎、避孕和人工流产等生育负面话题的关注。各搜索指数对生育意愿都具有显著的负向作用,说明互联网使用者会受到互联网上负面信息的影响而降低生育意愿。

  《上网为什么会影响个人生育意愿?》一文则将互联网与各类传统媒体进行了横向对比,以考察互联网对生育意愿的影响是否具有特殊性。

  该文数据来自2017年中国综合社会调查(2017 Chinese General Social Survey,CGSS2017)数据库,该调查开始于2003年,样本覆盖了中国31个省(自治区、直辖市),样本量大,涉及内容多,是公认的权威数据库。该文结合研究需求,最终保留7226个样本。

  研究选择报纸、杂志、电视、手机定制消息4种传统媒介与互联网进行比较,回归结果显示,使用报纸、杂志、电视、手机定制消息4种传统媒介对个人生育意 愿的影响都不具有统计显著性,只有上网的影响是显著为负的;即使把各种媒介都放在一起观察,也只有上网的影响显著。

  究其原因,作者分析道,上网在信息功能方面与传统媒介有根本的区别,那就是互联网具有开放性和相对较弱的约束性,匿名发布的信息较多,并常常带有较强的个人情绪,各类观点鱼龙混杂,不乏前卫和时尚。互联网上的观点和信息常常传播快、流行广,对上网者产生不自觉的影响。这些特点使互联网传播能放大负面信息的影响力,比如在生育问题上,强化生育的成本和负担意识,进而对个人生育意愿产生消极影响。

  该文作者提出,要加强对互联网信息的合理监管,包括降低网络上充斥的生育焦虑信息对个人生育意愿的影响,多提供科学、权威的生育知识和相关信息,引导公民树立积极正确的生育观念;要大力弘扬中华民族传统美德,构建新型婚育文化,尊重生育的社会价值,完善和落实各项生育支持政策,营造生育友好的社会环境,从根本上提高人们的生育意愿。

  消费诱惑挤压生育

  两项研究还构建起了“网络消费”与“生育”的关系。

  《上网为什么会影响个人生育意愿?》一文中,作者提出了“消费替代机制”的假设,以探究上网对个人生育意愿的影响。

  对于“消费替代机制”,该文从定性和定量两个方面进行了分析。定性方面,研究用受访者对CGSS2017问卷中“关于网上购物,您是否同意互联网可以随时随地购物,购物更加疯狂”的回答情况来反映其网络购物消费习惯;定量方面,用CGSS2017问卷中的“文化休闲娱乐支出(含旅游)占个人收入的比例”来反映消费状况。

  分析结果显示,用上述两个指标衡量,上网都产生了激发个人消费欲望、增加消费的作用。作者分析道,消费带来的满足一方面直接替代孩子的效用;另一方面加剧经济预算紧张,挤压可用于生育的资源,进而降低个人生育意愿。“消费替代机制”得到了验证。

  该研究还进一步对比了不同目的的上网行为对个人生育意愿的影响。

  由于该文CGSS2017数据中缺乏上网目的的指标,因此这一部分研究改用2018年中国家庭追踪调查(2018 Chinese Family Panel Studies,CFPS2018)数据进行实证检验。CFPS2018数据中将上网目的分为 5 种:学习、工作、社交、娱乐、商业活动(使用网银、网上购物等)。

  分析结果显示,不同目的的上网行为对个人生育意愿的影响存在显著差异,为学习、工作、社交目的上网对个人生育意愿没有显著影响,而为娱乐、商业活动目的上网则对个人生育意愿至少在5%的显著性水平上具有负向影响。

  对此,作者分析道,互联网娱乐具体内容很多,上网冲浪是主要形式之一。人们在上网冲浪中接受五花八门的信息,观念和行为不自觉地受到影响,生育观念的改变也在其中。购物、支付类上网行为标示着消费活动。互联网在方便购物的同时,也刺激消费欲望,增加消费支出,挤压生育预算,从而降低个人生育意愿。

  对于“消费替代机制”,《互联网使用会影响居民生育意愿吗?》一文给出了类似结论,并更具体地提出了“效用替代机制”。

  该文分析结果表明,业余生活上网时间越长,生育意愿就越低。上网时间每增加1%,个体的生育意愿降低169%;同时,上网社交与娱乐对生育意愿产生显著的负向影响。

  对此,作者提出,互联网通过提供低成本的网上社交和娱乐活动,部分替代了生儿育女所带来的效用满足,进而对居民生育意愿造成影响,此即“效用替代机制”。

  基于研究结果,作者写道,我们认为政府应加强对居民的引导,使之不将精神世界和情感需求过多寄托于互联网、沉迷于虚拟世界的娱乐与社交,而将更多业余时间用于陪伴家人。

  传统生育观念被削弱

  网络是如何影响“传统生育观念”的?两篇论文均对此进行了研究分析。

  《互联网使用会影响居民生育意愿吗?》一文作者提出,如果互联网使用者经常接触一些“前卫信息”,可能会削弱他们的传统生育观念,进而降低生育意愿。

  为验证此种机制,研究运用CFPS2018问卷中的两个问题“你认为传宗接代的重要程度”和“希望要几个男孩”来构建两个被解释变量“传宗接代”和“养儿防老”以反映传统的生育观念,并分别用“互联网使用”对其进行回归,检验互联网使用是否影响传统生育观念。

  结果显示,互联网使用者的“传宗接代”和“养儿防老”的观念更加薄弱,降低了其生育意愿。

  《上网为什么会影响个人生育意愿?》则用受访者对CGSS2017问卷中“为了传宗接代,至少要生一个儿子”观点的认可程度来衡量“传宗接代”的传统生育观念,对CGSS2017问卷中“您是否同意家庭的幸福应该优先于个人的利益的说法”的认可程度来衡量“重视个人价值”的现代生育观念。

  分析结果显示与上篇文章类似:上网显著削弱了个人“传宗接代”的传统观念。上网也显著降低了个人对“家庭的幸福应该优先于个人的利益”的认可程度。

  研究者写道,上网频率越高,个人越不认可为了传宗接代而多生育孩子的观点。互联网冲击了传宗接代的传统生育文化,降低了个人生育意愿。上网让个人更多关注自身发展和需求,将更多的时间与资源用于满足自身而非家庭的效用,更多基于自身幸福和内心感受来考虑生育,进而降低个人生育意愿。由此可见,促进生育观念的改变是上网影响个人生育意愿的作用机制之一。

  近年来,我国大力实施“宽带中国”战略,加快落实提速降费等政策,有力地促进了信息技术发展和互联网普及。中国互联网络信息中心(CNNIC)发布的第50次《中国互联网络发展状况统计报告》显示,截至2022年6月,我国网民规模为1051亿,网民人均每周上网时长为295个小时,网民使用手机上网的比例达996%。

  《上网为什么会影响个人生育意愿?》一文作者提出,互联网改变了人们获取信息的方式,提高了信息搜寻效率,正在悄然改变人们的价值观念和生活方式,包括对人们的生育意愿和生育行为产生重要影响,对此需要高度重视。

1、数据录入SPSS。

2、选择Analyze→Regression→Binary Logistic。

3、主对话框设置:将因变量cancer送入Dependent框中,将纳入模型的自变量sex, age, BMI和COPD变量Covariates中。本研究中,纳入age变量仅仅是为了调整该变量带来的混杂(不关心该变量的OR值),因此将age直接将改变量纳入Logistic回归模型。

4、Categorical设置:该选项可将多分类变量(包括有序多分类和无序多分类)变换成哑变量,指定某一分类为参照。本研究中,COPD是多分类变量,我们指定“无COPD病史”的研究对象为参照组,分别比较“轻/中度”和“重度”组相对于参照组患肺癌的风险变化。 

5、点击Categorical→将左侧Covariates中的COPD变量送入右侧Categorical Covariates中。

6、Hosmer-Lemeshow goodness-of-fit:检验模型的拟合优度;  CI for exp(B):结果给出OR值的95%可信区间; Display→At last step:仅展示变量筛选的最后一步结果。 →Continue→回到主界面→OK。

根据一些研究,互联网的普及和使用可能会对生育意愿产生一些影响,其中一些原因可能包括:

1 越来越多的年轻人和夫妇选择追求事业和个人发展,而不是把时间和精力用于家庭和育儿。

2 互联网泛滥的信息量和社交媒体的影响力可能会导致年轻人的焦虑和压力增大,从而影响其生育决策。

3 成本压力。互联网时代的生活成本可能会高于以前的生活方式,从而让许多夫妇难以承担生育所需的费用。

4 婚姻观念改变。许多年轻人倾向于追求自由和独立,而不是传统意义上的结婚和生育。

综上所述,互联网的普及和使用可能会对居民生育意愿产生一些影响,但也会因个人情况和社会和文化背景而有所不同。

在互联网时代,网络信息、文化之于人们生活方式和思维方式的影响,可谓无处不在、无时不在。无疑,网络信息对生育态度的影响也是存在的。

那么,互联网究竟是怎样影响人们的生育意愿的?

理论上,上网本身不足以直接影响网民的生育观念和行为。因为网上信息呈现出多样化面孔,当然也不乏一些对生育不友好的、不鼓励生育的信息。譬如,不婚主义、剩男剩女、单身人口与经济、丁克家庭、离婚率上升、教育内卷、孩子抚养成本高等种种现象,似乎都指向低生育是大势所趋。

长期处于网络低生育文化的熏陶下,网民潜移默化会受到低生育观念的影响。

潇洒的丁克文化背后,一定程度上是人们对生育焦虑的情绪表达和对生育压力的主动逃避,是生育信心指数下降的表现。不过,相关关系不等于是因果关系。应用截面数据分析时要特别小心变量之间的关系,没有前后向联系,很难做出因果推断的结论。

实证分析之前,应该首先是合乎逻辑的定性分析。关键在于要避免自说自话,预设答案。

如今,年轻人几乎没有不上网的,除非是某些不便上网的残障人士或者难以跨越“数字鸿沟”的老年人。或许首先要回答,使用互联网的居民和不使用者人数可比吗?统计上是否合理?不使用者又是什么性质的人群,是老年人还是年轻人?

简单的答案里,包含着无穷的可能性。

社会科学具有模糊性特点,过度追求精确反而会失其要义,令人不得要领。值得关注的还有网民的人口学特征与生育态度,要知道网民的异质性极大。对于已经完成生育任务的人们,上网自然不会影响其生育观念;对于还没有结婚的人来说,生育也是下一步的事;唯独结婚还未生育的人来说,网络有关生育的信息可能会影响其生育态度和信心。

因此,不能一概而论,而应区别对待。更应该关注的是这两类人群,一类是已经结婚但还没有生育的人们;另一类是已生育一孩的家庭,在生育政策放开之后有可能再生育。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/jiehun/9325600.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-10-10
下一篇2023-10-10

发表评论

登录后才能评论

评论列表(0条)

    保存