数据分析师的课程包括两个层面的内容,只有把数据分析师的这些课程都学会并且运用,你就可以成为一名顶级的大数据分析师。
一、课程层面
第一级别:数据分析课程内容主要是从理论-实操-案例应用步步进阶,能让学员充分掌握概率论和统计理论基础,能够熟练运用Excel、SPSS、SAS等一门专业分析软件,有良好的商业理解能力,能够根据业务问题指标利用常用数据分析方法进行数据的处理与分析,并得出逻辑清晰的业务报告。
第二级别:在第一级别的基础上,第二级别包括建模分析师与大数据分析师,即为企业决策提供及时有效、易实现、可信赖的数据支持。建模分析师,指在ZF、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。本课程针对数据挖掘整套流程,以金融、电信、电商和零售业为案例背景深入讲授数据挖掘的主要算法。并将SAS Enterprise Miner、SPSS Moderler、SAS编程和SQL进行有效的结合,让学员胜任全方位的数据挖掘运用场景。大数据分析师,本课程以大数据分析为目标,从数据分析基础、JAVA语言入门和linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce和Hbase等理论知识和hadoop的生态环境,详细演示hadoop三种模式的安装配置,以案例的形式,重点讲解基于mahout项目的大数据分析之聚类、分类以及主题推荐。通过演示实际的大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。
二、数据分析师的知识结构
1、业务
从事数据分析工作的前提就会需要懂业务,即熟悉行业知识、公司业务及流程,最好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的使用价值。
2、管理
一方面是搭建数据分析框架的要求,比如确定分析思路就需要用到营销、管理等理论知识来指导,如果不熟悉管理理论,就很难搭建数据分析的框架,后续的数据分析也很难进行。另一方面的作用是针对数据分析结论提出有指导意义的分析建议。
3、分析
指掌握数据分析基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,以便有效的开展数据分析。基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等。高级的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。
4、使用工具
指掌握数据分析相关的常用工具。数据分析方法是理论,而数据分析工具就是实现数据分析方法理论的工具,面对越来越庞大的数据,我们不能依靠计算器进行分析,必须依靠强大的数据分析工具帮我们完成数据分析工作。
5、设计
懂设计是指运用图表有效表达数据分析师的分析观点,使分析结果一目了然。图表的设计是门大学问,如图形的选择、版式的设计、颜色的搭配等等,都需要掌握一定的设计原则。
扩展资料:
数据分析师 是数据师Datician的一种,指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。
这是一个用数据说话的时代,也是一个依靠数据竞争的时代。目前世界500强企业中,有90%以上都建立了数据分析部门。IBM、微软、Google等知名公司都积极投资数据业务,建立数据部门,培养数据分析团队。各国政府和越来越多的企业意识到数据和信息已经成为企业的智力资产和资源,数据的分析和处理能力正在成为日益倚重的技术手段。
—数据分析师
数据分析师的基本工作流程:
1定义问题
确定需要的问题,以及想得出的结论。需要考虑的选项有很多,要根据所在业务去判断。常见的有:变化趋势、用户画像、影响因素、历史数据等。
2数据获取
数据获取的方式有很多种:
一是直接从企业数据库调取,需要SQL技能去完成数据提取等的数据库管理工作。
二是获取公开数据,政府、企业、统计局等机构有。
三是通过Python编写网页爬虫。
3数据预处理
对残缺、重复等异常数据进行清洗。
4数据分析与建模
这个部分需要了解基本的统计分析方法、数据挖掘算法,了解不同统计方法适用的场景和适合的问题。
5数据可视化和分析报告撰写
学习一款可视化工具,将数据通过可视化最直观的展现出来。
数据分析入门需要掌握的技能有:
1 SQL(数据库):
怎么从数据库取数据?怎么取到自己想要的特定的数据?等这些问题就是你首要考虑的问题,而这些问题都是通过SQL解决的,所以SQL是数据分析的最基础的技能。
2 excel
分析师更多的时候是在分析数据,分析数据时需要把数据放到一个文件里,就是excel。
熟练excel常用公式,学会做数据透视表,什么数据画什么图等。
3Python或者R的基础:
必备项,也是加分项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。
4学习一个可视化工具
如果你想往更高层次发展,上面的东西顶多只占20%,剩下的80%则是业务理解能力,目标拆解能力,根据数据需求更多新技能的学习能力。
现在远程授课很普遍,我去年也报的CDA数据就业班,也是远程授课,但是学习效率还不错,CDA除了课上会有导师为你解答疑问,对于重难点知识和同学普遍反应的问题,助教还会每周进行1-2次的直播串讲,一般都在两小时左右,主要针对各种重点问题进行解析,除正常答疑外,在课程持续期间,助教还会实时统计学员出勤情况,监督课堂纪律,跟进学习进度。个人感觉还是很有效率的,备战年底统考了,当然,每个人的学习习惯不同,效果多少也会有差异,远程上课是跟个人的坚持有关系的,只要你能坚持学习与练习,远程课一样出成绩的。
第一方面是数学基础,第二方面是统计学基础,第三方面是计算机基础。要想在数据分析的道路上走得更远,一定要注重数学和统计学的学习。数据分析说到底就是寻找数据背后的规律,而寻找规律就需要具备算法的设计能力,所以数学和统计学对于数据分析是非常重要的。
而想要快速成为数据分析师,则可以从计算机知识开始学起,具体点就是从数据分析工具开始学起,然后在学习工具使用过程中,辅助算法以及行业致死的学习。学习数据分析工具往往从Excel工具开始学起,Excel是目前职场人比较常用的数据分析工具,通常在面对10万条以内的结构化数据时,Excel还是能够胜任的。对于大部分职场人来说,掌握Excel的数据分析功能能够应付大部分常见的数据分析场景。
在掌握Excel之后,接下来就应该进一步学习数据库的相关知识了,可以从关系型数据库开始学起,重点在于Sql语言。掌握数据库之后,数据分析能力会有一个较大幅度的提升,能够分析的数据量也会有明显的提升。如果采用数据库和BI工具进行结合,那么数据分析的结果会更加丰富,同时也会有一个比较直观的呈现界面。
数据分析的最后一步就需要学习编程语言了,目前学习Python语言是个不错的选择,Python语言在大数据分析领域有比较广泛的使用,而且Python语言自身比较简单易学,即使没有编程基础的人也能够学得会。通过Python来采用机器学习的方式实现数据分析是当前比较流行的数据分析方式。
对大数据分析有兴趣的小伙伴们,不妨先从看看大数据分析书籍开始入门!B站上有很多的大数据教学视频,从基础到高级的都有,还挺不错的,知识点讲的很细致,还有完整版的学习路线图。也可以自己去看看,下载学习试试。初级数据分析师,需要掌握概率论和统计理论基础,能够熟练运用 Excel、SPSS、SAS 等一门专业分析软件,有良好的商业理解能力,能够根据业务问题指标利用常用数据分析方法进行数据的处理与分析,并得出逻辑清晰的业务报告。
就业方向:政府、金融、电信、零售等行业前端业务人员
Excel学习:Excel基础操作,逐步学习公式与函数、格式设置、数据高级分析、模拟分析、数据透视表、图表、后期打印以及宏与VBA。数据处理,数据清洗,数据加工,数据抽样,数据报表自动化等(黑体项为必会项)
Tableau学习:Tableau的数据连接与编辑、图形编辑与展示功能,包括数据连接与管理、基础与高级图形分析、地图分、高级数据操作、基础统计分析、如何与 R 集成进行高级分析、分析图表整合以及分析成果共享等
Echarts学习:支持折线图(区域图)、柱状图(条状图)、散点图(气泡图)、K 线图、饼图(环形图)、雷达图(填充雷达 图)、和弦图、力导向布局图、地图、仪盘、漏斗图、事件河流图等 12 类图表,同时提供标题,详情气泡、图例、值域、据区域、时间轴、工具箱等 7 个可交 互组件,支持多图表、组件的联动和混搭展现,最终达到能够利用 Echarts 图表结合后端数据进行前端可视化报表展示
数据挖掘精通(Excel、Oracle、SPSS 初步):oracle 数据库和办公软件 excel,用于存储及处理数据挖掘所需的数据,oracle 数据库(SQL,关系型数据库进行简单的了解)使用 excel 作为简单入门工具对数据挖掘进行了算法实现,数据挖掘专业工具 SPSS MODELER做一些基础性分析(聚类,回归,时序等)
PPT,xmind,Visio学习:visio用来画业务流程图,xmind是思维导图,PPT是用来做汇报的,三个工具学的浅显一点就行,主要为写数据分析报告服务的
思维的学习:BRD,MRD,PRD书写思路,竞品分析,数据产品规划与设计,尽可能了解这些文档的含义,并能针对一两款APP产品,完成上述的文档要求。
统计学(必学):初级数据分析师,对统计要求不高,大部分只有涉及到方差,标准差,一般不会很深奥,但是到中级可能就要求会比较多。
数据分析分析基本思路:采集、清理、转化、存储、可视化、分析决策等等,分析师得对各个行业有比较深的行业经验,特别是行业流程,各个行业的数据分析必须对业务流程熟悉,才能谈决策。
数据分析师要学:数学知识、分析工具、编程语言。
1、数学知识
数学知识是数据分析师的基础知识。对于初级数据分析师,了解一些描述统计相关的基础内容,有一定的公式计算能力即可,了解常用统计模型算法则是加分。
对于高级数据分析师,统计模型相关知识是必备能力,线性代数(主要是矩阵计算相关知识)最好也有一定的了解。而对于数据挖掘工程师,除了统计学以外,各类算法也需要熟练使用,对数学的要求是最高的。
2、分析工具
对于初级数据分析师,玩转Excel是必须的,数据透视表和公式使用必须熟练,VBA是加分。另外,还要学会一个统计分析工具,SPSS作为入门是比较好的。
对于高级数据分析师,使用分析工具是核心能力,VBA基本必备,SPSS/SAS/R至少要熟练使用其中之一,其他分析工具(如Matlab)视情况而定。
3、编程语言
对于初级数据分析师,会写SQL查询,有需要的话写写Hadoop和Hive查询,基本就OK了。对于高级数据分析师,除了SQL以外,学习Python是很有必要的,用来获取和处理数据都是事半功倍。当然其他编程语言也是可以的。
成为一名数据分析师的关键在于: 结合实际业务,建立一套解决问题框架的能力,工具只是完成目的的手段而已。
所以,我把数据分析师的学习路径归纳为:
鉴于不同行业,不同公司对数据分析师的要求不同。大家可以根据自身情况来判断到底该学啥:
金融行业:SAS/SQL
中大厂:R/Python、SQL、A/B test
小型互联网公司:SQL
以中大厂为例,成为数据分析师需要掌握以下几点:
这里用一道大厂真题举例,主要考察 DELETE语句中的子查询 的用法
现需要删除课程表中所有教师年龄小于 21 岁(不包括 21 岁)的课程,请你使用相关的 SQL 语句实现。
首先我们需要在教师表 teachers 中查询到教师年龄小于 21 岁的老师的教师 id ,再根据其教师 id 在课程表 course 中查询该教师 id 所创建的课程并将课程删除。
因此,这里我们首先需要通过嵌套子查询到的信息为符合条件的教师 id,而整个语句是为了删除数据。
使用 SQL 中子查询的方式如下:
执行输出结果:
在删除成功后,我们再对 courses 表进行查询,查看插入结果:
掌握了这类题型后,可以来做下这道练习题
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)