跳至正文

《成为数据分析师》-pdf,txt,mobi,kindle,epub电子版书免费百度云百度网盘

由于链接总是被和谐,需要本书电子版的朋友关注公众号:美书书(账号:meishushu2023),首页回复数字1335, 自动弹出下载地址.

【内容简介】

《成为数据分析师》是2018年浙江人民出版社出版的图书,作者是托马斯·达文波特 金镇浩 著

内容简介

《成为数据分析师》为掌握数据分析技能提供了一条清晰可行的路线图,懂得如何运用数据分析检视问题、解决问题,进而提出深入的商业洞见。

作者简介

托马斯·达文波特,1954年10月17日出生于美国。毕业于哈佛大学,曾先后在哈佛商学院、芝加哥大学和波士顿大学任教。

引言

数据决策时代,人人都是分析师

我们生活在一个数据泛滥的时代。数据正以惊人的速度在增长,每个人的下一秒都会被更多的数据包围。我们收集数据的主要目的是完善企业、政府和社会层面的决策制定机制。因此,如果我们无法通过定量分析,利用数据实现更好的决策制定,就是对数据资源的浪费,也有可能造成不良后果。因此,本书致力于为你展示定量分析的运作方式,以及该如何利用定量分析做出更好的决策,即使你没有相关知识背景,也无妨。

数据,创新产品与服务的源泉

数据的力量正在各行各业中崛起。如果你热爱运动,那肯定知道《点球成金》(Moneyball)这部电影,影片主角奥克兰运动家棒球队总经理比利·比恩(Billy Beane)利用球员的表现数据和分析学革新了职业棒球运动。现在,这种革新已经延伸到了所有的主流体育项目当中。如果你喜欢玩在线游戏,可能知道星佳(Zynga)和美国艺电(Electronic Arts),这些社交网络游戏公司正在收集并分析用户所有的游戏行为。那电影呢?你也许知道奈飞(Netflix)可以利用算法预测你可能喜欢的电影,好莱坞的一些制片人会利用算法来推断什么样的电影投资回报率高,美国独立电影公司相对论传媒(Relativity Media)就是这么做的。

数据种类各不相同。有的数据因为事务性用途被收集和管理,比如,企业和机构通过跟踪员工上班时间和剩余假期所得的数据。当企业收集到大量数据之后,就希望能读懂这些数据,并在此基础上做出决策。同样地,也可以利用分析学来研究与人力资源相关的事务性数据,企业可能会提出“下一年度有多少员工可能会退休”或者“员工休完所有的假期和其年度绩效考核之间是否存在关联”之类的问题。

不过,数据和分析学的作用并不局限于完善内部决策的制定。像谷歌、Facebook、亚马逊和eBay等许多立足于互联网的企业,都在利用收集网上交易数据所形成的大数据来支撑决策制定以及为客户提供新产品和服务。无论你是想实现更富成效的内部决策,还是想为客户提供更具价值的产品,分析学必不可少,它会对数据进行汇总、分析,并找出其中的含义和内在关联。要读懂并挖掘出数据的价值,必须借助数学或统计分析,简单地说,就是分析学。

人人都是分析师

数据分析的本质

一般情况下,我们所说的分析是指,使用大量数据、统计和定量分析、解释和预测模型以及基于事实的管理来推动决策过程与实现价值增生。

根据分析的方法和目的,分析可以被划分为描述性分析(descriptive analytics)、预测性分析(predictive analytics)和规范性分析(prescriptive analytics)。描述性分析包括数据收集、整理、制表、制图以及描述正要研究的事物的特征,这类分析以往被称为“报告”。描述性分析可能非常有用,但它不能解释某种结果出现的原因或者未来可能会发生的事情。

预测性分析不仅可以对数据特征和变量(可以假定取值范围的因素)之间的关系进行描述,还可以基于过去的数据预测未来。预测性分析首先会确定变量之间的关联,然后基于这种已知关联预测另一种现象出现的可能性,比如在看到某个广告后,一位消费者可能会去买产品的可能性。虽然预测性分析中的预测是基于变量之间的关联做出的,但这并不代表预测性分析都需要明确因果关系。事实上,准确的预测并不一定需要基于因果关系。

规范性分析是更高层次的分析,如实验设计和优化等。就像医生会在处方上建议患者采取什么行动一样,实验设计试图通过做实验给出某些事情发生的原因。为了能够在因果关系研究中信心饱满地做出推断,研究人员必须妥善处理一个或多个独立的变量,并有效控制其他无关的变量。如果处于实验环境下的测试组的表现大大优于对照组,决策制定者就应该立即推广这种实验环境。

优化是规范性分析采用的一种方法,指试图识别出一个特定变量与另一个变量之间理想的关系水平。例如,我们可能会对识别最有可能让产品实现高收益的价格感兴趣。同样地,优化这种方法能够识别出使零售企业最大限度避免缺货情况的库存水平。

根据分析采用的方法以及收集和分析的数据类型,我们可以将分析分为定性分析(qualitative analysis)和定量分析(quantitative analysis)。定性分析的目的是深入了解某种现象出现的根本原因和诱因。非结构化数据通常是从少数非代表性案例中收集而来,并进行了非统计性的分析。定性分析是分析的最初阶段,它通常是探索性研究的有效工具。定量分析是指通过统计、数学或计算的方法对现象进行系统的实证研究。通常情况下,结构化数据是从大量典型案例中收集而来,并进行统计分析。

为了服务于研究者的不同研究目的,存在以下几种类型的分析:

统计学:收集、整理、分析、说明和呈现数据的学科。

预测:根据已有数据,预测一些感兴趣的变量在未来某个特定时间点的情况。

数据挖掘:通过使用算法和统计技术,自动或半自动地提取大量数据中未知的有趣模式。

文本挖掘:用类似于数据挖掘的方式从文本中得出模式和趋势的过程。

优化:在同时满足约束条件的情况下,按照某些标准,利用数学方法来寻找最优的解决方案。

实验设计:给各组随机分配被试,然后使用测试组和对照组来推导出特定结果中存在的因果关系。

发表评论