《数据分析思维-分析方法和业务知识》读书笔记

此书由猴子与数据分析学院的作者们联合编写,此书在前两章介绍了许多数据分析方法,余下的十几章都是讲的具体的行业分析案例。

也是在此书中我才了解了如何解决“北京有多少特斯拉”这样的问题,也了解到这样的问题其实名叫“费米问题”。

以下是读书笔记

如果你不能衡量,那么你就不能有效增长——彼得·德鲁克

图片分享App Instagram在早期的社交功能和现在不一样,当时市面上已经有了Facebook这样多功能的社交产品,如果做的产品和facebook一样,是很难走下去的。在分析用户需求后,公司发现用户对分相照片的需求很大,于是公司团队找到的北极星指标是照片分享率,在意照片为核心去设计产品,最后只留下了照片、评论和点赞功能,并增加了美化拍照的滤镜。改变几个月后,专注于图片社交分享的Instagram正式推出,上线一天便获得25000个用户,3个月后这个数字达到100万。

喜马拉雅公司内部定的核心指标是用户的收听时长,就是每一个用户进来以后,他能听多久的音频。

  1. 明确部门KPI,找到一级指标
  2. 了解业务运营情况,找到二级指标
  3. 梳理业务流程,找到三级指标
  4. 通过报表监控指标,不断更新指标体系

常用的分析方法:

  • 5W2H分析方法
  • 逻辑树分析方法
  • PEST分析方法
  • 多维度拆解分析方法
  • 对比分析方法
  • 假设分析方法
  • 群组分析方法
  • RFM分析方法
  • AARRR模型分析方法
  • 漏斗分析方法

5W2H:

  • What 是什么
  • When 何时
  • Where 何地
  • Why 为什么
  • Who 是谁
  • How 怎么做
  • How much 多少钱

逻辑树分析方法

逻辑树分析方法是由科学家费米提出来的,这种分析问题的方法在面试中会经常用到,例如:北京有多少量特斯拉汽车?某胡同口的煎饼摊一年能卖出多少个煎饼?深圳有多少个产品经理?一辆公交车里能装下多少个乒乓球?一个正常成年人有多少根头发?

这类估算问题,被称为“费米问题”

回答费米问题,可以用到逻辑树分析方法,讲一个复杂的问题拆解成子问题,然后逐一解决。下面我们就用一个例子来学习如何解决这类问题。

有人曾经问费米:“芝加哥有多少钢琴调音师?”,对于这个问题,可以使用逻辑树分析方法来拆解。钢琴调音师数量=全部钢琴调音师1年的总工作时间/一位调音师每年的工作时间。所以,可以把这个问题拆解为两个子问题: 1. 全部钢琴调音师1年的总工作时间;
2. 一位调音师每年的工作时间

... 全部调音师1年的总工作时间是3个子问题的数字相乘,一共是10万小时,而调音师每年工作1600小时,我们用全部钢琴调音师1年的总工作时间,除以 一位调音师每年工作时间,就得到了62.5.再四舍五入,费米预测芝加哥大概有63位调音师。

这个答案准不准呢?后来费米找到了一张芝加哥钢琴调音师的名单,上面一共有83人,有不少人名还是重复的。所以费米估算出来的结果已经相当准了。

PEST分析方法

PEST分析方法是对公司发展宏观环境的分析,所以经常用于行业分析。通常是从政策(Policy)、经济(Economy)、社会(Socuety)和技术(Technology)这四个方面来分析的。

多维度拆解分析方法:

拆解就是做加法A=维度1+维度2+维度3+...

通过多维度拆解数据,我们发现了和一开始截然相反的结论,这种现象被称为“辛普森悖论”,也就是在有些情况下,考查数据整体和考察数据的不同部分,会得到相反的结论。

  1. 从指标构成来拆解
  2. 从业务流程来拆解

对比分析方法

弄清楚两个问题:
1. 和谁比
2. 如何比较

通过对比分析方法可以看出,硬件净利润率能达到5%的公司几乎就没有,所以雷军这个承诺其实是一种经过数据分析得出的结论,既不会让小米陷入无法实现承诺的困境,又可以在用户心中留下“小米性价比高”的产品形象。

西罗克在奥巴马捐赠页面上进行了A/B测试,发现: 1. 对于第一次访问竞选网站的用户,按钮文字是“捐赠并领取礼物”效果最好
2. 对于长期访问竞选网站,但是从来没有捐款的用户,按钮文字是“捐款”效果最好;
3. 对于过去曾经捐过款的用户,按钮文字是“捐助”效果最好。

相关性分析方法

针对数千名英国公务员的多项调查发现,那些对自己的工作没有支配能力的雇员,也就是基本上对干什么、怎么干没有话语权的人,相比起那些拥有更多决策权的雇员来说,猝死率更高。

可以使用Excel进行相关性分析

避免只是用单独的一种分析方法,而是用其他方法做补充,使得分析结论完整而丰富。

相关关系不等于因果关系。在使用的时候注意这一点,可以提高分析的质量。

根据法国一个社会学研究成果,学校在一个人的成长过程当中只有15%的作用,它跟孩子的成长、成功只有相关关系。唯一和孩子成功成长有因果关系的是家庭。这里家庭就是存在的第3方因素,家庭教育越好,孩子越成功。

在大部分的时候,是无法找到因果关系的,但仅仅知道相关关系也能帮助我们。沃尔玛公司有一个著名的统计案例。他们发现,在美国,每当有飓风来的时候,超市里一种草莓味道的饼干就会销量大增。显然,这两者之间只是相关关系。对于这种问题,没人知道背后的真实原因,但是利用好“相关分析”就够了,以后再有飓风来的时候。对于这种问题,超时就要多备一些这样的饼干。

假设分析方法

  1. 提出假设
  2. 收集证据
  3. 得出结论

既然假设1发现了问题,为什么还要去验证假设2和假设3?这是因为一个问题发生可能有多种原因造成的,需要找到不同的原因,这样后面决策的时候,才能分别根据不同原因制定不同的策略。

群组分析方法

核心用户组为什么留存率高呢?如果能找到这些用户有哪些共同行为,那么就找到了用户留存下来的原因。

通过使用群组分析方法和相关分析方法,推特团队找到了用户留存率低的原因。最后,他们利用分析结论优化了产品,就是在新用户注册的时候,根据用户的兴趣选择向他推荐30个他最可能感兴趣的账号,这样才可以使新用户成为长期活跃用户。

RFM分析方法

RFM是三个指标的缩写:最近一次消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary)

AARRR分析方法

  1. 获取用户 (Acquisition)
  2. 激活用户 (Activation)
  3. 提高留存 (Retention)
  4. 增加收入 (Retention)
  5. 推荐 (Referral)

这一环节有个概念需要重视,那就是“夹点”,它指的是损失潜在受益的地方。例如电商购物中,用户从选择商品到支付之间,很多人会中途放弃付费。要评估这些常见的夹点,分析用户在这些关键环节放弃的原因。

kisence

潮落江平未有风。