CDA

数据分析并不是盲目取数,掌握正确的分析流程比学了一堆数据分析理论和模型更加重要。有时候,我们学了很多数据理论,但面对真实业务问题,依然不知道从哪里下手?

有时候,知识点记得越多,反而越容易陷入迷茫,比如会常常搞混该用哪个、怎么串起来用?在这种情况下,就需要学会掌握完整的数据分析流程。

01

确定目标和整理数据

在如今数据驱动决策的时代,真正拉开分析师差距的,不是工具,而是方法。做数据分析,其实就是明确问题-分析原因-落地建议的过程。

1.确定分析目标

在开始做数据分析之前,首先要做的事明确分析目标,这是重中之重。

确定分析目的,拥有清晰的数据分析思路是有效进行数据分析的首要条件。只有思路清晰,才能为资料的收集、处理和分析提供明确的指导。

2.数据获取和整理

在确定了分析目标后,就要进行数据的获取、清洗和整理,这一步骤也十分重要,这直接决定了你能否做出正确的分析。

介绍几种常见的数据清洗和整理的方法:

01 处理缺失值

处理缺失值指的是在数据分析过程中处理缺失值(即数据集中缺少的数据)的方法。

其主要方式包括:‍

  • 删除:删除行/列中缺失的值

  • 归纳:用统计数据(均值,中位数,模态)或预测(回归,kNN)填充缺失值

  • 插值:根据其他样本的值估计缺失值

  • 外推:根据趋势预测缺失值

  • 匿名化:掩盖或扰乱缺失的值以保持隐私。

02 删除重复项

删除重复项指的是识别并消除数据集中重复或冗余的条目。这是数据清理和预处理中的一个重要步骤,可以确保对唯一且准确的数据执行分析。

具体方法包括:‍

  • 删除:删除所有重复的行

  • 保留首行:保留重复行的首行数据,并删除其余的行

  • 保留末行:保留重复行的末尾数据,并删除其余的行

  • 自定义:定义一个自定义方法来确定要保留或删除哪些副本。

03 处理异常值

处理异常值是指识别和处理数据集中与其余数据显著不同的极端值的过程。异常值可能会对数据分析的结果产生重大影响,如果处理不当,可能会使结果发生偏差。

处理异常值有几种方法,包括:‍

  • 移除:移除离群数据点

  • 修剪:只保留指定百分比的数据,丢弃极端值

  • 替换:用更接近其他数据点的指定值替换

  • 极端值归纳:将异常值替换为统计值,例如平均值或中位数

  • 转换:转换数据以减少异常值的影响

【干货】数据分析如何做?只需掌握这4个步骤!

方法的选择将取决于数据的具体要求和正在执行的分析。重要的是要考虑异常值对结果的潜在影响,并仔细选择适当的方法来处理它们。

04 转换格式和类型

格式和类型转换是指将一种数据格式转换为另一种格式或数据类型的过程。

例如,将字符串转换为数字,或将数字格式化为特定的字符串形式。

02

数据分析和结果呈现

对数据进行收集和整理后,就要开始对数据进行分析。在这一阶段,最重要的就是选择合适的数据分析方法。

1.选择数据分析方法

在这里,给大家推荐比较两种比较常见的数据分析方法:

01 关联分析 

关联分析,也叫作“购物篮分析”,是一种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法。

关联分析目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。

02 对比分析

对比法就是用两组或两组以上的数据进行比较。对比法是一种挖掘数据规律的思维,能够和任何技巧结合,一次合格的分析一定要用到N次对比。

对比主要分为以下几种:

  • 横向对比:同一层级不同对象比较,如江苏不同市茅台销售情况。

  • 纵向对比:同一对象不同层级比较,如江苏南京2021年各月份茅台销售情况。

  • 目标对比:常见于目标管理,如完成率等。

  • 时间对比:如同比、环比、月销售情况等,很多地方都会用到时间对比。

2.结果呈现

数据分析结果主要是通过数据可视化图表和数据分析报告来呈现。

可视化是数据分析结果呈现的重要步骤,可视化是以图表方式呈现数据分析结果,这样的结果会更清晰、直观,容易被理解。

推荐使用的工具包括Excel、Tableau、Power BI等,这些工具都是制作各种可视化图表的常见工具。

最后就是根据分析情况形成数据分析报告。需要注意的是,数据分析报告要尽量做到:架构清晰、主次分明核心结论先行、有逻辑有依据结合实际业务、建议合理分析需要基于可靠的数据源尽量图表化,提高可读性。

通过上面的步骤,我们就能对数据分析的基本流程有了全面的掌握和了解。当前是一个由数据驱动的时代,无论是在日常生活,还是工作中,数据都随处可见。

建议对数据分析感兴趣的小伙伴可以考一个CDA数据分析师,CDA数据分析师认证体系包含数据模型、用户价值分析等多个实战框架,可以帮助我们在工作中更好地运用,提高电商运营的专业度。