当前位置:首页 > 运营模型 > 在做运营策略之前,你需要掌握用户分群的N种方式!

在做运营策略之前,你需要掌握用户分群的N种方式!

5年前 (2020-11-18)运营模型

在做运营策略之前,你需要掌握用户分群的N种方式!

人群细分是数据分析师们进行用户运营最常用的数据分析方法之一。通过人群细分,可以快速了解产品的核心受众,进而得出洞察结论,指导优化运营策略。很多时候,人群细分之后,分析人员还会进一步分析不同人群在产品核心指标上面的表现差异,从而发现问题并进行优化。

从技术视角,用户分群的方式主要有两种:基于规则的分群方法 (Rule-based Segmentation)和基于算法的分群方法(ML-based Segmentation)。前者主要适用于业务规则确定,分群采用的用户特征维度单一的场景,而后者主要用于用户特征维度高,人工无法设定合理分群规则的场景。

从业务视角,分析师或者运营人员需要考虑的更多是要基于哪些特征维度来对用户进行分群。这往往跟要分析的问题息息相关。常见的用户分群维度包括如下几种:

  • 基于人口属性的用户分群

  • 基于地域属性的用户分群

  • 基于渠道来源的用户分群

  • 基于用户生命周期的分群

然而,在实际应用中,我们也经常通过用户使用的设备品牌,机型,用户使用产品的版本,在产品中的高频行为来对用户进行分群。

以基于人口属性的用户分群方法为例,我们主要考虑用户的年龄,性别,学历,职业,收入,婚育状态等属性。这些信息可以在用户第一次进入产品页面时或者通过在线问卷调查的方式收集。但随着用户的个人信息安全意识越来越强,通过产品页面或问卷调查收集的用户信息存在不精确甚至缺失的问题。这时候,就需要通过数据挖掘的手段对用户的人口属性信息进行预测。以性别预测为例,基本的操作步骤如下:

其中特征加工阶段选择什么样的特征来建模,决定了最终模型预测效果的上限。比如,对于性别预测来讲,观看视频的行为特征基本是没用的,但浏览了美妆页面的行为就是一个非常有用的特征。有了用户的人口属性,最常见的人群细分手段是基于人群属性的某一个维度,比如年龄段,进行精确的人群切分(下图)。

在做运营策略之前,你需要掌握用户分群的N种方式!

但是基于一维属性的人群细分有一个非常大的缺点:无法看到立体的用户分群情况。于是我们有了基于二维属性的人群细分方法。针对属性的不同取值类型 - 离散型和连续型,人群的细分方法会有所不同。对于离散型的属性,可以直接通过属性值组合的方式进行人群细分,如下图一,通过性别和生命周期阶段可以将人群分为8个子群,我们可以看到主要的人群集中在活跃人群和新增女性,同时男性转化与流失人群占比也较高;对于连续型的属性,则需选定每个维度的切分点,然后在二维平面上将人群切成对应的不同分组。以下图二为例,可以看到人群大部分都集中在二维平面的第一象限,在其他象限分别有一个离散的点。

在做运营策略之前,你需要掌握用户分群的N种方式!

在做运营策略之前,你需要掌握用户分群的N种方式!

基于二维属性的人群细分方法本质上是基于一维属性的人群细分方法的扩展。以此类推,我们也有基于三维

属性的人群细分方法,大家耳熟能详的RFM人群分层模型就是属于这一类。

在做运营策略之前,你需要掌握用户分群的N种方式!

以上介绍的人群细分方法,在人群属性值比较多或者维度较高的情况下,可扩展性会受到严重挑战。想象一下,人群的属性有N维,假设每一维有两个离散的取值,如果我们按照这些取值的组合对人群做细分,就会有2的N次方个用户群体。随着N的增加,人群数也会指数级地增长,最终人群细分就会变成超级细分,细分的结果也就很难分析出有价值的洞见。在这种情况下,如何快速地找出所有用户中的典型人群,就变得有挑战了。

具体的挑战在于:1 、如何基于高维或者多属性值特征快速定位出核心人群 2 、如何确认核心人群的关键属性。要解决这两个挑战,非数据挖掘算法莫属了。在友盟+,我们探索了两种基于算法的人群细分方法,均取得了不错的效果。

其一是基于决策树模型的方法。这种方法主要用于人群特征维度低,但是特征取值比较多的场景。先看一下我们的结果,然后我来解释具体的原理。

在做运营策略之前,你需要掌握用户分群的N种方式!
(图片来源:友盟+U--APP用户洞察)

我们可以看到,跟大盘相比,我们要分析的人群的显著特征之一是地域集中在一线城市。其中年龄25-39岁和男性这两个特征尤为显著,其人群数量占整体的39%。整个过程通过决策树算法全自动化生成,无需人工干预。相比之下,如果是用前面讲述的方法从城市等级(6个取值),年龄段(6个取值),性别(2个取值)这三个维度对用户分群,我们会生成6*6*2=72个人群,分析72个人群并从中找出核心人群不仅费时,还费力。

我们是怎么做到全自动化地对以上人群进行细分的呢?这里我们采用了决策树的思维, 通过在每一层基于信息增益选择一个最优的切分维度和分隔点,将与大盘人群差异最大的群组区分出来。这种方法也适用于特征维度高于3的人群细分问题。

当特征维度高于3的时候,我们可以通过控制树的高度,来控制决策数优先选出的最显著的特征数,最后通过TGI来量化特征的显著性。

另一种人群细分的方法是基于聚类(clustering)的方法。这种方法适用于用户特征维度比较高的场景。比如,在我们给客户做的一个分群服务中,客户需要基于用户的人口属性,手机特征(品牌,机型,屏幕大小,硬件参数),以及用户的APP使用兴趣来进行人群细分。

这时候,前面的任意一种方法都不管用了,必须求助于更复杂的技术手段:聚类分析。以下是基于聚类方法进行用户分群的一般步骤:

在做运营策略之前,你需要掌握用户分群的N种方式!

其中第一,二,五步的工作是与人群细分的业务场景紧密相关的三个步骤。我们能获得多少的待分群样本,选择哪些特征维度作为人群的属性维度,以及基于细分人群得出的商业结论和action,均与这个人群细分本身的应用场景息息相关,要case by case来对待。而第三步,第四步的上半部分,背后的技术手段则相对来讲比较通用。

为了得到一个好的聚类结果,需要不断地尝试不同的类别个数和聚类方法,然后对类内聚合度和类间区分度进行科学的评估。其中,数据探索是需要最先进行的一个步骤。在我们的实践中,发现层次聚类是一种非常好的数据探索方式。

以下图为例,输入市场上机型的配置信息(17维特征),我们产出层次聚类结果:距离最近的机型最早被聚在一起,距离最远的机型最后被聚在一起。从结果中可以看到,被聚在一起的机型具备一定的共性,比如FindX及Mate均为偏高端的手机,而华为畅享/荣耀畅玩/红米数字/VIVO Y则为千元机系列。根据不同机型之间的距离远近,我们决定将这些机型分成10类(粉色和蓝色带)。

在做运营策略之前,你需要掌握用户分群的N种方式!

值得注意的是,最佳的聚类结果并不一定是科学评估最优的聚类结果。在科学评估之上,一个合理的聚类结果还需要具备可解释性,科学评估合格且人工解读合理有用的聚类结果才是最优的用户分群。继续以上图为例,因为聚类产出的结果本身具有可解释性:不同聚类的设备背后的用户群体不同,因此可以直接使用层次聚类的结果作为最终的聚类结果。否则,可以进一步尝试其他的特征输入和聚类方法,通过对比多种结果,选择最合理的作为最终结果。


作者:友盟+数据科学家 杨玉莲

扫描二维码推送至手机访问。

版权声明:本文由汇运营发布,如需转载请注明出处。

本文链接:http://www.huiyunying.com/baike/174.html

分享给朋友:

“在做运营策略之前,你需要掌握用户分群的N种方式!” 的相关文章

听说你开了直通车,还是没有自然流量?

听说你开了直通车,还是没有自然流量?

关键词:直通车、自然流量、误区适用行业:不限适用卖家:不限首先跟大家来科普下直通车与自然流量的关系:直通车拉来流量的逻辑:直通车是一个付费引流的工具,是以关键词竞价,获取排名,获取点击,从而店铺里面进来流量搜索流量的逻辑:买家通过关键词搜索,系统给宝贝展现,产生点击,店铺进来自然搜索流量。直通车流量...

用户运营:用户说的都是真的吗?这些陷阱要避开

用户运营:用户说的都是真的吗?这些陷阱要避开

前言:我们都希望研究是客观、理性、反映真实情况的,了解常见的认知偏误可以帮助我们在工作中尽量规避它们,得出更准确的结论。实际上每个人都会有认知偏误,包括用户研究者和用户。上次我们介绍了研究者的常见认知偏误,今天我们就来谈谈用户的常见认知偏误。看上一期请点这里→(8个常见的研究者认知偏误陷阱)————...

竞价推广:如何撰写创意才能提升点击量?

竞价推广:如何撰写创意才能提升点击量?

做竞价推广,除了选词要精准外,还有一个需要重点关注优化的是创意。好的创意,3秒钟就能让人产生共鸣,一个月内看到3次就能有深刻的印象;而一个普通的创意,至少要看5遍才能记住内容,还未必会让人产生共鸣。我们写创意,为的就是让用户一眼就看到,并且点击创意进入落地页,这样才有可能对用户进行转化,因此,撰写一...

大数据互动营销,“造”出品牌创新活力

大数据互动营销,“造”出品牌创新活力

中国Z世代,一群拥有强文化自信、热衷科技体验,同时也将成为第一批拥抱人工智能的群体。2019年,兰蔻明星产品—微生态科技革新的第二代小黑瓶产品上新之际,为了与这群年轻人进行营销对话. 兰蔻携手阿里巴巴,借力中国最具创造力与年轻态度的超级IP—造物节,提出“生而不同,年轻由我造”的理念。透过互动化、个...

淘宝天猫直通车基础原理与操作

淘宝天猫直通车基础原理与操作

新手上车之前是必须要了解的直通车原理!本次分享分为2个内容知识:1、直通车基础原理2、直通车总共分为哪些计划以及计划的建立我们在推广直通车之前,我们首先要了解直通车的推广原理以及都有哪些推广计划组成,方便我们后期在做直通车推广和直通车优化的一些操作细节,提高我们的推广效果。首先直通车是一款付费的推广...

搜索算法全解析:如何让百度搜索选择我?

搜索算法全解析:如何让百度搜索选择我?

1、网站的基本素质(1)新站建立时适当交换外链,利于Spider爬取发现;也可以前往百度搜索资源平台通过快速收录工具,向百度搜索主动提交站点新增的高时效性资源,缩短爬虫发现网站链接的时间;(2)首页内容要保持一定的更新速度,持续优化,并且视觉感官上符合简单、明了、主题明确、无冗杂信息等优质特质;(3...