随着大数据技术的深入研究与应用,企业的关注点日益聚焦在如何利用大数据来为精细化运营和精准营销服务,而要做精细化运营,首先要建立本企业的用户画像。搭建一套用户画像方案整体来说需要考虑8个模块的建设,如下图:
下面简单介绍这八大模块。
用户画像是指描述一个用户或用户群体的细节和特征的方法,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。概括一句话:即用户信息标签化。
1)数据底层整理
2)用户画像建模
3)面向应用
1)需求分析
用户画像体系的建设不能凭空捏造,需要以经济建设为中心,根据实际的业务需求,考量画像系统能为业务带来的价值,所以我们第一步要做的是分析业务需求。
2)搭建标签体系
标签是某一种用户特征的符号表示,标签解决的是描述(或命名)问题,但在实际应用中,还需要解决数据之间的关联,所以通常将标签作为一个体系来设计,以解决数据之间的关联问题。所以说我们在给用户打标签的同时,需要有一个分类标准,简单说,就是你把用户分到多少个类别里面去,这些类是什么,彼此之间有什么关系,就构成了标签体系。
3)建立用户画像和用户画像系统
在把用户数据标签化之后,通过相应的模型或工具,根据数据分析的结果,将用户的特征、兴趣和行为整合成用户画像的形式,可以是文字描述、标签或图表等形式,以便后续使用和分析。为了提高体验,我们更多的的时候是一个用画像系统。
4)画像应用
应用场景包含 3 类:精准营销、用户分析、个性化推荐。
构成用户的标签可以是多种多样的,也应该能够渗透到丰富的业务场景中去,因而标签就需要兼顾广泛性和精确性,这就引入了标签体系的概念。说白了,所谓标签体系,标签体系就是分类。
标签体系化化是建立用户画像的关键环节,也是在标签开发前要进行的工作,具体来说就是需要结合本公司的业务情况设定相关的指标。从建立的标签维度来看,可以将其分为用户属性、用户行为、用户消费、风险控制、社交属性等五大常见类型。
首先我们来了解一下按统计方法的不同划分的分类,按统计方式分类的标签可分为统计类标签、规则类标签、挖掘类标签。
标签平台是一个中间层的服务,为前台提供的是数据支持。另外一方面标签平台的加工,依赖底层的基础数据平台的原始数据。
标签管理平台中,每个标签开发时,首先需要在管理平台上注册,生成标签元数据,然后我们在根据元数据信息在大数据平台进行逻辑加工。
标签视图与查询功能主要面向业务人员使用,标签视图版块中,层级化地展示了目前正在使用的全部用户标签。方便应用方点击查看每个标签的详细情况。
标签管理,是用户画像是开发的起点,所有的用户画像都起始于对标签的定义和规则的指定。标签管理是基于标签整个生命周期进行管理。标签的生命周期包括“标签创建、标签审核、标签上线、标签评估、标签变更、标签下线”六个部分。
标签的开发在hive库完成,因为标签的模型体系是基于数据仓库而来,所以大致流程也和数据仓库的开发流程类似,具体工作流程如下:
表结构设计也是画像开发过程中需要解决的一个重要问题。表结构设计的重点是要考虑存储哪些信息、如何存储(数据分区)、如何应用(如何抽取标签)这3个方面的问题。不同业务背景有不同的设计方式。
以Hive为例,我们最常用的就是横表,也就是一个 key,跟上它的所有标签。横表的问题:
2)不同的标签计算频率不同,比如说学历一周计算一次都是可以接受的,但是APP登录活跃情况却可能需要每天都要计算。
3)计算完成时间不同,如果是以横表的形式存储,那么最终需要把各个小表的计算结果合并,此时如果出现了一部分结果早上3点计算完成,一部分要早上10点才能计算完成,那么横表最终的生成时间就要很晚。
4)大量空缺的标签会导致存储稀疏,有一些标签会有很多的的缺失,这在标签用户画像中很常见,主要是当标签数据量开始快速增加的时候会遇到的问题。
如前面所分析,竖表和横表各有所长和所短,那么能不能两者结合呢?
这其实也要考虑横表和竖表的特性,整体来讲就是竖表对计算层支持的好,横表对查询层支持的好。那么设计的化就可以这样:
统计类标签是最为基础也最为常见的标签类型,例如,对于某个用户来说,其性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段可以从用户注册数据、用户访问、消费数据中统计得出。该类标签构成了用户画像的基础。
规则类标签基于用户行为及确定的规则产生。例如,对平台上“消费活跃”用户这一口径的定义为“近30天交易次数≥2”。在实际开发画像的过程中,由于运营人员对业务更为熟悉,而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则由运营人员和数据人员共同协商确定。
机器学习挖掘类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断。例如,根据一个用户的行为习惯判断该用户是男性还是女性、根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。
1、本站所有资源均从互联网上收集整理而来,仅供学习交流之用,因此不包含技术服务请大家谅解!
2、本站不提供任何实质性的付费和支付资源,所有需要积分下载的资源均为网站运营赞助费用或者线下劳务费用!
3、本站所有资源仅用于学习及研究使用,您必须在下载后的24小时内删除所下载资源,切勿用于商业用途,否则由此引发的法律纠纷及连带责任本站和发布者概不承担!
4、本站站内提供的所有可下载资源,本站保证未做任何负面改动(不包含修复bug和完善功能等正面优化或二次开发),但本站不保证资源的准确性、安全性和完整性,用户下载后自行斟酌,我们以交流学习为目的,并不是所有的源码都100%无错或无bug!如有链接无法下载、失效或广告,请联系客服处理!
5、本站资源除标明原创外均来自网络整理,版权归原作者或本站特约原创作者所有,如侵犯到您的合法权益,请立即告知本站,本站将及时予与删除并致以最深的歉意!
6、如果您也有好的资源或教程,您可以投稿发布,成功分享后有站币奖励和额外收入!
7、如果您喜欢该资源,请支持官方正版资源,以得到更好的正版服务!
8、请您认真阅读上述内容,注册本站用户或下载本站资源即您同意上述内容!
原文链接:https://www.shuli.cc/?p=15230,转载请注明出处。
评论0