导语: 如今,大数据的概念已得到全面普及,数据价值的重要性也得到很多行业认可。甚至很多传统行业的企业也开始重视数据,做好数据采集、保存、挖掘、应用的工作。具体到如何利用数据金矿,用数据驱动业务运营和自身发展,还是要回归到基本概念,理解大数据相关概念的本质和核心思想,从而牢牢把握住在DI时代(DI,为Data Intelligence的缩写,“DI时代”即“数据智能时代”)的数据海洋中航行的方向盘。本文围绕大数据诸多概念中最常见和常用的“用户画像”,第一部分就先为大家浅述一下用户画像的基本概念和构建原理。
用户画像初探
用户画像,英文为 User Profile,是根据用户基本属性、社会属性、行为属性、心理属性等真实信息而抽象出的一个标签化的、虚拟的用户模型。“用户画像”的实质是对 “人”的数字化。
用户画像的应用场景有很多,比如个性化推荐、精准营销、金融风控、精细化运营等等。
举个例子来理解用户画像的实际应用价值,我们经常用手机网购,但其实我们每个人的购物APP页面都不一样。所谓“千人千面”,即电商APP的个性化推荐系统会给每个用户“量身定制”专属首页,精准推送符合用户需求和偏好的商品,从而提升转化率和用户体验。
而 用户画像 构建 的核心工作 ,即 是给用户贴“标签”。 标签(tag):也称数据点。我们通过“标签”来对用户的多维度特征进行提炼和标识。以目前在APP开发者和运营者当中使用比较多的个推用户画像产品——个像为例,来看下业内的大数据公司是如何通过“贴标签”来构建自己的用户画像体系的。
以消息推送服务起家的个推,自2010年成立以来,已成功服务了数十万APP,累计覆盖40亿移动终端,有着维度全、覆盖面广的数据基础。依托海量线上用户APP兴趣偏好数据、线下用户基于场景的活动数据沉淀 以及强大的数据分析能力和算法建模能力 ,个推根据自己独创的 “冷数据“、”温数据“、”热数据”的原理 构建出覆盖人群属性、兴趣偏好、用户行为、实时场景等众多细分维度,拥有性别、年龄层次、消费水平、职业、购物偏好等上千多个标签的用户画像体系,并面向A PP 开发者推出用户画像产品——个像 ,旨在帮助APP开发者360度勾勒立体用户画像,深入洞察用户,精准把握受众,为APP在不同时期的精细化运营提供全面、可靠的数据支撑,帮助APP全方位了解用户,助力APP推广和运营。
个推的“冷、温、热”数据原理
冷数据:性别、兴趣、常驻地、职业、收入水平和年龄层次等相对稳定的用户画像数据。
温数据:近期活跃应用、近期活跃场景等具有一定时效性的用户行为数据。
热数据:当前区域、当下打开的应用等场景化明显的实时数据。
用户画像再探
当下,很多企业都积累了一定的数据,也开始或已经构建自己的用户画像体系,很多运营人员也将用户画像作为“用户洞察“、开展“精细化运营“的基础。但是,对于用户画像,我们真的完全理解吗? 本文第二部分,笔者就总结了对用户画像常见的3点误解,我们一起再和用户画像来一次”去伪求真“的亲密接触吧。
误解一:将标签等同于特征。
标签标识多维度的特征。但标签不同于特征。有的单个特征可以当做一个标签来使用,但有的标签是由多个特征聚类组合加工而成的。所以,不能把标签等同于特征。
还以个推旗下的用户画像产品——个像为例,其 “有车一族”这一标签就是由“男性(冷数据)”“手机安装有并经常打开汽车资讯类APP(温数据)” “常出现在4S店(基于LBS技术可以得到的场景化的热数据)”等特征综合提炼得出。
误解二:认为用户画像就是客观事实。
一般来说,企业在构建标签体系时,会标注标签属性,帮助内部理解标签赋值的来源,进而理解指标的含义。一般来说,常见的有5种标签属性:固有属性、推导属性、行为属性、态度属性、测试属性。
固有属性 即指这些指标的赋值体现的是用户生而有之或者客观存在的属性,比如:性别、年龄、是否生育等。推导属性 则是由其他属性推导而来的属性,比如星座,我们可以通过用户的生日推导;而用户的品类偏好,则可以通过日常购买来推导。行为属性 是产品内外实际发生的行为被记录后形成的赋值,比如用户的登陆时间、页面停留时长等。态度属性 则是用户自我表达的态度和意愿。在大数据的需求背景下,以往通过问卷来调研手机用户态度属性的方式显得有些低效;现在更多的则是利用产品中相关的模块做用户态度信息收集,比如微博的“点赞”按钮,用户可以表达自己对某观点的赞同。测试属性 是指来自用户的态度表达,但并不是用户直接表达的内容,而是通过分析用户的表达,结构化处理后,得出的测试结论。现在很多产品都有UGC功能,用户可以表达自己的观点、情感、态度,通过对用户生成的内容进行文本挖掘分析,可以得出用户的价值观、性格等属性。
所以,标签数据未必是客观事实,但也不是完全虚构,而是基于事实数据进行符合逻辑的模型分析得出。所以,用户画像中对某个人或某人群的描述,未必就是客观事实,只是该描述可以通过多维度数据进行推断得出,而这个推断有很高的合理性,能高度接近、刻画现实。这里就是对第二个误解的阐述,即用户画像不是客观事实。
误解三:认为用户画像都是对单个用户的描述
在互联网全面普及、物联网正进入爆发的当下,对特定用户的洞察有海量数据和前沿的数据智能技术作为支撑和依托,特定用户的画像构建当然是可行的。比如, APP/应用可以基于自身积累的用户注册数据和用户行为数据来综合刻画特定用户的画像,基于此,金融风控类应用可以精准识别高风险用户;新闻类应用可以准确筛选出热衷发表一些过激或负面言论跟帖的用户;电商类应用可以判断那些总是在频繁下单、打五星好评、然后取消订单的刷单用户…。
然而,目前行业更多聚焦于对某一人群或行业的洞察上,也会通过数据报告的形式呈现洞察结果。比如,数据智能企业个推通过对移动互联网的用户特征和行业趋势进行深入洞察和剖析,跟进市场发展热点,于前段时间发布的《5G手机首批用户画像报告》《生鲜电商APP数据报告》等。
当然,一个多维度、立体化、能实现360度洞察的用户画像体系才能最大程度上帮助企业和开发者更精准地洞察用户需求,为用户提供更人性化、智能化的服务。行业内也确实有进行用户画像和定制化标签合作的案例,如同“拼积木“一样,通过数据源之间的碰撞,最终”拼凑“出全面、清晰的用户画像。 以移动互联网领域为例,针对普通APP开发者构建用户画像时可能会面临的APP自有的数据体量不够庞大、数据过于垂直,覆盖面不够广、即使有一定的体量,但团队的数据分析能力和建模能力有所欠缺等问题,个像用自己具有行业覆盖广度的数据体量和数据建模算法能力,基于双方各自优势,为APP开发者提供定制化标签服务。
总结
本文上半部分简单讲述了用户画像的基本概念、应用价值,并以当下大数据公司为例,阐述了用户画像构建的实质和核心;下半部分则结合笔者经验,总结了3个对用户画像的常见认知误区;从初探到再探,希望能和大家一起加强对大数据领域一些常见概念的理解。后续,希望能和大家对用户画像在“精细化运营”“个性化推荐”等特定领域的应用实践一起做更多的探索,敬请期待。