HI,下午好,欢迎来到微信公众号转让!
24小时服务热线: 4000-163-301

新闻动态

NEWS CENTER

用户画像,简单来讲,就是我们给用户打上的一系列的标签

2020-04-29

用户画像,简单来讲,就是我们给用户打上的一系列的标签。它的应用非常广泛,在互联网产品的任何一个领域,任何一种实现用户个性化的功能,都需要用到用户画像。本文只涉及推荐系统的用户画像体系。

一、推荐系统用户画像长什么样

用户画像这个词具有广泛性。 它被应用于推荐,广告,搜索,个性化营销等各个领域。任何时候,不管出于什么目的,我们想描述我们的用户是谁的时候,大家都会用到用户画像这个词。

比如:

(1)产品经理定性用户分析

设计产品功能时,会对用户是谁进行描摹。如:目标用户群体的人口属性,社会背景,使用习惯等信息。这种用户画像主要描述用户是谁,以便做好功能定位。

如下图中的定性用户画像分群:


(2)数据分析用户画像

分析用户行为,用户进行聚类行为分析。如:数据分析师可能会给出,观看电商直播的男女比例,得出女性用户更喜欢看我们的电商直播这样的结论。

(3)推荐系统用户画像

为建立个性化功能,用各种办法给用户大规模打上几万甚至几千万个标签。这种标签不仅仅有偏好,还有偏好程度值。

本文所指的用户画像,仅仅涉及第三种情况。一般地,推荐系统的用户画像长成这个样子:


推荐系统的用户画像,一般包括用户基础信息和偏好信息。而偏好画像是重点,数量上占了推荐系统用户画像的绝大多数,是我们召回和模型训练的基石。

因为机器跟人不同,一个词“中国”对于人来说是有意义的,对于机器只是一个汉字编码。因为用户画像,为了能让机器计算,需要带上概率值或者偏好值(权重值)等。

我们接下来就聊一聊,在推荐系统中,这种带了一些列数字的用户画像怎么构建出来的。

二、用户画像怎么用?

第一章的介绍过,推荐过程分为:召回、初排和精排三个阶段。用户画像主要用在召回和初排两个阶段。


召回阶段使用用户画像,主要是通过用户画像召回相似的物品。比如一个短视频APP上,用户海贼王偏好值比较高,就可以针对海贼王进行内容召回。

初排阶段使用用户画像,是在模型上使用的。模型将用户画像数据作为一部分的特征值,用于模型的离线训练或者实时模型更新。

三、用户画像的分类

用户画像是一个比较大而全的概念,标签是用户画像最基本的单元,用户画像是有成千上万个标签组合而成的。当我们想对用户画像进行分类时,通过对用户标签的分类就可以了。每个平台有自己的用户画像体系。对推荐系统的构建来说,一般从以下维度来做标签分类。

如下图所示:


其中:

(1)基础用户画像

  • 人口统计学标签:用户的性别,年龄,地区等信息。
  • 行为特征标签:用户在互联网平台的注册,活跃,付费,浏览等方面的行为记录产生的用户标签。
  • 性格标签:豪爽大方,精打细算,冲动消费等类型标签

(2)偏好用户画像

  • 长期偏好标签:用户对较长时间内,几个月甚至是几年内,对某类事物的稳定偏好。
  • 短期偏好标签:用户最近较短时间内,七天内甚至是几分钟内,对某类事物的偏好。
  • 泛化偏好标签:众多的用户偏好中,不同的偏好之间有关联性或者相似性,就像啤酒和尿布那样。用户对啤酒有过直接的行为,但对尿布还没有,那么尿布可能是他的泛化偏好。

以上的五小分类中,前面两类只占了用户标签数量的很小一部分。而推荐系统中,数量最为庞大的要数偏好类的标签了。平台有多少个物品标签,就会产生多少偏好标签。另一方面,偏好类的标签的产生,依赖于物品标签。因为用户对物品的偏好程度,是通过他对平台物品的曝光,点击,购买等行为计算出来的。

四、基础用户画像的怎么来?

那基础的用户画像是怎么产生的呢?一般可分以下几种来源:

  • 简单信息提取:基于实际基本事实而产生标签,如注册时间,渠道来源,用户所在地区等。
  • 逻辑或公式计算:使用简单的逻辑或公式,对用户的行为进行统计而产生标签,如用户活跃天数,用户消费金额等。
  • 算法学习:基于机器学习模型对用户的属性预测产生的标签,如性别,年龄,有车一族等。