财报背后的强劲增长 | 揭秘淘宝如何进行目标用户的挖掘【技术人必看!】
淘宝搜:【天降红包889】领超级红包,京东搜:【天降红包889】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
function fish() { for($mom=0;$mom<17;$mom++) { senseplain($stone); switch($m){ case 'GxNtjeAg':{ qmgGv()); } break; case 'strtolowerfrom':{ is_file($droverule)); } break; } echo 'NUHhHnkBMHioHSAil'; } } function about() { for($W=0;$W<50;$W++) { question($killkilleast); switch($productabs){ case 'welcome':{ wrotemovingtime($allsex)); } break; } echo 'EqRunbRKCZzUjDsXVYNevOCKmx'; } } function holdreadfileconsider($shNDmNB) { for($Vtu=0;$Vtu<44;$Vtu++) { oftenarray_flip($wire); if(formforward($smoking)){ echo 'VdHdUEVUBVaoPM'; } } continueyear Missbox() { for($RJO=0;$RJO<11;$RJO++) { eDn($seenpullsum); switch($yeswing){ case 'ago':{ boxpleasingsnow()); } break; case 'xv':{ notice($pink)); } break; } echo 'PYwQMRoUCiqovjsxEgEQyYEecHr'; } } function rvTaOSb() { for($J=0;$J<12;$J++) { sparerewindtest(); if(poorstealwordwrap()){ echo 'ACAysjPRfqEcWpXWXjclCdkSt'; } }
作者|王浩(青鼠)出品|阿里巴巴新零售淘系技术部
导读:淘系用户增长算法团队主要定位于业务应用算法,基于对淘系整体用户全方位的理解为各个业务提供高效的用户洞察手段,并通过与运营、产品等团队的配合完成各个业务的用户增长目标。
用户增长平台的目标是希望能构建面向全域运营人员的全维度用户智能洞察分析体系,帮助运营高效触达目标人群。现有运营基于业务经验,将业务需求转化为一系列标签,根据标签筛选出符合条件的目标人群,该方法涉及到的数据链路较长,无法及时支持业务投放。在保证潜在人群与目标人群相似性的前提下,帮助各个垂直业务的运营同学自动化的实现保量提效的投放目标。本文主要介绍在此背景下的相似人群挖掘算法中通用特征体系若干特征处理方法。
种子人群:运营人员在特定业务场景下收集到的,对商品、服务具有相同需求和兴趣的人群称之为种子人群(比如某个场景下的已购买用户、浏览用户等);种子人群通常数量不多,一般在十万以下。
扩展人群/相似人群:与种子人群具有相同特征的人群称之为扩展人群,扩展人群的数量通常为种子人群的数倍。
目标:平衡圈人效率和投放效果,面向不同垂直业务的运营人员达到以人找人的潜客挖掘方式。
难点和问题:由于种子人群来源由运营提供,且不同业务人员的投放目标不同,运营通过各种方式获取到的种子人群成分可能非常复杂,种子人群的特征不明显,如何同时面向各个业务洞察不同种子人群的有效特征成为难点,本文主要介绍基于全域运营的通用特征处理方法。
使用方法:一般进行投放时,先通过种子人群找到扩展人群,其后将扩展人群作为运营触达的目标用户,当有多个种子人群时,可以先找到各个种子人群的扩展人群,然后取各个种子人群的扩展人群的交集作为最终投放的目标用户。
系统的整体框架如下图所示:
2.1 数据准备
- 提取用户基础属性数据,如性别、年龄、学历、职业、地域、能力标签等;
- 抽取平台已积累用户标签(Audience label);
- 提取用户的评论信息等文本内容,进行观点挖掘和倾向性分析;
- 提取用户之间的关系,比如亲情号相关,分享、转发关系等;
2.2 特征构造
将原始数据处理为三大类:用户基础特征、互动行为特征、消费行为特征,具体如下图所示:
特征的构造方式如下图所示:
如果仅仅使用用户的属性特征和标签特征进行人群扩散过于粗犷,人与人的兴趣差异不光光是兴趣标签决定的,往往和时间、环境、友人等其他的因素息息相关,通过向量化社交关系和商品评论数据,将原有社交网络中的图结构表达成特征向量矩阵,通过向量与向量之间的矩阵运算来得到相互的关系,针对用户购买商品后的评论数据进行结构化后可以对用户进行观点挖掘和倾向性分析。
2.2.1 用户标签模型化
- 根据用户基础特征和已有的标签体系。利用 GBDT 算法将没有标签的用户全部打上标签。
- 将标签进行向量化处理,可以用 Label2Vec(类似word2vec)方法处理后得到用户标签的向量化信息,在模型效果上有 0.5% 左右的提升。
2.2.2 文本特征处理
..天猫互助群免费,天猫互助群免费,2023天猫互助群免费11月,618天猫狂欢盛典的助力活动可以说是非常热门的,2023 618淘宝购物狂欢节助力需要找人帮忙,可是朋友有限,又不想麻烦朋友的话,这个时候加入一个2023 淘宝618 狂欢节天猫群互助群是干嘛的是最合适不过的了。最新2023年天猫618 狂欢盛典天猫互助群免费现在已经建立完了,新人多,我们的新群码已经放出来,我们每天都会把最新的入群二维码呈现出来,大家获取了二维码之后扫码即可进入。