人工智能提效数字营销 算法初试身手

2018-02-07 14:49:05来源:21世纪经济报道 热度:
传统广告有一个普遍痛点,正如百货商店之父约翰·沃纳梅克提出的广告营销界的哥德巴赫猜想所言:“我知道在广告上的投资有一半是无用的,但问题是我不知道是哪一半。”

如今,人工智能技术在营销层面的应用,正在帮助品牌方逐步找到有用的广告是哪一半,并且避开无用的那一半,而阿里巴巴集团的数据银行就是应用中的代表性工具。在2017年6月,阿里巴巴集团正式发布服务于品牌的消费者数据资产管理中心——品牌数据银行(Brand Databank),这也是国内首个实现品牌全域数据资产管理的平台。

在新零售的浪潮中,通过大数据预测潜在用户、筛选有效渠道的方式已经越来越普遍。人工智能领域的深度学习、智能设计正在走进商家日常的运作当中,投放、预估等环节的智能化都已经让商家的营销效率得以大幅提升。

技术赋能

人工智能是诸多技术的总称,机器学习是人工智能的基石之一。最热门的人工智能应用领域包括自然语言处理、图像识别、数据智能分析。而大量的可用于分析的数据是人工智能的另一块基石。想要在商业领域有效的运用人工智能,就目前全球应用级别的人工智能技术来讲,最重要的是人物画像和长期的经济行为数据。

人物画像一部分指的是人口学特征,比如女性,30岁,是否已婚,这部分数据现在各大互联网公司都有海量数据。还有一部分是社会学特征,比如住在一线城市,在外企上班,学历本科。这部分特征相对更精细,能够对个人的消费能力进行判断。

但更加关键的是长期的经济行为,特别是商业交易记录,比如一年网购多少次,购买张杰演唱会门票多少次,购买张杰门票的同时喜欢购买什么化妆品。可以说这些行为的记录和统计是消费预测领域人工智能分析的核心。

国内就目前来说,天猫,淘宝以阿里旗下的各类生活消费类网站,积累的数据是最丰富而完整的。更关键的是,天猫和淘宝是中国最早的在线电商平台,且阿里同时拥有全国最大的支付工具支付宝,长达十多年的交易数据比近几年才开始积累数据的平台要精确强大许多。

基于精准的交易数据,阿里巴巴的数据银行应运而生。天猫新零售平台数据技术总监魏虎告诉21世纪经济报道记者:“数据银行中有一个重要功能是消费者资产预测,即通过分析历史数据来预测用户未来3年在某一品牌上的消费。预测方法上运用了机器学习和深度学习,其中,机器学习包括逻辑回归、RandomForest(随机森林)、GBDT(梯度提升数)等算法。深度学习则会提升预测的精度和趋势的准确性,我们采用了CNN(卷积神经网络)、RNN(循环神经网络)等深度序列模型来做数据预测。”

魏虎解析道,相对于机器学习,深度学习一方面在准确度上进一步提高,例如MAE(误差平均值)会有10%的提升,趋势相关系数会有20%的提升;另一方面,深度学习模型更容易去拟合一个非线性空间,并且能够“自主学习”隐含特征,“传统机器学习需要人工定义,比如需要定义用户的浏览次数、加购次数,但是深度学习技术能从这些基础特征中归纳出更高维度、更精细、组合化的特征。”

除了数据银行,阿里线上店铺的CEM系统正在做“千人千面”的推荐,顾名思义,商家将为不同的用户展示不同的补贴优惠、商品陈列等。其中涉及到推荐和预测的功能,如何快速识别用户并推荐其感兴趣的商品,技术更为复杂。魏虎介绍道:“其中一大难点就是把握商品和用户之间的关系,一方面要知道用户对商品的偏好,这需要通过用户过往的购买记录抽象出特征;另一边也需要商品的特征,包括被什么样的人购买过等多种信息。我们要把这两种数据进行比对,然后得到相互之间的复杂关系,再对商家进行建议。”
 

初显身手

服饰、快消类等高频消费领域是阿里巴巴最擅长和较早进入的行业, 在运用数据来推动品牌建设过程中,他们占据了较高的比例。

以施华蔻为例,通过整合Uni Desk、微博、快闪店、手淘导购等渠道数据,展开精准消费者画像洞察,并相应向消费者传递个性化的品牌信息,在2017年天猫“双十一”,其消费者总量新增310%,加购增长200%。

其中,就数据银行部分来看,数据银行根据用户的行为,如忠实购买会员,会员,普通购买用户,浏览用户,品牌曝光的潜在用户。总体而言可以归为两类,一类是有过购买行为或购买潜力大的用户,另一类是可能购买或者购买潜力未知的用户。前者简单理解老用户或者续购用户,后者理解为拉新用户或促销用户。

然后,数据银行中的高阶工具数据工厂将核心用户进行特征提取,初始的特征量会非常大,有些特征相交易关性高,但也可能从用户特征上看过于普遍,比如30岁以下、未婚、女、天猫超级会员。这时候需要采用机器学习算法进行进一步目标人群预测,比如采用随机森林算法。随机森林是经典的分类器,之所以称之为森林,是指这种算法在进行数据判断的时候用了许多棵决策树。决策树的作用是用来对数据的特征进行选择,比如从海量的诸如“看过染发文章”,“经常看美妆视频”,“购买过同洗护品牌”这些用户特征中选出最可能购买施华蔻的特征组合。

“数据工厂相当于给了品牌一个建模平台,品牌可以自己定义品牌的样本,一款产品的种子用户可以在工厂里放大,寻找到一批新的候选用户。通过比对出两者的相似性,商家可以根据需求定义相似性的范围,例如可以选择对50%相似性内的用户做二次的投放运营,从而产生更高阶的、更加智能的人群推荐。”魏虎向记者解释道。

施华蔻方面接受21世纪经济报道记者采访时谈道:“数据银行带来的第一个好处是站外和站内多渠道数据的融合,了解消费者图像,在曝光和点击数据之外,还能够长期跟踪用户消费行为,提升了媒体投放效率;第二点是数据银行可以精准定位人群,工厂可以筛选出品牌的潜在客户,也可以帮助我们维护好老客户。”

除了快消品,阿里巴巴在大众品牌打造方面也有所作为,对品牌塑造的准确度也有提升。例如在汽车行业,比亚迪汽车销售电商商务部肖经理就告诉21世纪以经济报道记者:“在渠道引流上,数据银行前期在4S店部署的地动仪,收集了大量线下潜客信息,这些都回传到了数据银行,持续沉淀,并在线上不断的用内容和广告培育;最重要的是,数据银行根据线下潜客在线上的标签,例如判断是否有车、购车意向是否强烈、人生阶段、消费水平等,进行了详细的人群画像区分,借助这些消费者画像的维度,将潜在人群做了不同的分组,再利用数据银行对接的天猫站内推广渠道,钻展达摩盘、店铺的会员消息短信等,再次对精选的消费者触达,触达内容都是‘双十一’专门为线下门店设计的全渠道商品,引导消费者,到线下门店进行体验和核销,形成对线上客户在线下的循环运营和体验加深。”

要知道数据银行的特征数量非常庞大,一个用户的基础特征可能是几百个甚至几万个。从这些特征中提取这些数据之后,对于商家来说最关键的一步就是投放广告。广告投放并非是数据工厂工作的最后一步,而是数据检验的开始。天猫的强大优势是广告曝光、点击用购转化、支付及后续的再次购买都在自己闭环的平台上。对传统行业难以统计和分析复购率,广告投放准确度的判断,数据工厂可以不断地进行反馈和修正。

对于海量的数据,魏虎也提到了数据分析的两大挑战,一是进行用户画像时往往涉及到千万、上亿的用户,如何快速、实时地给出特征画像,需要实时计算引擎的不断升级;另外,如何在小样本的情况下精准地做出画像也是机器学习面临的难题。此外,他还表示,在数据安全方面,阿里巴巴运用了差分隐私技术、K-匿名等算法,在保护用户隐私的同时,又可以让商家使用脱敏数据。

 

责任编辑:吴礼得

为您推荐