精神障碍论坛

注册

 

发新话题 回复该主题

一场泛零售数智化要怎么做 [复制链接]

1#

“卖货”疯狂增长的背后,京东疯狂搞技术,废话不多说,快上车,故事开始了。

(一)扫雪危机

坐标北京潘家园,古玩市场人群熙熙攘攘。地摊上,玉器、书画、钱币、木器、古币散摆了一地,客人一屁股稳坐在摊口的破皮子小马扎上,粗糙的手指反复盘弄一个炭黑色“老底子”铅酒壶,把玩将近20分钟了,摊主无动于衷。

这位摊主,难道要等客人摸到“铅中毒”了才看出来“购买意愿”吗?

计算机里的人工智能可明白着呢,每当用户点商品,加购物车,翻详情页,读评论……它就一通忙活。

因为这些用户的动作,可太重要了,这可是人工智能眼里宝贵的“用户实时反馈”,用于准确判断用户兴趣。

假如一位京东APP用户也选购商品20分钟,人工智能过了三天三夜才懵懵懂懂反应过来“用(购)户(买)兴(意)趣(愿)”。

那就永别吧,人工智障。

发现兴趣是第一层功力,还要发现兴趣是变化的。剁手党总是善变,一会爱这个,一会爱那个,兴趣变,品味变,潮流变。

如果推荐商品的时候,用户看了20分钟鞋子,兴趣已然消耗殆尽,APP还在一(傻)味(傻)推荐鞋子,APP离被卸载的悲剧,也不远了。

总而言之,卖货,要反应快。体现在计算机里的人工智能身上,就是实时性。

反应越快,越能“做成买卖”,所以,实时性是人工智能做零售这门生意的时候的IQ水平。打分标准很简单,效果好,IQ高。延时多,效果差,IQ低,俗称傻呼呼。

京东和双十一大促的时候,压力排山倒海,逛APP就像逛春节的庙会,在线用户多,用户行为更多。

在平时,京东日常处理几十亿商品和五亿用户,如此大的数据,想要处理好,不仅是一个技术问题,还是一个见识问题。更别说,用户在京东APP里不是静止的,买买买,逛逛逛,就会产生海量行为数据。

新数据像雪片一样飞来。人工智能要有边下雪边扫雪的能力。

在这个“动不动就一个亿”的玩法里,增量信息就是用户兴趣、用户意图的增量,好比把积雪(数据增量)及时扫掉(模型更新)。

几万年不处理,数据就像雪一样堆到富士山顶了。

想要精准抓住用户特点,人工智能就需要特大(百GB级别)的模型参数。模型参数是什么呢?就是商品和用户的特征,简单理解,就是人工智能抓住的特点。综艺节目里的模仿秀惟妙惟肖,这就是演员在表演中抓住了“神特征”。

当特点海量,参数也会海量。

陈奕迅轻唱,谁能凭爱意将富士山私有?人工智能说,唱得好,打断一下,在下认为,能抓住富士山雪顶特点,那才是真爱。

目前,整个科技界公认的做法分两步。第一步,把AI模型做得很大。足够大,才能在这么大规模的群体中精准刻画用户特(兴)点(趣)。第二步,在这个大体量压力下,性能还要好。

说白了,就是在山崩雪啸中清理雪道,难度可想而知。当AI模型超大(TB级别)的时候,传输,更新,就好比把富士山的雪块,全部搬到北海道去。

那应该怎么办呢?答案不是搬雪,而是扫雪。“扫雪”的水平要高,及时又精准。

及时扫雪,举一个例子。

假如你和我都用京东APP,这些海量参数里,有一批参数表达了你,有一批参数表达了我。你点击了,就是你的用户行为有反馈了,及时更新你的参数(特点)。

精准扫雪,举一个例子。

一大堆雪,要能区分,是谁家门口积雪。扫错了门前雪就是错误地更新了别人家的参数(特点)。

时间往往是最大的敌人,实时性是最难的问题。虽然难,但是业务很受益。所以,京东零售对实时性的要求十分之苛刻。

世人常说,昨天之不可能,今日之极限,明日之平常。在京东零售推荐系统(召回过程)里,年做到了30分钟级的实时性,年做到了1分钟级别。

那么问题来了,如何办到的?这得从一个人谈起。他就是现任京东集团副总裁、京东零售技术委员会主席、京东零售技术与数据中心负责人、京东零售云总裁颜伟鹏。

在来京东之前,他曾担任谷歌中国工程研究院副院长,英文名字是Paul,发音简短上口,所以,大家日常称呼,Paul总。

年,Paul总初到京东,看到这样一番景象,场景多,需求多,研发团队忙得脚打后脑勺。谈创新?谁也顾不上。Paul总说,这样不行,京东研发体系是采销体系的坚强后盾。

他在一张神秘蓝图的留白处,批了八个字:标准、自动、规范、智能。

(二)最骚操作

追溯八年时光,再看烟火热闹。

那些年,虽然生意亮眼,但是技术欠些火候。Paul总在谷歌公司的时候,曾经穿越谷歌与必应搜索世纪大战的硝烟,战绩斐然。在他心里,无论业务是什么,技术实力要对标硅谷。

顶尖人才需要愿景驱动。于是,Paul总用这张神秘蓝图招揽人才。

年春,Paul总面试了一位年轻人,包勇军,他身形挺拔清瘦,对技术的热情像白色水蒸气一样往外冒,简历里写满全球顶尖项目,反而很少有人提他是北京大学毕业的。

据说,包勇军看过那张神秘蓝图后,转身就入职了,带广告算法团队。

有一件事,大家都知道。Paul总倾听汇报的时候,要么不说话,要么只问一个问题便能抓住要害。而那些从Paul总办公室里结束汇报,走出来的算法工程师,心底都只有一句话:“你哪里有问题,他一眼就能看穿。”

另一件事,只有几位专业的博士同事才知道。语音识别是典型的人工智能赛道,在语音识别技术试水初期,一个小众语音识别工具需要选型,多位资深专家举旗不定。Paul总亲自参加多场选型会后,定下了结果(kaldi)。

一段时间后,其中一名研发人员机缘巧合地请教了一家科研院所专攻此方向的教授,吃惊地发现教授实验室的同方向的组里也用同款工具。想不通Paul总是怎么定下来的。

Paul总的身上,没有时差,一直过着中美两个时区,电话会议开到深夜,一觉睡醒,京东ME里总有Paul总的指导性留言。次日清晨的技术选型会上,又见Paul总的身影。

团队在Paul总的领导下,避大坑,绕雷区,躲弹片,不恋战,从不为了技术而技术。只为速穿火线,荡平山头,拥兵破阵,策应业务,用技术驱动零售。

北京的窗外,西北风横扫一切,窗内“从严治军之风”横扫一切。京东零售的代码质量被史无前例地提升,技术在业务场景里加速创新。

时光流转,Paul总当初定下的目标没有变,标准、自动、规范、智能。想做到这几点,绝对少不了一个强大的算法底座。算法和算法底座虽为两件事,但又密不可分,刚柔并济。干的活完全不同,还又要彼此理解。

一般来说,一个业务场景,由一个算法团队负责,一个算法底座团队来打配合。表面合理,本质错误。若是日后业务场景里的算法数量翻10倍,算法底座团队数量是不是也翻10倍?一路放任,无法无天。

这打法又俗称“堆人战术”,明显是错的,来一个工单,堆一波人。这就好比下雪了,派人扫雪,下大雪了,派更多的人扫雪。可是效率呢?技术研发很少讲绝对,但是“研发人效低了”绝对不行。

认错很难,尤其是错了很久之后。所以,早期判断,弥足珍贵。

包勇军是怎么干的呢?

他把队伍分成两路,上路纵队专攻算法,下路纵队专攻算法底座。上路猛冲狠打,下路火线支援。算法冲锋,算法底座支援。战场上,增援和冲锋同样重要。否则一味冲锋,孤军惜败。

软件开发是一个创造性的过程,但也有许多重复性的工作。

尤其是工程越大,重复性的工作越多,还容易引起混乱。得有个“以一顶百”的东西,这个“顶”有顶住、支撑之意,这个东西就是“算法底座”,也有人管这个叫“中台”。

你用,他用,都要用,有一种公共属性。所以,“算法底座”让所有团队共用,从人力角度,整支部队就能“缩编减冗”“效率大增”。

更重要的是,无论是堆机器、堆人力,都无法在数据的快速膨胀、业务的高速增长和平台的稳定易用高效上取得比较好的平衡。

理论上讲,线上业务离不开人工智能算法,几亿用户,几十亿量级商品,没有算法,京东“停摆”。事实上讲,更是如此。如果你不信,那得先了解一下,那些人工智能算法是什么样的。

全世界所有电商公司的人工智能算法,都是为了提高购买率(点击率CTR和转化率CVR)。不搞技术就不用记这个,请记住“点击”这个动作。这个动作可是网购界的“最骚操作”。

谁网上购物都得用手指头点击,光用眼睛瞅,买不了东西。“点”就是兴趣,“点”就是

分享 转发
TOP
发新话题 回复该主题