漆远:蚂蚁金服 AI 技术大揭秘, 开放“模型服务平台”

  • 时间:
  • 浏览:2

你这种模型服务平台简单来说你这其他人什么都模型所见即所得,不光数据是资产,模型五种生活也是资产。做到可视化的,对于用户来讲,提供给开发人员非常方便的建模最好的辦法 ,非常容易使用,不时要知道某一行公式如何推导的,如何让里能 不能支持A/B测试,里能 不能全流程地效果监控,同时跨团队地战略公司合作 ,如何让里能 不能实现多人同时开发。

7 月 22 - 23 日,在中国科学技术學會、中国科学院的指导下,由中国人工智能學會、阿里巴巴集团 & 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办,云栖社区作为独家直播战略公司合作 伙伴的 2017 中国人工智能大会(CCAI 2017)在杭州国际会议中心盛大召开。



在你这种金融智能平台中包括了一系列的人工智能技术,比如说强化学习、无监督学习、图推理、共享学习。哪些技术具备金融领域的实时对抗性、大规模以及安全加密性。

刚才讲了整体的从模型训练到数据实物的产生,您里能 不能从各种模块,到训练到部署产生API,到最后效果的监控,全流程地展示。

你这种项目的刚刚结束了了 和拿到初步的结果是算法团队和业务同学通力战略公司合作 的结果。算法同学积极学习业务,从刚刚结束了了 看沒有来图像里车的间题,到现在都快成了专业的图像定损员了。你这其他人的技术有一系列的流程,从噪音去除到类别识别到目标检测和程度判断,到底多严重,是变形还是刮蹭。根据什么都张图片,最后你这其他人要做预测结果的综合,综合刚刚你这其他人做数据决策辅助,这要打通车的原件数据库来分析,假如你这种部件坏了几块钱。全国有460 0万案件/年, 60 %的案件不是纯外观损伤的,它覆盖了非常大的比例。每个成本平均60 块钱, 里能 不能减少60 %的作业量。

这里对舆情分析头上技术简单介绍,首先三个小不为什么在么在简单的模型,什么都统计哪些感情是什么 是什么 单元,同时又和淬硬层 学习的最好的辦法 结合,最后产生整体的判断,这上面句子使用CNN,k-max pooling里能 不能结合起来,还有TNN,将所有的信息结合起来进行三个小综合的评价。

首先我会讲一讲为哪些你这其他人要做AI,为哪些呢?意味AI离不开场景和数据,为哪些要场景,意味你这其他人要除理真正的间题,产生真正有意义的服务。在金融上面你这其他人有血块的服务,从支付、保险、财富、到风控、微贷等各个领域,其中典型的场景就类式要判断某个小企业不是具备相应的信用里能 承受贷款的风险。在所有的场景上面产生了海量的数据,而哪些数据成为了人工智能的燃料,使得你这其他人里能 不能发展和应用一系列的人工智能技术。而哪些场景、间题五种生活又为人工智能带来了挑战,比如说时间敏感要求一笔交易时要毫秒级完成判断。再如海量数据,一天几亿笔的数据,这就时要非常大规模的稳定的风控的系统。还有业务多样性,比如说咋办 用迁移学习来发现不同任务之间的共性。再比如说系统性风险, 系统里能 不能用三个小网络来表达,那你如何从网络的淬硬层 分析间题。还有强数据安全和用户隐私保护也是金融业务五种生活的属性。

刚才三个小例子讲到对话机器人,第三个小是客服,第三个小是财富号的舆情分析。再什么都保险,同时支付宝五种生活也在进行升级,您对支付宝里能 不能说话,比如说我能 给我的同事通过语音进行转账,自动完成转账并记录到账单上面。

总结一下,今天讲了淬硬层 学习和图的结合,它主什么都系统性风险的监测与预测; 智能助 理,你这其他人达到了超越人满意度的智能客服。今天智能助 理完成任务基于一系列的场景,意味支付宝你这其他人是一系列的金融生活服务平台,今天就加上智能的定语叫智能的一系列的金融生活服务平台; 今天也介绍了基于哈希的海量实物提取,完不是从工业的淬硬层 ,希望算得快、便宜和省内存;另外是淬硬层 强化学习,在营销与推荐应用。在营销比较关键,意味什么都淬硬层 学习如此 经常我能 后来的,如何让加强学习您里能 不能探索三个小在exploitation 和exploration的平衡:我能 刚刚推荐你都看的类式的,里能 不里能 我能 如此 都看的。

大会资料分享:点击查看

大会官网:点击进入

下面说些你这其他人和你这种公司意味都面临的挑战,你这其他人觉得有什么都的数据,如何让比起你这其他人的业务间题比较复杂度还是欠缺,小数据、弱标注的数据的学习就不为什么在么在要。另外,比如说如何除理有噪音与不选取性的推理,专家系统是从逻辑推出来的,如何让它里能 不能handle真实世界里的噪音和异常情况报告,今天讲的Graph Emedding是三根路,但不是仅你这种条还有你这种的方向。 如何让机器学习上面还有三个小不为什么在么在要的间题是模型的可解释性,我能 知道为哪些,那在金融场景有非常多的应用,为哪些信用分变低了我能 给三个小交代,什么都解释,今天的淬硬层 学习欠缺解释性。还有如何从观测的而不是随机对比的数据中分析因果分析。还有长期目标与短期目标映射,如何把长期的目标和短期做的目标结合起来。最后,非线性动态网络系统,网络五种生活在改变 这里和物理学你这种概念很相关,同时和图理论非常相关,这对风险、监控和交易不是很有用。

接下来简单展示训练模型时的三个小视频。这是显示的分类结果,这是得出来的树状模型,如何让里能 不能进行效果评估,这里能 不里能 不能比较三个小算法哪三个小更好,拆分刚刚随便选三个小算法自动评估,如何让里能 不能进行结果对比。你这其他人刚刚在学校训练完模型,如何让手工测试几块测试集就刚刚结束了了 了,而在实际业界应用里经常有新的数据跑,新的预测,时要简洁好用。在你这其他人说话的刚刚,这就产生了三个小部署的API,你这其他人意味有间题还里能 不能看三个小请求示例,示范如何使用你这种API。部署完了刚刚你这其他人要知道效果好不好,不是经常稳定,比如你这其他人要监控信用分,KS值,它是AUC的变种。你这其他人里能 不能都看它对每一天当时的效果实时进行监控。

以下为漆远博士演讲实录:

今天很高兴给你这其他人作三个小分享,介绍一下AI在蚂蚁金服的发展和应用。

假设非常多的数据,万亿参数非常耗能耗的,同时时要什么都的机器。什么都时间的applications,你这其他人希望时延比较快比较省能源。在非常非常经典的矩阵分解中,相信什么都做相关研究和做开发的同学都非常了解,意味你这其他人把矩阵分解和哈希算法做结合,你这其他人里能 不能除理非常大的矩阵,比如说1亿×1千万的矩阵分解,你这其他人2小时收敛,从工业界的淬硬层 具有非常大的价值。你这其他人用到了口碑的场景中,点击率的升幅超过120%。

刚才讲了加强学习,讲了淬硬层 学习,下面讲另外三个小例子。意味每个技术都作为三个小好用的工具开放出来,您只想用你这种工具而不过深入技术五种生活咋办 办?你这其他人开发了三个小模型服务平台,将整个模型训练给您可视化,您通过简单的点击、拖拽数据就能产生所有的结果。比如说您是开发应用的,您里能 不能把算法在上面应用刚刚进行一键部署。当然意味您是开发算法的里能 不里能 写出新的算法,类式加强学习等,里能 不能通过统一的平台进行服务。在蚂蚁金服实物,从芝麻信用到网商银行的借贷,到风控都正在全面地使用你这其他人的平台。

在本次大会上,蚂蚁金服副总裁兼首席数据科学家漆远博士发表了主题为《金融智能的发展与应用》的演讲。漆远表示,蚂蚁金服今年的三个小关键词,三个小是“开放”,三个小是“AI”。

面对哪些挑战你这其他人构建了三个小金融智能的平台,从底层的图像理解,以及使用阿里巴巴集团的语音识别能力,在此之上发展了NLP的能力,如何让这上面进行机器学习、淬硬层 学习,分析时间序列,比如说预测余额宝的利率变化;在最顶层,你这其他人发展推理和决策的能力,使你这其他人里能 帮助你这其他人的用户和金融战略公司合作 伙伴做出明智的决策。

下面讲讲另外三个小方向,在过去的什么都年,不管是中国还是美国,讲起智能助 理和机器人不是非常热句子题。这里对话很关键,在蚂蚁金服初始的对话从客服机器人刚刚结束了了 ,意味你使用支付宝,打开客服小蚂答里能 不能问各种各样的间题,类式你问余额宝收益咋办 算,他就我能 三个小刚刚三个小答复,提供工具输入金额并计算。如何让还有财富的理财渠道,你问某个企业业绩如何就会刚刚结束了了 进行舆情分析,舆情分析在金融上面非常多的应用,你这其他人里能 不能自动分析,海量的舆情在中国国内,为月新闻、周新闻相应地打出舆情分。

今天我介绍了一系列的技术,刚刚我当老师写NSF proposals,不是三个小目标要写,三个小是intellectual merits 什么都技术的原创性,另外三个小是broad impact,什么都对世界的影响。一般第三个小目标你这其他人都拼命写,第二段不是那种来回贴的那种,为哪些?意味当时在学校的研究里工业界有距离,欠缺直接的对世界产生影响的最好的辦法 。今天觉得学校里能 不能和工业界战略公司合作 ,工业界有更多的数据,更大的间题更难的挑战,不仅应用技术还里能 不能发展技术,今天介绍的什么都一每种的技术,你这其他人还有如此 发布的技术。

现场,蚂蚁金服的“模型服务平台”首次公开亮相,主打“模型所见即所得”。漆远表示,数据是资产,模型五种生活也是资产。未来,蚂蚁金服也会将你这种平台作为其中三个小AI能力向战略公司合作 伙伴和客户开放。

你这其他人今天讲到了开放与AI,这里讲到蚂蚁金融云和开放平台,希望你这其他人的AI技术的能力开放服务于你这其他人的客户和战略公司合作 伙伴。

首先是在安全风控中,上面有用户、设备、商家,你这其他人之间通过资金流动形成互联。传统的风控技术中你这其他人建立了什么都的规则和模型。蚂蚁金服过去十年通过使用血块的机器学习建立强大的风控系统。如何让今天你这其他人希望进一步地升级风控系统。比如说可信模型,你这其他人想判断有一笔交易不是位于账号被盗。而这上面你这其他人使用了三个小跨界的技术,觉得就广告CTR预估的技术。 在2014年Facebook广告算法的文章中, 讲的是GBDT+逻辑回归。使用你这其他人开发的参数服务器技术,你这其他人把逻辑回归加上了大规模淬硬层 学习,使用到风控上面: 通过GBDT产生实物,如何让DNN继续学习。 意味在风控上面什么都实物你这其他人无法判断哪些有用哪些如此 用,你这其他人用GBDT产生海量实物如何让把哪些实物feed给淬硬层 学习模型。

刚才介绍的是机器学习,什么都参数服务器,支持淬硬层 学习。下面再讲三个小技术,你这其他人的场景是营销,比如说各种各样的商家营销,如何发,发给谁,这是非常有价值的商业间题。这上面你这其他人开发了加强学习技术。在你这种算法中,你这其他人有State、Action和Reward的情况报告,你这其他人定义了三个小空间,State是从多个业务抽取实物,刻画用户情况报告,Action是对哪些卡片和渠道做了相关决策组合,Reward什么都用户的点击和签约行为。整个框架是流式强化学习框架,什么都里能 实时实现Update。这上面讲了三个小流程,比如说花呗准入,比如说它不是点入和签约,整个算法里能 不能在框架上迭代,效果什么都在淬硬层 学习基础上有更好的效果提升,比如推荐卡片点击率171%的增长和最终签约率149%的增长。

将图的关系和Feature结合起来,里能 不能产生非常Power的模型,用在你这其他人的模型上面。通过广告的算法提升了系统,你这其他人进一步学习,将淬硬层 学习和图模型结合起来,里能 不能融合网络关系与比较复杂实物。

下面讲三个小技术,在对话机器人上面,在客服上面,假如问了这句话我如何申请退钱回来,它是如此 场景的。在问答系统中要理解它,就要真正知道在问哪些,你这其他人里能 不能根据用户的近期操作,哪些操作五种生活就提供了三个小背景和场景。你这其他人通过LSTM对用户行为轨迹做三个小编码,如何让整个模型是三个小淬硬层 排序模型,比较哪个更类式,通过LSTM建立模型,把如何申请退钱回来的用户间题,和转账转错咋办 办和为哪些银行卡转账被退回来,你这种个进行答案匹配。你这其他人给出正确的选取转账到账户错了咋办 办。这里有一系列的创新。哪些创新今天不一一讲。最后的结果,去年双十一智能客服自助率做到97%。同时今年你这其他人间题除理率超过了人工客服,机器人回答间题比人回答更为满意。

今天讲几块例子,从例子出发讲讲头上的技术。在这刚刚,我先讲讲蚂蚁金服现在的三个小关键词。蚂蚁金服你这其他人定位为Techfin,而科技公司的三个小核心的是哪些?是AI。什么都今年蚂蚁金服三个小关键词,三个小是“开放”,三个小是“AI”,你这其他人希望通过AI驱动所有的业务,同时作为科技公司,你这其他人技术成熟是什么的句子的句子图片 图片 图片 的句子期期是什么是什么三个小开放三个小,什么都下面探讨的技术也是探讨如何开放给伙伴。

在此次演讲中,漆远从风控系统、智能助 理、定损宝等产品案例出发,全面介绍了蚂蚁金服产品头上的 AI 技术。

前面是说你这其他人把GBDT和DNN结合起来考虑风控。淬硬层 学习往下走,你这其他人也考虑关系,用户、商家、卖家等的关系,下面我举三个小例子,你这其他人通过embedding技术,把整个关系结合起来,形成图形网络,如何让进行监督学习、加强学习。给你这其他人看看例子,比如说支付宝账号的账户(行为),你这其他人三个小网络有好人、坏人,有设备比如说手机、计算机,iPad等,我判断今天你这其他人不是注册三个小垃圾账号不为什么在么在简单。你这其他人里能 不能把整个的图关系通过三个小embedding的技术产生三个小淬硬层 学习的网络,通过机器学习产生三个小隐层表达,你这种表达不光所含了每个节点自身比较复杂的实物,同时还对网络实物做了三个小encoding。在垃圾账号的识别上,在经典的Recall-Precision曲线中,Precision越高越好,接近1什么都完美。刚刚的规则是不具可采信的,现在你这其他人对图使用embedding技术后有三个小质的飞跃,Recall在70%、60 %的刚刚,Precision达到90%,而刚刚的算法Precision在40%几,这基本最少瞎猜。你这种和刚刚的系统相比,Node2Vec也是非常先进了,你这其他人在此基础上又做出了明显的提升。

那下面最后讲三个小例子,前几周你这其他人保险事业部和你这其他人发布了三个小产品叫“定损宝”,做哪些呢?出了三个小小车祸,照张像,哪里有间题,是撞了三个小洞还是刮蹭进行判断,这是非常比较复杂的事。你这其他人不是做 OCR识别,什么都是做数字识别,如何后来这其他人要做检测,你这其他人要检测哪个部件比如说车门、车灯还是bumper,你这其他人要理解你这种场景,比如说有三个小缝,五种生活计算机我不知道是车上的缝还是墙上的缝,还时要知道你这种间题多么严重,最后是三个小决策,将多个数据源结合起来,给用户和定损员三个小辅助判断 。看这张图像,您觉得车哪里有间题,我当时都看后来也没看出来,我不知道你这其他人如何? 这上面哪些间题呢?如这里所示,有个不为什么在么在微小的变形。如何让这里你这其他人要除理几块间题,第三个小是间题在哪里,第三个小我能 把间题分几层,到底有多严重的间题,比如说这是轻度变形。有的变形了你得把整个部件换掉,有的稍微一修就修好了,最后告诉您修几块钱,在您的App上面把北京你所在位置附过的维修店删改选出来告诉您成本,您做三个小决策不是要修。 下面举几块你这其他人遇到的计算机视觉上的挑战。比如部件识别,这上面有几块个部件呢?我不是很专业,不算汽车爱好者,如何让里能 不能看出来这里有什么都什么都部件。所有的部件要找到,如何让说有间题你不是看出来。再举个例子,左边三个小强反光,强反光不是有间题呢?你这其他人要琢磨琢磨。还有,照相的刚刚人脸都对着框子里照,拍车照片的淬硬层 变化大什么都 。

下面第三个小讲机器学习平台,这是你这其他人团队在阿里第一年刚刚结束了了 做的工作,后来在蚂蚁继续和阿里集团战略公司合作 开发。现在它是阿里和蚂蚁金服使用最广泛的大规模机器学习平台。2015年你这其他人用于广告取得非常好的效果,后来用于淘宝推荐,前年用到双11推荐,今年又用到了蚂蚁的风控上面,觉得它的核心技术什么都你这其他人里能 通过系统和算法的结合,除理海量数据。什么都在风控系统上面,你这其他人里能 不能在同样安全覆盖的情况报告下,提升召回率,每天一千多万笔里能 不能准确轻松地通过审查。你这种平台前年做到了,如何让今年才写文章出来。它能支持60 亿实物、千亿样本、万亿参数。这是说它里能 不能支持非常多的数据和实物,你这其他人能从数据中提取价值做出预测。

最后,再次说,蚂蚁是一家做普惠金融的科技公司。你这其他人主题的是开放与AI, 技术成熟是什么的句子的句子图片 图片 图片 的句子期期是什么是什么三个小开放三个小。从客服到模型部署平台到你这种的每三个小案例,包括舆情平台,你这其他人都非常后来赋能和服务客户,和你这其他人的战略公司合作 伙伴、与你这其他人的客户同时探讨和创造未来。

谢谢你这其他人!