软件频道

滴滴数据大脑超越AlphaGo在现实世界中出行

2016-04-24作者:清凉依夏

滴滴数据大脑超越AlphaGo在现实世界中出行,4月18日,人工智能顶级科学家、滴滴研究院院长何晓飞首次公开面对媒体阐述他对人工智能工智能发展阶段的看法,同时解密人工智能技术上针对如何落实滴滴应用平台,以及以后的发展成果,这都是在滴滴出行与Udacity合作发布会上为大家揭开序幕的。

何晓飞曾担任雅虎研究院科学家,回国后在浙江大学任教,2015年加入滴滴出行。过去15年,他在机器学习、人工智能、计算机视觉等研究领域作出了卓越的贡献,同时是有科学领域“奥林匹克”之称的国际模式识别学会会士(IAPR Fellow)。

3月中旬,谷歌人工智能产品“AlphaGo”在围棋大赛中4:1战胜人类选手,引发业内热议。然而,从AlphaGo可以看到,很多人工智能产品目前还处于实验室阶段,距离现实应用还有一定距离。

何晓飞指出,人工智能技术在出行领域的应用探索,滴滴目前走在世界前列。AlphaGo通过自己与自己下棋取得无穷、无限的数据,而滴滴出行每天正常出行本身就可以产生海量数据,通过监控这些数据的产生,又能产生更多维度的数据。而通过与现实出行领域的“对弈”学习,滴滴研究院已经在多个维度取得了阶段性突破。

曾经质疑,但人工智能“奇点”已经来临

何晓飞指出,1950年左右人工智能概念被提出,引发第一次人工智能的浪潮,随后出现了许多关于人工智能的影视作品。但几十年来,人工智能领域并未出现革命性产品,导致很多人,甚至做学术的研究人员自己,都不相信人工智能真的可以实现。

近几年是人工智能爆发的第二次浪潮,与第一次浪潮不同的是,不管是普通大众还是业内专家,越来越多的人相信,人工智能真的可以实现了,“奇点”即将来临。而人工智能产品也逐渐走向大众,除了业内关注的谷歌AlphahGo之外,很多技术已经被应用到一线。

此外,10年前大家在讲人工智能的时候,被提到更多的是机器学习,因为人工智能太抽象,并且一直在被怀疑。现在,业内更多在谈论人工智能,而机器学习是作为人工智能领域的一个重要术语被业内熟识,当然,接下来更多专业术语会走向大众,包括监督学习、非监督学习等等。

何晓飞本人相信,在未来3年、5年甚至10年,人工智能会深刻改变生活中的方方面面。而现在,何晓飞带领的滴滴研究院团队已经在用人工智能技术,直接作用于出行平台、产品、技术的方方面面。

硬件技术的发展,也使人工智能“奇点”来临成为可能。此前CPU(中央处理器)用于数据计算,而GPU(图形处理器)被用于处理图形、游戏等领域,随着硬件普及,GPU可以大量用于数据处理,而通过云计算连接大量GPU/CPU之后,可以进一步满足人工智能需要的海量计算需求。

滴滴大脑如何跟出行“下棋”

在媒体描述中,AlphaGo会在夜深人静,计算资源闲置的时候,自己跟自己下棋,通过一次又一次的对弈,获取无限、无穷的数据规模,进而完成数据的挖掘、分析、学习,实现了“打败人类”。

而滴滴研究院的“数据大脑”,通过研究每天真实的滴滴出行平台上产生的数据,以及对这些数据如何产生进行二次追踪的数据,实现提高出行效率的结果。

目前,滴滴平台上每天产生超过50TB数据(相当于5万部电影),超过90亿次路径规划次数。在过去一年中,滴滴出行平台完成14.3亿订单,这相当于在中国平均每个人都使用滴滴打过一次车;累计行驶里程达128亿公里,相当于环绕中国行驶29万圈,累计行驶时间达4.9亿小时,相当于昼夜不歇的行驶56000年。

之所以每天产生90亿量级的路径规划数据,是因为每收到一个订单请求,系统会针对一个区域范围内的车主、用户做多次路径规划,并从中选择双方最优的匹配选项。增加快车拼车产品之后,需要规划的路径次数成几何指数倍增,因为在原有规划基础上,又增加了各种变量。

所以滴滴“数据大脑”对弈的是现实出行的海量数据,通过对每天24小时不间断产生的新数据,以及检测这些数据本身产生的二度数据,包括ETA、路径规划、实际路线、匹配时间等等,进行研究、学习,最终实现订单匹配效率的提升,司机取得更多收入,乘客更加快捷出行。

何晓飞提到,大数据是石油一般的宝藏,滴滴拥有在全世界范围内,出行领域最完善的数据资料。挖掘滴滴数据宝藏需要机器学习、深度学习作为工具,机器学习是一个浅层模型,输入一张图片、一段语音,输出可能就是一只狗还是猫。而深度学习是多层的,类似于人的大脑有一个深层次的信息处理传播,像人一样去理解数据并且输出结果。滴滴研究院已经招聘了许多世界一流的科学家在从事这个领域的研究。

最终要实现数据的“预测”功能,而非一直留在“监测”层面。

数据如何预测未来

何晓飞提到,滴滴的目标是建立一个移动的智能出行网络。这是一个完整的系统,其中包括随区域、时间变动的定价、订单的高效匹配、根据供需预测之后的司机运力调度等等。

对于一个具体区域来说,滴滴“数据大脑”已经实现了,提前15分钟时间内可以实现超过88%准确率的预测,根据预测结果,就可以选择要不要对司机运力进行调度,使在附近的司机可以提前到达运力紧缺的区域,以缓解可能发生的拥堵。

即通过预测—干预,再次预测-再次干预。通过预测干预来缓解区域的运能紧缺,而非在紧缺之后再通过价格杠杆事后处理。这个思路与目前市面同类产品有本质区别。

以上预测加调度的模式是宏观视角,另外还有微观角度的预测。比如一个乘客发送订单之后,根据算法模型可以预测这个订单的成交率,这个模型中包括乘客历史数据的出行习惯,以及周围司机的出行习惯,进而得出本次订单能否成交的预测。

预测之后是干预,如果预测乘客订单成交率比较低,系统会采用反馈手段来激励司机的接单意愿,促进成交。

何晓飞认为,传统搜索引擎出来的结果是很多条的,但对于出行领域来说,人工智能运算的结果只有0和1,即乘客的出行能否达成。滴滴所有的数据、算法都在为了匹配用户和出行工具而努力。

在过去的一年,滴滴已经在多个数据维度产生很大的改变。以快车为例,乘客发单后平均ETA降到4分钟,节约了60%出行成本,在高峰时期增加5%订单成交的机会。对于司机来说,每小时订单成交量提高了20%,平均收入提升了30%~40%。

接下来,技术创新会在滴滴平台上起到越来越大的作用,而滴滴出行,也要成为一个像Google、Facebook这样的科技驱动公司。

手机软件>>正文