软件频道

人工智能技术新体验百度识图题诗

2014-08-29作者:芐錯站--

近日,百度手机客户端上线了一项有趣的应用——“为你写诗”。用户进入百度客户端首页,点击“为你写诗”选项,拍照上传人物或景物图片,后台系统就会根据用户提供的图像进行智能分析和匹配,为用户量身打造属于自己的诗歌。数据显示,上线两周内,“为你写诗”应用扫描图片次数已经超过了1000万次,即平均每秒有8.26人使用这个应用。

创作是人类作为高级生物的优势之一,写诗画画对于人类来说不是件难事,但如何让机器像人类一样自主创作,却是人工智能领域的难题之一。“为你写诗”这一看似简单的上传图片并匹配生成原创诗词动作,背后是百度在深度学习和自然语言处理领域的深厚技术积累。

如何让机器学会创作诗歌?百度的工程师将这一创造性工作分解为两个步骤。首先是识别图片信息,确定图片主题。在计算机视觉领域中,从图像到语义的转换是极具挑战性的课题,业界称其为语义鸿沟。在“为你写诗”功能中,百度深度学习算法构造出一个多层非线性层叠式神经元网络,能够很好地模拟视觉信号从视网膜开始逐层处理传递,直至大脑深处的整个过程。这样的学习模式能够以更高的精度和更快的速度跨越语义鸿沟,让机器快速对对图像中可能蕴含的成千上万种语义概念进行有效地识别,进而确定图片的主题。

其次,根据图片主题,机器自动写诗。一般人人看到一张优美的照片,能很快看出图片的主要内容,但是只有文学功底深厚的人才能触景生情,写出应景的诗词。比如面对一张蓝天白云的照片,一般人可能会想到晴朗的天空,而诗人则会联想到类似“雨色秋来寒,风严青空爽”诗句。人在写诗的过程中,大脑会充分发挥想象力并综合运用各种知识。在自然语言处理领域中,让机器写诗,同样需要让机器自动处理词语、句法、语义、语用、韵律等复杂语言现象,并借助知识库进行想象推理,这是人工智能领域极具挑战的课题。百度自然语言处理技术通过对大量古代和现代诗歌的分析、理解、建模,自动学习到了诗词写作模型,并开发了诗词生成器。根据对图片主题词的语义理解,诗词生成器首先生成应景的首句诗词。使用过“为你写诗”的用户很容易发现,百度创作的诗歌第一句会包含图片里的主要元素。首句诗的生成,是机器进行诗歌创作的第一个步骤,也奠定了整首诗歌的意境。接下来,诗词生成器会基于首句的内容、韵律和意境来生成后续诗词,最后呈现给用户。由于“为你写诗”采用的是机器自动生成的诗词,这些诗词内容都属于原创,很难在互联网上搜索到相同的诗句。

据悉,读图写诗这个创意源自百度内部一个名为“图文并茂”的Hackthon项目,Hackthon项目是由工程师自发提出创意、并做出产品原型的项目。应用中使用的上传图片生成诗歌的技术专利已经成功申报专利。

读图写诗功能的实现,体现了百度在人工智能等前沿技术领域中的领先性和创新精神,也展示出百度在移动互联网方面远超竞争对手的技术实力。

手机软件>>正文