【北京论道】英博格刘克:人工智能未来发展趋势——自主交互
流媒体网| 2016-10-13

  【流媒体网】消息:在电视新媒体时代,大数据正成为客厅经济的下一个商业价值的驱动力。而在当下,数据泛滥也成为不争的事实,如何借助大数据的解析,实现商业价值的有的放矢和物尽其用,构建商业生态,重绘客厅营销的精准蓝图,就成为客厅生态价值挖掘的重要课题。我们期望通过本次分论坛,汇聚产业各方基于大数据,精准营销,客厅生态,以及跨屏融合等技术、产品、运营方面的探讨,寻求产业的商业未来。

  2016年是人工智能第一阶段爆发的一年,这一年世界各地有很多机器人展览、机器人大赛等,围绕人工智能的全球竞争和商业化应用也正式开始。人工智能将走向何方?此次论坛将共同探讨。

  10月13日,以“智屏·互联,大‘视’所趋”为主题的流媒体网第十二届论道在北京举办,会上,成都英博格科技有限公司CEO刘克做了主题为《人工智能未来发展趋势——自主交互》的演讲。以下为演讲全文:

刘克.png

  大家下午好,今天很荣幸来到这里。我来给大家做一个话题的分享,就是《人工智能未来发展趋势——自主交互》,我是来自成都英博格科技的刘克。

  人工智能的前提——认知

  说到这个人工智能,可能大多数的人会反应到底这个人工智能它是有多聪明。它能听懂我讲的这个笑话吗?它能表达自己的感情带来这种喜怒哀乐的这种表现吗?其实我觉得大家的这种反应在于这个人们乐于看到自己的能力,被迁移到其它的这种物体上。然而这种迁移对我们来说是一个必须先要做到认识和理解。人对自身的能力的认识和理解其实并不是一个简单的过程,要实现正确的认识和理解,就需要有正确的方法,在人工智能里面我觉得也是这样。首先需要有感观的认识,同时也要有理性的认识。在启蒙运动的早期,其实人们认为这个感官经验的知识的来源,因此我们通过看到的,听到的,后来认识和理解这个事物,这种说法也符合大家的这种直觉。那么笛卡尔大家都知道他是法国著名的哲学家、物理学家,也被誉为我们的解析几何之父,他认为眼睛看到的不见得是真实,耳朵听到的也不一定是真实的,他其实是怀疑他能怀疑的一切。但是他唯一认为有一件事情他不怀疑,那就是他正在怀疑别人这件事,所以说,他认为思考实际上是唯一确定的存在,理性才是人们了解事物本质的途径。有个作家、哲学家康德,他恰恰综合了两者,他也是被誉为这个思想界的一个代表人物。他认为实际上理解这个事物应该感官的体验和理性的思维,都不可缺少,那么感官的经验给出了理性功能的这个范围,就是我们只能去理解那些感官经验之下的事物。那这个怎么来理解其实我举个简单的例子,就像我们能够看到和摸到花,那么通过感官和理性的思维相结合,我们就能明白和理解为什么花它会开,它什么时候能够结果?那么这就是作为康德,他的对事物理解的两种的这种结合认识。

刘克1.png

  所以说,我们去了解这种理性的这个功能的过程,我们可以看出包括人工智能,包括机器人,创作它注定是一个漫长的过程。机器人也变得越来越自能,并且在将来我们相信它一定会自主。人们在身上迁移自己能力的同时,我们也认识到它也有自己的局限性。

  人工智能的局限

  现在机器人在实现这个实时翻译人脸识别,包括这种物体识别上它可以比人更加精确。但是和人的这种能力差别我们认为它只是局限在这个量上,在面对挑战人类极限的这些问题的时候,其实机器人它也不一定能够大获全胜,那比如说,再从这个苏格拉底开始,那我们就在讨论什么是公平主义。其实有人认为生下来就是平等的,但是实际上我们看到因为这个出生的这个环境不同,其实人的这个境遇它是可以千差万别的,因为人工智能所拥有的这种人类作品的共同点,它就是把所有的被创作的作品,都赋予了创作者的印记,这个可以怎么样去理解呢。

  我可以举几个例子,大家可以看一下,包括拉菲尔啊,他认为世上有绝对的美,这是他的理解。所以说他在创作的作品上,它把绝对的美都赋予在了圣母身上;像达芬奇他对自然的关注和对人性的赞美也通通地体现在了这个蒙娜丽莎的身上;经历了非常多社会动荡的米开朗基罗,他也是把自己的怜悯和哀伤深深地烙在了他自己的作品上面,包括莫扎特、贝多芬,还有巴赫等等。其实这些都说明一点什么呢,就是我们创作的作品,它都有创作者自身的人格特征和人格印记。那么其实我们在作品创作的最高峰上有很多人自身形象的作品,像八四年施瓦辛格的《终结者》,也包括人工智能那部电影AI中的机器男孩也包括去年上映的《超能陆战队》的大白,还有像我们看到的,星球大战里面,这个灵动可爱的机器人也包括我们从小就看过的这个多啦A梦里面机器猫啊,勾起了我们对机器人未来的无限憧憬。

  未来的人工智能

  未来的这个自主的智能机器人产品会是什么样呢?其实我们在这个地方也给大家做一个这个简单的这个剧透。我们的产品经历了大概一年半的设计和研发,也会在今年的12月份。在全国正式的亮相和上市,它实际上也搭载了我们刚才提到的情感自主交互系统,以及这个协同行为表达系统,我们也希望它能够最快的时间用最好的表现能够逐渐走入家庭,走入我们的学校,甚至走入我们每个人的生活。

刘克2.png

  刚才提到的服务机器人,包括人工智能发展的3个阶段,这3个阶段也是上次我在APEC会议上听到这个微软的研究院的一位负责人张志兵教授他讲到,他说现在的这个智能机器人其实经历的3个阶段,第一阶段应该是从联网阶段开始,包括无线的联网家居的控制信息的推送以及社交的服务,近期我们看到的智能机器人,它在听说看,包括识别,以及个性化服务,这一块已经有了明显的提升,我们相信也希望未来的服务机器人包括智能机器人,它在自主上面,它未来的发展趋势在行为理解,情绪的感知,推理的规划以及主动运动上应该是一个标准的一个特征。

  我们认为奥叮在能够做到自主的前提,是因为它先有对自己的认识,那么要认识自己的所有的特点和特征,它首先还是要对我们的使用者,也就是我们的用户能够有一个深度的了解和认知,这样的话它才能够更深入的了解自己。人工智能的这些产品包括奥叮,它实际上也是借助了机器学习的技术,将提炼出全方位的用户画像,比如爱好习惯,和行为逻辑等等,然后呢机器人将这些自身牵引用户的一些诸多的优点,同时它利用自己的算法,去找到一个非常合适的这个机会和合适的交流方式去跟用户达成这种满足她的需求,让整个交互有提升。

  现阶段,我们看到的一些理性的功能,主要有机器人的逻辑能力和推理能力去组成。其实机器人在做这个卷积神经网络和这个长短时的记忆,这一块它可以让机器人本身根据交互的场景生成合适的交互内容。那么除此之外在逻辑推理能力的这个基础上我们对交互场景的理解也借助了发展而CNN,也就是更快速的区域,卷积神经网络技术去帮助机器人快速的识别交互场景里面的各种物体,因为卷积神经网络和我们发的还是CNN,它不同的一点就是发展20,实际上它虽然可以去识别图形中得很多的这个物体识别很快,它可以把整张图按照2000个分区分块去进行相应的这个识别,这是它的一个特点。

  所以说我们刚才讲到的CNN,它可以快速准确地去识别物体,而我们长短时的记忆模型,它又可以去生成文本。二者结合就赋予了机器人有识物文本的联想能力,从而可以和用户展开恰当的交流。我们同时也在介入循环神经网络和注意力模型,包括这个用户画像数据让机器人能够自主的转发,其实机器人的这个自主品牌、交互环境和交互内容以及自主生成和转换交互内容的这种能力是寄生逻辑能力的一种,也是理性能力的一个初步体现。这个地方我可以举个例子,比如说我们在和人工智能的设备进行交互的时候,你对它给你提的问题,或者说你们交互的内容不感兴趣,那么机器人它会通过一些我们僵词库的设计以及我们的一个算法,所谓僵词库就是不感兴趣的这些词语,如果你发出邀请,它其实就会理解,你可能对这个话题已经不感兴趣了,那么它会根据它的这个话题控制的一些算法再结合,我们前面讲到的这个用户画像,你会感什么兴趣的一些话题?再加上我们的一些机器人自身的语言模型,它会控制性的,去给你做一个新话题的交互。那么这一块就是我们我们自主交互的另外一个核心内容。

  新阶段,我们也提到了机器人的这种感情功能,主要是通过交互过程中表现出来的喜怒哀乐,其实我们也是借助循环神经网络和这个卷积神经网络让机器人来学会人类表达情感的方式,并将特性迁移到了机器人身上,应此可以去理解人的情感,也能表达出比较丰富的这种情感。我也可以举个例子,比如说我们在跟机器人聊天的时候到我们很开心,那么我们的奥叮的这种机器人包括其它的智能机型,它会通过人脸识别,发现你的表情是在微笑同时呢从你的笑声,她能判断出你是在比较开心的状态下,那么它也会根据你的这个刚才我们看到的用户画像包括你的语言模型去跟你匹配,开心时候聊天的这个内容,这就是其中的一块。

  那么我们其实也是创作刚刚开始,奥叮也是我们的一个第一代的产品,我们其实也是怀着极大的热情去把新的技术理念运用到人工智能产品当中,我们也会持续不断的去理解这个人自身的各种能力,并向好的智能产品上去迁移我们的能力,同时我们也希望通过自己,不断的思考实践,然后奥叮能够懂得更多,然后想得更深,看得更远,我们的奥叮,是为您而来。谢谢大家。

责任编辑:张海月

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!