【广州论道】联想魏晋:联想电视的人工智能探索之路

流媒体网| 2017-06-08

　　【流媒体网】消息：从IPTV到IPTV+的客厅未来，在于产品的进化、在于技术的演进、在于体验的改善，让越来越多的智能科技服务进入我们的客厅，借助科技产品连接构建成客厅智能业务的延展。2017年5月25日——26日举办的流媒体网第十三届电视新媒体产业峰会上，特设“IPTV+：迎接客厅智能未来”论坛，期望借助此论坛，探求科技与客厅经济的结合，寻求创新服务与电视新媒体IPTV的融合，使各种需求和智慧交互成为可能。为运营商的大屏未来提供更多可能。

　　在该论坛上，联想智能电视产品营销总经理魏晋进行了《联想电视的人工智能探索之路》的主题演讲。

以下为演讲全文：

首先跟大家分享一些联想电视的故事，2012年，也就是五年前，联想发布了第一台电视，那时联想在智能电视上，内部一直把它作为一个孵化业务。

　　联想电视在人工智能方面的探索

　　五年过去了，现在在电视这个行业发展的也很快，而且联想的变化也很大，在去年就提出了一个特别大的战略转型叫Devise+，加什么? 服务。Devise就是硬件，包括现在我们也承认联想是一个硬件比重大的公司，现在我们要把加号这边转移，就是要做更多的服务。在这个大帽子下，大家也看到了方向，智能家庭毫无疑问是重中之重的一块，智能电视又是智能家庭里非常重要的入口，所以我们这个业务是一个非常幸运的，是一个非常好的平台，今年也借助产业大升级，会有很多发力的可能性，所以我相信接下来大家听到联想电视的声音会多一些，首先我们看一段VCR。

　　刚才那个VCR给了大家一个印象，因为我刚才说了好多人并不熟悉我们这块业务。其实看出来这块业务在联想内部应该说越来越重要，我们利用了联想有史以来在中国最大的一次科技巡展，目前已经从去年第一站西安站，12月28日的第一站，总共有15个城市已经做完了。今年的目标是准备在全国100个城市进行科技巡展，在科技巡展里面，总共2个小时的会，电视在里边的篇幅占到了10分钟，所以公司把它越来越的提高到战略上来。

　　图片2.png

　　成长性是界定人工智能的重要标准

　　谈完联想电视，再谈一下电视跟人工智能的结合。什么是电视的人工智能?其实这个词很难界定，我在准备这个材料的时候我就觉得，比如屏幕上列的这块电磁，它是智能的吗?也算。它有点人工智能的感觉?也可以，但是你说它真是，好像还不够味道。比如说几年前就有人工查询，还有边看边做的事情，还有今年特别火的千人千面的UI，还有猜你喜欢的智能推荐，还有公司也发布产品不可流失的UI，包括语音控制音量。那这些到底算不算人工智能?不知道这些问题大家有没有思考过，至少我经过一些思考以后，我们团队做了一些探讨。

　　我们的理解，人工智能电视应该是像成长中的人一样，如果把它拟人化，我们把它比作是一个成长中的小孩，它应该具备的能力应该是“听、说、读、写、作”，这是跟大家交流通俗的能力。但是还不够，它必须有成长性，所以我们觉得这六个词是最关键的，“听、说、读、写、作和成长”。我们分别看一下，听在技术上我们列了三点。1、噪音处理，现在近场比较容易，用摇控器。但是远场技术成熟了，现在还不太成熟，噪音处理这件事情还是会有很多麻烦。包括我们现在的产品在家里使用应该没问题，但是卖场里面，还是有些反馈，比如说有时候语音识别会出问题。2、语音识别，这个技术讯飞公司很早就实现了，能把你的声音最后识别成文字。3、语意理解，就跟小孩子一样，他可能听到了这个字，但是他不知道什么意思。如果大家有小孩，孩子会问你这句话什么意思，说明他听到了，但是他不懂，所以语意理解是非常难的，工作量也会非常大。

　　紧接着他要“说”出来，说首先要解决的是智能搜索，比如说我们的论道，你听懂以后要在库里找出来，以前我们百度或者Web搜索，搜索完以后列了很多你自己选，但是这个不行，它的搜索是惟一性的。之后你要进行语音合成，你要把搜索出来的东西进行合成声音。因为很多人经常会说合成的声音有点像机器人，但是大家希望它是一个非常真人化的，所以这个工作也在不断完成过程当中。第三个是多轮交互，我们经常说的话，你不听上文，光听下文不懂什么意思，但是人懂，你跟一个人聊天，你有前文，他知道后面的话，这个话就可以用的很简短，但是机器有时候不懂，所以要做到多轮交互。

　　再说一下“读”，我们列四点。比如第一个声纹识别，像我的声音是一个中年男性。然后是视频内容识别，比如说这个视频里面出现的场景，地标建筑是什么，他根据地标建筑就可以知道视频里讲的是什么地方，比如是巴黎还是北京。还有图像识别，比如说这盆花，他就知道这朵花是玫瑰或者是月季。然后是视觉识别，像我们做脸部搜索，这种就是视觉识别。

　　第四个是“写”，这个就是大家说的关键词“千人千面”，另外一个是“消费弹窗”，我们认为电视上有可能做出一个弹窗的机制，怎么在不打扰你的前提下做到弹窗的互动机制。

　　第五个是“做”，比如说通过ZigBee或者Wifi实现设备的互联或者是控制。

图片3.png

最后是“成长”，现在有大数据、深度学习、神经网络，比如说阿尔法狗到底怎么像人的思维能够深度学习，不断的学习，然后去挑战人类的极限。最后是神经网络，可能以后他真有情绪了，现在大家跟他做互动的时候，他会跟你聊天。我们上次有一个人说这个音响好像设计的不是特别好，里边突然传出来一个，你这样对我很不礼貌，这个就让人很有意思，感觉他有一些类似于人的思维，甚至是情感，他的语气也是很生气的，你这样对我不太礼貌，我们当时觉得很惊讶，在这个实验室里面，这个是我们拟人化的总结。

　　基于以上这些点，那么用户心目中的人工智能，似乎可以分为人工智能和人工弱智。

　　人工智能方面，比如说我想看最近很火的鹿晗演的那个古装剧，他就能够判断出来，那个剧的名字，已经搜索到择天记，因为择天记最近很热嘛，又是鹿晗的，所以就选出来。然后你再问，里边的女一号是谁?即刻有一个语音告诉你是古力娜扎，同时有一个弹窗，告诉你这个女一号哪一天出生的，哪儿毕业的，有一个简单的八卦背景，这个就能够把用户的需求说出来。举一个例子，我问他明天出门要不要带伞，他会说明天天气很好，不需要带伞。

　　右边是人工弱智，你现在搜这样一句话，他搜不出来择天记，他说的是电影消息一网打尽。第二个你问他女一号是谁?他说院线消失我全知道。第三个你问他明天出门需要带伞吗?他会回答你，刚好出门遇大雨。所以这些东西也似乎好像跟问话有关联，但是不是答案，不是人类真正的答案，所以我们认为人类需要的可能是左边的，而不是需要右边的。

　　联想电视的AI探索之路

　　联想现阶段可以做的一些具体的工作，分别是什么?

　　1、人机交互升级;

　　2、服务创新;

　　3、丰富产品形态;

　　4、人工智能实验室;

　　5、战略联盟;

　　第一点，我们来看一下，在交互的方式上，我们觉得最重要的是化繁为简，为什么这样说?因为以前电视不智能，也很简单，大家用摇控器，特别是最早的时候播广播的时代，后来到了点播VOD时代，基本上用户用上下左右的摇控器还能应付。但是大家再想想今天的摇控器，它的复杂度会越来越高，这种复杂度如果用一个上下左右，很难想象它能应付，所以需要做很多新的交互。

　　左边这两项是目前联想产品的一些基础交互，左上角是一个空鼠操控，不是上下左右的操控，空鼠操控很多厂家把它作为高端或者差异化的点，但是联想是唯一一家把空鼠摇控器做成标配，而且是最低那一款也是用的是空鼠摇控器。空鼠摇控器可能比传统摇控器贵十倍，因为里面有蓝牙、陀螺仪，还有很多算法，所以它的复杂度是很高的，这是第一个联想在交互上的基因，我们需要保留。

　　我们内部叫三明治UI，当然各家有各家的特色，我们是把视频分成直播、广播和应用商店三大类，然后像三明治一样，三层，不断的左右滑动，很快你就能找到想看的区域，这个是联想的特色。

　　除此之外我们有三个新的交互围绕人工智能展开，第一个我刚才讲过了，智能远场语音，能识别、能理解、能回应，无论近场还是远场。

　　第二点，千人千面，怎么样个性化的推荐。刚才张院长提到了，我有同感，比如说用今日头条，他那个是千人千面了，但是你看长了就会烦了，因为他推给你的是你看过的，导致你错过了新的东西。所以人工智能不是要推荐你看过的东西，而是要理解你这个人，也就是你这个人的画像准不准?他要通过声纹技术知道你是男的、女的，知道你的地理位置，你在北京还是在一个县里，这些是很关键的，与你的消费行为是相关联的，基于这个我们觉得才能做新的千人千面，这个时候协同算法和以前的简单算法就不一样了，以前的算法是基于你曾经的行为，但是协同算法可能你还没看过这个片，但是已经知道你这个人什么样，你的同龄人或者同类人在看什么片子，他会推给你，这个就很关键。这个东西要比刚才说的更加有吸引力，像我们这种千人千面的路也是蛮长的，要不断优化和更新。

　　因为现在的交互不是点完一个片看就可以了，而是要有新的互动，因为机器更加智能了。就像我们现在的手机，它给人反馈的信息非常多，你触控之后有大量的信息反馈。电视也是一项，随着人工智能的发展，它不光是被动给你推荐一个片子，它以后的信息非常多，比如说我们“联想乐窗”，它能够实现业内比较流行的边看边买，边看边查，边看边聊天，边看边猜球赛比分，像这些工作都会在人工智能基础之上，我们在交互上也同样让你有更大的想象空间。

　　联想的服务有两大类，一类叫视频内容相关的，我们内部词叫VBS(Video Based Service)，这是第一类。第一类是家庭相关的服务HBS(Home Based Service)。

　　第一类是你看视频的时候跟你互动;第二类是根据你家庭的地址，他知道你在某个小区或哪栋楼，他跟周边的医疗、商超联动进行服务。这种购物不是简单把京东网页放上去，一定是边看边买，比如说你看到这个包特别漂亮，然后沉浸式的跟他交互，当然这个工作量很大，今天我们写上去很容易，但是做起来很难，我们还是要归类，逐渐分布式的来实施。

　　第三点，更丰富的产品硬件形态。大家可以看到我们在做智能电视、电视盒子，包括激光电视，都在我们的规划里面。另外我们的投影仪已经在市场中卖了，它里面的内容都是一致的，交互也是一致的。所以像这种投影、电视、盒子、智能BAR，都会在我们后续的产品形态里不断推出。

　　第四点是联想最近的一个动作，在2017年3月成立人工智能实验室，这个实验室在未来四年将有专项的12亿美金投入，这件事情是芮勇博士主力来推进的，芮勇是我们现在的CTU，以前曾是微软亚洲研究院的常务副院长，他的学科背景是人工智能的专家。

　　除此之外实验室的具体负责人也是业内的一个大咖级的专家——德国人工智能研究中心的技术领袖级别的人物徐飞玉。公司搭建了这样一个平台，刚好我来的前两三天，我跟徐博士专门为电视开了个会，谈了我们的想法和需求，她特别感兴趣，她觉得整个公司应该在这块进行更大的投入，成立联合的项目组，把实验室的东西尽快的落地。

图片4.png

　最后，其实光靠联想自己肯定不够，这个是今年3月我们在南昌召开的65寸分体电视发布会上，我们做了一个大屏内容服务战略联盟，包括百度、思必驰这些公司都在我们联盟里面，这个联盟会不断的做成长。我们很开放，把这个平台开放出来，把电视这条线硬件上，更多的去孵化人工智能。同时我们又会基于视频这条线，X轴跟Y轴，X轴是电视，Y轴是视频。因为电视主推的是视频，所以我们这个团队核心工作还要做视频。但是在联想内部视频不是孤立在电视上，今年很重要的工作是要把PC、手机跟PAD，包括电视要打通，所以这也是一个巨大的工作。我们希望在人工智能上做成一个新的线索，能够串在电视跟视频这两个轴里边，使得整个业务有新的创新，然后给用户更加完美的体验。

　　我总结一下，关键词是两个，联想电视和人工智能，在联想电视里边我谈到了现在联想会在电视上做更多的露出跟曝光，这是联想新的战略，所以以后大家经常看到我就不要太奇怪。

　　第二点，人工智能，我们自己内部讨论完，提到了听、说、读、写、作和成长。同时我们的人工智能应该是什么样。

责任编辑：胡思佳

分享到：