上海逸迅信息科技王之栋:视频大时代、决胜大数据
流媒体网| 2013-11-21

    【流媒体网】消息:2013年是IPTV发展的十周年,同时,2013年也是OTT开始回归理性、寻求产业共赢的新起点之年,2013年,对于中国的电视新媒体的发展均具有重要的里程碑意义。

    11月21日-22日,流媒体网“厦门论道IPTV/OTT”高峰论坛正式召开,今天的主题是“致青春 IPTV 十年生聚 十年分享”。

    上海逸迅信息科技有限公司王之栋参加此次论坛并发表了题为“视频大时代、决胜大数据”的演讲。

    王之栋首先向大家介绍了逸迅信息科技以及公司定位:利用逸迅科技在大数据领域的整体优势,我们向电信运营商、广电运营商、金融、医疗、交通与企业客户输出大数据平台整体解决方案和咨询服务。

    他指出这是个视频大时代,群雄逐鹿中原,视频数据量爆炸式增长。因此,视频与大数据结合就显得十分必要。视频与大数据结合,可突显运营价值。可以说,大数据平台决定业务支撑平台的竞争力,基于大数据技术构建的海量数据的支撑体系,构建智能的业务网络,打造端到端的价值链,专注为用户提供优质的视频服务,实现业务价值、用户价值到数据价值的沉淀。

    王之栋认为,用户使用行为的碎片化以及系统的复杂性导致数据总量不断增加,但对我们有价值的信息却越来越少,因此需要我们对跨业务域的多个系统的数据进行统一的汇聚和分析。对于大数据聚合平台构建面临哪些挑战?他认为有四方面:1.数据体量大;2.数据种类多样;3.价值密度低;4.及时反馈。实现机制有三方面:1.构建分布式、高性能的大数据管理和分析平台;2.面向业务的数据清洗、关联和组织;3.基于用户价值的业务模型构建、算法设计、业务呈现和应用服务。

    最后,他还对大数据分析带来深层次的业务价值进行了论述。

    演讲全文如下:

    我们是一家去年刚成立的新公司,公司成立最重要的理念就是顺应现在大数据的时代,在大数据的领域做一些技术服务和解决方案。我们目前整个的技术和研发团队都投入在大数据技术方面。技术方面有一些类型,未来可以给大家提供一些产品和方案:在一些行业里会做端到端的解决方案,会做一些广电和电信领域里的视频大数据的解决方案。这家公司建立的初衷也是不局限在视频这个领域,我们也会为一些企业,为一些金融部门和一些互联网的企业提供一些大数据技术平台。我们叫这个平台是大数据的管理和分析平台。通过这个平台,各个行业可以把自己海量的数据放在这个平台管理,同时,可以提供一些工具来帮助它进行业务方面的分析。

    视频与大数据结合,突显运营价值

    在视频领域里,有几类体系:一个是终端电视制造商;一个是传统的运营商的体系,这个体系当中无论是广电有线运营商还是电信运营商都在这个行业中拼搏了十年了。其次是OTT运营体系,七家的牌照商,他们融合了电信与互联网企业的文化和理念,实际上他们是真正掌握了牌照的资源,也是真正合法的去运营OTT的基础的运营商;还有一支非常重要的力量,新加入进来的,也是让我们觉得这个行业将迎来巨大爆发的互联网体系。任何一个互联网的巨头加入到这个行业,都会带来天翻地覆的变化;还有一个力量是暗处的,网上有一篇文章在讲“中国有一个在明处的互联网,还有一个暗处的互联网”,我们也有一个暗处的OTT的领域就是山寨机顶盒。这也是一股非常可怕的力量,有一些统计,在今年很有可能山寨的OTT机顶盒将会达到一千万,这个是非常庞大的数据。有多种运营主体在逐鹿这个领域。


 
    PC视频和手机视频全面监管是我们现在要拭目以待的。正是因为这个巨变会带来一些新的变化,随着这种新的视频模式的产生,视频数据量存在爆发式的增长。它是由几种因素造成的:

    第一,内容产生的方法和量跟我们以前完全不一样了。有很多分片的内容,同时内容信息也变得非常丰富和庞杂。第二,用户视频使用的方法带来非常大的变化。传统用户是单向的,做简单的交互去观看视频。但是现在用户观看视频的方法变得非常丰富,方式也非常多样,接触面变得非常广,本身产生的数据量非常大。第三,个性化。用户希望在观看视频的过程中有个性化内容和自身产生的个性化信息。这样用户个性化的内容会占据视频数据量的很大一个部分。第四,用户的认知。目前用户对视频的认知得到了很大的升华。这四个因素使得目前整个视频的量(数据量:用户在使用视频过程中留下来的可被使用的,或者是留下来的可被储存的数据)呈现几何倍数的增长。传统数据库的体系处理这样的数据已经变得越来越困难,必须引入一些更新的处理海量数据的模型。同时,这样的数据也会经历一个分散、集中再分散的过程。随着业务的发展,数据量的增长会是未来运营商所面临的一个巨大的风险和挑战。当然也会是重大的机遇和机会。另外一方面,我们也会看到,大数据的应用,这几年无论是炒作还是发展,技术变得越来越成熟。在这样的过程当中,视频跟大数据的结合就会凸显我们整个运营的价值。

    一方面,传统的数据虽然是海量的,但是是碎片化的。通过大数据技术的引入,可以帮助运营商把这样的数据变成可衡量的数据资产。另外一个方面,传统的一些数据如果不经过处理,本身是粗放、静态、低效的。这样比较难以真正的去掌握和利用它。通过大数据的技术,我们可以把这样的数据变得更加精准和动态、高效。这样我们就可以产生出更多新的运营模式。第三个现原有的数据,可能运营商也采集了这样一些数据,比如现在机顶盒响应或者使用的数据,虽然被采集,但没有充分的利用,通过视频大数据的引用,我们可以从一些繁杂的数据源中提取出我们所需要,具有业务价值的数据。这样一些数据可以带给我们新的一些业务价值以及对我们的运营有所知指导。

    因此我们觉得从视频的运营平台的角度去看,我们现在是关注几个方面:比如服务平台,希望这样的服务平台具有海量内容聚合的能力,可以打通线形和非线形的通道,同时可以构建出不可复制的内容的平面优势。另外一个方面,我们的服务网络比如服务体系需要高质量,大容量的,可以感知用户体验和用户状态的,同时具有搜索,推送消息的转发的能力。有一些资源层面的调度优势,这个是对服务网络的要求。对用户终端来讲,希望我们这样的服务终端有融合开放的能力,有一些超级入口和更强的用户体验。要完成对服务平台,对服务网络,用户终端的要求,我们认为除了自身的技术以及对业务的研究之外,通过一个海量的数据汇聚的平台可以帮我们打造一个强大的业务系统,可以帮助我们提成前面三个层面的竞争力。这样的话,基于我们数据聚合后的数据,我们可以找到一个对业务有价值的东西,提升我们整个服务平台的能力。

    通过聚合这样大数据之后,我们在的业务会面临什么样的形态?我们认为,当我们可以充分利用运营商视频网络当中的数据之后,可以把目前的业务模型从一个业务价值拓展到用户价值上。传统的互联网技术,互联网引入这些技术不是去改变用户的行为,而是强化用户的反馈。反馈之后,其实就会有大量的数据产生,特别是运营商要充分了解用户行为带来的含义。这个反馈有时候是不明确的。把数据收集以后,进行很好的梳理和分析,可以找到用户的思想和用户行为所带来的变化的原因,以及相应的内在一些价值。这样有利于我们更好的了解用户,然后更好的为用户提供无论是体验、服务还是创新方面的变化。也就是说,我们可以通过数据平台的引入,把我们以前实际上更关注的业务价值,转向关于用户的价值。

    构建大数据聚合平台面临的挑战

    我们发现虽然大数据汇聚之后会产生一些新的业务价值和用户价值,但是,现在运营商要部署或者是使用大数据的注册平台也会面临巨大的挑战。这个挑战主要来自于用户碎片化的使用行为。同时,系统的复杂性也导致了业务数据总量的变化。数据量很大,但垃圾数据非常多,真正有价值的数据占很小部分。同时,我们这个数据的来源实际上是非常丰富的,那么多个系统之间的数据要进行关联,只有关联起来才能从中找到更有价值的数据。因此,我们会发现,无论是数据体量增大,种类增多,价值密度低等这些都导致了我们在构建大数据聚合平台当中会面临的挑战和困难。

    实现机制有三方面:1.构建分布式、高性能的大数据管理和分析平台。这个平台本身要能够支持海量内容。同时,它的处理效率要非常高效,要在几秒中把需要的数据计算出来。

    2.面向业务的数据清洗、关联和组织。数据是非常庞杂的,无效数据非常多。我们就必须从业务的角度来进行数据的清洗。当你拿到数据以后,虽然你会全面保持原始的数据,但要把无效的数据清洗,我们要做关联,我们要从多个业务系统中获取数据,而多个系统中的数据是有关联的。比如一个用户当在门户平台当中记录了一条记录,对应的使用过程中可能会在其他地方也有纪录,在CD平台当中也有纪录。这种多种系统之间都会产生针对一条使用的记录。我们就必须很好的理解这个业务的过程,从多个系统源中找到我所需要的信息,然后把它关联起来。

    3.基于用户价值的业务模型构建、算法设计、业务呈现和应用服务。传统的数据库是很难支撑这样的海量内容的。因此我们就要采用新的数据库的技术,比如IAY的数据库,在这个数据库中该如何组织我们拿到的用户信息和用户数据,并且把这个数据对未来的分析更好的利用,组织也非常关键。我们要给予用户价值去进行业务模型的构建,算法的构建。一个外行的人一定不可能做好视频数据分析工作的,我们必须是要针对业务的特点,甚至是不同业务特点设计算法的模型,同时把这种最终的结果呈现出来,可以给上端的业务系统调用。

    运营商大数据聚合平台的实现机制:一是数据的源头。我们要从什么系统中来获取数据,并且加以分析,这个数据的源头是非常关键的。如果数据源头不够丰富,数据源头的数据不够准确,那后面的一切就白谈了。第二个是业务输出。你面向什么样的业务场景去做一个大数据的分析,做个性化的广告还是个性化的推荐,还是做一些组合营销等等不同的业务要求,其实对输出的要求是不一样的,我们要针对业务需求加以变化和组织。一个数据源头和业务输出是最关键的。这个平台本身主要的工作是做一些数据的采集,清洗和存储、挖掘等等工作。面对不同的业务形态,我们的算法是不同的,分析方法也不同。只有把这样一个平台很好的构建清楚,才能真正充分利用这些数据。 
 
    大数据分析带来深层次的业务价值

    数据整合。也就是说不管怎么样,我们先把数据重架起来。第一个关键是我们要做数据的整合,要把有用的数据存下来,有一些数据可能不知道要干什么,但是没有关系,现在大数据用的设备也很便宜,软件也不贵。不管怎么说先把数据存下来,存下来以后再去看将来的价值是什么。所以我们要做跨领域的数据整合,做开放的数据平台。其实你可以把它的宽带上网各用户数据和IPTV的数据加以结合,这是两个不同区域间的数据,结合到一起,其实可能就会找得到很多的价值。

    感知业务。我们通过这样一个数据可以知道用户对什么业务感兴趣,可以通过几种业务形态,比如说时时的榜单,时时的采集视频的使用数据,时时的更新榜单。看到在当前的情况下,什么样的电影,什么样的剧集是用户访问量最大,这对内容的调度和分发提供一些依据。还可以做智能推荐,智能推荐也可以延伸出多种的业务形态。还有一个就是我们可以做一些新媒体指数的发布,现在很多互联网有视频的指数。数据量大了,分析的能力增强了之后,其实不是简单的做一个榜单,说哪个电影电视剧看的人最多,我们可以做更深层次的分析。比如我们做一个饱和度的分析,是指某一部片子它看的人当中有多少人把这部片子看完了。我们发现用户看片子可能只看一半就关掉了,但是有的片子用户可以一直看下去,这种片子是饱和度最高的,所以我们就做饱和度的模型。

    感知用户。通过用户的使用行为等等作为用户行为的画像,做一些多维的统计,可以知道每个用户是哪种类型的用户,消费能力是什么样等等。之后就可以针对不同的用户的类型推广业务。

    感知服务。大数据应用未来的发展方向,视频网络当中一些网络的数据和用户的数据加以结合之后,可以发现用户在看某一部片子的过程当中的质量是怎么样子的,通过这种分析就可以知道整个的网络端的运维的过程当中哪个部分比较繁忙等等。当然现在也有一些技术可以做,但是我们通过大数据把原始的深层次的数据采集下来再做一些分析之后可能找得到比以前的方案更加高效,更加准确的解决方案,我们在未来会做更多的尝试和研发的投入。大数据的分析可以为运营商的视频网络带来感知业务和感知服务的能力,这张网络是真正为用户提供服务的网络。
最后我们简单的简单分享一下我们在某个运营商的做的主要案例。我们在广电运营商做的大数据的平台,这个平台本身从采集、数据管理、数据整合到分析等等工作,一期我们已经完成了,主要是做榜单、指数分析、用户行为画像以及智能推荐的业务形态。在后续过程中,我们会采集更多的数据,做一些面向用户服务质量的监测,网络的安全的态势的感知以及个性化的广告等等。真正使用户更好运用网络中的各种数据,对经营和服务的过程以及整个运力的过程有更深刻的了解。


 
    随着视频的发展,视频大数据的时代已经到来了,我们逸讯信息科技愿意帮助大家真正的分析现在网络当中的数据情况,同时针对数据的特点提供一些相应的服务和解决方案,帮助大家从纷繁的数据当中找到数据的价值,促进整个运营的发展。

    更多嘉宾演讲,请关注厦门论道专题http://meeting.lmtw.com/20131121.html

 

责任编辑:lmtwadmin

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!