【西溪论道】 央视国际网络无锡公司朱立松:精耕大屏,视频智能化服务思考与探索
流媒体网| 2018-10-25

   【流媒体网】消息:从规模到运营,电视大屏产业当下已进入新的发展阶段。大屏流量价值的挖掘和运营、IP生态和大屏融合生态的构建、4K+5G带来的电视新体验......通过精耕细作,促进电视大屏商业化探索和良性发展,更好地实现电视大屏的价值,成为产业各方当前的要务。

  10月25-26日,以“运营未来,视在必行”为主题的流媒体网第16届电视新媒体高峰论坛在杭州西溪举行,在25日下午的“电视大屏的精耕细作”分论坛上,央视国际网络无锡有限公司副总经理朱立松进行了主题为《精耕大屏,视频智能化服务思考与探索》的演讲。

  图片1.png

  以下为演讲全文:

  央视国际网络无锡有限公司,是央视网全资子公司和南方基地,成立于2011年12月31日。主要为未来电视、爱上电视等企业提供后台视频服务的运营支撑,主要的服务内容有音视频的生产制作、音视频的审核以及风险管控,音视频内容媒体相关大数据分析等,对媒体运营服务形成一个闭环。 2017年9月,获批成为江苏省博士后创新实践基地,今年4月与高校签订联合培养博士后协议,确立人才战略。5月,首批博士后进站开展技术研究工作。

  创新基地的研究内容包括音视频技术,如超高清4K转码、DTS全景声、视频检索技术包括如内容对比,多维度检索等。视频理解技术包括人脸识别、对象识别、场景识别、自然语言处理等。对现在的AI行业认为的未来发展方向NLP技术也有所涉猎。

  精耕家庭大屏,智慧运营内容

  现在对大屏发展的理解是来源于《大屏生态发展报告白皮书》,从里面可以看到大屏用户发展已经到4亿户的水平,基本上接近整个人口的规模,而且在三类大屏有线电视、IPTV和OTT中有很多的重叠,有线电视和OTT的重叠率从2016年的23%到2017年25.6%,大屏拓展的路越来越窄,人口红利也即将消失,大屏的争夺变得更加激烈。

 

  但三类大屏现有的用户规模为运营提供非常好的基础。在支持客户内容的视频运营过程中发现两个问题需要解决,第一个问题跟播出内容有关,IPTV、OTT业务形态不一样,但是和传统媒体电视播出方面没什么区别,比如审核尺度没有区别,社会媒体责任也一样,对视频内容的把控都是非常重要的节点。

  图片2.png

  作为运营团队的第一个目标是解决内容安全性与运营时效性的矛盾,希望新的内容能尽快上线,同时要保证内容安全,确定内容的规范性,这是要解决的一个矛盾。内容审核其实包括两部分:一部分是大家比较熟悉的内容合规性方面的审核,另一部分是内容技术方面的审核,比如这个内容在播出的时候会不会因为技术问题导致故障。

  随着移动互联网的发展,用户需求越来越多样化,已经不能满足原来大屏提供方式的那些内容,此外,平台如何提升用户黏性,产生更多价值也是需要思考的。IPTV、OTT每天最焦虑的是怎么留住用户,以及在与用户的互动中如何产生更多的价值。可以通过对于视频内容更深入的理解,通过投其所好式的视频服务,提升用户的忠诚度,进而留住用户,再通过对用户后续的服务来挖掘更大的价值。

  有了这两个目标以后,会把视频应用中的过程做一个浓缩,浓缩后的业务流程中能够提供服务和做出贡献的地方。

  智能审核

  视频提供以后,要经过内容审核以后才可以做上线运营,上线运营后,将用户互动的主要编目信息理解视频为用户提供服务,有关于内容的运营安全问题和视频有效性是在互动中发现的两个节点。在平台和用户互动以及平台对用户选择上面,用户的行为与视频关联行为的分析,以及在平台内容制作定位和内容采购上面,我们也可以提供一些帮助和支持。

  在给出一个解决方案之前,还有其他两个问题建议的解决方案:在视频上线前的准备过程中引入智能审核和智能编目相关的技术服务,通过这样的服务能够在保证安全的前提下提升视频上线的效率。

  另外,这里提到智能编目其实还是比较宽泛的概念,传统的编目在视频中可以直接获取和得到信息,比如说这个视频中出现过什么人、什么物体、什么事件,这些信息是编目信息,可以由人工去做,也可以用智能方式提取。智能编目除了这部分的编目以外,还有一部分是视频标签,基于视频中已有内容,通过特定的知识或者常识能够推断出更多新的内容或标签,往往这是上一级抽象化的概念。所以智能编目是由两部分组成,里面涉及到视频处理技术以及知识图谱相关数据的技术。因为注册了博文大数据的产品平台,可以通过大数据的服务为平台的用户运营和采购提供相关的支持和服务。

  这里想强调的是不仅有相关的技术能力和系统,更重要的是我们有经过7年专业工作和专业经验积累这样的审核和视频编目专业化团队,再与技术能力、人工智能相结合,就能为大屏运营提供非常好的支撑。

  此外,在智能审核、智能编目方面做了一些探索工作。先从智能审核开始介绍。

 

  比如之前传统大屏阶段审核的内容,审核其实有两个部分:一部分是关于内容合规性和安全性,还有一部分关于视频质量。一个视频内容是不是足够清晰,是否可以上线在大屏上呈现?有没有技术上的问题会影响用户观看和体验?审核维度很多,涉及到视频里面的音轨,字幕文字等所有信息都在审核范围之内,而且对于人员专业性依赖程度非常高,给大家看一个日常工作中的小例子,大家就能够体会为什么需要专业知识的积累。

  图片3.png

  对于大屏内容智能审核的思路:首先所有的内容一共分成两个部分,一个部分是视频和图片的审核,另一部分是对于文字内容的审核。视频图片这一部分在逐步引入的技术包括人脸识别、旗帜识别、物体识别、景识别。这些内容的引入到逐步可以在产业中可以投入使用,但是这个不会完全取代人工的审核,在审核效率上提升的比例在10%到50%的区间。对视频的内容通过OCR和ASR全部转成文字,对自然语言处理对文字进行分析,帮助审核员提升审核效率,降低漏检率把漏检率降到零。

  智能审核的架构分为两点:第一点对外服务有开放接口,这样一套系统不仅仅提供内部团队在用,通过开放的接口对其他客户在技术层面提供相关的服务。

  第二点在整个体系架构中视频理解基础能力这一块,通过统一调度中心接入到系统中,也就是说系统建成完以后是一个可以持续迭代的系统,可以在任何时候去选择最好或者最适合现有的技术,接入到系统中为客户提供最优质的服务,包括自主研发的成果可以接入这个系统中,现在这个系统架构已经完成,后面很多系统架构都是按照这个原则来做,也就是说首先对客户提供各方面的服务。另外核心能力是开放的,是可以随时升级迭代的,当有新的方案、新的供应商进来以后也随时可以迭代。

  各项技术目前一些使用情况方面,人脸识别系统已经比较成熟,通过视频中的图片,将人脸分辨出来,进行剪辑面部特征确定他是谁,这个可以帮助审核人员快速定位到视频中的人物,并且指出这个人物出现的时间,可以提升审核效率。

  去年年底的时候做的一个系统的演示,在视频中出现的物体可以实时的,这是一个真实应用的过程,能够实时去识别,它能够识别其中包括汽车、行人等,而且可以对25帧1080P的视频做实时的处理,也就是说直播的视频可以实时的处理,在性能提升上有不少的帮助。

  场景识别,场景识别的分享的原理是这个事情为什么它可行,场景识别对视频抽取的时候对一个视频每一秒钟抽出一幅画面,可能一小时的视频抽出3600个画面,根据3600个画面分析每个画面的特征,在高层阶段分析每个画面之间的特征,由此可以判断这个画面属于哪一类的画面。

  比如说一个视频可以识别出来这里面有电脑,有人在写报告,也有笔记本,也有办公桌,可以推断这个环境是办公室的环境,这个不仅仅视频技术,还有结合知识库的内容。

  根据提到几项技术帮助我们来完成视频内容的审核,刚才提到视频审核分为两部分,还有一部分对于视频质量的检测,这部分原来请人工过来看,主观做出评价。其实视频质量检测一共分为两种:一种有参考,就是说已知这个视频原来是怎么样,一个最基本的版本,拿这个跟它比,有一个比较。现在做一个无参考的比较,可以规避人去看去检测质量的过程,比如说选择一段乒乓球的比赛视频,可以计算出参数,这视频信息可以用来评估视频质量能不能上大屏,而且越用越好,越准确。

  经验丰富认证上岗的审核团队加上人工智能技术的赋能,会为视频运营,大屏运营的安全运营提供保驾护航。

  智能编目

  关于智能编目方面,传统编目大概就是通过人工来做,包括效率问题,人不可能对视频的内容方方面面都会考虑到,包括满足不了运营支撑很多需求,另外用户的检索效率非常低,用过的一些视频平台,如果想搜索一个视频的时候,是需要用它的首字母,用整个视频标题拼音的首字母都录进去才行,多一个少一个或者发音不准,或者不记得名字的时候搜不到,用户体验非常差,对用户检索效果非常不好,分享一个小例子,一个家庭使用有线电视,装宽带送IPTV的机顶盒,但是会发现家里的人,他们更倾向于用有线的直播看,很难切到这个盒子上去,用户去做选择,这个选择就是一个决策的过程,这个决策的过程中讲反人性,他会比较辛苦,为什么领导最重要,因为他要做决策,决策看什么东西的时候脑力负担很重,像今日头条可以不动脑筋给你推送你喜欢的新闻。大屏也是做到这种,帮助用户做决策,能够帮助找到他感兴趣的东西。

 

  所以说在这个环节增加一个智能编目的环节,刚才提到智能编目其实有两个部分组成的。

  图片4.png

  看一下智能编目一个例子,这个例子还没有完全能够实现。这个是一首歌,通过OCR会把屏幕上的歌词识别出来,通过厂商提到的场景识别我知道在演播室,识别的效果,知道他是谁,知道关键字,比方说这首词是北宋苏轼写的,曾经王菲演唱过,有一些关联的信息也会提供基础。通过OCR的视频是河北高清,是《中国好诗词》的栏目。能够帮助我们这些来之不易珍贵视频内容更好的运营起来,更好的为用户提供服务。

  这是智能标签一个实现方案,总之简单一句话通过技术的手段做智能编目,同时离不开人工的参与,有经验编辑的参与肯定离不开,通过视频中所有内容的理解进入知识库来生成标签,来帮助我们做运营。

  标签做完有什么用呢?现有的编目系统如果做的好一点都是能够实现的,比如说柳云龙是谍战剧的导演,可以把这个搜索出来。比如说《舌尖上的中国》第二季第一集提到的糯米稻花鱼,提供关键词搜索可以知道苗族,跟贵州有关,通过标签可以知道这个是美食,假设一个用户不知道这个鱼,只是想看一下有没有跟贵州美食相关的内容,他做这个搜索的时候其实通过编目的信息的配合就能够为他把这个视频精确的找出来,能够帮助他可以减少他很多负载,不需要精确的知道要检索的什么,他大概知道要的是什么,对视频深入的理解帮用户实现这个目标。

  现代编目系统是能够支持的,通过上面观看记录为用户推荐内容,比方说用户喜欢悬疑类,逻辑推理类,可以帮用户推荐一些相关的内容,这些都是可以做到,但是有了标签系统以后可以做的更好一点。

  通过标签其实是缩短视频推荐之间所要跨越的距离,通过人工编目到关键词的标签缩短视频与视频之间的距离,右边这个是动画片里面一集玉兔传说,通过视频标签的月饼可以把这两个视频结合在一起,这个适合在家庭大屏场景下,同一个题材不同类型的片子在大屏上推荐都是有价值,比方说7点到8点推荐动画片。

  编目就是同样的逻辑有专业的视频生产团队,也在视频生产行业做了很多年,同时通过AI技术的赋能对视频内容的理解希望为大屏做一点价值。

  最后跟大家分享一下博闻大数据,这是一系列大数据产品一个统称,它有两个服务:一个平台和用户这边形成闭环的支撑,另外一个平台与内容提供方之间在大数据方面提供的一些服务和助力。

  简单说就是在用户和平台之间,通过用户特征数据的分析,包括用户行为的分析,通过编目对媒资内容的提取。

  第二个服务不局限于平台上的内容或者用户的行为,可以通过外部比方说行业的信息,比方说相关政府的文件或者是相关的规定以及境内外提供的互联网数据上一些信息,能够为P的采购或者视频生产的选材选型提供指导性的建议和帮助。

 

  通过人工智能的赋能,通过智能化的手段,为大屏视频运营提供安全高效的视频服务支撑。

  “嘉宾演讲PPT及更多论道资料,可至今日流媒体获取”请点击:

 

  https://v.lmtw.com/mzs/content/index/keyword_id/-2

责任编辑:古莉

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!