三晋论道丨橙视传媒孙于扬: 关于用户收视行为数据分析与应用的经验分享
流媒体网| 2020-06-18

  【流媒体网】消息:从流量到留量的运营进阶,从单品到产业的价值挖掘,2020年的电视大屏,正经历着一场价值闯关。面对一系列新的变化,通过对大数据、AI、5G赋能下新模式的探索,大屏广告运营和智能营销的发力,电视大屏应用延展和智慧家庭的布局,最终完成精细化与场景化的运营智变,就显得愈发重要。

  2020年6月17-18日,由流媒体网主办的第19届论道“融智2020——视听激荡与变革”暨中国IPTV/OTT智能视听产业高峰论坛在太原举行。17日下午,在以“运营智变 精细化与场景化”为主题的运营+论坛上,成都台新媒体成都橙视传媒科技股份公司首席大数据工程师孙于扬进行了主题为《关于用户收视行为数据分析与应用的经验分享》的演讲。

  以下为演讲全文:

  今天有幸来到太原,主要和大家分享关于用户收视行为数据分析与应用的经验。

  橙视传媒发展历程

  橙视传媒按照成都广播电视台党委的战略规划,于2010年开始从事IPTV等领域的数据分析与应用探索,是国内广电领域较早研究广电大数据分析与应用的企业之一。2010年至今,已完成了海量数据的接收与处理,实现了一个数据中台及多个大数据应用系统的研发,具备针对IPTV、移动端、PC端等大数据采集及分析能力,积累了丰富的行业经验。

  自2010年起,橙视传媒逐步构建起了多元化的数据传输、管理体系;2012年,与流媒体网联合发布《成都IPTV用户行为数据分析报告》;2016年底,IPTV数据分析系统等大数据研究成果获得了中宣部副部长、国家广电总局局长聂辰席的肯定,并于2017年受邀参与了由广电总局规划院牵头的《电视收视数据清洗规范》等三项行业规范的编制工作,行业影响力逐步提升;2020年,已经开始服务多家媒体机构。从数据监测、挖掘到最终的数据呈现,橙视传媒已经实现了全自动化。

  技术能力

  橙视传媒数据中台拥有众多技术能力:

  分布式计算——基于Hadoop,Spark等计算框架,实现了海量数据的高效计算处理;

  丰富的计算模型——已构建了海量数据计算模型,如新闻传播趋势、热点新闻挖掘、热点人物分析、收益预测等,可高效完成数据信息的处理;

  自然语言处理——利用多年文本处理、互联网内容处理技术的研发及实施经验,结合数据分析需求特征,通过文本挖掘和自然语言识别技术,实现数据的精准抽取、分析、归类、识别、研判等功能;

  数据生产调度——运用数据工厂平台实现了对数据信息的全流程化管理,从采集到分析到呈现,全流程实现可管可控;

  机器学习——利用互联网数据,通过数据挖掘、机器学习等技术,构建舆情分析、预测模型,具有分析预测精准特征;

  智能数据采集——自主研发智能网络数据采集程序、搜索引擎系统,可打破数据采集限制,实现高质量的数据抓取;

  自定义数据呈现——全拖拽式操作,基于海量数据展示组件与模板,可完成数据仪表盘的实时生成,实现人人参与大数据;

  多种采集形式——系统已内置定向搜索网站、国内全部的搜索引擎,以定向监控的及时性结合搜索引擎的全面性,确保用户数据及时、准确、全面;

  元搜索和渗透技术——系统支持元搜索,可以将来自谷歌、百度、必应等搜索引擎的数据引入系统数据中,并能够穿透防火墙实现对国外网站的搜索;

  流处理技术——将流处理技术应用到数据抓取及处理过程中,提升数据信息采集与处理的及时性;

  精确提取——自动识别采集信息的主题、标题、来源、作者、发布时间、摘要、正文和出现次数,便于数据统计和信息检索,同时支持网页内容智能提取;

  信息溯源——可追溯信息源头,更好地了解事件的来龙去脉,为后期的数据处理提供支撑。

  在算法方面,采用主题模型、逻辑回归、SVM支持向量机等算法实现了文本分类等计算,准确率约90%;在自然语言处理、深度学习及大数据计算技术的研究与应用方面,采用Fasttext等来构建文本敏感性识别模型,准确率接近90%。

  IPTV数据分析

  IPTV数据分析系统基于IPTV家庭用户的全量行为数据,主要通过分布式运算快速完成海量数据信息的处理,不仅可实现对收视率、市场份额的检索,还实现了电视观众流向的可视化呈现,付费节目的收益预测,为电视节目内容生产与内容运营优化提供了全面的数据支撑服务。

  IPTV数据分析系统可以实现的功能与应用有:电视频道、节目收视率、市场份额的数据波动分析;历史趋势分析对比(如达到率、忠诚度);精准匹配播节目内容与收视曲线,精确到秒级;精准定位到电视栏目进行剖析,实现收视率考核,比如今天晚上的收视率出现了大幅度下滑,我们通过这个工具可以实时分析结果,比如是广告的原因,就可以缩短广告时长;用户流入流出统计,洞察用户流动情况;分析潜在受众,扩大收视群体;分析竞争频道,降低用户流失率;对比历史趋势,优化节目编排等。

  我们统计了疫情期间的收视表现,疫情期间,IPTV平台受众日活上涨趋势明显,由疫情前的29%上升到39%,上涨率约35%。此外,各类电视节目收视率在疫情期间均有增长,其中新闻类节目收视率涨幅最大,约68%。

  用线性回归算法,可以预估影片收入,就是说哪些因素可能会影响影片表现,通过对数万部影片的历史数据进行分析,计算出能影响影片收入的主要维度,再利用线性回归计算并预测, 让选片更科学,提高上线节目收益率。

  产品运营支撑方面,可以通过数据模型评估每部影片可能带来的收入,为付费点播等产品的运营提供数据支持,对更新时间提供更科学的建议,对更新内容进行调整建议。

  融媒体数据分析

  融媒体数据分析则可实现对各类新媒体平台(网站、手机客户端、微信、IPTV等)用户行为数据的采集、分析、挖掘与展示功能。借助大数据处理技术与多维数据模型,实现对海量用户行为数据的深度挖掘,可为平台运营及工作成效考核提供及时有效的数据支撑,辅助运营决策。

  此外,我们还完成了融媒传播指数体系的构建,基于粉丝数、阅读量、评论量和点赞量等数据维度,将媒体机构微信公众号、微博号、头条号和抖音号等渠道的传播影响力进行综合分析,可按日、周等时间维度进行灵活统计,实时呈现各维度、各渠道最新的数据信息。

  热点新闻与舆情

  橙视传媒的舆情监测系统是国内领先的互联网舆情监测智能云平台,监测渠道覆盖新闻、论坛、博客、微博、微信、视频、APP、平媒等众多网络媒体,平台采用大数据、SaaS模式、人工智能技术收集、存储和分析海量的互联网舆情信息,有助于政府机构、企事业单位精准、及时、全面的掌握关于自身的互联网舆情信息,提高舆情应对能力,及时化解矛盾,处理好政府和民众、企业和客户的关系。产品提供PC、移动及大屏呈现等多类终端展示形式。

  对于热点新闻与舆情,在舆情信息的监测方面,可以根据预设的关键词实时监测全网舆情,支持舆情信息的收藏、报送、复制与溯源,可以进行语义正负面识别、深度数据挖掘、观察数据历史趋势等;

  在传播分析与预警方面,可以分析关键词的全网热度变化趋势、信息总量,以及各渠道传播信息量并进行对比分析,可进行区域热度统计分析,分析最感兴趣的地域区划,支持舆情预警功能,舆情总量及负面信息占比超过阈值时,系统将自动发送邮件或短信告警;

  在舆情搜索方面,可通过设置筛选条件,并输入关键热词进行自定义全网舆情检索,分析结果包括关键词云分析、数据传播趋势分析等;

  在自动报告方面,利用大数据及人工智能技术,已实现舆情热词的自动报告生成功能,平台可智能分析事件背景、数据整体传播趋势、正负面语义占比及主要用户观点等,为用户快速了解舆情信息提供便捷的支撑,此外还支持自动报告的导出功能;

  在热点人物分析方面,可监测全网实时最热人物TOP榜单,展示热点人物最新新闻动态,分析与之相关的人物及关联紧密度,针对关键人物进行舆情正负面分析。

  目前,橙视传媒的舆情产品除了PC端之外,还可以自定义可视化数据大屏,手机端也有支持。

  总的来说,橙视传媒的方向非常多,欢迎各方朋友共同参与大数据应用的市场化研究与探索。

  直播及回看请识别二维码

 

责任编辑:侯亚丽

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!