人工智能技术在媒体融合中的应用研究
袁斌| 有线电视技术| 2019-12-24
【流媒体网】摘要:本文研究了将大数据、人工智能技术应用于长江云平台的新闻生产、分析中,通过自然语言处理、深度学习等技术搭建自动生成新闻标题的神经网络算法模型,未来将模型应用于实际的生产还有很长的路要走。

  2015年,国家广播电视总局发布了《电视台融合媒体平台建设技术白皮书》和《广播电台融合媒体平台建设技术白皮书》,白皮书要求加快传统媒体与新兴媒体融合发展的战略部署,必须选择合理的云化技术。

  长江云媒体融合平台是由湖北广播电视台打造的集政务办事、新闻资讯、生活服务三大功能于一体的信息互动平台,是湖北媒体融合发展的重要举措和基础性建设任务,目前全省超过2220家党政机关集体入驻平台。

  大数据分析

  大数据分析技术通过分析数据集,找出不同数据之间的隐藏相关性,找到数据之间的隐藏模式,并得出结论,大数据分析技术能够帮助经营主体作出明智的业务决策。

  近年来,随着分布式技术和硬件算力的大幅改进,大数据分析成为可能。目前大数据已经影响到各行各业,融媒体作为资源融通的新型媒体,更应该将大数据和人工智能技术应用到媒体的生产中。

  本文研究如何将大数据分析技术和人工智能技术应用于媒体融合的生产中,以长江云的新闻生产为切入点,研究如何利用大数据分析技术改进新闻运营、管理,同时研究如何利用人工智能技术实现新闻标题的自动生成。

  利用人工智能技术

  实现新闻标题的自动生成

  大数据让人工智能成为可能,人工智能就是在大数据的基础上,建立数据模型和算法,将多元数据中的有用信息抽取出来,转换为可被利用的知识、结论、策略等。这背后需要结构化和非结构化数据的存储、分布式存储系统、分布式计算等基础设备和技术的支撑。

  如果有数据和基础设施作支撑,人工智能技术将颠覆融媒体生产的各个环节。在新闻稿件生产中很重要的一个方面就是拟定标题,一个好的新闻标题能够吸引读者带来更多流量,在传统新闻生产中,标题通常由人工拟定,有时费时费力也不一定有好的产出效果,我们结合大数据、人工智能技术,研究将其应用到新闻标题的自动生成中,提高了新闻生产的效率和效果。

  1.模型构建

  深度学习是通过模拟大脑结构的网络结构,称为神经网络。神经网络的基本单元模拟人大脑的神经元,类似于生物神经元,信号输入传递后,经过不同的信号处理再输出。深度学习是现代人工智能发展的基础。构建新闻标题自动生成模型需要用到深度学习的技术。

  (1)循环神经网络

  (2)序列到序列模型

  (3)注意力机制

  2.实验

  总体模型框架中编码层(Encoder)使用两层双向长短记忆网络(Bi-LSTM),解码层(Decoder)使用一层双向长短记忆网络。

  模型输出选择采用BeamSearch算法,每次找到使得输出语句概率最大的前三个作为备选。由于爬取的长江云新闻仅有10万条,数据量过少,我们将长江云数据中2万条新闻数据作为测试集,另外,加入50多万条网络新闻数据组成60万条新闻数据作为训练集,训练我们的神经网络模型。

  3.不足和改进

  (1)增加训练数据

  由于模型优化需要大量时间,目前模型仅使用60万条新闻数据作为训练,在时间允许的情况下,可增加训练集的数据,提高模型准确率。

  (2)尝试更复杂的模型和算法

  目前模型还比较简单,在条件允许的情况下,还可以尝试更为复杂的模型,比如在解码层加入强化学习技术,让模型自动寻找生成错误的标题。

  (3)将实时数据信息加入模型算法

  此外,在实时系统中还可加入爬取到的实时新闻数据,结合实时数据信息预测生成标题的流行度自动修正标题。

  本文研究了将大数据、人工智能技术应用于长江云平台的新闻生产、分析中,通过自然语言处理、深度学习等技术搭建自动生成新闻标题的神经网络算法模型,未来将模型应用于实际的生产还有很长的路要走。本文研究的只是一个小方面,人工智能技术将应用到融媒体生产的各个环节。目前大数据和人工智能新的算法、技术层出不穷、日新月异,在媒体融合的大背景下,融合媒体也应该尽快将新技术应用到媒体融合的生产、管理、经营中。

责任编辑:李平

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!