直击上海电视节!当虹视听大模型为内容生产注入AI活力
| 当虹科技 Arcvideo| 2024-06-27
【流媒体网】摘要:BlackEye多模态视听大模型如何提升视听媒体的制播效率和内容吸引力。

  推荐阅读:灯少|OTT十年,从规模经济到规模不经济

  又到“白玉兰飘香”时。6月24日-28日,第29届上海电视节在申城举行。25日下午,当虹科技亮相本届上海电视节白玉兰电视论坛暨电视市场活动系列技术研讨会。

  在高新视听与AIGC技术研讨会上,来自国家广播电视总局、上海交通大学、阿里云以及当虹科技等单位的专家学者和技术精英,围绕AIGC技术的前沿发展、关键技术以及应用案例进行分享。

  当虹科技智能媒资产品线总经理范涛作主题演讲,分享了当虹科技BlackEye多模态视听大模型如何提升视听媒体的制播效率和内容吸引力

  01注入AI活力,提升制播效率

  当虹科技BlackEye多模态视听大模型为用户提供了强大的视频编辑和创作能力——支持AI横屏转竖屏、高能集锦(智能花絮)、文生视频等丰富功能。

  范涛表示,新媒体时代,手机竖屏看视频已成为众多用户的习惯。但是在节目拍摄现场,摄像机机位空间有限。而且,系统摇臂、圆轨、滑轨等4K特种机位的画面需要横屏拍摄。这也就是为什么不直接架设原生竖屏机位,而是需要“横转竖”。

  传统的竖屏节目制作方式往往是通过人工裁切,将16:9“横屏”内容转成 9:16“竖屏”内容,耗时耗力。

  大模型的融入将为节目制作带来更多AI动力。有限空间、有限人员的情况下,实现电视横屏与新媒体竖屏直播的同步制作。

  当虹科技BlackEye多模态视听大模型提供“AI横转竖”算法,对现场的机位信号进行实时分析、裁剪,生成竖屏信号,结合原生竖屏机位,由导演组现场进行制作,实现竖屏内容呈现。

  范涛向大家演示了一段AI竖屏制作的羽毛球赛事:画面更加聚焦于运动员主体,接发球等各种战术细节丰富呈现,为观众提供了更有观赏度和沉浸感的比赛观看体验。

  针对多人场景,如何选择合适的C位出镜一直是个难题。BlackEye大模型基于丰富的节目素材训练数据,通过分析人物主体的位置及大小等信息,进行主体的判断和选择,从而实现精准追踪。

  02拓展创意空间,提升内容吸引力

  当虹科技BlackEye大模型集合了视听合作伙伴的海量内容数据与原创先进算法优势,帮助媒体工作者创作更有吸引力的内容。

  例如,利用大模型的生成式算法实现三维建模,不需要架设一圈高精度摄像机采集360°的实景数据,用手机拍几张静态照片或者一段视频,就能生成一个三维模型,降低建模和渲染成本。

  又或者,当BlackEye大模型“看”到一段体操比赛视频,就能理解视频内容,分析运动轨迹,输出流畅的慢动作镜头。观众可以看清每一个动作,重温精彩时刻。

  范涛介绍说:“类似画质增强三维建模慢动作等算法,正在体育赛事制播、直播带货、综艺文化晚会节目制作等场景中大显身手。”在大模型的驱动下,视听媒体还有更多创意空间可以拓展。

责任编辑:房家辉

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!