2025年10月30日-31日,由流媒体网主办的「天津论道暨第30届智能视听与科技创新产业论坛」在天津隆重举行。
本届论道以“视听破圈 智联无界”为主题,共启视听新局,共创智屏新篇。
在10月30日举行的“智屏创新论坛”上,北京风行在线技术有限公司大屏产品总监高萍做了主题为《多模态交互式AI,重塑智慧家庭生态》的演讲。
以下为演讲全文:
大家好,我是来自北京风行在线的高萍,今天和大家分享我们在AI时代做的一些探索。主题是“多模态交互式AI,重塑智慧家庭生态”。
大屏用户需要什么样的产品?
相信在座的很多朋友和我一样,一直以来都被这样一个问题所困扰。我们反复探索、上下求索,到底大屏用户需要什么样的产品?
风行深耕视频行业20年了,在大屏OTT及智慧家庭领域也有10多年积累。在此期间,我们不断连接各种内容,已经覆盖了所有的大屏内容品类。同时持续不断地面向用户,从视觉呈现、交互、功能、硬件等多维度去提升家庭的视听体验。
但是,用户在家庭观影这一个场景依然存在很多痛点。
打开电视,面对满屏的内容,却不知道看什么;开始看了,也容易注意力不集中,看完后想和人讨论,分享操作很难,也无人共鸣。
这里有一个非常核心的影响因素,就是短视频成了新的时间杀手,微短剧的兴起,则进一步推动了这一趋势。 在我们的平台,也能看到中低活跃的用户占比增加,变得相对沉默。
基于用户行为的碎片化和不知道看什么的问题,我们尝试以高光短视频来挽回用户注意力,「小剪刀AI创作平台」正是在这一背景下产生的。
小剪刀平台,依托百万级别爆款原子库进行AI分析,自动提取影视的开头、结尾剧情,以及中间爆点片段,再利用风行自建的爆款模版库进行智能剪辑,就可以一站式创作大量的高质量短视频。
这些高质量短视频都是和长视频关联的,经过内容审核后,我们在产品上采用“短带长”的形态精准分发至家庭大屏,实现“3秒锁定兴趣内容—10秒沉浸体验—一键跳转长片”的流畅闭环,不仅活跃用户看视频更爽了,不太活跃的用户来了就会被吸引,提升整体的活跃度。
多模态交互式AI构建观影新体验
除了用AI内容给用户带来更爽的视频体验,另一个关键就是AI交互。多模态输入+AI意图识别,让AI时代的大屏交互有更多创新空间。
风行推出的“橙子AI”多屏互动系统,就是基于多模态AI驱动的跨屏沉浸式交互体验平台。基于橙子AI可实现“多模态输入- AI处理-跨屏互动输出”全链路自动化。
面向家庭的常见场景,我们打造了影视、教育、创作、陪伴、生活等一系列的智能体。
比如在影视场景,以我们的大屏影视产品“橙子瓣瓣”为例,观看前,若用户有选择困难症,可以用影视智能体做选片助手,通过剧情、台词等进行模糊搜索,让用户更便捷地找到喜欢的内容,同时也便于让相对经典的好内容被AI推荐出来。
观看过程中,可用AI制作切片,即时分享到手机小程序上;也可以拍摄自己喜欢的人物/物品等,生成大屏好友,作为情感陪伴,得到全新的情感化体验。
在“橙子瓣瓣”产品中,我们利用这一套多模态交互式AI,对全家人的观影流程进行了重构,解决用户在每个过程中的痛点,让大屏娱乐从“被动看”变为“主动玩”。
用AI把学习变成孩子的游乐场
大屏产品是家庭场景下的显示中心。除了观影场景外,还有其他的老人场景、儿童场景等。
以儿童学习场景为例,如何用AI提升孩子们的体验呢?我们的理念是:用AI把学习变成游乐场。
通过观察孩子,我们发现,对他们而言最重要的体验是沉浸感。这需要我们的产品给他们互动交互、还要有即时反馈;要让他们达到心流,需要挑战与技能相适应,把学习藏进游戏化流程里,最终体会到掌控感、惊喜与归属感。这些设计在风行自研的橙子乐学系统中都有体现。
在橙子乐学系统中,我们有多种学习模式,比如说AI互动学,支持边看边问,还有知识点标注以及关联视频,让孩子不再被动式的接收知识。
AI智能学,通过综合评测后可形成个性化的薄弱点学习,以及配套练习和精细的学情报告,整个过程都可以利用AI做到更好的个性化,形成完整的学习闭环。
AI沉浸学,利用图像识别、自然语言处理、3D建模等,将平面学习内容(如绘本、课本)转化为沉浸式、交互式、场景化的数字体验,帮助孩子在沉浸式过程中提升认知能力与学习兴趣。
另外,我们还设计了一系列的趣玩学,强调亲子互动和多模态交互。比如互动猜谜、陀螺仪走迷宫等,都可以全家一起玩,让孩子在玩中学。
未来的家庭交互,将不再局限于单一设备或固定场景。我们构建的这一套多模态交互式AI系统,融合遥控器、手机、摄像头等多维输入,通过AI实时解析用户意图,并输出视频、语音、动态画面等丰富反馈,实现“所想即所得”的智能体验。
无论是精准或模糊搜索、创意激发,情感陪伴、还是沉浸式学习,这套系统都将重新定义人与家的交互方式——让技术服务于人,让家庭场景更自然、更温暖。
重新定义智慧家庭生态
基于千万级用户行为数据,风行已构建多模态交互式AI技术中台。
前面分享了AI内容、AI交互以及用户可体验的橙子瓣瓣、橙子AI、橙子乐学等几个产品,我们认为,多模态交互式AI是“智慧家庭”的通用语言,所以,这一AI技术语言,能够让家庭多品类的视听终端焕发新的活力,具有智慧。
比如我们的橙子乐学魔盒,搭载橙子AI的教育、创作、情感等智能体,加上多模态交互,结合硬件摄像头、麦克风等模块,就是面向教育的AI终端。
类似的还有AI投影,搭载影视、生活等智能体,加上交互和硬件模块,整体类似于积木式的终端构建方式。
讲到这里,大家还记得那个困扰我们的问题吗?
传统模式下,海量内容通过电视、投影等硬件载体单向呈现在用户面前,去满足观影、学习、游戏等需求。
借助多模态交互式AI系统,家庭里的智能设备,变成了多模态输入端和输出端,原来的海量内容成为素材,AI通过分析内容和用户行为,最终为用户提供个性化的交互式体验。
我们可以面向多种场景去构建解决方案。
面向老人,给他们情感陪伴,人间烟火气;面向观影,有精彩的解说与互动式观看,也有观影搭子一起陪伴。
面向少儿,多种互动式娱乐、学习场景,打造全方位的沉浸感;面向学习,一方面是个性化的引导与步骤化讲解,一方面是预习、矫正、复测、精练、深拓全环节的 AI 方案。
多模态交互式AI系统包含设施层、感知层、决策层、执行层和场景层。
感知层比以前单一的大屏更加丰富,不仅是遥控器,还可以有手势、语音、视觉、触觉、甚至运动感知、眼动等。
通过多模态输入,到综合大脑做决策,整合内容数据、调用各种场景智能体,实现沉浸式的综合服务,可形成面向家庭娱乐、家庭教育、智能家居等多应用场景的解决方案。
未来,风行不仅在内容生态和应用生态持续生长,还将通过多模态交互式AI系统,将更好的内容与体验在家庭小机器人、家庭影音娱乐等软硬一体的产品方案上持续探索。
我们期待联合更多行业伙伴,共同打造有温度、会思考的智慧家庭未来。
谢谢大家!
责任编辑:凌美
24小时热文
流 • 视界
专栏文章更多
- [常话短说] 【解局】年底冲刺,广电政企发力?! 2025-12-05
- [探显家] 2026年流媒体展望:Roku的CTV五大预测 2025-12-05
- [探显家] 获投 5000 万欧元!Titan OS 完成 A 轮融资 2025-12-04
- [常话短说] 【解局】广电化债方式:债券债务抵消! 2025-12-04
- [常话短说] 【解局】“央企联姻”引发广电大猜想! 2025-12-03





