尊敬的各位总局领导、尊敬的各位行业专家:
大家上午好!下面由我给大家介绍一下科大讯飞在通信运营商领域、TOS 行业领域以及家庭方面的一些应用。
科大讯飞从早期智能语音技术起步,到如今大模型的行业应用,始终致力于场景、技术和应用的探索。2015 年,我们在智能语音和人机交互领域,针对家庭场景推出了第一台智能语音交互电视;截至 2018 年,联合广科院成立了语音技术融合创新实验室;2023 年,与广科院共建了国家广播电视网工程技术中心以及广电认知大模型分中心。接下来,我向大家汇报一下最新进展。
随着大模型技术的普及,以及家庭和各场景用户需求的不断演进,我们期望借助新技术,为更多场景和用户提供满足最新需求、形成服务闭环的解决方案。无论是在儿童陪伴、车机,还是手机应用场景,我们都积极进行探索,力求通过新的人机交互技术与终端硬件相结合,打造全新的交互服务体验。同时,在技术方面,我们积极突破探索,目前已有 800 多个技术方向和方案,并逐步向视听领域开放,涵盖教育、运动等场景的服务。
非常荣幸向大家介绍,2023 年 9 月,我们与广科院签署了新的战略合作协议,围绕大模型技术,科大讯飞与广科院共同开展广电仁智智能大模型相关工作,在 AIGC、真假新闻判别、教育、虚拟人、数字员工等方面,启动相关研发和技术应用探索。下面,我很高兴为大家介绍最新进展。
我们围绕广电认知大模型工作,推出以家庭视听大模型为底座,升级全新的交互服务入口,为家庭用户和多场景提供应用服务。
推出拟人化 AI 交互入口:让交互更加自然、亲切。
聚焦家庭场景中“一老一小”用户群体:提供更具关怀的个性化需求满足。在后续场景中,提供更多生态和服务,构建影视、运动、新闻、生活周边以及运动顾问等长尾服务。
在人的交互方面,我们进一步围绕虚拟人的强视觉交互,通过生成式表情动作,让用户的视觉交互更加生动。例如,在表情、人物形象以及声音传递方面,未来将基于个性化数字形象的复刻,打造不同人设情感,构建超拟人的数字人,实现更立体的表达,通过情感化方式与用户建立更好的情感连接。
同时,我们赋予了模型更聪明的“大脑”,首发面向家庭场景的混域泛意图识别技术。家庭是一个复杂的多人场景,不同用户的需求和表达的自然语言存在差异。我们通过域训练大模型,结合在影视、深层信源、教育、康养等方面的积累,实现长文本多轮交互、泛意图精准识别。通过复杂的意图理解,找出相关服务的智能体,这是我们在家庭场景中的探索。基于这些技术积累,我们通过家庭视听大模型,以意图驱动未来家庭场景下服务引擎的升级,并基于此构建面向家庭的服务生态。
例如,我们通过用户的语料数据,目前家庭覆盖用户超过 1 亿。未来,通过通用模型的微调,以及模型算法能力构建整个能力底座,构建 TOS 底座,为通信运营商所有家庭场景的服务构建端到端解决方案。通过 SFT 的微调,结合 80 多万家语料数据和验证,构建了一个基于 0.5B 的 SFB 的预调模型,未来可连接家庭中所有服务场景。
今天,在广科院大领导的支持和指导下,我们有幸联合总局广播电视科学研究院发布家庭视听大模型 1.0 版本,助力家庭场景交互进入大模型智能体时代。
首先推出的是影视智能体。过去,影视观看是单向的点播方式,基于句式 NLP 规则。现在,我们已演进到基于用户随意的全自然语言表达,实现剧情搜索、影视价值观搜索等多维度方式,从说、听、聊、找等多维度协助用户找到满意的服务,构建整个影视智能体。同时,基于用户服务提供更主动的人机交互方式,协助用户追剧、聊剧,找到任何领域想要的内容。通过对用户意图的理解,快速结合智能搜索技术和大数据推荐,为用户提供丰富的长尾内容推荐,进一步挖掘单向被动搜索的问题。
其次是康养智能体。考虑到未来中国老龄化问题以及社会医疗资源不平衡的现状,我们推出康养智能体,满足家庭中老龄群体的需求,让每位家庭老人都有一位专业的 AI 医生,助力科技适老。讯飞在 AI 领域拥有丰富的数据、业务和技术积累,同时推出了面向手机端的讯飞小医。升级版本通过慢思考推理能力,结合专业医疗数据,实现了手机端和大屏端联动的全科 AI 医生,支持全自然语音交互,实现疾病自查、用药科普、报告解读等功能,可在家庭场景中为老年人和“三高”慢性病群体提供全面的专病居家管理能力,实现从语音交互到服务、管理、应用的端到端服务方案。
除了康养,在家庭场景中,小朋友也是重要群体,尤其是教育问题。我们推出了教育智能体,通过更生动形象的虚拟人,结合对话技术实现互动沉浸式教学。例如,通过图灵、孔子、爱因斯坦、李白等形象,让小朋友与这些历史人物对话,挖掘教育过程中的知识点。我们非常荣幸在前几年与中国教育电视台成立了一家合资公司,专门围绕教育内容的引进和服务进行打造,通过启蒙课程、家庭课程等多维度提供教育体系服务。科大讯飞在语音评测、翻译、对话等方面的能力全部集成应用到其中,在对话过程中帮助小朋友找到不准确的发音,尤其在英语学习过程中的单词阅读,通过全面的教育推进。
基于以上服务,在安全和面向“一老一小”群体方面的应用,讯飞在内容输出和大模型安全层面投入了更多技术,采用机审、人审相结合的多重审核方案,组织专职团队实施全方位风险监控和分级处理闭环机制,保证 AIGC 内容的安全。从输入到输出端,整个过程实现快修、人审、机审服务闭环,实现日级别的迭代更新。在所有场景中,讯飞的大模型应用都有安全保障。
基于此,我们希望未来与生态伙伴一起为整个场景构建更多生态。例如,在美食方面,每个家庭成员都可以有自己的美食专家协助制作美食;在旅游、家庭运动、健康等方面,讯飞目前已经提供了相关智能服务的 MaaS 平台,对接众多互联网服务商和信源伙伴。未来,通过每个合作方自己的能力编排,以及正在签署的 MCP 协议,通过多轮上下文大模型对话以及自有原子能力的扩充,希望通过这样开放的平台和接口获得更多行业开发者的支持,共同打造家庭大屏的智能体生态。
最后,我们期待更多合作伙伴的加入。目前,通过语音平台和语音遥控器的积累,我们有 1.5 亿用户规模,覆盖四大运营商,与华为、中兴等相关硬件厂商也开展了在家庭泛终端方面的合作。未来,我们希望携手更多泛终端厂商以及内容方,共同构建家庭智能体的生态服务。
谢谢大家!我今天的分享到此结束。
更多关于CCBN的内容,请关注【专题】聚焦|CCBN 2025
责任编辑:李楠
今日聚焦更多
24小时热文
流 • 视界
专栏文章更多
- IPTV月报|2025年3月家庭智慧屏IPTV报告 2025-05-08
- 见微知著|海南自贸港2025封关,短剧出海新坐标? 2025-04-23
- 短剧榜单|3月美妆短剧竞逐女神节,电商品牌领跑短剧营销 2025-04-18
- [常话短说] 【破局】异业合作、跨界经营,广电自救新招式?! 2025-04-16
- 见微知著|对话张若波:多年芒果系转身微短剧得与失 2025-04-16