45秒AI转录34分钟4K视频:苹果Speech技术力压群雄,比OpenAI Whisper快55%
故渊| IT之家| 2025-06-18
【流媒体网】摘要:苹果新Speech API转录速度超OpenAI Whisper 55%,34分钟视频仅需45秒。

  科技媒体 macstories (6 月 17 日)发布博文,通过一段长达 34 分钟,7GB 的视频文件实测,发现苹果全新的 Speech API 仅用 45 秒完成,比 OpenAI Whisper(101 秒)快 55%。

  注:苹果公司在 WWDC 2025全球开发者大会上,宣布推出全新的 Speech 框架,其中包含 SpeechAnalyzer 和 SpeechTranscriber 两款模组。

  该媒体实测了基于上述模组开发的 Yap 应用工具,发现转录处理一段 34 分钟、7GB 的 4K 视频,只需要 45 秒,远超竞品 MacWhisper(基于 OpenAI 的 Whisper 开源语音转录模型)的 1 分 41 秒。

  该媒体进一步对比 Yap 与 MacWhisper、VidCap 等主流工具的表现:

  Yap:45 秒完成转录,输出 SRT 及 TXT 格式文件;

  MacWhisper(V3 Turbo):1 分 41 秒;

  VidCap:1 分 55 秒;

  MacWhisper(V2):3 分 55 秒。

  该媒体指出尽管所有工具在专有名词识别(如“AppStories”)存在误差,但 Yap 的本地化运算,让其速度优势显著,以每周处理多段视频计算,累计节省时间效益可观。

责任编辑:凌美

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!