2025 年 3 月 21 日,OpenAI 在其开发者直播中正式推出新一代语音智能体解决方案,通过全新的 gpt-4o 系列音频模型与突破性的 API 定价策略,宣告 AI 交互进入自然语音时代。此次发布不仅带来了语音识别准确率的显著提升,更以颠覆性的价格体系重新定义行业标准。
《科创板日报》3月17日讯近日,米哈游创始人蔡浩宇的二次创业公司,公布了其首个AI游戏项目。游戏名为《Whispers from the Star》。据官方介绍,这是一款融入大语言模型(LLM)的科幻背景沉浸式互动叙事游戏。
豆包即将发布最新实时语音大模型,并将基于此模型全量上线豆包App实时语音通话功能。目前,豆包APP已小范围测试最新能力,部分用户在豆包App的实时通话界面已更新。此前,业内就曾有消息称豆包将上线最新情感语音大模型,测试效果超过GPT-4o。
3月20日,声网在2025年中国家电及消费电子博览会(AWE2025)正式推出对话式AI开发套件,此套件可为智能硬件开发者打造AI实时语音交互产品,提升人机实时互动体验。同时,声网宣布已将对话式AI开发套件软硬件全面开源。