来源:环球网 【环球网科技综合报道】2月13日消息,字节跳动豆包大模型Foundation团队近日宣布了一项重要创新成果——UltraMem稀疏模型架构。这一架构通过将计算和参数解耦,在保证模型效果的同时,有效解决了推理过程中的访存问题,为人工智能领域带来了新的突破。
转载自:新民科学咖啡馆Science & Technology上海人工智能科技公司MiniMax日前发布并开源新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。
【大河财立方消息】9月15日,宇树科技宣布开源UnifoLM-WMA-0——跨多类机器人本体的开源世界模型-动作架构。宇树科技介绍,UnifoLM-WMA-0专为通用机器人学习而设计,其核心在于一个可以理解“机器人与环境交互”物理规律的世界模型。
近期DeepSeek团队在其新论文《Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures》中从芯片用户角度对未来AI硬件提出了一些期待,其中很多点和SRDA架构的思路不谋而合,也让我们更有信心SRDA架构有机会成为下一代针对AI大模型场景的更优计算架构。
来源:环球网 【环球网科技综合报道】9月15日,宇树科技宣布开源 UnifoLM-WMA-0,即宇树科技旗下跨多类机器人本体的开源世界模型-动作架构,据宇树科技介绍,UnifoLM-WMA-0是专为通用机器人学习量身打造的。
DeepSeek R1 在 2025 年 1 月发布时引起了巨大反响。它可能是目前这一代中最大的 LLM,在不考虑尚未发布的 Llama 4 Behemoth、闭源模型以及架构不同的 Google 1.6 万亿 Switch Transformer前提下,Kimi K2 几乎是无出其右的。