大模型长记忆

资讯

华为针对AI大模型场景发布“长记忆”存储产品
3月5日，MWC25巴塞罗那期间，华为发布新一代全闪数据中心系列产品和行业场景化方案。其中，针对AI大模型场景，发布下一代高性能AI存储OceanStor A800，为业界首款提供“长记忆”能力的存储，为AI训练提供数据吞吐支持，可提升30%的算力利用率，实现毫秒级推理响应。
界面快讯
2评论
落地有声｜AI+游戏：大模型让角色有了记忆和情绪
编者按：由ChatGPT引发的大模型热已一年有余，围绕大模型创业的公司也如雨后春笋，技术最终要为产业所用才能创造价值，当大模型落地千行百业，能够发挥怎样的价值？澎湃科技走进产业一线，访谈创始人、专家、投资人，调研大模型落地产业现状。本文为游戏大模型访谈。
澎湃新闻
1评论
院士郑纬民：内存型长记忆存储以存换算，是AI推理新趋势
来源：环球网【环球网科技报道记者张阳】10月29日，在中国电子工业标准化技术协会主办的数据存储专业委员会（以下简称“数据存储专业委员会”）成立大会上，汇聚了100多位产业单位代表、数据存储专业委员会成员、院士专家。
环球网
1评论
热议生成式人工智能：大模型的“偏见”和“幻觉”如何应对？怎么让大模型像人一样有记忆力？
央广网北京7月7日消息（记者吕红桥）据中央广播电视总台经济之声《环球新财讯》报道，在正在举办的2023世界人工智能大会上，生成式人工智能是专家关注的焦点。讨论的话题涉及大模型的发展方向、技术短板、提升空间等。什么是大模型的“偏见”和“幻觉”？如何应对“偏见”和“幻觉”？
央广网
记忆力成为大模型竞争新赛道，更博闻强记的大模型有何优势与风险？
央广网北京4月11日消息（记者吕红桥）据中央广播电视总台经济之声《环球新财讯》报道，除了拼训练参数、拼成本，大模型又找到了新的赛道，那就是拼记忆力。全球多款通用大模型的记忆力最近都显著提升，有的甚至可以调用用户之前所有对话内容。大模型拥有更强的记忆力有什么用途，又有哪些潜在风险？
央广网
手把手教你用大模型写百万字长篇小说！（附实操方案）
通过「故事背景库 + 上下文记忆魔盒 + AI 方向盘 + 自动化生成器 + 人工质检流水线」五大模块，我们打造了一条全自动小说生产线:✅ 每日稳定产出 100 万字。
rule
3评论
谷歌：大模型不仅有涌现能力，训练时间长了还有「领悟」能力
2021 年，研究人员在训练一系列微型模型时取得了一个惊人的发现，即模型经过长时间的训练后，会有一个变化，从开始只会「记忆训练数据」，转变为对没见过的数据也表现出很强的泛化能力。为了判断模型是在泛化还是记忆，该研究训练模型预测 30 个 1 和 0 随机序列的前三位数字中是否有奇数个 1。
机器之心Pro
16评论
大模型到底该如何落地？王小川、闫俊杰、韩歆毅给出了这些看法
界面新闻记者 | 程璐界面新闻编辑 | 宋佳楠9月5日，2024 Inclusion·外滩大会在上海正式开幕。
界面新闻
联想集团CTO：大模型发展的下一步是智能体
中新网北京4月1日电题：联想集团CTO：大模型发展的下一步是智能体中新财经记者刘育英AIGC(生成式人工智能)掀起AI热潮，但也有其局限性，如“一本正经胡说八道”，不符合因果关系的合成视频等。如何解决这些问题？联想集团高级副总裁、首席技术官芮勇认为，大模型发展的下一步是智能体。
中国新闻网
29评论
超200亿元！大模型产业，究竟是啥？
来源 | 人民论坛网-人民论坛杂志转载请注明来源连日来，随着深度求索公司（DeepSeek）发布其最新开源模型DeepSeek-R1在国内外引发热烈关注，百度、腾讯、阿里巴巴、字节跳动等企业纷纷宣布旗下AI大模型、AI应用新动作，包括全面免费使用、接入DeepSeek模型以及拓展
人民论坛网
1评论
星环科技创始人孙元浩：大模型在特定领域只是本科生，有3个限制
·“向量数据库就是大语言模型的海马体（存放记忆）。它的基本功能是把非结构化的数据转成高维向量，然后提供进一步的搜索。”星环科技创始人、CEO孙元浩。
澎湃新闻
5评论
腾讯自研混元大模型正式亮相：从零开始训练，重点解决“胡言乱语”问题
界面新闻记者崔鹏9月7日，在2023腾讯全球数字生态大会上，腾讯混元大模型正式对外亮相，同时宣布通过腾讯云对外开放。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示，混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预训练语料超2万亿tokens。
界面新闻
2评论
Honda中国宣布与Momenta共建端到端大模型
来源：环球网【环球网科技综合报道】4月23日消息，第二十一届上海国际汽车工业展览会（2025上海车展）现场，Honda中国正式宣布与智能驾驶科技公司Momenta达成深度战略合作，双方将共同研发基于端到端大模型的量产辅助驾驶解决方案，推动高速领航辅助驾驶、城区领航辅助驾驶、自动
环球网
Kimi爆火，中国大模型何时商业落地？
来源：环球时报【环球时报记者陈子帅杨沙沙马梦阳】编者的话：一款擅长处理长文本的国产大模型日前引发广泛关注。
环球网
对标GPT-4o，面壁智能瞄准手机、汽车等智能终端大模型
9月5日，头部大模型初创公司面壁智能官宣实现旗下模型新一轮迭代。正式进化的MiniCPM 3.0基座模型，再次以小博大，以仅为4B的参数，在包括自然语言理解、知识、代码、数学等多项能力上已实现超越GPT-3.5的性能。南都记者了解到，此次MiniCPM 3.
南方都市报

加载更多

视频

在线举报