3月5日,MWC25巴塞罗那期间,华为发布新一代全闪数据中心系列产品和行业场景化方案。其中,针对AI大模型场景,发布下一代高性能AI存储OceanStor A800,为业界首款提供“长记忆”能力的存储,为AI训练提供数据吞吐支持,可提升30%的算力利用率,实现毫秒级推理响应。
编者按:由ChatGPT引发的大模型热已一年有余,围绕大模型创业的公司也如雨后春笋,技术最终要为产业所用才能创造价值,当大模型落地千行百业,能够发挥怎样的价值?澎湃科技走进产业一线,访谈创始人、专家、投资人,调研大模型落地产业现状。本文为游戏大模型访谈。
来源:环球网 【环球网科技报道 记者 张阳】10月29日,在中国电子工业标准化技术协会主办的数据存储专业委员会(以下简称“数据存储专业委员会”)成立大会上,汇聚了100多位产业单位代表、数据存储专业委员会成员、院士专家。
央广网北京7月7日消息(记者吕红桥)据中央广播电视总台经济之声《环球新财讯》报道,在正在举办的2023世界人工智能大会上,生成式人工智能是专家关注的焦点。讨论的话题涉及大模型的发展方向、技术短板、提升空间等。什么是大模型的“偏见”和“幻觉”?如何应对“偏见”和“幻觉”?
央广网北京4月11日消息(记者吕红桥)据中央广播电视总台经济之声《环球新财讯》报道,除了拼训练参数、拼成本,大模型又找到了新的赛道,那就是拼记忆力。全球多款通用大模型的记忆力最近都显著提升,有的甚至可以调用用户之前所有对话内容。大模型拥有更强的记忆力有什么用途,又有哪些潜在风险?
2021 年,研究人员在训练一系列微型模型时取得了一个惊人的发现,即模型经过长时间的训练后,会有一个变化,从开始只会「记忆训练数据」,转变为对没见过的数据也表现出很强的泛化能力。为了判断模型是在泛化还是记忆,该研究训练模型预测 30 个 1 和 0 随机序列的前三位数字中是否有奇数个 1。
中新网北京4月1日电 题:联想集团CTO:大模型发展的下一步是智能体中新财经记者刘育英AIGC(生成式人工智能)掀起AI热潮,但也有其局限性,如“一本正经胡说八道”,不符合因果关系的合成视频等。如何解决这些问题?联想集团高级副总裁、首席技术官芮勇认为,大模型发展的下一步是智能体。
来源 | 人民论坛网-人民论坛杂志转载请注明来源连日来,随着深度求索公司(DeepSeek)发布其最新开源模型DeepSeek-R1在国内外引发热烈关注,百度、腾讯、阿里巴巴、字节跳动等企业纷纷宣布旗下AI大模型、AI应用新动作,包括全面免费使用、接入DeepSeek模型以及拓展
界面新闻记者 崔鹏9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式对外亮相,同时宣布通过腾讯云对外开放。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens。
来源:环球网 【环球网科技综合报道】4月23日消息,第二十一届上海国际汽车工业展览会(2025上海车展)现场,Honda中国正式宣布与智能驾驶科技公司Momenta达成深度战略合作,双方将共同研发基于端到端大模型的量产辅助驾驶解决方案,推动高速领航辅助驾驶、城区领航辅助驾驶、自动
9月5日,头部大模型初创公司面壁智能官宣实现旗下模型新一轮迭代。正式进化的MiniCPM 3.0基座模型,再次以小博大,以仅为4B的参数,在包括自然语言理解、知识、代码、数学等多项能力上已实现超越GPT-3.5的性能。南都记者了解到,此次MiniCPM 3.