gtp3开源模型

资讯

科技公司史上第一次：Meta开源GPT3参数大小的AI模型
在生成文本段落、模拟人类对话及解决数学问题表现惊人的大型语言模型，显然是这几年AI发展最热门的领域之一。
澎湃新闻
1评论
算法新闻汇编｜GPT3参数大小AI模型开源，VR设备模拟唇齿触感
中国正处于全球人工智能发展第三次浪潮的时代潮头，《算法周刊》将聚焦人工智能“上海高地”和中国新基建，并持续关注全球AI最前沿。
澎湃新闻
免费可商用开源GPT模型问世，50G权重直接下载，性能不输GPT-3
参数量级130亿，大小比肩最近Meta开放的LLaMA-13B，但从数据集、模型权重到计算优化训练，全部开源。
量子位
122评论
重磅论文！与GPT-3差不多水平的1750亿大模型OPT开源了
关注深度学习或者NLP的童鞋应该都知道openAI的GPT-3模型，这是一个非常厉害的模型，在很多任务上都取得了极其出色的成绩。
数据学习DataLearner
2评论
开源Llama 3.1一夜成最强大模型！超越闭源GPT-4o，OpenAI坐不住了
我们昨天已经领略过Llama3.1威名:Llama3.1共包含8b、70b和405b三种模型，它们都有惊人的128k最大上下文。
夕小瑶科技说
25评论
击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了
Meta 在大约 15 万亿的多语言 Token 语料库上对 Llama 3 进行了预训练，相比之下，Llama 2 只使用了 1.8 万亿 Token。
再建巴别塔
量化巨头发布第一代大模型：免费商用，完全开源
量化巨头幻方开发的大模型来了！11月2日晚间，幻方宣布，探索AGI（通用人工智能）的新组织“深度求索（DeepSeek）”在成立半年后，发布第一代大模型——开源代码大模型DeepSeek Coder，已经开放内测，免费商用，完全开源。
澎湃新闻
8评论
大模型为啥要免费开源？开源模型怎么盈利？
哪怕一个门外汉，也可以抹黑进去，虽然一无所获走出来，甚至搞砸了一堵墙，依旧没有门卫拦你，也没人检查你离开时是否拿了东西。
刘兴亮
15评论
私募巨头幻方量化又有新动作，第一代大模型DeepSeek Coder已经开源
界面新闻记者 | 慕泽界面新闻编辑 | 11月2日晚间，知名私募巨头幻方量化宣布，公司旗下的DeepSeek已经发布第一代大模型DeepSeed Coder，免费商用，完全开源。
界面新闻
1评论
性能匹敌GPT-4o的国产模型在海外火了，训练仅花费558万美元
12月27日，海外社交媒体平台X被来自中国的大模型DeepSeek-V3刷屏了，科技圈惊叹的点在于，这一模型能力对标头部模型，但训练的预算却非常低，“2048个GPU、2个月、近600万美元”，相比之下，GPT-4o等模型的训练成本约为1亿美元，至少在万个GPU量级的计算集群上训练。
第一财经
115评论
Llama 3.1横空出世！开源巨无霸首次击溃闭源，全民GPT-4时代来临
Llama 3.1 405B重磅登场，在多项测试中一举超越GPT-4o和Claude 3.5 Sonnet。
新智元
15评论
训练ChatGPT有多烧钱？国产大模型有机会吗？
GPT1.0和GPT2.0是开源的，目前很多国产大语言模型是用开源软件，加上中文语料处理的，差距和GPT3.5可能并不只相差了一代。
澎湃新闻
14评论
液冷，让AI模型更庞大
1943年，当心理学家W.S.McCulloch和数理逻辑学家W.Pitts，经过反复地推算验证，提出神经网络和数学模型，并接受掌声和鲜花时，他们心中必然有一丝遗憾，因为在晶体管还未发明的年代，纷繁复杂的数学公式无异于纸上谈兵。
观察者网
4评论
这个比 ChatGPT 还牛逼的 AI，竟然能直接修复代码
今天就要推荐一个基于 GPT-3 构建的工具 adrenaline，可以用来直接修复代码问题，同时告诉你为什么这是一个 bug 的应用，而 ChatGPT 在 GPT-3 面前就是个弟弟，以下是 ChatGPT 告诉我的，它和 GPT-3 的关系，你们感受一下。
GitHub项目精选
1评论

加载更多

视频

在线举报