9月25日,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。
长文本对大模型而言为何重要?文|孙欣编辑|姚赟头图来源|视觉中国200万字,意味着什么?《埃隆·马斯克传》30万字,《红楼梦》70万字,《后宫甄嬛传》100万字。如果按照20分钟看1万字的阅读速度来计算,1小时阅读3万字,那么200万字大概要读66.67个小时。
继百度“文心一言”之后,阿里云大模型“通义千问”也官宣内测。4月7日,阿里云官方微博宣布:阿里版GPT官宣内测,其自研大模型“通义千问”开始邀请用户测试体验,新京报贝壳财经记者通过邀测码对通义千问进行了体验。
【大河财立方 记者 陈薇】通义大模型发布一周年之际,5月9日,阿里云公布数据显示,通义大模型通过阿里云服务企业超9万,通义开源模型累计下载量突破700万。通义落地应用现已进入PC、手机、汽车、教育、餐饮等领域。当天,阿里云正式发布通义千问2.
鉴于二者都有自己各自擅长的能力,如百度强调文心一言具有“文学创作、商业文案创作、数理推算、中文理解、多模态生成”五大能力,阿里强调通义千问除基础问答外还有“写提纲、SWOT分析、商品描述生成、会放飞的菜谱、小学生作文、然后呢、彩虹屁专家、写情书、为你写诗”九大百宝箱,因此我们针对以上相关维度,通过同样的问题进行了二者的测评。
今日,阿里云宣布自研大模型「通义千问」开始邀请用户测试体验,现阶段该模型主要定向邀请企业用户进行体验测试,可通过官网申请(http://tongyi.aliyun.com),请问有没有测试过的来说一下实际体验如何?对于此次阿里云发布AI大模型还有哪些信息值得关注?