豆包推桌面端,看上了浏览器市场?|周报(产品篇)

撰文 :徐弢、张司钰、杨秋秋、陆彦君

编辑 :吴洋洋

Key Points

豆包也推出了桌面客户端;

Perplexity推出Pages功能,让你搜索完就能形成文档;

树莓派与Hailo合作,推出了一个AI套件;

智谱推出开源模型GLM-4-9B;

快手发布文生视频模型「可灵」;

Stability发布用于生成声音和歌曲的开源AI模型;

阿里云开源Qwen2系列模型,最大模型有720亿参数。

豆包也推出了桌面客户端

6月3日消息,字节旗下大模型产品豆包推出桌面客户端,基于Google开源项目Chromium开发,目前支持Windows、macOS两个系统。

此前,豆包已经拥有网页版和手机App。桌面版主要在桌面浏览器领域里与Google旗下Chrome、微软旗下Edge浏览器竞争。

豆包桌面版还支持:

- 快捷键启动;

- 划词搜索、翻译、解释,也可以通过自定义「提示词」添加额外的功能;

- 网页搜索;

- 通过开通设置权限,划词功能可以覆盖电脑内所有软件。

今年5月,字节跳动的云雀大模型更名为豆包大模型。字节跳动产品和战略副总裁朱骏在活动上透露,用户已经在豆包上创建了超过800万个智能体(agent),豆包的月活跃用户达到2600万。

此外,朱骏还提到,字节做了很多学习和探索,希望找到适合的大模型应用形态。桌面客户端是豆包在网页版、手机App之外的最新产品形态。

微软旗下的Edge浏览器已经证明,生成式AI能够推动产品获得更多用户。根据美国流量检测机构StatCounter的数据,桌面端浏览器中,微软Edge浏览器的市场份额于2023年12月超过苹果公司Safari,成为全球第二受欢迎的浏览器产品。

还有更多公司也在开发大模型产品的桌面客户端。「新皮层」曾经报道,OpenAI今年5月在发布新版模型GPT-4o的同时发布了ChatGPT桌面版,付费用户可以直接下载macOS客户端,Windows客户端也计划在下半年推出。

参考链接:

https://www.doubao.com/chat/

Perplexity推出Pages功能,让你搜索完就能形成文档

5月30日,AI搜索公司Perplexity宣布推出一项名为Pages的新功能,可以根据用户提示生成自定义的研究演示文稿。用户可以在提示框中输入报告内容或想要了解的内容,然后由Pages利用Perplexity的AI搜索模型来查找信息并编写相应页面。在Pages中,Perplexity生成的信息被划分成多个部分,附上了引用来源,并制作了相应的视觉效果,形态就像一篇论文。用户可以根据需要将页面制作得尽可能详细或简洁,还可以更改Perplexity使用的图像,但用户无法编辑它生成的文本,除非编写另一个修改文本的指令。

把你跟Perplexity交互的内容变成排版好的网页,更方便分享。

Perplexity称,它设计Pages是为了帮助教育工作者、研究人员和爱好者开发他们的「学习指南」,以便他们根据自己的研究成果撰写报告,并分享出去。Pages将会向所有Perplexity用户开放。

参考链接:

https://www.perplexity.ai/hub/blog/perplexity-pages

树莓派与Hailo合作,推出了一个AI套件

6月4日,英国树莓派基金会开发的微型单板计算机树莓派(Raspberry Pi)宣布推出树莓派AI套件,可以安装在树莓派5产品中,售价70美元。

这款AI套件由树莓派与以色列芯片制造商Hailo合作开发,由树莓派M.2 HAT+套件与Hailo公司开发的Hailo-8L AI加速器模块组装而成,可以集成在树莓派的相机上。开发者可以借此AI套件在本地以低延迟、低功耗的方式运行AI视觉应用程序。

「新皮层」曾报道,树莓派是一种微型单板计算机,最初是为了帮助人们学习编码并培养对计算机科学的兴趣而设计,但很快超出了最初的目标市场,目前广泛应用于工业环境,尤其物联网设备。去年11月,Arm战略投资树莓派,被认为将合作开发新的物联网设备。

Hailo公司由Orr Danon、Avi Baum联合创立于2017年,开发的芯片可以使用更少的内存和更低功效执行AI工作,吸引了施耐德电气、戴尔科技以及ABB在内的三百多个客户。Orr Danon过去在以色列国防部工作,Avi Baum曾经担任德州仪器的无线连接首席技术官。目前,Hailo已经完成了3.4亿美元融资,最新一轮融资是今年4月筹集到的1.2亿美元,公司估值也达到了12亿美元。

参考链接:

https://www.theverge.com/2024/6/4/24170818/raspberry-pi-ai-chip-hailo-devices

https://www.raspberrypi.com/news/raspberry-pi-ai-kit-available-now-at-70/

智谱开源新模型GLM-4-9B

6月5日,智谱AI举办Open Day活动,发布清言App以及MaaS大模型开放平台bigmodel.cn的最新更新,并发布了GLM-4-9B开源模型。

清言App及平台更新

在多智能体协作系统「清流」中,用户可以在同一个对话框中自由调用多种不同的智能体,实现高效协同工作,提升了用户在使用智能体时的便利性和工作效率。

MaaS 2.0大模型开放平台则全线接入了新模型,新增的一键微调功能无需编写代码,仅需3步即可完成模型微调。

此外,AllTools智能体API为开发者集成了包括飞书日历、印象笔记、WPS、网易有道、微信公众号、高德地图、流程图、思维导图等工具,让用户可以更简单地构建自己的AI助手。

新开源模型GLM-4-9B

智谱开源的GLM-4-9B系列模型,性能号称超越Llama3-8B模型。智谱称,GLM-4-9B使用了10T高质量多语言数据训练,数据量是ChatGLM3-6B模型的3倍以上,因此具备更强的推理性能、更长的上下文处理能力、多语言、多模态,以及集成流程图、地图、思维导图、共享文档等多Al Tools等能力。

本次开源的GLM-4-9B系列模型包括基础版本GLM-4-9B(8K)、对话版本GLM-4-9B-Chat(128K)、超长上下文版本GLM-4-9B-Chat-1M(1M)和多模态版本GLM-4V-9B-Chat(8K)。

参考链接:

https://github.com/THUDM/GLM-4

快手发布文生视频模型「可灵」

6月7日,快手发布「可灵」视频生成大模型,并已开放邀测。该模型采用类Sora的DiT结构,目前该模型生成的视频分辨率可达1080p,时长最高可达2分钟,并将很快开放竖版视频生成功能。在模型能力扩展方面,可灵大模型在长宽比上没有采用传统的固定分辨率训练方式,而是直接处理不同长宽比的数据,保留了原始数据的构图。同时,团队研发了基于自回归的视频时序拓展方案,以应对未来数分钟甚至更长视频的生成需求。有消息称,基于可灵大模型的图生视频功能也将于近期上线。

参考链接:

http://kling.kuaishou.com/

Stability发布用于生成声音和歌曲的开源AI模型

6月5日,Stability AI宣布发布开源模型Stable Audio Open,该模型可根据文本提示生成不超过47秒的音频样本和音效。与Stability AI此前推出的用于创作完整音乐曲目的Stable Audio不同,Stable Audio Open无法生成完整的歌曲或旋律,只能生成鼓点、乐器旋律、环境噪音和「音乐元素」,也可用于编辑现有歌曲或将一首歌的风格应用到另一首歌中。据Stability称,Stable Audio Open使用了来自免费音乐库FreeSound和免费音乐档案馆的约48.6万个样本训练。

推出Stable Audio Open被认为是Stability AI尝试扭转其低迷业务的一部分。据报道,2024年第一季度,Stability AI的收入不到500万美元,但亏损超过3000万美元,并且该公司目前还有欠云计算提供商和其他公司的近1亿美元未偿账单。由于现金短缺,Stability AI曾被报道在5月与至少一位潜在买家就出售事宜展开讨论。

参考链接:

https://stability.ai/news/introducing-stable-audio-open

阿里云开源Qwen2系列模型,最大模型有720亿参数

6月7日,阿里云发布开源模型Qwen2系列,该系列包含5个尺寸的预训练和指令微调模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。其中,Qwen2-72B的性能相比今年5月开源的Qwen1.5-110B又有所提升,而Qwen2-57B-A14B为混合专家模型(MoE)。所有尺寸的模型都使用了分组查询注意力(GQA)机制,以提高推理速度并降低显存占用。模型训练数据中增加了27种语言相关的高质量数据,这也提升了模型的多语言能力。Qwen2还增大了上下文长度支持,Qwen2-72B-Instruct能够处理128k上下文长度内的信息抽取任务。

阿里云称,Qwen2-72B在代码、数学、推理、指令遵循、多语言理解等方面超过了美国最强的开源模型Llama3-70B,也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。

-END-

xAI估值超过Anthropic,仅次于OpenAI;Perplexity估值较年初涨2倍|投融资篇

字节设两支团队做AI硬件;快手前副总加入百度负责文心一言|大公司篇

腾讯发布首个AI原生应用;又一个中国公司发布了「空间计算」设备|模型与应用篇

举报