文 | 光锥智能,作者 | 魏琳华 ,编辑 | 王一粟在DeepSeek和Manus的冲击之下,“沉寂”已久的字节,做出了首个由大厂发布的Agent爆款。从4月18号扣子Agent上线以来,各个AI交流群都开始抢起了扣子的邀请码。
在数据处理任务中表现出色,但在其他任务上整体表现中规中矩,亮点不足。上周末拿到了 Coze 空间的邀请码,又一个类 Manus 产品,果然 Manus 带来的这股浪潮,不单带火了 Genspark,也让大厂迅速布局。
每经记者:杨昕怡 每经编辑:陈俊杰“接下来,AI(人工智能)的重点将从解决问题转向定义问题。”近日,OpenAI研究员姚顺雨在其新博文中表示,AI下半场的重点将从解决问题转向如何定义有现实意义的任务,如何有效评估AI系统的表现,“要思考‘我们应该训练AI做什么?
方法来自刚发的论文:《LLM×MapReduce-V2: Entropy-Driven Convolutional Test-Time Scaling for Generating Long-Form Articles from Extremely Long Resources》LLM×MapReduce-V2:用信息熵和卷积机制,指导大模型写出结构清晰的长文档。
我们用光了一天的对话额度,考验了扣子空间的信息整理、任务执行、工具调用等多项技能。结果,仍处在早期测试中的扣子空间整体表现已经相当惊艳,在自主任务规划和资料搜集方面表现不错,已经具备解决很多真实任务的潜力。