每经记者:蔡鼎 每经编辑:高涵|2025年5月13日 星期二|NO.1 OpenAI推出医疗开源测试基准HealthBenchOpenAI推出 HealthBench开源基准测试,一项旨在更好地衡量AI系统在医疗健康领域能力的全新基准测试。
每经编辑:杜宇美东时间6月27日周四,OpenAI公布,其研究人员训练了一个基于GPT-4的模型,它被称为CriticGPT,用于捕捉ChatGPT代码输出中的错误。简单来说就是,CriticGPT让人能用GPT-4查找GPT-4的错误。
编辑:桃子 KingHZ【新智元导读】OpenAI发布新基准HealthBench,联手60个国家262名执业医生,树立新的「AGI标志性用例」。OpenAI o3碾压Grok 3和Gemini 2.5 Pro,成功登顶。而最强AI几乎达到了人类医生最佳水平!
科技日报 12月20日,美国开放人工智能研究中心(OpenAI)介绍了其最新的人工智能(AI)推理模型——o3及其轻量版o3-mini。该公司宣称,o3具备更先进、近似人类的推理能力,在代码编写、数学竞赛和掌握人类博士级别的科学知识等方面,均超越了其“前辈”o1。
每经记者:蔡鼎 每经编辑:高涵|2024年6月19日 星期三|NO.1 OpenAI与初创公司联手打造癌症筛查AI助手OpenAI正与初创公司Color Health合作,将其AI模型应用于癌症筛查和治疗,从而扩大AI在医疗健康领域的应用。