热门

开源大模型新王干翻GPT-4o，新技术可纠正自己幻觉，数学99.2分刷爆测试集

热点资讯2年前发布时间煮雨

5,640 00

文章标题：开源大模型新王干翻GPT-4o，新技术可纠正自己幻觉，数学99.2分刷爆测试集

摘要：

一个名为 Reflection 70B 的新开源大模型在AI领域引起轰动，由一个小型创业团队开发。
该模型采用创新的训练技术 Reflection-Tuning，使AI能在推理过程中主动发现并纠正自身的错误和幻觉。
在数学基准测试GSM8K中，Reflection 70B取得了99.2%的高分，超越了包括GPT-4o在内的其他顶尖模型。
该模型的出色表现甚至引发了OpenAI科学家Noam Brown的讨论，他质疑是否应该淘汰GSM8K基准。
Reflection 70B模型的权重已经公开，并且Hyperbolic Labs将提供API访问。
该模型不仅能够纠正数r测试中的错误，还能识别并纠正GSM8K数据集中本身答案错误的问题。
背后的团队由HyperWriteAI的CEO Mutt Shumer领导，他是一位连续创业者，拥有丰富的AI应用开发经验。
官方计划下周发布更大的模型 Reflection 405B，预计性能将大幅优于现有模型。
目前，Reflection 70B的试玩平台已经上线，尽管在高峰时段可能会暂时无法访问。

文章链接：点击访问

热点资讯 # GPT-4o # HyperWriteA # OpenA # Reflection-Tuning

© 版权声明

文章版权归作者所有，未经允许请勿转载。

阿里云ECS “99套餐” 双11特惠 36元/年

相关文章

免费AI绘画工具大赏：Vega AI、XTimesAI与Dashtoon Studio

免费AI绘画工具大赏：Vega AI、XTimesAI与Dashtoon Studio

热点资讯 # Ai工具 # Ai资讯 # Dashtoon Studio

2年前

017,1160

YouTube 将推出 AI“一站式服务”：可生成创意、标题、完整视频

YouTube 将推出 AI“一站式服务”：可生成创意、标题、完整视频

2年前

04,5730

瑞士启用“阿尔卑斯”新型超级计算机，满足极端数据处理及 AI 需求

瑞士启用“阿尔卑斯”新型超级计算机，满足极端数据处理及 AI 需求

2年前

04,2750

消息称 OpenAI 明年调整结构，转变为传统的营利性公司

消息称 OpenAI 明年调整结构，转变为传统的营利性公司

2年前

04,4120

暂无评论

none

暂无评论...