生成的摘要改变了其搜索体验

pappu6327 · Post by **pappu6327** » Sun Feb 16, 2025 3:59 am

Anthropic 的 Claude Sonnet-3.5 在推理和分析任务中出人意料地成为领先者。该模型在图表解释等视觉推理任务中表现出色，同时在研究生水平的推理、本科生知识和编码能力方面树立了标杆。最值得注意的是，它在实现这些进步的同时，运行速度是 Claude 3 Opus 的两倍，成本只有其五分之一。这种更好的性能和更低的资源需求相结合，预示着未来先进的人工智能能力将变得越来越容易获得。

谷歌
双子座 1.5 专业版
2 月推出了 Gemini 1.5 Pro，在长上下文理解方面取得了突破性进展。该模型可以连续处理多达一百万个标记 — 一次处理长达一小时的视频、11 小时的音频或 70 万字的文本。这个巨大的上下文窗口，加上即使在大规模情况下也能保持准确性的强大性能，标志着人工智能在理解和处理大量信息方面迈出了重要一步。

伟创
5 月，谷歌推出了 Veo，这是一种先进的视频生成模型，能够制作时长超过一分钟的 1080p 视频。该模型支持各种电影风格，包括延时摄影和航拍，并计划整合到 YouTube Shorts 中。

人工智能搜索的演变
5 月份，谷歌还通过添加 AI 。这标志着数十亿人在线获取信息的方式发生了根本性转变，从链接列表转向上下文综合答案。GenAI 的大规模实际部署为用户与 AI 生成内容的互动提供了宝贵的经验教训。

元
LLaMA 3 系列（4 月至 9 月）
Meta 积极的开源开发改变了 AI 行业的动态。从高效的 8B 模型开始，到扩展到 405B 参数版本，LLaMA 3 系列证明了最先进的 AI 不需要专有。

4 月份发布的版本提供了 8B 和 70B 参数模型，这些模型经过了 15 万亿个 token 的训练，在编码和多语菲律宾电话号码数据言任务中表现出色。到 7 月份，LLaMA 3.1 已扩展到 405B 参数，在关键基准上超越了商业领导者。9 月份发布的 LLaMA 3.2 增加了视觉功能，并引入了针对移动设备优化的 1B 和 3B 参数模型，使最先进的 AI 可以在从智能手机到数据中心的计算环境中使用。

人工智能
Grok 进化（3 月至 8 月）
3 月，xAI 在 Apache 2.0 许可下开源了 Grok-1，这是一个拥有 3140 亿个参数的混合专家模型。到 8 月，Grok-2 取得了重大进展，在 LMSYS 排行榜上超越了领先模型，在 MMLU 基准上达到了 87.5%。同时发布的 Grok-2 mini 表明 xAI 致力于让高级 AI 适用于不同规模。Grok-2 在检索内容和内容分析推理方面表现出特别的优势，同时提高了识别和丢弃不相关信息的能力。

亚马逊
Nova 系列（十二月）
12 月，亚马逊推出了 Nova 系列 AI 模型，加入竞争行列。Nova 系列（Micro、Lite 和 Pro）在 AWS re:Invent 大会上发布，提供文本、图像和视频生成功能，同时专注于降低成本和减少延迟。这标志着亚马逊正努力通过其云基础设施直接提供具有竞争力的基础模型。