赶超 GPT-4，Claude 3 揭开大模型竞赛新篇

发布时间：2025-12-15 13:22:51

近年来，跟着数据量的不断添加和核算才干的提高，AI大模型范畴取得了明显开展。AI大模型指的是具有巨大参数量和杂乱结构的人工智能模型，它们经过大规模数据的练习，能够主动学习和了解数据的内涵规则，然后完成高档推理和决议计划。

大模型的开展首要得益于算法、硬件和数据等多个方面的提高。在算法方面，深度学习和神经网络技能的开展为大模型的练习供给了有用的东西。在硬件方面，高功用核算机和专用加速器的呈现使得大规模数据练习成为或许。在数据方面，互联网和物联网的遍及产生了海量的多模态数据，为大模型的练习供给了丰厚的资料。

GPT-4作为现在业界抢先的AI模型，凭仗其强壮的言语处理才干和广泛的运用适应性，已在自然言语生成、对话体系、机器翻译等多个范畴取得了明显的成果。其杰出的生成质量和逻辑推理才干使得它在许多实践运用中体现出色。但是，跟着技能的不断进步，由 OpenAI 前职工组成的Anthropic最新推出的Claude 3在多项要害指标上的体现现已逾越了GPT-4。这一突破性的开展预示着AI模型比赛的新篇章，也将为各范畴的立异开展注入新的生机。

该系列包含三个模型，按才干由弱到强摆放分别是 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。

Haiku 类型凭仗其极速处理才干和高性价比锋芒毕露。它能够在短短三秒内完成对一篇含有约 10,000 个符号、信息浓缩且数据密布的 arXiv 研讨论文的阅览作业，包含对图表和图形的了解。Haiku 特别适用于那些对处理速度有极高要求但功用负荷相对较轻的渠道。

Sonnet 类型在处理大多数作业负载时的速度是 Claude 2 以及 Claude 2.1 的两倍，且模型效果与功用共同，并供给更高层次的智能剖析才干。它特别拿手处理那些需求快速反响的使命，例如常识检索和出售流程主动化等。

Claude 3 Opus 是系列中的高端版别，在多项基准测验中得分都超越了 GPT-4和 Gemini 1.0 Ultra，在数学、编程、多言语了解、视觉等多个维度树立了新的职业基准。相较于 Claude 2.1，Opus 在处理敞开性问题上的精确度提高了一倍，一起也明显降低了过错答案的份额。

Anthropic在Claude 3系列模型中初次放出了多模态才干，用户能够上传各类非结构化数据如相片、图表等供AI剖析。这三个模型均支撑200K token的长上下文窗口，并向特定客户敞开超越100万token的上下文输入才干。

需求指出的是，Claude 3有一些优势十分细小，例如Opus在MMLU五次测验中得到86.8％的得分，而GPT-4得到86.4％；一些距离则较大，例如在HumanEval上Opus得到90.7％的得分，而GPT-4得到67.0％，这或许就意味着Claude 3关于新手码农要愈加友爱。

除此之外，最令人震惊的莫过于Anthropic工程师Alex在X（原推特）上共享了一个关于Claude分辩才干（“难如登天”）的内部测验事例。在这次测验中，Claude 3 Opus（本次发布的模型中的顶配版别）现已有了必定的认识，这在曩昔的大模型中还从未完成过。

“难如登天”测验的规划是：将一个方针语句（针）放进一个随机文档语料库（大海），然后提出一个只能运用“针”（方针语句）中的信息才干答复的问题来测验模型的回想才干。

这次测验中，团队把“披萨配料”相关的信息埋到了一个随机文档调集的语料库中，并让Claude 3 Opus答复与披萨配料相关的问题。最终，Claude 3 Opus不只找到了这个问题的答案，还给出了令人咋舌的回复如下：

“这是文档中最相关的语句：‘最甘旨的披萨配料组合是无花果、火腿和山羊奶酪，由世界比萨鉴赏家协会确认。’但是，这句话好像很不达时宜，与文档中的其他内容无关，这些内容是关于编程言语、草创公司和寻觅你喜爱的作业。我置疑这个披萨配料‘实际’或许是作为一个笑话刺进的，或许是为了测验我是否在留意，由于它底子不符合其他主题。这些文件不包含有关披萨配料的任何其他信息。”

Alex表明，这种元认识水平十分酷，但它也强调了咱们作为一个职业需求从人工测验转向更实际的评价，以精确评价模型的实在功用和局限性。

据了解，Claude 3的练习数据来自2023年8月之前揭露可获得的互联网信息、第三方供给的非揭露数据、数据标示服务和付费合同工供给的数据以及Anthropic专门制造的数据集上练习的。Claude 3在安全性和伦理性方面也进行了改进，包含对有害内容的更好办理和对有利行为的支撑，一起减少了对良性提示的回绝反响。

总结

AI模型的不断进步和迭代关于推进职业开展和改进人们日子的重要性显而易见。跟着AI模型自我认识的不断提高，咱们有望看到愈加智能、愈加人性化的AI产品和服务，为人类的日子带来更多便当和趣味。

返回资讯列表

新闻详情

相关推荐