type
status
date
slug
summary
tags
category
icon
password
URL
前OpenAI研究人员创立的AI公司Anthropic,推出了其更新版聊天机器人Claude 2,目标直指ChatGPT和Google Bard。
在Claude首次亮相仅五个月后,其继任者拥有更长的回答、细致入微的推理能力以及卓越的表现,在GRE阅读和写作考试中取得了令人印象深刻的成绩。Claude2同样是一个对话式机器人,需要注意目前只对美国和英国开放,使用前要先切换下魔法节点,性能直逼GPT-4级别的体验,免费可用。体验入口:https://claude.ai
- 更强的上下文:早在5月11日Claude就发布了支持100K的版本,在Poe上可以付费使用,这次Claude直接提升到200K,相当于一般中长篇小说的长度,不过官网版本目前只支持使用100K的(还是比GPT-4长)
- 更新的数据:Claude2包含了更新的训练数据,其中有2023年的内容(但不清楚具体的时间)
- 原生支持PDF: 和ChatGPT需要插件不同,Claude2官方开放了PDF的能力,你不需要使用ChatPDF或者ChatDoc直接上传文件给Claude2就可以帮你进行分析或者总结
- 更多的非英语数据:对多语言的理解更好,目前还没看到对中文的提升有多大,会不会再出现之前中英文夹杂洋里洋气的现象
- 更强的代码能力:Claude 2在代码生成能力方面也有显著提高,在编码基准测试和人工反馈评估中表现出色。
我们很高兴地推出我们的新型号Claude 2。Claude 2 的性能得到了提高,响应时间更长,并且可以通过 API 以及面向公众的新测试版网站claude.ai进行访问。我们从用户那里听说,克劳德很容易交谈,清楚地解释其思维,不太可能产生有害的输出,并且具有更长的记忆力。我们在编码、数学和推理方面对之前的模型进行了改进。例如,我们最新的模型在律师考试多项选择部分的得分为76.5%,高于 Claude 1.3 的 73.0%。与申请研究生院的大学生相比,Claude 2 在 GRE 阅读和写作考试中的得分高于 90%,在定量推理方面与申请者的中位数相似。
将克劳德视为一位友好、热情的同事或私人助理,可以用自然语言指导来帮助您完成许多任务。面向企业的 Claude 2 API 的价格与 Claude 1.3 相同。此外,美国和英国的任何人今天都可以开始使用我们的测试版聊天体验。
当我们努力提高模型的性能和安全性时,我们增加了 Claude 输入和输出的长度。用户可以在每个提示中输入最多 100K 个令牌,这意味着 Claude 可以处理数百页的技术文档甚至一本书。克劳德现在还可以编写更长的文档 – 从备忘录到信件再到故事,最多可达几千个标记 – 全部一次性完成。
此外,我们的最新模型大大提高了编码技能。Claude 2在 Python 编码测试Codex HumanEval上的得分比 56.0% 提高了71.2%。在 GSM8k 这一大量小学数学题上,Claude 2 的得分从 85.2% 上升到88.0%。我们为 Claude 2 制定了令人兴奋的功能改进路线图,并将在未来几个月内缓慢、迭代地部署它们。
我们一直在迭代改进克劳德 2 的底层安全性,使其更加无害,并且更难以提示产生攻击性或危险的输出。我们有一个内部红队评估,使用自动化测试对我们的模型在大量有代表性的有害提示上进行评分,同时我们还定期手动检查结果。在此评估中,与 Claude 1.3 相比,Claude 2在提供无害响应方面的表现要好 2 倍。尽管没有模型可以免受越狱的影响,但我们使用了各种安全技术(您可以在此处和此处阅读相关内容)以及广泛的红队合作来提高其输出。
Claude 2 为我们的聊天体验提供动力,并且在美国和英国普遍可用。我们正在努力让 Claude 在未来几个月内能够在全球范围内提供更多服务。现在,您可以创建一个帐户并开始用自然语言与 Claude 交谈,请求其帮助完成您喜欢的任何任务。与人工智能助手交谈可能需要一些尝试和错误,因此请阅读我们的提示,以充分利用 Claude。
我们目前还与数千家使用 Claude API 的企业合作。Jasper是我们的合作伙伴之一,一个生成式人工智能平台,使个人和团队能够扩展他们的内容策略。他们发现,Claude 2 能够在各种用例中与其他最先进的模型进行正面竞争,但在长格式低延迟用途方面具有特殊的优势。“我们真的很高兴成为第一批向客户提供 Claude 2 的公司之一,它带来了增强的语义、最新的知识培训、改进的复杂提示推理,以及通过 3 倍大的上下文窗口轻松重新混合现有内容的能力”,Jasper 工程副总裁 Greg Larson 说道。“我们很自豪能够通过与 Anthropic 的合作来帮助我们的客户保持领先地位。”
资料记录器 是一个代码AI平台,帮助客户编写、修复和维护代码。他们的 编码助理科迪使用 Claude 2 改进的推理能力为用户查询提供更准确的答案,同时还通过多达 100K 上下文窗口传递更多代码库上下文。此外,Claude 2 还接受了最新数据的训练,这意味着它拥有更新的框架和库的知识,可供 Cody 从中提取。Sourcegraph 首席执行官兼联合创始人 Quinn Slack 表示:“在人工智能编码方面,开发人员需要快速、可靠地访问有关其独特代码库的上下文,以及具有大上下文窗口和强大通用推理能力的强大法学硕士。” “开发工作流程中最慢、最令人沮丧的部分正在变得更快、更愉快。感谢 Claude 2,Cody 帮助更多开发人员构建更多推动世界前进的软件。”
- 作者:布鲁斯
- 链接:https://bvip.one/2023/12/29/01
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。