Anthropic是一家专注于人工智能(AI)研究的公司,由OpenAI的前首席科学家Ilya Sutskever和Dario Amodei共同创立。Claude是Anthropic公司发布的基于transformer架构的大语言模型,被认为是最接近ChatGPT的商业产品。今天,Anthropic宣布Claude 2正式开始上架。
Claude模型可以在Slack中免费使用,一度是我们团队使用的ChatGPT的最强替代者,对中文支持很好,意图理解也非常优秀。Claude 2的发布应该会很快会在Slack中体现。本次也推出了Claude Chat网页版,完全免费,支持直接根据PDF总结结果(最高不超过10MB的文档,单词数应该是7.5万以内都可以)。
Claude模型介绍
(资料图片)
Claude2的重要更新总结
编码能力提升很大
最高支持10万tokens的输入和4000个tokens的输出
更强大的逻辑能力
更新的训练数据
Claude2实测总结和免费使用方式
Claude是Anthropic公司开发的一系列大型语言模型。这些模型使用了Transformer架构,并通过无监督学习、人类反馈强化学习(RLHF)进行训练。Claude模型可以理解和生成人类语言,用于各种任务,如回答问题、写作、编辑和编程。
尽管Claude API接受申请,但是很难(我也申请过几次,完全杳无音讯)。不过,在Slack中,有免费的Claude模型可以使用。大多数人使用Claude的感受应该都是它与ChatGPT很像,对意图的识别和文本的生成都有很好的支持。相比较免费版本的ChatGPT(训练数据在2021年9月之前),Claude模型中包含更多的最新数据,因此就免费版本来说,Claude更好。
Claude 2和之前的Claude模型都是通用的大型语言模型,使用Transformer架构。Claude 2是该公司迄今为止最强大的系统,它代表了从早期的“有用且无害”的语言助手模型到现在的连续演进。Claude 2并没有从先前模型和研究中带来变革性的变化,而是代表了一种连续的演变和一系列小而有意义的改进,这些改进建立在Anthropic过去2年多的研究基础之上。
Claude 2有几个非常重要的更新值得关注。
Claude 2在Codex HumanEval(一项Python编码测试)上的得分从56.0%提高到了71.2%。官方的演示视频中,你可以直接上传一个代码文件(js库),然后Claude就可以自动分析代码并给出这个库的使用方法。
看起来代码理解和生成能力十分厉害。
尽管很早之前Anthropic就生成Claude最高支持10万tokens的输入,但是一直没有发布。今天的Claude2宣布正式支持10万tokens的输入,并且可以一次性输出4000个tokens,大约3000多个单词。
这应该是目前最高的上下文限制了(超过GPT-4的32K)。
官方演示视频中上传了一个84K的文档给Claude,然后可以顺利输出文档中的重要部分。还支持以Markdown的格式输出其中重要的内容。
实话说,我体验Claude1.3的时候已经觉得这个模型做的很好了,几乎与ChatGPT没有啥区别。但是Claude 2宣称它在众多的测试中有更好的表现。
如下图所示,在GRE、USMLE Medical测试和Multistate Bar Exam中表现都很好。
Claude2在Bar exam的多选得分中从1.3版本的73%提升到76.5%。GRE的阅读和写作中也处在90分位数。表现非常好。
这一点比ChatGPT好,尽管付费版本的GPT-4支持插件方式来访问最新的数据。但是插件尤其是网络插件很多时候会出问题。而Claude2则是已经使用了2023年初的新数据来训练模型了。所以,模型本身对2023年之前发生的重要事情与内容应该都是知道的。
尽管ClaudeAI不支持插件。但是官方说,它是支持与搜索工具连接的,包括网络和数据库等。同时,也可以直接将文档发给Claude来分析。
本次其实官方推出了一个Claude2的聊天工具,完全免费!我已经测试了Claude这个模型,速度很快,效果非常好。
上面是我让它总结的GPT-4的技术细节文档,识别速度和结果都非常棒。
需要注意的是目前Claude Chat仅开放US和UK地区!
根据此前的合作,它应该很快会在Slack上更新。Slack是一款流行的团队协作工具,可以免费注册,然后引入Claude APP即可使用,也是完全免费。
不得不说,Claude真业界良心啊~大家可以用起来了!
本文来源:DataLearner,原文标题:《最像ChatGPT的产品更新:GPT-4最强竞争模型Claude2发布!免费!具有更强的代码能力与更长的上下文!》
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。