Claude 3系列AI模型 多项基准测试胜GPT-4

发布 : 2024-3-06  来源 : 明报新闻网


用微信扫描二维码,分享至好友和朋友圈
AI模型之争愈趋激烈。由ChatGPT母企OpenAI前雇员创立,并获Google和亚马逊注资的AI初创Anthropic,发布了Claude 3系列的AI模型,声称该AI模型的Opus版本,在多项基准测试的表现,击败OpenAI的GPT-4及Google旗下Gemini 1.0 Ultra等顶尖AI模型。

Anthropic由OpenAI前雇员创立

Anthropic表示,Claude 3与GPT-4也是多模态(multimodal)模型,它可理解用户提供的文字及图像,进而作出分析和预测、建立内容、生成编码,并以英语、法语、西班牙语及日语等作出回应。

它也可接收不同的视像格式,包括照片、图像及施工图等。在用户提问后,它几乎可即时给予答案。

该公司表示,Claude 3有初级版的Haiku、中级版的Sonnet及高级版的Opus,合共3个版本。其中最聪明的Opus,在「研究生水平逻辑思考能力」的基准测试中,得分达50.4%,高于GPT-4的35.7%;在「本科生专业知识水平」的基准测试,Opus取得86.8%,压倒GPT-4的86.4%。此外,在数学解难、编码及文字理解的基准测试,Opus也胜过GPT-4和Gemini 1.0 Ultra。即使是中级版的Sonnet,其「研究生水平逻辑思考能力」基准测试的得分,也比GPT-4高。就是初级版的Haiku,也能在3秒内阅读包含图表在内的研究论文。

Anthropic的应用程式介面(API)目前支援Sonnet及Opus,用户亦可透过亚马逊及Google云端平台使用这两个版本。不过Opus目前仅开放给Claude Pro订户,而Haiku将于稍后才上市。

75美元生成每百万个tokens 高GPT-4 Turbo收费1.5倍

Opus目前的收费高于同行,客户提供每百万个tokens(语言模型的最小单位,包括单字、词素及标点)给其处理,收费为15美元,相比GPT-4 Turbo的收费为10美元。Opus生成每百万个tokens的收费为75美元,而GPT-4 Turbo的收费仅30美元。但Anthropic似乎对其收费颇具信心,认为客户如要执行复杂的认知任务,例如准确处理复杂的财务分析,Opus仍有其吸引力。

Anthropic于2021年由OpenAI的前高层Dario Amodei等创立,是OpenAI主要竞争对手之一。由于OpenAI与微软紧密合作,使Anthropic成为其他科技巨企的合作对象。《金融时报》的消息指,Google在2022年向其注资3亿美元,换取其10%股份,并在去年继续加码投资。亚马逊去年亦表示,将向该公司投资最多40亿美元,以获取其少数股权。

(综合报道)