• 首页 > 云计算频道 > 大模型

    Anthropic大模型实力全面超越GPT-4 亚马逊云科技露锋芒

    2024年03月05日 14:28:39   来源:TechWeb

      3月5日消息,OpenAI最强竞对Anthropic发布Claude 3系列模型,已经实现了对GPT-4的全面超越。

      Anthropic是由前OpenAI员工创立的公司,在过去一年获得了来自亚马逊40亿美元的投资。

      此次,Anthropic宣布推出Claude 3模型系列,该系列包括三个模型,按能力升序排列依次是:Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus。

      从Anthropic公布的测试数据看,其最高能力模型Claude 3 Opus的能力已经全面碾压GPT-4。

      如Anthropic所说,Claude 3模型将设定新的行业基准!

      目前,Claude 3 Opus和Sonnet已可以在Claude.ai和Claude API中使用。Sonnet正在Claude.ai上提供免费体验,Claude Pro用户则可以使用Opus。目前,Claude 3 Sonnet已可在159个国家可用,而Claude 3 Haiku很快将会上市。

      同时,今天起Claude 3 Sonnet也可以通过Amazon Bedrock,以及Google Cloud的Vertex AI Model Garden使用,Opus和Haiku很快就会在这两个平台同时推出。

      如果说微软通过绑定Open AI的GPT模型,在人工智能领域和亚马逊、谷歌等大厂的竞争中一骑绝尘,那么,随着全面碾压GPT-4的Claude 3 Opus的出现,在这场竞争中亚马逊也将吹起全面反击的号角。

      现在压力给到微软和Open AI,在马斯克的诉讼中,GPT-5何时发布?而Anthropic和Open AI的那些恩怨情仇还将继续上演……

      Claude 3 Opus模型性能全面超越GPT-4

      根据Anthropic公布的技术文档,Opus是Claude 3 模型家族中最智能的模型,在人工智能系统的大多数常见评估基准上都优于GPT-4,包括本科生级专家知识(MMLU)、研究生级专家推理(GPQA)、基础数学(GSM8K)等。它在复杂任务上表现出接近人类水平的理解力和流利性。

      Claude 3模型在分析和预测、细致入微的内容创建、代码生成以及西班牙语、日语和法语等非英语语言的对话方面都显示出更强的能力。

      总之,就是在各项测试领域,Claude 3 Opus的性能都已超越GPT-4。

      响应速度方面,据介绍,Claude 3 Haiku是市场上速度最快、性价比最高的模型。它可以在不到三秒的时间内阅读(约10k token)的包含图表和图形信息和数据密集的研究论文,并给出分析反馈。

      Anthropic表示正式发布后,预计Haiku性能将进一步提高。

      对于绝大多数工作负载,Sonnet比Claude 2和Claude 2.1快2倍,智能水平更高。它擅长于要求快速响应的任务,如知识检索或销售自动化。Opus提供了与Claude 2和2.1相似的速度,但具有更高的智能水平。

      Claude 3模型可以处理各种视觉信息数据,包括照片、图片、图表和技术图表。

      Anthropic称,一些客户的知识库,高达50%是如PDF、流程图或演示幻灯片以格式存储的信息。Claude 3 Opus在图表理解和多步推理上表现优秀。

      以例子来看,通过输入一张来自皮尤研究中心图表(如上)“年轻人比长辈更有可能使用互联网”,然后询问“G7国家的年轻人和老年人之间的平均差异百分比是多少?”

      模型顺利理解了G7概念,识别哪些国家是G7,并从输入的图表中检索数据并使用这些值进行数学运算。

      另外,全新的Claude模型在减少“过度拒绝”,与Claude 2.1相比,Claude 3 Opus模型在具有挑战性的开放式问题上的准确性提高了两倍,错误答案的水平也有所降低。

      在长语境理解能力方面,Claude 3系列的3个模型,都至少支持20万token的上下文窗口,都能处理超过100万token的输入。在200Ktoken的NIAH测试(大海捞针测试)中,Claude 3 Opus准确率超过99%。

      同时,Anthropic透露,计划在未来几个月内频繁发布Claude 3模型系列的更新。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    中兴二合一 5G 云电脑“逍遥”系列上架:一键切换双模式,

    5 月 10 日消息,据中兴通讯官微,中兴二合一 5G 云电脑“逍遥”系列已经在电商平台上架。其支持本地、云端双模式,可在电脑与平板模式之间一键切换。售价方面,型号为 W200DS 的产品首销价格为 1899 元。

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。