• 首页 > 云计算频道 > 大模型

    大模型新皇Claude 3即将入驻Amazon Bedrock,公有云成AI创新加速器

    2024年03月11日 13:17:14   来源:智能进化论AImatters

      2024年3月4日,Anthropic发布旗下最新一代大模型Claude 3系列,引发行业热议。

      在推理、数学、编码、多语言理解和视觉方面,Claude 3在多个基准测试上树立了新的标准,性能超越了包括GPT4在内的其他模型,被认为是通用大模型新皇。

      与此同时,亚马逊云科技宣布,Claude 3系列将入驻其生成式AI托管服务Amazon Bedrock。亚马逊云科技的客户将可以通过Amazon Bedrock访问Claude 3系列的三个模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。

      Claude 3对于通用大模型发展带来哪些改变?对于更多想要用好大模型的企业,什么是更好的使用通用大模型的方式?以下是笔者的一些观察。

      1 冲破一家独大,Claude3成通用大模型新“卷王”

      此次推出的Claude3共有三个模型,性能和价格由低到高为:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,也被形象概括为中杯、大杯、超大杯。

      其中,Claude 3 Haiku 主打快速紧凑,即时的响应能力。Claude 3 Sonnet 在智能和速度之间取得了理想的平衡,特别适合企业用例。Claude 3 Opus具有深度推理、高级数学和编码能力,在高度复杂的任务上具有领先性能。

      Claude 3的领先之处体现在基准性能、视觉能力、复杂开放性问题处理能力等。

      基准性能方面,Claude 3在多项AI系统常用评估标准,包括本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K),均取得领先业界LLM的性能。

      Claude 3的三个模型均具备视觉功能,可以理解不同格式的结构化和非结构化数据,包括图像、图表、图表等。比如,官方演示视频中,Claude 3 Opus可以在几分钟内分析全球经济、未来美国GDP走势等。

      对于下图这样的复杂开放式问题, Claude3能够理解物体的外观及其与数学等概念的联系。

      此外,Claude3的三个模型都将至少支持200K token的上下文窗口。在200K token的「大海捞针」(NIAH)测试中,Claude 3 Opus准确率超过99%。Claude 3 Haiku 能够3秒读完10k token论文。

      笔者认为,目前大模型发展呈现两条不同的路径:

      一条路径,围绕如何练好大模型。像OpenAI、Anthropic、Google这样的科技巨头,有能力和资源在通用基础大模型赛道竞争。通用基础大模型的赛道相对同质化,各家都在追求更高更快更强,即更强大更全面的性能。

      而且通用大模型的竞争态势一直是动态变化的,任何一家的领先都是暂时的,榜单随时可能被刷新和超越。在这种态势下,任何一家独大,强者恒强未必对行业、对生态更好。

      从这个意义上,Claude3能够打破OpenAI长期领先的优势,加速通用大模型卷出更高的智能水平。

      另一条路径,围绕如何用好大模型。如何用大模型的能力解决不同行业不同场景下的专业问题,才是绝大多数企业最关注的。在这条路径上,云计算正发挥着举足轻重的价值。

      2 云计算,使用基础大模型的必经之路

      目前,AI大模型已经成为云计算厂商的第二增长曲线,全球头部云计算厂商都将AI大模型作为下一个十年发展的必争之地。

      如果我们回到企业需求的视角,企业使用基础大模型至少有以下几个核心诉求:

      首先,数据安全与合规

      数据安全合规是企业使用大模型的首要考量,包括数据泄露风险、数据滥用风险、模型安全漏洞等等。比如,很多企业担心客户信息、商业秘密和个人身份信息等敏感数据泄露。这些都对提供大模型能力的公有云厂商提出了更高的要求。

      在如何保障大模型安全使用方面,亚马逊云科技率先做出了很多探索。比如,Amazon Bedrock 处理的任何客户内容都会被加密,并静态存储在客户使用的亚马逊云科技区域中。客户可以使用Amazon PrivateLink建立从Amazon Virtual Private Cloud(VPC)到Amazon Bedrock的私有连接,而无需将VPC暴露给互联网流量。用户输入和模型输出不会与任何模型提供商共享。Amazon Bedrock还提供全面的监控和日志记录功能。

      其次,丰富的基础模型选择

      没有任何一款大模型可以满足所有需求。

      企业在使用大模型时,一定是博采众长,多款并用的。笔者观察到,很多企业在开发垂直领域的企业服务大模型时,底层都接入了不止一个头部大模型。

      在头部云厂商中,以亚马逊云科技为例,丰富的基础模型选择也是其在大模型赛道的差异化优势。目前,Amazon Bedrock平台的大模型提供商扩充至7家,包括AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI。

      “回顾2021年,当 Anthropic第一次开始在亚马逊云科技上构建时,没有人能想到Claude系列模型会带来多大的变革。自Amazon Bedrock于 2023年9月28日全面上线以来的短短几个月内,已有超过10,000名客户使用它,其中许多客户正在使用Claude。”亚马逊云科技数据和AI副总裁Swami Sivasubramanian博士表示。

      目前,已经有不少头部企业在云上使用Claude创建生成式AI应用。比如,全球领先的生物制药公司辉瑞正通过Amazon Bedrock使用Claude模型,加速创新癌症治疗方案的研发。通过运用生成式AI技术,辉瑞能够大幅缩短收集相关数据和科学内容所需的时间,进而利用这些内容分析趋势、制定肿瘤学目标并进行验证,从而提高成功概率。

      第三,易用的AI平台和工具集

      云计算厂商并非仅仅提供AI大模型的底层基础设施和基础模型接口,更关键是提供系统化的AI平台和工具集,帮助企业更好使用大模型进行创新。

      比如,Amazon Bedrock推出了丰富的AI功能,包括帮助客户识别、比较模型的模型评估功能、简化生成式AI应用构建并利用专有数据提供定制化响应的知识库功能、模型调优功能、能执行多步骤业务指令的代理功能、实现负责任AI的Guardrails安全功能等。

      Claude3的出现,让生成式AI领域再度风起云涌。Claude3不仅刷新了基础大模型的性能,也打破了长期以来通用大模型领域一家独大的市场格局。

      同时,亚马逊云科技与Anthropic的强强联合,不仅能让更多企业在云上便捷使用更新更强大的通用大模型,也代表了企业首选在公有云上使用大模型能力和生成式AI的发展趋势。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    中兴二合一 5G 云电脑“逍遥”系列上架:一键切换双模式,

    5 月 10 日消息,据中兴通讯官微,中兴二合一 5G 云电脑“逍遥”系列已经在电商平台上架。其支持本地、云端双模式,可在电脑与平板模式之间一键切换。售价方面,型号为 W200DS 的产品首销价格为 1899 元。

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。