阿里巴巴华中总部项目商业投入运营铁路客运电子发票全国推广一个多月,开具超过 1000 万张微短剧上电视大屏总收视规模超 5 亿户次美团外卖启动“恶意差评治理专项行动”:引入 AI 识别关键词,未来将预警风险用户工信部:我国 5G 基站总数达 414.1 万个,每万人拥有 5G 基站数达 29 个极越 CEO 夏一平内部信被指抄袭蔚来李斌:核心内容几乎相同vivo、OPPO 快应用接入自家支付平台,年底不再默认支持微信、支付宝接口内部人士谈极越汽车崩盘:百度吉利两大股东不愿继续投资,承诺 30 亿融资未到账罗姆、台积电就车载氮化镓 GaN 功率器件达成战略合作伙伴关系吉利旗下沃飞长空全球总部基地开工,AE200 eVTOL 进入适航取证与量产冲刺阶段消息称 Synopsys 拟收购 Ansys 后剥离资产,以期欧盟批准 350 亿美元交易消息称《数据结构》教科书编著者、清华大学计算机教授严蔚敏去世国内规模最大的电力 5G 专网在秦山核电正式上线极越 CEO 夏一平:百度最近对公司进行了全面审计,没有任何问题索尼确认有意收购 FromSoftware 母公司角川集团刚融资就大裁员,云鲸智能进入寒冬?联想寒促优惠来袭:联想AI全家桶带你一起狂欢双十二月销超11万辆,新能源销量榜前三,五菱神话能持续多久?AlmaLinux 10.0 Beta发布:代号“紫狮”,支持后量子密码学谷歌测试Gemini AI游戏助手:实时分析屏幕以提供游戏建议
  • 首页 > 云计算频道 > 大模型

    Intel发布Gaudi 3 AI加速器:4倍性能提升、无惧1800亿参数大模型

    2024年04月10日 09:52:39   来源:快科技

      美国当地时间4月9日,Intel举办了一场面向客户和合作伙伴的Intel Vision 2024产业创新大会,做出多项重磅宣布,包括全新的Gaudi 3 AI加速器,包括全新的至强6品牌,以及涵盖全新开放、可扩展系统,下一代产品和一系列战略合作的全栈解决方案。

      数据显示,预计到2030年,全球半导体市场规模将达1万亿美元,AI是主要推动力,不过在2023年,只有10%的企业能够成功将其AIGC项目产品化。

      Intel的最新解决方案,有望帮助企业应对推广AI项目时所面临的挑战,加速实现AIGC落地商用。

      Intel现有的Gaudi 2诞生于2022年5月,并于2023年7月正式引入中国,拥有极高的深度学习性能、效率,以及极高的性价比。

      它采用台积电7nm工艺制造,集成24个可编程的Tenor张量核心(TPC)、48MB SRAM缓存、21个10万兆内部互连以太网接口(ROCEv2 RDMA)、96GB HBM2E高带宽内存(总带宽2.4TB/s)、多媒体引擎等,支持PCIe 4.0 x16,最高功耗800W,可满足大规模语言模型、生成式AI模型的强算力需求。

      新一代的Gaudi 3面向AI训练和推理,升级为台积电5nm工艺,带来了2倍的FP8 AI算力、4倍的BF16 AI算力、2倍的网络带宽、1.5倍的内存带宽。

      对比NVIDIA H100,它在流行LLM上的推理性能领先50%、训练时间快40%。

      Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型、1750亿参数GPT-3模型的训练时间。

      在Llama 70亿/700亿参数、Falcon 1800亿参数大型语言模型上,Gaudi 3的推理吞吐量和能效也都非常出色。

      Gaudi 3提供多种灵活的形态,包括OAM兼容夹层卡、通用基板、PCIe扩展卡,满足不同应用需求。

      Gaudi 3提供开放的、基于社区的软件,以及行业标准以太网网络,可以灵活地从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群,支持大规模的推理、微调和训练。

      Gaudi 3 AI加速器具备高性能、经济实用、节能、可快速部署等优点,能够充分满足复杂性、成本效益、碎片化、数据可靠性、合规性等AI应用需求。

      Gaudi 3将于2024年第二季度面向OEM厂商出货,包括戴尔、慧与、联想、超威等。

      目前,Intel Gaudi加速器的行业客户及合作伙伴有NAVER、博世(Bosch)、IBM、Ola/Krutrim、NielsenIQ、Seekr、IFF、CtrlS Group、Bharti Airtel、Landing AI、Roboflow、Infosys,等等。

      此外,Intel还宣布联合Anyscale、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、SAS、VMware、Yellowbrick、Zilliz等伙伴,共同创建一个开放平台,助力企业推动AI创新。

      该计划旨在开发开放的、多供应商的AIGC系统,通过RAG(检索增强生成)技术,提供一流的部署便利性、性能和价值。

      初始阶段,Intel将利用至强处理器、Gaudi加速器,推出AIGC流水线的参考实现,发布技术概念框架,并继续加强Intel Tiber开发者云平台基础设施的功能。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。