首页 > 资讯 > 科技 > 正文

英特尔发布Gaudi 3:对标英伟达H100 预计Q2向OEM厂商出货

互联网

  美国当地时间4月9日,英特尔举办了面向客户和合作伙伴的英特尔on产业创新大会。毫无预兆,这场大会上,英特尔首次介绍了他们的GPU产品Gaudi 3.向英伟达发起冲击。

  尽管英伟达在数日前的GTC上已经发布了最新的Blackwell架构的GPU,英特尔Gaudi 3在具体的参数上,瞄准了英伟达更早之前的主力产品H100.

  据介绍,英特尔Gaudi 3将带来4倍的BF16 AI计算能力提升,以及1.5倍的内存带宽提升,采用 5nm制程制造。这颗芯片能够支持多种的大模型,包括Llama、文生图的Stable Diffusion、语音识别的Whisper等等。

  英特尔副总裁Das Kamhout表示,若应用在70亿、130亿参数Llama2模型,甚至1750亿参数GPT-3模型上,采用英特尔Gaudi 3时的大模型训练时间,相比于英伟达H100将缩短50%,同时推理吞吐量提高50%。

  不过,英特尔公司首席执行官帕特·基辛格也高调呛声,称Gaudi 3的性能将与英伟达H200相当,甚至在某些领域的性能甚至会更好。不过,他在发布会上暂时没有拿出对比数据,也并未就此展开说明。

  在GPU中,网络连接也是一项关键重点。在英特尔Gaudi 3中,英特尔采用的是以太网网络,也允许企业灵活地从单个节点,扩展到拥有数千个节点的集群、超级集群和超大集群,支持大规模的推理、微调和训练。

  英特尔方面称,英特尔Gaudi 3将于2024年第二季度面向OEM厂商出货,名单包括戴尔、HPE、联想和Supermicro。

  不仅仅是 GPU产品的进展,英特尔此次还发布了另外一款宣布面向数据中心、云和边缘的英特尔至强6处理器,具体包括两款新产品。这也是这款产品时隔数个月之后的再一次更新。

  其中,配备能效核的英特尔至强6处理器(代号为Sierra Forest),与第二代英特尔至强处理器相比,每瓦性能提高2.4倍,机架密度提高2.7倍,将于2024年第二季度推出。

  配备性能核的英特尔至强6处理器(代号为Granite Rapids),与使用FP16的第四代英特尔至强处理器相比,可将token的延迟时间最多缩短6.5倍,能够运行700亿参数的Llama-2模型。

  根据cnvrg.io的调研结果,2023年只有10%的企业成功将其生成式AI项目产品化。为了改变现状,英特尔还在打造他们的 AI生态。

  此次发布会上,英特尔还宣布和多家企业合作, 为企业AI创建一个开放平台。在这一平台上,通过检索增强生成(RAG),让企业用户能够通过开放的 LLM功能,更容易部署生成式AI。

  另外,英特尔此次还更新了不少端侧产品的更新节奏——

  英特尔宣布将于2024年推出的下一代英特尔酷睿Ultra客户端处理器家族(代号Lunar Lake),处理器将具备超过100 TOPS平台算力,在神经网络处理单元(NPU)上也将带来超过46 TOPS的算力,从而为下一代AI PC提供强大支持。

  另外,英特尔也发布了涵盖英特尔酷睿Ultra、英特尔凌动处理器和英特尔锐显卡系列产品在内的全新边缘芯片。这些产品主要面向零售、工业制造和医疗等关键领域,所有新品将于本季度上市。

  英特尔公司首席执行官帕特·基辛格表示,“从PC到数据中心再到边缘,英特尔正在让AI走进千行百业。英特尔最新的Gaudi、至强和酷睿平台将提供灵活的、可定制化的解决方案,满足客户和合作伙伴不断变化的需求,把握住未来的巨大机遇。”

  “我们即将再次改变世界”——这是帕特·基辛格在发布会上留下的最后一句话。

中国基金网遵守行业规则,本站所转载的稿件都标注作者和来源。 中国基金网原创文章,请转载时务必注明文章作者和来源“中国基金网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 4673 445@qq.com