Intel重回高性能GPU市场！Xe HPG微架构潜力无穷-科技数码-数据世界

2022年Intel接连发力，在6月份率先推出了旗下首款高性能桌面级GPU A380，虽然定位入门级，却也初具规模。

而在同年10月再次推出了中高性能的A750/A770桌面级GPU，本次的两款显卡一跃达到了市场主流产品的水准，虽然尚未达到旗舰级发烧性能，但其潜力可见一斑。

下面则为大家简单解析一下Intel的Xe HPG微架构，到底有何玄妙之处。

Xe HPG微架构浅析

本代Intel 3款显卡采用了Xe HPG微架构设计，最初发布的入门级A380显卡包含8个Xe内核（Xe Core），即两个渲染切片（Rendering Slice），下面我们从最小的Xe Core逐步为大家讲解。

Xe Core

每个Xe Core包含16个256位宽的(XVE)矢量引擎，它主要负责传统图像处理计算的任务，且提供大部分运算。

同时由于AI算法核心几乎完全围绕着一系列大型矩阵算法和累加算法，所以每个Xe Core还包含16个1024位宽的矩阵引擎(XMX)，主要为加速AI运算而生。

为了满足矩阵、矢量和光线追踪单元的高带宽需求，每个Xe Core中还构建了一个192KB的大型本地内存。它可以根据每个工作负载的需要在L1缓存和共享本地内存(SLM) 之间动态分配。

Render slice

综上所述，每4个微小的Xe Core，将构成一个Render slice(渲染切片)。除此之外，每个Render slice还集成了几何处理、光栅化、纹理采样、像素处理和光线跟踪等主流图形技术。

新的光线追踪单元架构可为DirectX Raytracing和Vulkan RT提供全面支持，通过加速光线遍历、光线盒交叉点和光线基元交叉点实现逼真的闪电和视觉保真度。

Xe HPG

Xe HPG架构最大的特点就是出色的灵活性，Intel可通过叠加渲染切片的方法来构建不同核心，目前最少为2个(8 Xe Core)，最大可以做到8个(32 Xe Core)，A380为两个，而A770则为8个Render slice。

通过此方法，可实现GPU配置从低功耗解决方案扩展到旗舰级的游戏引擎。每个Render slice通过大型L2缓存的高带宽内存交换矩阵，能够灵活地扩展到强大的多切片配置，并连接到独立的GPU基础架构。

具有连接每个切片的大型二级缓存的高带宽内存交换矩阵能够灵活地扩展到强大的多切片配置，并连接到独立的GPU基础架构。

Intel Xe HPG微架构其他特性

XeSS 超级采样

针对游戏帧数优化方面，目前NVIDIA拥有DLSS、NIS技术，AMD拥有FSR、RSR技术，这几种技术旨在降低渲染分辨率，输出高帧率画面，但原理有所不同。

而Intel的XeSS超级采样技术，同样在未发布时就引起了玩家的高度关注。

它是由机器学习通过相邻像素以及运动补偿先前帧重建子像素细节，可以帮助合成非常接近于原生超高分辨率渲染质量的图像。

整体算法采用了人工智能算法和硬件加速，以较低分辨率渲染所要求的性能水平，提高输出分辨率，提供超高清视觉效果，性能可提高2倍。

根据官方的描述，XeSS采用了与DLSS相似的时间算法，它类似于用相机拍摄长曝光，捕捉的时间越长，收集到的细节也就越多。

在多个不同帧之间，AI会通过运动矢量来跟踪对象并分析数据，并决定如何将它们结合在一起。XeSS会通过中间帧和前后帧，收集超高像素后，再经由AI网络处理，输出相对较小且清晰的画面。

和时间算法相比，NIS、FSR、RSR这类空间缩放算法则只能取一个像素点附近的低分辨率图像进行采样，然后缩放锐化。但锐化并不能从低分辨率图像中创建额外的细节，只能提高低分辨率信息中已经存在的细节对比度。

令人惊喜的是，XeSS是采用开放标准实现的。换句话说，在游戏厂商的支持下，它可以适配多家GPU广泛使用。当然，XeSS算法在Xe GPU的DP4a和XMX硬件功能下，会呈现更好的性能效果。

Deep link

Deep link可充分利用Intel CPU和GPU协同工作，完成如视频转码，直播推流等任务，编解码优势显著。Deep link并不是某种具象技术，而是多项技术的总称，下面我们来分别讲解。

Stream Assist

Stream Assist技术主要针对游戏主播，或者有直播需求的用户。在开启直播时，Stream Assist可将直播负载分载到系统中的辅助引擎，从而优化游戏性能。性能更强的独显则依旧负责游戏运算，以获得最高的帧率和协同工作效率。

另外集显负责直播的同时，还负责捕获任务(如虚拟绿屏、自动构图、清晰直播和自动捕捉游戏精彩时刻)。

需要注意的是，台式机如果想使用Stream Assist技术，前提是与12代酷睿处理器或代次更高的处理器搭配使用，另外需要带有集成显卡的处理器，后缀带有“F”的则无法使用。

超级编码、超级计算

超级编码可以让Intel平台上并行工作的多个媒体引擎(适用于看重工作效率的选定应用程序)，加速编码。从而让用户花更少的时间等待项目输出，最大限度地发挥创作动力。

而超级计算则需要用到XMX引擎，它可以利用Intel平台上的多个计算引擎和 AI 加速器(适用于看重工作效率的选定应用程序)，加速内容创作。

同样，这两项技术均需要搭载12代酷睿处理器或代次更高的处理器搭配使用，另外需要带有集成显卡的处理器。

这里着重说一下超级编码，它可以使用CPU和GPU上所有可用的媒体编码引擎，某种意义上说，可以看做双显卡共同编码。

我们此前的编码工作，无论使用CPU或者GPU，都是单线程工作。而Intel超级编码则是通过OneVPL这个跨平台的开放性框架，让CPU和GPU协同工作。

当超级编码开始工作时，一组组解码后的原始帧通过特定的API函数被交给oneVPL，进而按组被分配到不同的多媒体引擎上，拷贝到相应的内存中缓存起来。

不论每一组有多少帧，相应的集显或者独显的多媒体引擎会开始按照设定的格式编码。而OneVPL会完成后续的打包工作，把编码后的帧一组组拼接成最终视频来输出。这种并行处理，编码效率比单一显卡更加显著。

高级Xe媒体引擎

高级Xe媒体引擎带有专门AI加速、宽编解码器支持，包含H.264/AVC、H.265/HEVC、VP9以及AV1。并且得益于强大的媒体引擎，它也是全球首款支持AV1硬件编码的GPU。与软件编码相比，编码速度提高了50倍。

AV1与H.265编解码谁才是未来一直广受争议，从压缩效率来讲，AV1比最为常见的H.264编解码器高出50%，比H.265高30%。换句话说，对于相同的图像质量，AV1可以比HEVC节省多达30%的文件大小。

当然，如此强大的AV1也需要更强大的硬件来解码，即便如此，它也比HEVC需要更长的时间来解码。并且HEVC已经由AMD、NVIDIA、Intel、Apple、高通等公司的GPU/CPU支持，而AV1目前的支持是有限的。

最重要的是，AV1是完全开放没有任何授权费用的编解码器。虽然目前还没有被广泛采用，但行业内用户对其前景非常认可。

目前，包括FFMPEG、Handbrake、Adobe和XSplit都已集成了对锐炫AV1的支持。

结语：

作为Intel第一代高性能独显架构，Xe HPG微架构从硬件水准来说，显然已经达到预期，目前欠缺的只是软件方面的优化。根据Intel官方说明，刚刚发布的A770已经达到了最大的8个Render Slice成为完全体，性能的提升也是有目共睹。

当然一代架构并不能说明太多问题，我们还要看后续以Xe HPG微架构为蓝本的迭代升级效果如何，不过无论怎样，在NVIDIA和AMD两强相争多年的格局下，Intel重回高性能GPU市场，无疑会在未来几年内对市场格局带来巨大冲击。

【数据世界网】3月22日消息，微软近日宣布推出专为商业用户量身打造的Surface人工智能电脑系列，包括Surface Pro 10商用版和Surface Laptop 6商用版。这两款新品以其卓越的性能和前沿的AI技术，为商业用户带来了前所未有的体验。据数据世界了解，Surface Pro 10商用版和

【数据世界网】3月22日消息，随着春天的到来，万物复苏，人们纷纷踏春出游，享受大自然的美景。而在出游过程中，一款出色的手机无疑是记录美好时刻的得力助手。其中，三星Galaxy Z Fold5凭借其高端旗舰的地位和折叠屏的创新设计，成为了众多消费者的首选。三星Galaxy Z

【数据世界网】3月22日消息，小米公司于昨日下午14点正式发布旗下新款旗舰手机——小米Civi 4 Pro，起售价定为2999元，并已开启预售。新机以其轻薄设计成为市场焦点，小米集团多位高管对其赞赏有加，小米品牌总经理卢伟冰更是直言不讳地表示，小米Civi 4 Pro有可能是202

【数据世界网】3月22日消息，近期，Redmi与一加两大手机品牌之间的竞争愈发白热化，双方高管在社交媒体上频频展开激烈交锋。昨晚，一加旗下全新机型一加Ace 3V正式发布，一加中国区总裁李杰在发布会上宣称，这款新机的硬件配置达到了顶级水平，综合体验更是全面超越竞品

【数据世界网】3月21日消息，华为P70系列旗舰手机备受期待，尽管官方消息指出该系列要到4月才会正式发布，但已有数码博主放出风声，暗示新品即将问世。据悉，华为P70系列发布会可能在下周迎来官方宣布，届时将有多款旗舰新品亮相，预计在清明节前的4月初与广大消费者见

【数据世界网】3月21日消息，随着春天的脚步渐近，大地恢复生机，人们纷纷外出感受自然的魅力。在这样的季节里，手机成为记录美好瞬间的重要工具。三星Galaxy Z Fold5以其出色的耐用性和影像表现，成为户外爱好者的理想选择。在春日的徒步或骑行中，手机往往需要面对各

【数据世界网】3月21日消息，备受瞩目的小米Civi 4 Pro于今日下午2点正式亮相。据数据世界了解，这款新机在继承前辈优秀基因的同时，实现了性能和体验上的全面革新，成为了一款备受期待的全能选手。在外观设计上，小米Civi 4 Pro别出心裁地采用了等深微曲面屏设计，相较

【数据世界网】3月20日消息，小米手机官方近日开始为旗下全新机型——小米Civi 4 Pro进行预热宣传。据悉，该机将搭载备受瞩目的徕卡超大光圈Summilux镜头，其旗舰级的表现令人期待。传感器方面，小米Civi 4 Pro选用了光影猎人800，为用户带来超高动态范围的成像体验。徕

【数据世界网】3月19日消息，备受瞩目的小米Civi 4 Pro终于敲定发布日期，将于3月21日下午14:00与广大粉丝见面。小米官方宣称，这款新品将在性能、影像和设计三大方面实现跨越式成长，开启“潮流旗舰”新篇章，引发业界和消费者的广泛关注。据了解，小米Civi 4 Pro在筹

【数据世界网】3月19日消息，华为Mate系列作为华为手机的高端旗舰标杆，一直以来都引领着科技潮流。去年Mate60系列的发布，再次展现了华为在技术创新方面的实力。而近日，关于下一代Mate系列——Mate70的传闻与讨论逐渐升温，引发了广大消费者的广泛关注。据悉，Mate70

【数据世界网】3月18日消息，近日，科技圈掀起了一股关于华为P70系列的热议。据悉，华为内部会议中再次强调了P系列的重要性，甚至将其地位提升到了超越Mate系列的高度。尽管Mate系列有着芯片优势的光环，但P系列作为华为在影像领域的旗舰担当，肩负着重回影像巅峰的重任

【数据世界网】3月15日消息，中国家电及消费电子博览会(AWE)于3月14日盛大开幕，其中备受瞩目的全屋智能开创者云米，以“智能家居+智能家电+软件服务”的全新模式惊艳亮相。云米凭借其深厚的AI+IoT技术积累，成功打造出一系列颠覆性的全屋智能场景，引领智能家居行业迈

【数据世界网】3月14日消息，在当下社会，电子产品已不仅仅是满足人们日常需求的工具，更逐渐演变成为展现个性和品味的时尚配饰。随着消费升级的趋势，电子潮流穿搭在年轻人中迅速兴起。三星Galaxy Z Fold5，作为这一潮流的佼佼者，正以其独特的设计和前沿科技体验，引

【数据世界网】3月14日消息，荣耀旗下备受瞩目的旗舰系列Magic6将迎来新成员。继Magic6和Magic6 Pro两款机型在市场上掀起热潮后，荣耀再度发力，计划于3月18日推出Magic6至臻版和Magic6 RSR保时捷设计两款高端新机。这两款新机在上市前便已经证件齐全，备受消费者期待。

【数据世界网】3月13日消息，近日DXOMARK官方对OPPO Find X7 Ultra的影像能力进行了全面评测，最终该机以157分的优异成绩与华为Mate60 Pro+并列成为DXOMARK影像测试排行榜的冠军。DXOMARK在评测报告中指出，OPPO Find X7 Ultra在各项影像子项目测试中均表现出色，堪称全