본문 바로가기
IT 소식

인텔, 4세대 제온 사파이어 래피즈 CPU 출시

by meeco.kr 2023. 1. 11.

수년간의 지연 끝에 인텔은 Intel은 4세대 제온 스캐어블 사파이어 래피즈(Xeon Scalable Sapphire Rapids)CPU를 일반 및 HBM이 적용된 Max 버전으로 정식 출시했습니다.

 

인텔의 52개의 새로운 CPU로 구성된 광범위한 포트폴리오는 작년에 출시된 AMD의 EPYC 제노아 라인업과 대결할 것입니다. 또한 Optane Persistent Memory DIMM의 마지막 라인에 대한 낮은 발표에서 미끄러졌습니다.

AMD의 칩은 단일 칩에서 최대 96개의 코어로 코어 수 선두를 유지하고 있지만, 인텔의 사파이어 래피즈 칩은 3세대 Ice Lake Xeons의 이전 피크인 40개의 코어보다 50% 향상된 최대 60개의 코어를 제공합니다. Intel은 이를 통해 이전 세대 칩에 비해 일반 컴퓨팅 성능이 53% 향상될 것이라고 주장합니다.

사파이어 래피즈는 새로운 가속 기술에 크게 의존합니다. 이 칩의 새로운 목적에 맞게 구축된 가속기 영역은 압축, 암호화, 데이터 이동 및 데이터 분석과 같은 여러 유형의 작업에서 성능을 획기적으로 향상시키도록 설계되었으며, 일반적으로 성능을 극대화하기 위해 별도의 가속기가 필요합니다. 인텔은 새로운 가속기를 사용할 때 일부 워크로드에서 이전 세대 모델에 비해 와트당 성능이 평균 2.9배 향상되었다고 주장합니다. 인텔은 또한 AI 추론 및 교육의 10배 향상과 데이터 분석 워크로드의 3배 향상을 주장합니다.

'인텔7' 프로세스를 기반으로 제공되는 인텔의 사파이어 래피즈는 PCIe 5.0, DDR5 메모리 및 CXL 1.1 인터페이스(타입 1 및 2 장치) 지원과 같은 다양한 새로운 연결 기술을 제공합니다.

 

인텔 사파이어 래피즈 제품 스택은 성능 및 메인스트림 이중 소켓 범용 모델로 세분화된 52개 모델과 액체 냉각, 단일 소켓, 네트워킹, 클라우드, HPC, 스토리지 및 HCI 시스템을 위한 특수 모델에 걸쳐 있습니다.

그런 다음 이러한 칩은 다양한 수준의 소켓 확장성, Optane 영구 메모리 지원, RAS 기능, SGX 엔클로저 용량 등을 나타내는 다양한 Max, Platinum, Gold, Silver 및 Bronze 하위 계층으로 분할됩니다.

또한 사파이어 래피즈 칩은 다양한 수의 활성화된 가속기 장치와 함께 제공되며, SKU에 따라 다릅니다. 아래에서는 다양한 유형의 가속기에 대해 살펴보겠습니다. 그러나 현재로서는 각 칩이 다양한 수의 가속기 '장치'를 활성화할 수 있으며(위의 사양 시트에 나열됨), 각 유형별로 여러 장치를 사용할 수 있습니다('장치'의 수는 '핵심'과 유사하다고 생각하십시오).

사용자는 네 가지 유형의 가속기가 모두 활성화된 경우 네 가지 장치가 모두 포함된 칩을 구입하거나, 활성화된 장치 수가 적은 더 저렴한 칩 모델을 선택한 다음 인텔 온 디맨드Intel On Demand라는 새로운 종량제 메커니즘을 통해 활성화할 수 있습니다. '+' 모델에는 기본적으로 각 유형의 가속기가 하나 이상 활성화되어 있지만, 두 가지 다른 가속기 할당이 있는 두 가지 클래스의 칩이 있습니다. 다음 섹션에서는 이러한 세부 사항을 다룹니다.

새로운 프로세서는 모두 AVX-512, DLBoost(Deep Liling Boost) 및 새로운 Advanced Matrix Extensions(AMX) 명령을 지원하며, 후자는 '타일'이라는 새로운 2차원 레지스터 세트를 사용하여 AI 워크로드의 폭발적인 성능 향상을 제공합니다 인텔의 AMX 구현은 주로 AI 훈련 및 추론 작업의 성능을 향상시키는 데 사용될 것입니다.

이전과 마찬가지로 인텔 4세대 제온 스캐어블 플랫폼은 1, 2, 4 및 8 소켓 구성을 지원하는 반면 AMD의 Gena는 2 소켓으로만 확장할 수 있습니다. AMD는 최대 128개의 PCIe 5.0 레인을 제공하는 PCIe 연결 옵션에서 선두를 달리고 있으며, 사파이어 래피즈는 80개의 PCIe 5.0 레인을 제공합니다.

사파이어 래피즈는 최대 1.5도 지원합니다TB의 DDR5-4800 메모리는 소켓당 8개 채널에 분산되어 있으며, AMD의 Gena는 12개 채널에 걸쳐 최대 6TB의 DDR5-4800 메모리를 지원합니다. Intel은 DDR5-4400에서 2DPC(채널당 DIMM) 구성을 사양한 반면, AMD는 2DPC 전송 속도의 적격성을 완료하지 않았습니다(이 회사는 이번 분기에 2DPC 사양을 출시할 예정입니다).

사파이어 래피즈 프로세서는 8코어 모델부터 60코어까지 다양하며 가격은 415달러에서 8490H는 17,000달러로 최고가를 기록합니다. 대표적인 제온 스캐어블 Platinum 8490H는 60개의 코어와 120개의 스레드를 가지고 있으며, 네 가지 액셀러레이터 유형이 모두 완전히 활성화되어 있습니다. 이 칩은 또한 112.5MB의 L3 캐시와 350W TDP 등급을 가지고 있습니다. 350W 정격은 인텔의 이전 세대 Ice Lake Xeon 시리즈의 280W 피크보다 훨씬 높지만, 성능 향상에 대한 끊임없는 요구로 인해 업계는 전반적으로 더 높은 한계에 다다르고 있습니다. 예를 들어, AMD의 제노바는 96 코어 모델의 경우에도 비슷한 360W TDP를 사용하며, 400W 칩으로 구성할 수 있습니다. 사파이어 래피드는 120W에서 350W 사이입니다.

8490H는 유일한 60코어 모델이며 모든 가속 엔진이 활성화된 상태에서만 사용할 수 있습니다. 56-코어 플래티넘 8480+로 돌아가면 10,710달러가 들지만 각 유형의 가속 장치 중 하나만 활성화됩니다. 이 프로세서는 3.8GHz 부스트 클럭, 35W TDP 및 105MB의 L3 캐시를 갖추고 있습니다.

 

인텔의 새로운 온다이 가속기는 사파이어 래피즈 프로세서의 핵심적인 새로운 구성 요소입니다. 위에서 언급한 바와 같이 고객은 모든 가속기 옵션이 활성화된 상태에서 칩을 구입하거나 Intel On Demand 서비스를 통해 필요에 따라 가속기 라이센스를 구입할 수 있는 저렴한 모델을 선택할 수 있습니다. 모든 칩에 동일한 가속기 옵션이 있는 것은 아닙니다. 이에 대해서는 아래에서 설명하겠습니다.

인텔은 아직 액셀러레이터에 대한 가격 가이드를 제공하지 않았지만 라이센스는 서버 OEM을 통해 제공되며 소프트웨어 및 라이센싱 API를 통해 활성화됩니다. 전체 라이센스를 직접 구입하는 대신 사용량 측정 기능이 있는 종량제 기능을 선택하여 사용하는 서비스의 양을 측정할 수도 있습니다.

이 서비스의 배경에는 고객이 필요한 기능만 활성화하고 비용을 지불할 수 있도록 하며, 새 서버나 프로세서를 구입할 필요가 없는 미래의 업그레이드 경로를 제공하는 것이 있습니다. 대신, 고객은 성능을 향상시키기 위해 가속 엔진을 사용할 수 있습니다. 이를 통해 Intel과 파트너는 동일한 기능의 실리콘에서 여러 유형의 SKU를 조각할 수 있으므로 공급망을 단순화하고 비용을 절감할 수 있습니다.

이러한 기능은 고정 기능 가속기를 프로세서 다이에 장착한 인텔의 오랜 역사를 나타냅니다. 그럼에도 불구하고, 사파이어 래피즈 장치는 전체 성능 기능을 추출하는 소프트웨어 지원이 필요합니다. 인텔은 이미 여러 소프트웨어 공급자와 협력하여 광범위한 응용 프로그램을 지원하고 있으며, 그 중 많은 부분은 위의 앨범에서 볼 수 있습니다.

인텔은 사파이어 래피즈와 함께 사용할 수 있는 네 가지 유형의 가속기를 제공합니다. DSA(Data Streaming Accelerator)는 데이터 복사 및 데이터 변환 작업의 CPU를 오프로드하여 데이터 이동을 개선합니다. DLB(Dynamic Load Balancer) 가속기는 패킷 우선 순위를 제공하고 시스템 로드가 변동할 때 CPU 코어 전체에서 네트워크 트래픽의 균형을 동적으로 조정합니다.

인텔은 또한 분석 성능을 가속화하고 CPU 코어를 오프로드하여 데이터베이스 쿼리 처리량 및 기타 기능을 향상시키는 IAA(In-Memory Analytics Accelerator)도 갖추고 있습니다.

인텔은 또한 칩셋에 상주하던 퀵 어시스트 기술(QAT) 가속기를 CPU에 탑재했습니다. 이 하드웨어 오프로드 가속기는 암호화 및 압축/압축 해제 성능을 향상시킵니다. 인텔은 꽤 오랫동안 QAT 가속기를 사용해 왔기 때문에 이 기술은 이미 광범위한 소프트웨어 지원을 받고 있습니다.

사파이어 래피즈 프로세서는 SKU 표에 나열된 것처럼 두 가지 유형의 설계(Die Chops)로 구성됩니다. XCC 칩은 총 4개의 다이로 구성되며, 각 다이에는 각 가속기(IAA, QAT, DSA, DLB) 중 하나가 있습니다. 즉, 이러한 칩에서 각 유형의 가속기를 최대 4개까지 활성화할 수 있습니다(예: 4 IAA, 4 QAT, 4 DSA, 4 DLB).

반면, 일부 칩은 IAA 및 DSA 가속기 1개와 QAT 및 DLB 가속기 2개만 함께 제공되는 단일 MCC 다이를 사용합니다. 즉, 주문형 기능을 통해 QAT 및 DLB 가속기 2개와 IAA 및 DSA 가속기 1개만 활성화할 수 있습니다.

728x90