개발 IT 게시판

제목[발표] 인텔 제온 6+ '클리어워터 포레스트'는 최대 288개의 코어와 576MB의 L3 캐시를 탑재하여 데이터 센터에 18A급 성능을 제공2026-01-01 05:45
작성자 Level 1
기사 원문 - https://www.tomshardware.com/pc-components/cpus/intel-xeon-6-clearwater-forest-puts-18a-in-the-data-center-with-up-to-288-cores-576-mb-of-l3-cache-new-xeon-6990e-is-30-percent-faster-per-thread-than-192-core-amd-epyc-9965-says-intel
 

인텔이 인텔 18A 아키텍처 기반의 Xeon 6+ 프로세서로 데이터 센터 시장에 복귀합니다. 올해 초 워크스테이션용 Xeon 600 칩을 공개한 후, 인텔은 E 코어만으로 구성된 Xeon 6+ 프로세서(이전에는 Clearwater Forest로 알려짐)를 통해 데이터 센터 시장에 다시 주목하고 있습니다. 플래그십 모델인 Xeon 6990E+는 컴퓨팅 밀도 향상을 위해 288개의 Darkmont 코어와 576MB의 L3 캐시를 탑재했으며, 듀얼 소켓 시스템을 지원하여 코어 수를 최대 576개까지 늘릴 수 있습니다. 인텔은 6990E+가 AMD의 192코어 Epyc 9965 대비 스레드당 평균 30% 향상된 성능과 최대 30% 향상된 전력 효율을 제공한다고 주장합니다.

이번 출시를 앞두고 클리어워터 포레스트에 대한 많은 이야기가 나왔는데, 작년에 인텔이 공개한 아키텍처에 대한 심층 분석 자료도 그중 하나입니다. 다시 한번 설명드리자면, Xeon 6+는 지난 몇 세대에 걸쳐 인텔이 프로세서 설계에 적용해 온 분산형 접근 방식의 결정체로, 다양한 노드와 패키징 기술을 조합하여 높은 코어 밀도를 달성했습니다. 실리콘 스택 최상단에는 인텔 18A 기반의 CPU 칩렛 12개가 있으며, 각 칩렛에는 하이퍼스레딩이 없는 24개의 다크몬트 E-코어가 탑재되어 있습니다. 이 칩렛들은 인텔 3 기반의 L3 캐시와 메모리를 담는 3개의 베이스 타일 위에 놓여 있습니다. 이 스택 사이에는 인텔 7 기반의 I/O 칩렛 2개가 있습니다. 이 칩렛들을 연결하는 것은 기판에 직접 내장된 실리콘 브리지인 12개의 EMIB 2.5D 타일입니다.

칩 자체를 제외하면, Xeon 6+ 칩은 LGA 4710 소켓(Sierra Forest와 동일)을 사용하는 기존 Xeon 6 플랫폼과 호환됩니다. 인텔은 싱글 소켓 및 듀얼 소켓 시스템을 모두 지원하며, 최대 12채널의 DDR5 메모리(최대 8000MT/s)와 96레인의 PCIe 5.0(CXL 64레인)을 지원합니다. 위 플랫폼 사양은 싱글 소켓 시스템 기준입니다.

이 칩에는 Intel QAT(QuickAssist Technology), DLB(Dynamic Load Balancer), DSA(Data Streaming Accelerator), IAA(In-memory Analytics Accelerator) 등 약어로 표기된 다양한 하드웨어 가속기가 탑재되어 있습니다. 플래그십 모델인 6990E+는 아키텍처에 포함된 각 유형별로 4개씩, 총 16개의 가속기를 갖추고 있습니다. 또한 Intel은 SHA-512, SM3, SM4 암호화 알고리즘을 가속화하는 명령어와 애플리케이션 격리를 위한 Intel SGX, 가상 머신 격리를 위한 Intel TDX를 통해 더욱 강력한 기밀 컴퓨팅 기능을 칩에 추가했습니다.

인텔 제온 6+ 상세 정보.
인텔 제온 6+ 상세 정보.
인텔 제온 6+ 상세 정보.
인텔 제온 6+ 상세 정보.
인텔 제온 6+ 상세 정보.
Xeon 6+ CPU에 새롭게 추가된 기능은 인텔 애플리케이션 에너지 텔레메트리(AET)입니다. 인텔에 따르면 AET는 하드웨어 기반 텔레메트리 도구로, "워크로드, 마이크로서비스, 컨테이너, VMS, 애플리케이션은 물론 필요에 따라 개별 소프트웨어 스레드 수준까지 에너지 사용량에 대한 통찰력을 제공할 수 있습니다." Xeon 6+ CPU는 AET를 지원하는 최초의 CPU이며, 인텔은 향후 데이터 센터 제공업체를 중심으로 모든 Xeon 프로세서에서 AET를 사용할 수 있도록 지원할 계획입니다.

인텔이 오랫동안 기다려온 AVX10.2가 제온 6+ 프로세서에 탑재될 것이라는 기대가 있었지만, 현실은 그렇지 않습니다. 인텔 대변인은 톰스 하드웨어와의 인터뷰에서 해당 CPU는 AVX10은 물론 AVX-512조차 지원하지 않으며, 최대 AVX2까지만 지원한다고 확인했습니다.

인텔 제온 6+ '클리어워터 포레스트' 사양

인텔은 4가지 Xeon 6+ 설계와 총 6개의 SKU를 보유하고 있으며, 최상위 두 모델은 전력 소비를 줄이기 위해 기본 속도와 모든 코어의 터보 속도가 낮게 구성된 형태로 제공되지만, 그 외 사양은 동일합니다.

개별 프로세서에 대해 자세히 알아보기 전에, 전체 제품군에 공통적으로 적용되는 몇 가지 사양이 있습니다.

- 최대 DDR5-8000 속도의 12채널 메모리
- 싱글 또는 듀얼 소켓 호환성
- 96개의 PCIe 5.0 레인, 64개의 CXL 2.0 레인, 그리고 6개의 UPI 2.0 레인
- CPU당 1024개의 Intel TDX 키
- 최대 16개의 가속기(Intel QAT, DLB, DSA 및 IAA 각각 4개씩)
- 인텔 AET

이전 세대 시에라 포레스트 칩과 비교했을 때 가장 눈에 띄는 사양은 TDP입니다. 시에라 포레스트에서 인텔은 제온 6780E의 최대 TDP를 330W로, 6710E는 205W까지 낮췄습니다. 하지만 이제 최소 TDP는 300W, 최대 TDP는 450W로, AMD EPYC 시리즈의 최고급 TDP와 더욱 유사해졌습니다. 하지만 언제나 그렇듯이 TDP는 실제 전력 소비량을 가늠하는 지표일 뿐이며, 실제 전력 소비량은 여러 요인에 따라 크게 달라질 수 있습니다.

예상대로 코어 수는 엄청나게 증가했지만, L3 캐시 용량도 마찬가지로 늘어났습니다. 6990E+는 6780E보다 5배 이상 많은 L3 캐시를 탑재하고 있습니다. 6780E와 마찬가지로 144개의 코어를 가진 6960E+조차도 L3 캐시 용량이 4배나 많습니다. 하지만 L2 캐시는 변함이 없습니다. 인텔은 4개의 코어로 구성된 클러스터당 4MB의 L2 캐시를 사용합니다. 이 캐시는 클러스터 내의 코어들이 공유하지만, 코어당 1MB의 L2 캐시로 생각할 수 있습니다.

Intel Xeon 6+ 'Clearwater Forest' 성능 및 벤치마크 결과

인텔은 새로운 플래그십 프로세서인 Xeon 6990E+를 이전 세대 인텔 칩 및 AMD의 최신 EPYC 제품군과 비교하는 다양한 벤치마크 결과를 공개했습니다. 인텔은 전반적으로 Xeon 6780E 대비 2.26배 향상된 성능과 AMD EPYC 9965 대비 스레드당 30% 향상된 성능을 제공한다고 주장합니다.

세대 차이로 인한 성능 향상부터 살펴보면, 이처럼 엄청난 성능 향상은 놀라운 일이 아닙니다. 인텔은 Xeon 6990E+를 스레드 수가 절반이고 TDP가 120W 낮은 CPU와 비교하고 있기 때문입니다. 인텔이 최신 Xeon 6+ 칩과 비교 대상으로 삼은 Xeon 6780E는 바로 이전 세대 Sierra Forest 제품군의 플래그십 모델입니다. 인텔은 평균 2.26배의 성능 향상을 주장하며, 인텔의 자체 벤치마크 결과에서도 확인할 수 있듯이 Xeon 6990E+는 인텔이 테스트한 모든 워크로드에서 Xeon 6780E보다 두 배 이상의 성능을 제공했습니다.

인텔 제온 6+ 성능 관련 주장.
인텔 제온 6+ 성능 관련 주장.
인텔 제온 6+ 성능 관련 주장.
인텔 제온 6+ 성능 관련 주장.
하지만 여기서 더 중요한 지표는 와트당 성능입니다. Xeon 6990E+는 훨씬 높은 TDP와 더 높은 컴퓨팅 밀도를 가지고 있지만, 인텔은 Stream Triad 메모리 대역폭 벤치마크에서 30% 향상, Linpack에서 최대 79% 향상 등 평균 55%의 효율성 개선을 주장합니다. 이러한 벤치마크를 위해 인텔은 듀얼 소켓 시스템과 싱글 소켓 시스템을 혼합하여 사용했으며, 각 테스트에 맞는 구성(예: 듀얼 소켓 시스템 2개 또는 싱글 소켓 시스템 2개 사용)을 적용했습니다. 정확한 구성 정보는 이 글 말미에 있는 전체 슬라이드 자료에서 확인할 수 있습니다.

지난 몇 세대에 걸쳐 AMD가 데이터 센터 시장을 장악해 온 점을 고려하면, 경쟁력 있는 성능은 더욱 중요할 수 있습니다. 인텔은 Xeon 6990E+가 EPYC 9965 대비 스레드당 평균 성능이 30% 향상되었으며, 와트당 평균 성능 또한 30% 향상되었다고 밝혔습니다. 스레드당 성능은 물론 중요하지만, 인텔은 AMD 제품과 전체 다이의 평균 성능을 비교한 데이터는 제시하지 않았습니다.

이는 전체 스레드 수 차이 때문일 가능성이 높습니다. 인텔은 제온 6990E+에 288개의 코어를 탑재한 반면, EPYC 9965는 192개의 코어를 탑재했습니다. 하지만 AMD는 동시 멀티스레딩을 사용하는 반면, 인텔은 그렇지 않습니다. 스레드당 성능 차이가 항상 전체적인 성능 우위로 이어지는 것은 아닙니다. 이는 실행하는 작업 부하에 따라 중요해질 수 있는 여러 지표 중 하나일 뿐입니다 . 인텔 벤치마크에 따르면 제온 6+는 정수 및 부동 소수점 처리량에서 약 30%, 효율성에서 약 38%의 우위를 보입니다.

인텔은 구체적인 수치를 스레드당 성능으로 제한했지만, 경쟁 제품과의 전반적인 효율성을 살짝 엿볼 수 있게 해주었습니다. 인텔은 CPU 사용률 40%에서 6990E+가 EPYC 9965보다 최대 30% 더 효율적이라고 주장합니다. 이 차트가 정확하고 왜곡된 시각화가 아니라면(물론 그럴 가능성도 있지만), 사용률이 높아질수록 효율성 차이가 훨씬 더 커지는 것을 알 수 있습니다.

인텔은 Xeon 6+와 ARM 명령어 세트 기반 설계 간의 벤치마크 결과를 제공하지 않고 있는데, 이는 중요한 비교 기준이 되고 있습니다. 최근 엔비디아의 Vera CPU에 대한 첫 번째 벤치마크 결과가 공개되었습니다 . 엔비디아는 Xeon 6+가 ARM 기반 옵션과 비교했을 때 "매우 우수한 성능을 보인다"고 밝혔습니다.



위로 스크롤