ACROFAN

인텔 코어 i9-7900X X-시리즈 프로세서 : 특징편

기사입력 : 2017년 08월 03일 13시 51분
ACROFAN=권용만 | yongman.kwon@acrofan.com | SNS
최근 데스크톱 PC 시장에서 볼 수 있는 흥미로운 변화를 꼽자면 고급형과 보급형으로의 ‘양극화’와 함께 최근 다시금 주목받고 있는 ‘성능 경쟁’과 이에 따른 제품 구성의 변화 정도가 있을 것이다. 그리고 인텔의 하이엔드 데스크톱(HEDT) 플랫폼 역시 지금까지 몇 세대 동안 점진적으로 코어 수와 성능을 올려 왔지만, 이번 세대에 들어서는 지난 컴퓨텍스에서 발표된 새로운 브랜드 ‘X-시리즈 프로세서’와 함께 이전 세대와는 사뭇 다른 공격적인 전략을 선보이고 있다.

지금까지 몇 세대 동안, 인텔의 하이엔드 데스크톱 플랫폼은 서버, 워크스테이션용 1소켓 제온 프로세서와 플랫폼 기반으로 구성되어 왔다. 그리고 지금까지는 프로세서의 기반을 이루는 기술과 구성들에서 PC용 코어 프로세서에서 서버용 제온 프로세서까자, 하나의 아키텍처로 모든 시장에 대응한다는 전략의 연장선에 있었다. 하지만 ‘스카이레이크’ 기반의 제온 스케일러블 프로세서 제품군은 ‘워크로드 최적화’를 표방하며, 같은 기술 기반에서 출발했지만 많은 부분이 변경된, 서로 다른 아키텍처로 보일 수준에 이르렀다.

새로운 ‘X-시리즈’ 코어 프로세서에서 최상위 브랜드인 i9의 시작이자 현재 최상위 모델인 코어 i9-7900X 프로세서는, 최근 발표된 제온 스케일러블 프로세서의 ‘스카이레이크’ 아키텍처를 기반으로 한다. 하지만 같은 스카이레이크 아키텍처라도 기존 PC와는 크게 다른 기술적 특징을 갖추고 있는데, 프로세서 코어 수준에서는 새로운 캐시 구성과 AVX-512를 지원하고, 패키징 측면에서는 메시 아키텍처를 기반으로 내부 전송 성능이 개선되었다. 그리고 10코어 20쓰레드 구성의 프로세서임에도 동작 속도를 크게 끌어올린 것도 주목할 만한 부분이다.

 
▲ 코어 i9 시리즈의 시작을 알리는, 10코어 프로세서 코어 i9-7900X

인텔의 하이엔드 데스크톱 프로세서와 플랫폼은 지금까지 꽤 오랜 시간 동안 제온 브랜드의 워크스테이션, 서버용 플랫폼을 공유해 왔고, 이번 세대 또한 마찬가지다. 6코어 이상의 ‘X-시리즈’ 프로세서들은 ‘스카이레이크-X’ 마이크로아키텍처를 기반으로 하며, 이는 제온 스케일러블 프로세서의 ‘스카이레이크-SP’와 대부분의 기술적 특징을 공유한다. 이 새로운 스카이레이크 마이크로아키텍처는, 기존의 PC와 노트북 등에 사용되던 스카이레이크 아키텍처와는 완전히 다른 구성을 갖췄다.

프로세서 아키텍처 측면에서, ‘스카이레이크-SP’는 기존의 ‘스카이레이크’를 최대한 활용하면서, 데이터센터 워크로드를 위해 다양한 변화를 시도했다. 이미 제온파이를 통해 선보인 바 있는 AVX-512가 제온 프로세서에도 새롭게 적용되었으며, 캐시 구조 역시 기존 256KB L2, 2.5MB L3의 inclusive 캐시에서 1MB L2, 1.375MB L3의 non-inclusive 캐시 구성으로 바뀌었다. 이와 함께, 기존의 링버스 기반 구성은 새로운 메시(Mesh) 아키텍처로 바뀌어, 더 많은 데이터 이동 경로로 더 큰 대역폭과 경로의 유연성, 프로세서 코어 확장성을 확보했다.

이전 세대의 브로드웰(Broadwell)과 비교하면, 새로운 아키텍처에서는 더 확장된 프론트엔드와 분기예측, 디코더, 스케줄러 등이 적용되어, 이전 세대보다 약 10% 가량의 IPC 향상을 제공한다. 또한 새로운 AVX-512는 기존 AVX2보다 최대 두 배의 성능 향상을 제공할 수 있으며, AVX-512의 적용으로 AES-NI 등 암호화 관련에서의 성능도 크게 향상되었다. 이와 함께, PC로의 활용에서 중요한 의미를 부여할 수 있는 점으로는, 10코어의 i9-7900X에서도 동작 속도가 4GHz 이상에 이르고 있으며, 스피드 시프트 기술도 적용되어 반응성 측면이 상당 부분 개선되었다는 것이 있다.

 
▲ 6코어 이상의 ‘X-시리즈’ 프로세서 또한 메시 아키텍처를 기반으로 구성된다

 
▲ AVX-512의 지원은 AVX2 FMA 두 개를 묶었고, 추가 768KB 캐시는 코어 밖에 배치했다

AVX-512는 제온파이에 적용된 것과는 조금 다른 형태로, 이는 프로세서의 성격과 지원 기능에 따른 차이인 것으로 알려져 있고, 소프트웨어 작성 단계의 컴파일러 옵션 등으로 대응하게 된다. 512비트 폭의 벡터를 다룰 수 있는 AVX-512는 기존 256비트 폭의 AVX2 대비 이론적으로는 두 배의, 사이클 당 SP 연산은 64 FLOPs, DP 연산은 32 FLOPs의 성능을 낼 수 있다. 그리고 기존 스카이레이크 아키텍처를 활용하면서 AVX-512를 지원하기 위해, 기본적으로는 기존 AVX2 FMA 두 개를 합쳐 하나의 AVX-512 FMA 유닛을 구성하고 있다.

캐시 구성 또한 기존의 256KB L2/2.5MB L3 구성에서 1MB L2/1.375MB L3로 바꾸고, 동작 방식도 기존에는 L2의 내용을 L3가 모두 포함하는 inclusive 방식에서, 이제는 L2와 L3의 내용이 서로 다른 non-inclusive 형식으로 바꾸었다. 이에 캐시 용량 자체는 조금 줄었지만 성능에 대한 영향은 캐시를 쓰는 방법에 따라 달라지며, 고속의 L2 용량이 늘어남에 따라 데이터센터 가상화나 패킷 처리에는 큰 이득이 있었고, PC용 애플리케이션에서도 다소의 성능 향상이 기대된다.

메시 아키텍처는 기존의 링버스보다 캐시나 PCIe, 메모리 컨트롤러 등의 공유 자원에 접근하기 위한 거리와 지연 시간을 줄이고, 다양한 접근 경로를 통해 트래픽 분산과 대역폭 향상을 기대할 수 있게 한다. 이 메시 아키텍처와 함께 볼 것이 PCIe 컨트롤러와 메모리 컨트롤러가 블록 형태로 메시 아키텍처에 바로 연결되어 있다는 부분인데, 기존 링버스 아키텍처 때보다 결과적으로는 연결 포트가 크게 늘어난 구성이 되어, 내부 대역폭은 이전 세대보다 크게 올라갔다.

 
▲ 10코어까지와 그 이상은 다이 구성이 나뉘게 된다

플랫폼 구성에 있어, ‘X-시리즈’ 코어 프로세서는 이전 세대보다 PCIe 수는 4개 더 늘어난 최대 44레인을 제공한다. 이전 세대와 다른 점이라면 메시 아키텍처와 함께, PCIe x16 단위로 컨트롤러가 구성되어, 3개 포트에 직접 연결되어 내부 대역폭 등이 강화되었다는 부분이 있다. 또한 PCH와 연결되는 DMI 규격도 PCIe 3.0 기반의 DMI3 8GT/s 로 바뀌어, PCH의 기능 활용에서도 이전 세대보다 훨씬 여유로운 구성을 제공한다.

메모리 컨트롤러는 두 개의 컨트롤러에서 2채널을 활성화, 총 4채널에서 8개 메모리 소켓을 사용할 수 있다. 구성 자체는 이전 세대 수준을 유지하는데, 이는 메인보드 구성 등에서의 현실적 문제를 감안한 것으로도 보인다. 메모리 동작 속도는 DDR4-2666을 지원하고 있으며, 이는 현재 인텔의 PC용 플랫폼 중에서는 가장 높은 수준이고, 제온 스케일러블 프로세서에서의 최대 지원 동작 속도이기도 하다.

한편, 이번 ‘X-시리즈’ 코어 프로세서는 최대 18코어 모델까지 등장할 것으로 알려져 있는데, 이는 스카이레이크-SP에서의 HCC, LCC 다이 구성을 활용할 것으로 예상된다. 이 중 최대 10코어 구성을 지원하는 LCC 다이 기반이 먼저 선보였고, 최대 18코어의 HCC 기반 모델들이 추후에 선보일 예정으로 알려져 있다. 그리고 이 LCC 구성에서도, 이전 세대의 HEDT 프로세서 대비 ‘X-시리즈’ 코어 프로세서는 동작 속도가 크게 향상되었으며, 제온 스케일러블 프로세서 제품군에서도 이 정도의 높은 동작 속도를 가지는 제품은 찾기 어려울 정도로 특별한 존재다.

 
▲ 새로운 LGA 2066 소켓, X299 칩셋을 사용한 메인보드와 함께 사용된다

 
▲ X299 칩셋은 Z270과 기능적 구성에서 비슷한 모습을 보인다

코어 프로세서 X-시리즈는 새로운 LGA 2066 소켓 규격을 사용하며, 대응하는 칩셋은 X299다. 이 칩셋은 새로운 DMI 3.0 규격으로 프로세서와 연결되며, 최대 24개의 PCIe 레인과 14개의 USB 포트, 최대 10개의 USB 3.0 포트, 8개의 SATA3 포트 등과 함께, 칩셋 수준에서 NVMe와 옵테인 메모리 기술 지원 등을 포함한 최신 버전의 RST(Rapid Storage Technology)를 지원한다. 그리고 지원 기능적으로만 봤을 때, 이 칩셋은 Z270 칩셋의 변형 버전 정도로 보일 정도로 유사한 특징을 가졌다.

이전 세대의 X99와 비교하면, DMI 3.0의 적용과 제공 PCIe 레인의 증가, USB 3.0 지원 확장 등이 눈에 띈다. 또한 스토리지 지원에서도 단일 컨트롤러에서 8개의 SATA 6Gbps 인터페이스와 RAID 구성을 지원하는데, 이는 C620 시리즈의 SATA 컨트롤러와 같은 구성이기도 하다. 그리고 PCH에서의 NVMe 지원도 개선되어, RST를 통한 NVMe RAID 구성도 제공된다. 한편 6코어 이상의 코어 X-시리즈 프로세서 기반에서는 프로세서의 PCIe에 연결된 NVMe SSD의 RAID 구성이 가능한 VROC 기술도 지원되어, 더욱 높은 성능의 NVMe SSD RAID 구성도 가능하다.

이 외에도, 많은 코어를 가진, 비교적 낮은 동작 속도를 가진 프로세서의 반응성 측면을 개선하기 위한 방안으로는, 좀 더 공격적인 터보 부스트 정책 설정과 터보 부스트 맥스 3.0 기술, 스피드 시프트 기술 등이 적용되었다. 코어 i9-7900X는 기본 동작 속도 3.3GHz 정도지만, 터보 부스트 맥스 3.0에서는 2코어 정도를 최대 4.5GHz로 구동할 수 있고, 터보 부스트 정책 또한 10코어 전체를 4GHz 가량으로 사용할 수 있을 정도로 동작 속도 전반이 크게 올랐다. 또한 스피드 시프트 기술은 특정 저부하 워크로드들에서의 반응성 문제를 효율적으로 극복할 수 있게 한다.

오버클록킹 측면에서는, 메인보드들이 제공하는 방법 자체는 이전과 큰 차이가 없으며, 터보 부스트 배수 설정 혹은 베이스 클럭 조절 모두 가능하다. 하지만 안정화 등에 있어, 이미 빠듯한 수준까지 올라간 동작 속도와 10코어, 부하가 큰 AVX-512 등을 고려하면 난이도는 여전히 높은 편이다. 이미 10코어 기준 4GHz 수준까지 올라간 상황에서, 체감 가능한 수준까지의 오버클록킹 마진을 확보하기는 쉽지 않아 보인다. 한편 쿨러는 기존 LGA 2011, 2011-3과 같은 규격을 사용해, 새로운 규격 대응을 위해 기다릴 필요 없이 기존 솔루션을 그대로 활용하면 된다.

Copyright ⓒ Acrofan All Right Reserved



[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 권용만
Copyright(c) ACROFAN All Right Reserved