ACROFAN

인텔 코어 i9-7960X X-시리즈 프로세서

기사입력 : 2017년 12월 04일 11시 51분
ACROFAN=권용만 | yongman.kwon@acrofan.com | SNS
꽤 오래 전의 일이 된 ‘싱글 코어’ 시대에 뛰어난 프로세서의 조건은 ‘높은 IPC와 동작속도’로 요약되었지만, ‘멀티 코어’ 시대에 이르러서 뛰어난 프로세서의 조건은 ‘더 많은 코어’라는 조건이 추가되었다. 하지만 이 ‘더 많은 코어’라는 것이 막상 체감으로 느껴지기까지는 꽤 오랜 시간을 필요로 했는데, 더 많은 코어가 생산성 향상으로 증명될 수 있는 서버나 워크스테이션에서는 가치를 증명하기 어렵지 않았지만, PC에서는 그렇지 않았기 때문이기도 하다.

얼마 전까지만 해도, PC와 워크스테이션 모두에서 6코어 이상의 영역은 하이엔드 플랫폼의 영역이었고, 그나마도 1소켓급 플랫폼과 프로세서에서 사용할 수 있었던 한계는 10코어 정도였다. 그 이상의 코어 수를 가진 프로세서는 2소켓 급 이상의 제온 E5 시리즈 프로세서 이상에서나 찾을 수 있었는데, 물론 이를 하이엔드 급 1소켓 플랫폼과 함께 조합할 수도 있긴 했지만 흔하게 볼 수 있는 것은 아니었다.

인텔이 새롭게 선보인 ‘코어 i9’ 브랜드, 그리고 ‘코어 X-시리즈’ 프로세서 제품군은 이전에는 감히 상상하기도 힘들었을 정도의 전략적 변화가 보인다. 가장 큰 변화는 역시 플랫폼에서 제공할 수 있는 ‘코어 수’일 텐데, 기존 플래그십의 10개를 훌쩍 넘는 최대 18개 코어의 프로세서가 존재한다. 코어 i9-7960X 또한 기존에는 2소켓 워크스테이션 급에서나 생각해 봄 직했던 16코어 32쓰레드를 하나의 프로세서로 제공해, 1소켓 급 플랫폼에서 ‘멀티’를 넘어선 ‘메가 태스킹’ 환경에서 뚜렷한 강점을 가진 것이 특징이다.

 
▲ 기존의 10코어를 훌쩍 넘는 구성의 16코어 32쓰레드를 갖춘 코어 i9-7960X X-시리즈 프로세서

잘 알려져 있듯이, 6코어 이상의 ‘코어 X-시리즈’ 프로세서는 ‘스카이레이크-SP’ 아키텍처 기반의 ‘제온 스케일러블 프로세서’와 기술적 특징을 상당 부분 공유하며, 소켓과 플랫폼은 1소켓급 워크스테이션용 ‘제온 W’ 시리즈 프로세서와 공유한다. 그리고 이 프로세서에 사용된 ‘스카이레이크’ 아키텍처는 기존의 PC와 노트북용 플랫폼에 사용된 동명의 아키텍처와는 꽤 다른 모습을 가지는데, 프로세서 코어 아키텍처는 공유하지만 그 이외에 캐시 패키징이나 코어간 연결 등에서 모두 새로운 기술이 적용되고 있고, AVX-512 명령어의 지원 또한 차별점으로 꼽힌다.

이 프로세서의 기반이 되는 ‘스카이레이크-SP’ 마이크로아키텍처는 기존 스카이레이크 아키텍처를 최대한 활용하면서 새로운 특징을 담기 위한 독특한 점들을 찾을 수 있다. 원래 코어당 256KB였던 L2 캐시에 코어 외부의 768KB 캐시를 결합, 코어당 1MB L2 캐시를 구성한 점이나, AVX2 FMA 유닛 두 개를 묶어서 하나의 AVX-512 유닛을 구성하고, 추가 AVX-512 유닛을 외부에서 연결하는 구성 등이 대표적이다. 또한 코어와 여타 구성 요소들의 연결에도 기존의 링버스 대신 메쉬(Mesh) 아키텍처를 통해, 내부 연결의 유연성을 확보한 것도 큰 변화다.

플랫폼 구성에서도, 코어 X-시리즈 프로세서는 최대 44레인의 PCIe와 쿼드 채널 DDR4-2666 메모리 컨트롤러를 갖춰, 메인스트림 급 플랫폼 대비 PCIe 에서는 3배 가깝게, 메모리는 두 배 가까운 확장성과 성능을 제공한다. 함께 사용되는 X299 칩셋 또한 하이엔드 데스크톱 플랫폼에 걸맞는 최신 기술들과 넉넉한 확장성이 모두 확보되어, 이전 세대 플랫폼에서의 아쉬움을 거의 털어낸 것도 특징이다. X299 칩셋은 이전 세대의 X99 칩셋 대비, DMI3 기반의 확장된 대역폭을 바탕으로 더 많은 HSIO 레인을 확보하고, 이를 기반으로 해 다양한 부가 기능들을 제공한다.

 
▲ ‘코어 i9’ X-시리즈 프로세서의 특별함이라면 12코어 이상의 HCC 다이 투입일 것 (자료제공: Intel)

이번 ‘코어 X-시리즈’ 프로세서 제품군에서의 가장 큰 특징은 ‘최대 18코어’일 것이다. 처음 발표되었을 때 나올 법한 의문인 ‘왜 18코어인가’ 에 대한 답은, 인텔이 지금까지는 1소켓급 플랫폼에 투입하지 않던, 최신 제온 프로세서의 HCC급 다이를 투입했기 때문으로 정리된다. 제온 스케일러블 프로세서의 ‘스카이레이크-SP’ 다이 구성에서, 10코어 급까지는 LCC, 18코어까지는 HCC, 그리고 28코어의 풀 구성까지는 XCC로 구분되는데, 지금까지는 1소켓 플랫폼에는 LCC 급만 투입했지만 이번 세대에서는 HCC 급의 구성까지 투입해, 최대 18코어 구성이 선보이게 된 것이다.

지금까지 10코어 이상의 구성을 얻으려면 워크스테이션이나 서버 플랫폼을 기반으로 하는 시스템을 꾸려야 했는데, 이는 비용 이상의 난감한 운영 난이도를 선사하기도 했다. 메모리 규격의 문제는 물론이고, 두 개의 프로세서 구성까지 가면 메모리와 PCIe 구성도 프로세서 당 연결 배치 등을 잘 따져야 하기도 했다. 만만치 않은 풋프린트와 전력 소비량, 일반 PC 부품들과의 난감한 호환성, 막막한 부가 기능 같은 것은 말할 필요도 없을 정도다. 게다가 제온 프로세서는 운영 안정성 중심의 설정으로, 동작 속도도 꽤 낮게 설정되는 특징을 보인다.

이에, 12코어 이상의 HCC급 다이를 사용하는 코어 X-시리즈 프로세서는, 1,000달러가 훌쩍 넘는 가격이 부담스럽게 보이긴 하지만, 시스템 구성 전체를 생각하면 하이엔드와 워크스테이션 급 사용자에게는 꽤 설득력 있는, 높은 수준의 ‘비용 효율’을 제공하기도 한다. 여기에 PC 사용자에게는 친숙한 하드웨어들에 대한 호환성과, 난이도가 쉽지는 않지만 오버클록킹이 가능한 플랫폼이라는 것, 그리고 이전 세대보다 코어 당 비용이 크게 줄어들었다는 점 등은 하이엔드 데스크톱 플랫폼을 선호하는 사용자들에게 현실적으로 더욱 각별한 의미로 다가올 것으로 기대된다.

 
▲ 12코어 이상에서는 TDP 마진이 거의 없어, 코어 수 변화에 따른 추이가 뚜렷하게 보인다 (출처: Intel.com)

한편 이전 세대보다 코어 수가 크게 늘어난 플래그십 급 PC용 프로세서가 가진 과제는, 얼마나 동작 속도를 끌어올릴 수 있는가가 된다. PC 환경에서는 코어 수와 동작 속도의 ‘균형’ 측면이 사용자의 체감 성능에 큰 영향을 미치며, 이 덕분에 같은 코어 수에서도 하이엔드 데스크톱 프로세서들은 제온 브랜드의 프로세서보다 언제나 동작 속도가 높게 설정되어 온 바 있다. 그리고 새로운 플래그십 급 프로세서 또한, 코어가 늘어났음에도 동작 속도를 최대한 높여 놓지 않으면 실제 사용자 입장에서는 만족도가 꽤 떨어지게 될 수밖에 없다.

이에 10코어 급의 i9-7900X 까지는 140W TDP에서도 꽤 높은 동작 속도를 유지했지만, 12코어 이상부터는 TDP가 높아지지만 동작 속도는 점차 떨어지는 모습을 확인할 수 있다. 또한 제한된 TDP에서 최대한의 동작 속도를 확보하기 위한 방법으로, 프로세서 동작 속도에 AVX, AVX-512 부하에 대응하는 오프셋 설정이 있어, 다양한 환경에서 최대한 성능을 짜낼 수 있도록 한 것도 특징이다. 이에 코어 i9-7960X 프로세서는 기본 동작 속도 2.8GHz, 터보 부스트 시 단일 코어의 최대 동작 속도는 4.4GHz 정도고, AVX-512 풀로드 시 동작 속도는 3.2GHz 정도를 보이게 된다.

한편 더 많은 코어를 가졌음에도 TDP 제약 덕분에 동작 속도가 떨어지게 되면, 더 많은 코어에서 오는 멀티쓰레드 성능 향상 효과도 다소 빛이 바래게 된다. 예를 들어, AVX-512 풀로드에서 10코어의 코어 i9-7900X가 4GHz로 동작할 때를 기준으로 하면, 3.2GHz 정도로 동작하는 16코어의 i9-7960X는 코어 수가 60% 더 많음에도 성능 향상 폭은 이론상 28% 정도가 되는 것이다. 이에, 아키텍처의 특성이나 사용자 상황에 따라, 멀티 코어 프로세서의 구성에서 얻을 수 있는 혜택의 크기는 달라질 수 있어, 언제나 많은 코어가 장점이라고 하기는 힘들게 된다.

 
▲ 테스트 시스템 구성

 
▲ SiSoft Sandra 2017 SP1(Processor Arithmetic) 테스트 결과, 높을수록 좋다

 
▲ SiSoft Sandra 2017 SP1(Processor Multimedia) 테스트 결과, 단위 MPix/s, 높을수록 좋다

 
▲ SiSoft Sandra 2017 SP1 (Processor Image Processing) 테스트 결과, 단위 Mpix/s, 높을수록 좋다

 
▲ SiSoft Sandra 2017 SP1(Memory Bandwidth) 테스트 결과, 단위 GB/s, 높을수록 좋다

테스트 시스템은 코어 i9-7960X X-시리즈 프로세서와 에이수스의 TUF X299 Mark2 메인보드, 8GB DDR4-2666 메모리 4개로 쿼드 채널 구성을 갖췄다. 그래픽카드는 엔비디아의 지포스 GTX 1060 6GB 모델을, 스토리지는 인텔의 120GB SSD를 사용했다. 운영체제는 테스트 당시 최신 버전의 윈도우 10 Pro 버전을 사용했고, 드라이버는 각 제조사에서 제공되는 공식 최신 버전을 사용했다. 메인보드의 프로세서 설정은, 프로세서의 기본 프로파일을 반영하도록 설정되었다.

프로세서의 기본 성능을 확인할 수 있는 SiSoft Sandra 2017 SP1의 연산 성능 테스트 결과에서, 코어 i9-7960X는 i9-7900X보다 40% 가량 높은 성능을 보이는 모습이다. 코어가 60% 많지만, 동작 속도에서 밀리는 모습이 이런 결과를 만들어 낸 이유이며, 사실 AVX 오프셋이 적용되기 시작하면 이런 성능 관계를 파악하는 것은 좀 더 까다로워지기도 한다. 이를 반영하는 것이 프로세서 멀티미디어 테스트인데, 성능 향상 폭은 좀 더 줄어서 30% 정도까지로 내려가고, 이는 AVX2 헤비 로드나 AVX-512 오프셋에서의 동작 속도 차이와 비슷한 결과다.

이미지 프로세싱 성능에서도, 코어 i9-7960X는 코어 i9-7900X 대비 적게는 34%, 많게는 43%까지 높은 성능을 보이고 있다. 코어 수가 60% 많은 것에 비하면 아쉬울 수도 있겠지만, 이 정도 성능의 영역은 사실 지금까지 PC 레벨에서는 거의 볼 수 없었던 영역이기도 하다. 그리고 과학 연산이나 금융 분석 등의 테스트에서도, 사용하는 명령어 셋과 부하 등에 따라 30~40% 정도의 성능 차이를 보였다. 한편, 흥미로운 점이라면 메모리 성능이 있는데, 같은 설정을 적용했음에도 7960X의 메모리 성능은 7900X보다 다소 높은 결과를 보였다.

 
▲ 3DMark 프로세서 테스트 결과, 높을수록 좋다

 
▲ Cinebench R15 테스트 결과, 높을수록 좋다

 
▲ Intel Linpack (2018.0.008) 테스트 결과, 단위 GFlops, 높을수록 좋다

 
▲ Blender 렌더링 테스트 결과, 단위 초, 낮을수록 좋다

동작 속도가 조절된 멀티 코어 프로세서의 성능 이점은 애플리케이션이 프로세서를 어떻게 쓰느냐에 따라 달라지는데, 이를 잘 보여주는 것이 3DMark의 프로세서 테스트 결과다. Firestrike의 프로세서 피직스 테스트에서, 7960X와 7900X의 성능 차이는 15% 남짓, 그리고 Time Spy의 프로세서 테스트 결과는 겨우 3% 정도밖에 나지 않는다. 이는 프로세서 테스트의 쓰레드 수가 충분하지 못해서, 늘어난 쓰레드 수로 동작 속도 차이를 극복하지 못했다는 것으로 해석할 수 있을 것이다. 반면 Time Spy Extreme에서는 쓰레드 수와 부하가 더 늘어, 37% 정도의 성능 차이를 보여 줌을 확인할 수 있다.

그래픽 렌더링을 통해 프로세서의 성능을 가늠할 수 있는 Cinebench R15에서, 7960X는 7900 대비 41% 가량 높은 성능을 기록하고 있다. 이 테스트 결과는 여러 가지 의미를 가지고 있기도 한데, 오프셋 설정이 존재하는 상황에서 이 테스트는 AVX 명령어셋의 부하가 크지 않다는 것과, 이에 따라 차등화된 오프셋 설정으로 성능을 얼마나 효율적으로 낼 수 있는지를 잘 보여준다. 한편 Blender를 통한 렌더링 테스트에서도, BMW27 샘플을 사용했을 때는 양 프로세서 간 34%의 성능 차이가 있었지만, Classroom 샘플에서는 12% 정도의 성능 차이를 확인할 수 있었다.

프로세서의 연산 성능을 확인할 수 있는 Intel Linpack 테스트는, AVX-512의 능력과 이에 따른 특성을 가장 잘 보여주는 결과이기도 하다. 7960X와 7900X 프로세서 모두 AVX-512를 사용할 때 성능 차이는 28% 정도를 나타내며, 이는 동작 속도 측면에서 예상했던 범위와 일치한다. AVX-512 오프셋에 있어, 7960X는 고부하 상황에서 AVX 활용 수준에 따라 3.2GHz 정도까지 동작 속도가 떨어지지만, 7900X는 약간의 TDP 여유 덕분에 AVX 활용 수준에 상관 없이 전체 코어 활성화 상황에서도 4GHz 정도의 동작 속도를 유지하는 설정을 기본으로 하고 있다.

 
▲ PCMark 10 테스트 결과, 높을수록 좋다

 
▲ SYSMark 2014 SE 테스트 결과, 높을수록 좋다

실제 사용 시나리오에서의 성능과 생산성을 가늠할 수 있는 PCMark 10 테스트에서는, 이 프로세서의 성격을 좀 더 명확히 확인할 수 있다. 비교적 높은 동작 속도를 갖춘 7900X와 비교할 때, 7960X는 일반적인 가벼운 부하에서는 기대만큼 성능이 잘 나오지 않는 경우도 있고, 16코어 32쓰레드를 제대로 활용할 수 있는 상황은 예상보다 많지 않다는 점을 테스트 결과에서 볼 수 있다. 전반적으로, 동작 속도와 부하 인식 등의 차이로 순발력은 떨어지고, 프로세서 중심의 워크로드에서는 우세함이 있지만 기대만큼은 아닌 정도다.

SYSMark 2014 SE의 테스트 결과에서도 유사한 모습을 확인할 수 있다. 사무 생산성 측면이나 반응성 측면에서 7960X는 7900X에 미세하게 밀리는 모습을 보이는데, 이는 동작 속도와 함께 더 많은 코어 구성에서 오는, 프로세서의 작업 부하 인식에 대한 측면도 반영되어 있을 것으로 보인다. 그리고 의외로 ‘미디어 크리에이션’ 측면에서의 격차도 크지 않은데, 프로세서의 효율을 극대화하려면 워크로드의 특성도 고려할 필요가 있을 것으로 보인다. 한편, 이 프로세서의 활용 방향을 알려주는 부분은 의외로 ‘데이터/금융 분석’ 부분이었는데, 이 부분에서 7960X는 7900X 대비 31% 높은 성능을 보였다.

 
▲ 인텔 코어 i9-7960X X-시리즈 프로세서 주요 제원

인텔 코어 i9-7960X X-시리즈 프로세서는 지금까지는 PC용 프로세서에서 기대하기 힘들었던 수준의 메가태스킹 환경을 제공하는, 어찌 보면 PC 사용자에게는 꿈에서도 보기 힘들 정도의 구성을 제공하는 프로세서이기도 하다. 그리고 지금까지 ‘하이엔드 데스크톱’ 플랫폼의 세대가 바뀔 때마다 두 개 정도씩 늘어나던 코어 수가 갑자기 이전 세대보다 두 배 가까이 많아진 것도 이번 세대에서 새롭게 만난 ‘코어 i9’ 브랜드에 각별한 의미를 부여하기도 한다. 이전 세대의 플래그십 급 구성이었던 i9-7900X는 이제 ‘코어 i9’ 브랜드의 시작을 알리는 의미가 되기도 했다.

그리고, 코어 수가 12개를 넘어가면서 ‘코어 i9’ 프로세서에서는 TDP에 따라 아주 민감하게 설정된 동작 속도의 특징도 볼 수 있다. 당장 7920X보다 7940X가 코어 수가 두 개 더 많음에도 기본 동작 속도가 높은 이유는 TDP가 165W이기 때문이며, 이보다 코어 수가 두 개 더 많은 7960X는 165W TDP 안에서 기본 동작 속도와 최대 터보 부스트 동작 속도 모두 소폭 내려간 모습이다. 그리고 이 설정은 보기보다 복잡하게 되어 있어, 제한된 TDP 안에서 다양한 상황에 최대한 폭넓게 대응하는 모습을 보이고 있기도 하다.

확실히 이 프로세서의 진가는, 멀티쓰레드를 잘 활용하는 단일 워크로드보다도, 많은 쓰레드를 기반으로 해 여러 작업을 동시 수행하는 ‘메가태스킹’에서 나온다. 그리고 최근 주목받고 있는 게이밍 등에서의 개인 방송과 미디어 워크로드 등에 있어, 이 프로세서 기반 시스템의 존재는 일반적인 메인스트림 급 데스크톱 두 대의 몫 이상을 충분히 할 수 있을 정도다. 게다가 이전 세대의 플래그십 프로세서 수준에 가까운 가격은 분명 접근하기 쉽지 않지만, 코어당 비용이나 시스템 레벨에서의 생산성 등을 따져 봤을 때는 분명 높은 경쟁력을 갖추고 있는 프로세서다.

Copyright ⓒ Acrofan All Right Reserved



[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 권용만
Copyright(c) ACROFAN All Right Reserved