인텔

TDP : 8세대 인텔 모바일 프로세서에 대하여

2018. 3. 14. 20:51

TDP를 알아야 하나요?

컴퓨터를 구입하는 데에 있어서 TDP를 관심있게 보는 사람은 없다.

Intel은 4세대 Core 아키텍처인 Haswell 부터 Turbo Boost Technology를 도입했다. 이 때부터 TDP의 수치는 성능의 구분할 수 있는 지표가 되었다. 그래도 여전히 더 높은 스펙을 가진 제품이 더 높은 성능을 보여주었기 때문에 소비자들은 TDP에 큰 관심을 갖지 않았다.

하지만 Intel에서 8세대 Mobile Processor가 Quad Core로 출시되면서 TDP는 중요해졌다. 데스크탑, 고성능 노트북, 저전력 노트북 모두 쿼드코어인데, 여기서 성능의 차이는 TDP를 따라가기 때문이다.

TDP가 뭔가요?

TDP는 Thermal Design Power의 약자로, 열 설계 전력이라고 번역한다.
이렇게 번역하고 보니 많은 사람들이 전력이라고 착각한다. 또한 TDP의 단위에 W(watt)를 사용하니 더 착각하기 쉽다.
이런 착각이 생기는 원인은 파워의 번역이다. Power의 기본적인 뜻은 '힘'이다. 다만, 전자제품이고 사전에 전력이라는 뜻도 있으니 전력이라고 번역하기 쉽다.

실제로는 TDP는 전력과는 전혀 관계가 없다.

첫번째 이유는 열과 전력은 같은 위치에 있을 수 없다. 에너지 효율에 관한 위키피디아 문서를 보자. 에너지 효율이란 "투입한 에너지에 대해 이용할 수 있는 에너지의 비"이다.

에너지를 투입하면 에너지의 일부를 System에서 사용하고 에너지의 일부는 Loss된다. (실제로 그림처럼 효율이 높은 제품은 거의 없다.)

CPU에서 열은 일이 아닌 Loss이다. 즉, 발열량이 15W이면 전력소비는 반드시 15W를 넘어야 한다. 발열이 15W인데 전력소비가 15W라면 에너지 효율은 0이다.

그러므로 열과 전력은 비례 관계를 가질 수는 있지만 발열량이 15W라고 고정이 되면 열과 전력은 같은 공간에 있을 수 없다는 것이다.

두번째 이유는 TDP의 'Design(설계)'에 있다. 설계 전력이라고 하면 마치 15W의 전력소비를 넘지 않을 것 같다. 해당 CPU와 연결된 컴퓨터는 이 설계에 따라 15W를 제공할 수 있으면 충분한 구성을 가진 컴퓨터가 된다. 그러면 CPU는 Boost Clock을 이용할 수 없다. Boost Clock은 설계보다 더 많은 전력이 필요하기 때문이다. 아니면 CPU 내부에 Boost Clock을 이용할 때를 위해 전력을 저장하는 축전기가 있으면 된다. 반대로 열 설계라고 생각해보자. 해당 CPU와 연결된 컴퓨터는 CPU에서, 본체 내에서 15W의 열을 빼는 능력만 있으면 된다. CPU는 Boost Clock을 이용하면서 너무 많은 열이 CPU나 본체 내에 축적되면 쓰로틀링(Thermal Throttle)을 통해 열을 조절할 수 있다.

세번째는 논리가 아닌 경험적 근거이다. 필자의 CPU는 아래 라이젠의 소비전력 그래프와 거의 비슷한 수율을 가지고 있는데, Cooling 능력이 65W인 쿨러로 3.6Ghz까지 문제없이 오버클럭이 된다. 하지만 그래프를 통해 알 수 있듯이 소비전력은 130W 가까이 된다. TDP가 소비전력과 관계가 있다고 보기에는 그 차이가 크다.

그러니까 'TDP 가 15W이다' 라고 정의되었을 때, 여기서 15W는 전력이 아닌 발열량인 것이다.

자세한 내용은 TDP에 대한 위키피디아(영문)를 보자.

그러므로 TDP는 열설계전력이라고 번역하는 대신 열설계력이라고 해석해야 한다. 물론 관용적으로 열설계전력을 사용할 수 있지만, 이 단어를 보면서 전력과는 관련이 없다는 것을 상기해야 한다.

TDP가 왜 중요한가요?

그렇다면 TDP를 왜 중요하게 봐야 할까? 단순히 해석만 하자면 CPU가 15W의 열을 배출할 수 있는 컴퓨터 환경을 전제로 하는 설계했다는 것이다. 이렇게 생각하면 다른 의문도 해결된다. CPU들이 클럭이 다른데도 TDP가 같은 경우가 있는데, 그 이유는 CPU의 스펙을 나타낸 것이 아니라 이 CPU를 사용하는 데에 필요한 외부의 쿨링 능력이었기 때문이다.

아래 비교군을 보자

인텔 i5-7600은 Turbo Clock 4.1Ghz를 가지고 있다. 인텔 i7-7920HQ도 Turbo Clock 4.1Ghz를 가지고 있다. 하지만 각각 베이스클럭 3.5Ghz, 3.1Ghz로 65W, 45W이다.

인텔 i7-7920HQ는 Clock Limit 없이 TDP 35W로도 구성이 가능한데, 데스크탑 프로세서도 TDP 36W인 제품이 있다.
인텔 i7-7700T는 Turbo Clock이 3.8Ghz로 차이가 크다. 반면에 Base Clock은 2.9Ghz로 Base Clock이 3.1Ghz인 i7-7920HQ와 비슷하고 TDP도 같다.

데스크탑 프로세서와 모바일 프로세서는 타겟이 다르다. 클럭이 같다고 하여도 구성이 다르다.

그럼에도 불구하고 위 제품들에서 TDP와 Base Clock은 큰 연관이 있다는 것을 알 수 있다.

베이스 클럭은 뭔가요?

TDP에서 알 수 있듯이 '열'으로 결정한다. 하지만 데스크탑과 모바일은 조금 다르다.

데스크탑 프로세서는 메인보드 제조사가 따로 있는 경우가 대부분이다. 그리고 메인보드에 따라 성능차이가 있어서 소비자들은 메인보드에 따른 벤치마킹 결과를 참고해서 메인보드를 선택한다. 그렇기 때문에 보틍의 데스크탑 메인보드들은 Fan을 조절해서 TDP제한에 걸리지 않게끔 열을 해소한다.

노트북은 다르다. 메인보드를 노트북 제조사가 만들기 때문에 보통 메인보드가 달라지면 컴퓨터 스펙 자체가 달라진다. 완전한 비교는 어려운 것이다. RAM, SSD 등은 메인보드보다 더 컴퓨터의 성능에 영향을 미친다. 또한 노트북은 배터리가 오래가고 조용하고 가벼워야 한다. 소비자들도 데스크탑에 비해 더 낮은 성능을 감안하고서 가볍고, 조용한 노트북을 구입한다. 성능이 높으면 좋지만 노트북을 고르면서 첫번째 요소가 성능이 되지는 않는다. 그래서 보통의 노트북은 베이스 클럭으로 작동하도록 설계한다.

노트북은 베이스 클럭으로 작동한다는 것은 데스크탑 컴퓨터에 대해 상대적인 의미이다. 노트북이라고 무조건 베이스 클럭으로만 작동하는 것은 아니다. 고성능 노트북이나 쿨링이 뛰어난 노트북은 부스트 클럭으로 작동하는 시간이 길 것이고, 저소음 노트북이나 가벼운 노트북은 부스트 클럭으로 작동하는 시간이 짧을 것이다.(2019.10.29 개정)

출처 : hwbattle.com

위 사진에서 전압을 보자. 사진을 보면 클럭이 오르는데, 소비전력은 크게 오른다. 여기서 관심있게 봐야 할 것은 전압이다. 3.5Ghz까지는 전압이 같은데, 소비전력 증가량이 일정하다. 반면, 3.6Ghz부터 전압이 오르는데, 소비전력도 크게 오른다. 3.9Ghz는 전압도 크게 오른다.
소비전력은 전압에 따라 갈린다고 봐도 될 정도로 전압의 영향을 받는데, 클럭이 높아지면 그 전압도 크게 오른다.

클럭이 높아지면 전압이 크게 높아지는데, 소비전력은 전압의 제곱만큼 증가한다. Clock, 즉 일은 비례적으로 증가하는데 소비전력은 전압의 제곱만큼 증가하니, 그 만큼 에너지 효율이 떨어지고 발열량이 크게 증가하는 것이다.
그러므로 부스트 클럭을 유지한다는 것은 배터리 소모를 크게 늘리고 팬 소음도 커진다는 것이다. 이런 차이 때문에 데스크탑 프로세서는 All Core Boost 또는 Boost Clock을 보면 프로세서의 성능을 알 수 있지만, 노트북은 (용도에 따라 다르지만; 보통은) 베이스 클럭을 봐야 한다.

물론 편법으로 부스트 클럭을 유지할 수는 있다. 하지만 편법이 적용되지 않는 제품도 있고, 편법을 적용했는데도 쿨링 능력이 부족하면 클럭이 떨어질 수 있다. 수동으로 조절해서 사용하고 싶다면 충분히 알아보고 구입해야 한다.

여기까지 읽고 나면 드는 의문이 하나 있다.

그러면 베이스 클럭을 보면 되는 것 아닌가요?

그래서 재미있는 비교군을 가져왔다.

i7-7920HQ : 4 Cores, 3.1Ghz up to 4.1Ghz, TDP 45W
i7-7660U : 2 Cores, 2.5Ghz up to 4.0Ghz, TDP 15W
i7-7567U : 2 Cores, 3.5Ghz up to 4.0Ghz, TDP 28W
i7-7560U : 2 Cores, 2.4Ghz up to 3.8Ghz, TDP 15W

i5-7440HQ : 4 Cores, 2.8Ghz up to 3.8Ghz, TDP 45W
i5-7200U : 2 Cores, 2.5Ghz up to 3.1Ghz, TDP 15W

몇 개의 CPU 스펙을 가져왔다. i7끼리, i5끼리 묶었다. i7이 등급이 높지만 성능 순서는 절대 아니다.

그래서 성능 순서로 재 정렬해보면

i7-7920HQ : 4 Cores, 3.1Ghz up to 4.1Ghz, TDP 45W
i5-7440HQ : 4 Cores, 2.8Ghz up to 3.8Ghz, TDP 45W

i7-7567U : 2 Cores, 3.5Ghz up to 4.0Ghz, TDP 28W

i7-7660U : 2 Cores, 2.5Ghz up to 4.0Ghz, TDP 15W
i7-7560U : 2 Cores, 2.4Ghz up to 3.8Ghz, TDP 15W
i5-7200U : 2 Cores, 2.5Ghz up to 3.1Ghz, TDP 15W

이렇게 된다. TDP가 같은 것끼리 묶인다.

듀얼코어이면서도 베이스클럭이 굉장히 높아 TDP가 높은 제품이 있다. 좀 더 찾아보면, 쿼드코어이면서 듀얼코어보다 베이스클럭이 낮은 경우도 있다. 이러한 차이를 구분할 필요가 없는 기준이 TDP이다.

쿼드코어 저전력 모바일 프로세서는 뭐가 좋아요?

작년, AMD가 모바일 프로세서 저전력 라인에 쿼드코어를 출시했다. 그리고 인텔도 AMD의 공격적인 제품 구성에 발빠르게 새로운 제품을 내놓았다.

지금까지의 CPU는 듀얼코어 CPU보다 쿼드코어 CPU의 성능이 확실히 좋았기 때문에 AMD가 저전력 라인에 쿼드코어를 출시하니 소비자의 마음이 AMD쪽으로 기울 수밖에 없었다. 그래서 인텔이 급히 저전력 라인에 쿼드코어를 출시하게 된다.

하지만 인텔의 장점은 멀티코어가 아니다. 인텔은 코어당 성능이 굉장히 좋다. 인텔은 2013년에 출시된 하스웰도 4.5Ghz이상으로 오버클럭하는 데에 1.25V이상을 넘지 않았다. 순정 상태의 전압은 말할 것도 없다. 2017년에 출시된 Ryzen은 같은 전압으로는 3.7Ghz정도가 최선이다. 반면에 Multi Core 성능은 인텔의 장점이 아니다. 이전 글에서도 멀티코어 성능에 대해 언급했다. AMD는 비셰라부터 멀티 코어를 지원하는 프로그램에 대해서는 강한 모습을 보여줬다. 라이젠 또한 멀티코어 성능은 인텔보다 좋았다. 이런 양상은 라이젠 이후 출시 된 Intel 8세대 프로세서에서도 나타난다.

아래는 Intel i7-8700k와 AMD Ryzen 5 1600x를 비교한 표이다.

구분 Ryzen 5 1600x i7-8700k 차이
Base Clock 3.6Ghz 3.7Ghz 0.973
Boost Clock 4.0Ghz 4.7Ghz 0.851
12 Thread Clock 3.7Ghz 4.3Ghz 0.860
TDP 95W 95W 같음
Single Thread Benchmark(출처) 386 508 0.760
Multi Thread Benchmark(출처) 3374 3814 0.885
Multi Thread Ratio x8.74 x7.50 1.165
Single Thread Perf. per 1Ghz (점수/클럭) 96.5 108.1 0.90
12 Thread Perf. per 1Ghz 6core (점수/클럭) 991.9 887.0 1.12

AMD Ryzen 5 1600x와 Intel i7-8700k는 베이스 클럭을 보면 거의 비슷한 스펙인 것 같지만 사실은 그렇지 않다. 앞서 말한 것과 같이 인텔은 클럭이 높은 게 장점이다. 같은 TDP를 가지고도 실제 작동 주파수가 0.7Ghz가 높다. (데스크탑 프로세서이므로 Boost Clock을 비교한다.) 라이젠이 출시될 때는 IPC가 인텔에 거의 근접했다고 알려지기도 했었는데, AMD Ryzen 5 1600x와 Intel i7-8700k의 싱글쓰레드 벤치마킹 점수의 차이는 두 CPU의 클럭 차이보다 더 크게 나타났다. 즉, 해당 벤치에서 수행하는 연산에 대해서는 AMD의 IPC가 인텔 8세대 프로세서에 못미친다는 뜻이다. 반면 멀티코어의 점수는 그 격차가 감소했다. 단순계산(단순계산일 뿐이다. 실제로는 다를 수 있다)으로 클럭을 같게 했을 때는 라이젠이 오히려 더 높은 성능을 보여준다.

인텔은 클럭이 높을 때에 유리함에도 불구하고 클럭을 낮추고 쿼드코어를 출시했다. 클럭은 라이젠 프로세서보다 더 낮다. 모바일 라이젠의 최하위 모델인 Ryzen 3 2300u는 Base Clock이 2.0Ghz이고 Boost Clock이 3.4Ghz이다. 최상위 모델인 Ryzen 7 2700u는 Base Clock이 2.2Ghz이고 Boost Clock은 3.8Ghz이다. 인텔은 최하위 모델인 i5-8250u는 Base Clock이 1.6Ghz이고 Turbo Clock이 3.4Ghz이다. 최상위 모델인 i7-8650u는 Base Clock이 1.9Ghz이고 Turbo Clock은 4.2Ghz이다.

이번 인텔 8세대 모바일 프로세서의 장점은 Turbo Clock이다. 그리고 넓은 주파수 범위(Frequency Range)에 있다. 인텔이 지금까지 Dual Core를 판매한 것은 장점이 있기 때문이다. 멀티 쓰레드를 지원하지 않는 프로그램에서는 클럭이 높은 게 유리하기 때문이다. 아직까지도 멀티코어를 지원하지 않는 프로그램이 있는데, 그런 프로그램에서 3.8Ghz이상을 요하는 프로그램도 봤다. 인텔은 Turbo Clock을 4.0Ghz로 만들었다. 멀티 쓰레드를 지원하지 않는 프로그램에서 인텔의 장점을 살려 4.0Ghz로 작동하면서, 높은 클럭으로 생긴 열을 낮은 베이스 클럭으로 보상할 수 있다. 클럭이 낮으면 열효율이 증가하기 때문에 성능을 더 높게 오래 유지할 수 있다.
라이젠은 반대로 베이스 클럭을 높여서 멀티코어를 지원하는 프로그램에 대해 높은 성능을 내도록 구성했다.

HQ모델을 기대하지는 말자

이 글을 통해 꼭 하고 싶었던 말인데, 열이 제대로 해소된다면 분명히 i5-8250u는 쿼드코어의 퍼포먼스를 보여줄 것이다. 컴퓨터 부팅, 웹서핑, 문서편집 등은 쿼드코어의 퍼포먼스를 보여줄 것이다. 하지만 보통의 쿼드코어 시스템에서 기대하는 동영상 렌더링, 프로그램 컴파일, 게임 플레이는 계속적으로 발열이 생기게 되고 TDP에 따라 클럭이 감소할 것이다. 아이러니(?) 하게도 i5-8250u는 쿼드코어의 퍼포먼스를 보여줄 것이지만, 쿼드코어에서만 원활하게 이용 가능한 프로그램을 구동할 때는 쿼드코어의 성능을 기대할 수 없다. 웹서핑이나 간단한 문서작업은 게이밍 PC만큼 빨라질 것이지만, 게임은 할 수 없다. 그러니 고성능의 노트북이 필요한 것이라면 저전력 제품을 구입하진 않아야 한다.

라이젠, 어떤 걸 봐야 할까?

2017. 3. 23. 00:46

ㅎㅎㅎㅎ 글쓰기를 좋아해서 블로그를 시작했는데, 막상 글 하나에 6시간 이상 투자하다 보니 꾸준한 업로드가 어렵네요
블로그 컨셉은 새로운 IT 소식에 대해 여러 매체들의 정보를 한 곳에서 볼 수 있게 하려는 것이었​는데요...
새 IT 소식이 올라오는 빈도는 빠르고, 글쓰기가 느린 저로서는 감당이 되지 않네요.
이 글도 내용 준비 외에 초안 작성만 5시간 정도 썼네요.
임시 저장 해놓고 글 마무리나 다듬기, 추가 내용 보충도 해서 작성한 글입니다...ㅎㅎ

라이젠, 반응

요즘 라이젠이 출시되면서 CPU쪽이 떠들썩 합니다. 긍정적인 반응도 있고 부정적인 반응도 있습니다.
라이젠 후기들을 보면 "이거 사도 되는건가..."하는 생각이 들게 하는 내용도 있습니다.
그 오해와 진실을 후기로 파헤쳐보려고 합니다.

라이젠의 장점은 8코어에 있습니다.
8코어는 멀티 쓰레딩을 지원하는 단일 프로그램에서 성능 향상이 생깁니다.
그리고 8코어는 멀티 태스킹이 훨씬 부드럽습니다.

또한 라이젠은 인공지능 기술인 SenseMI를 통해 더 조용하고 빠른 연산이 가능해졌습니다.

마지막으로 아직은 소프트웨어적인 최적화가 덜 되어있는 라이젠 무작정 따라하는 최적화를 준비했습니다.

멀티쓰레딩

많은 분들이 8코어로 멀티태스킹을 생각할 때 라이젠 8 단일작업 멀티쓰레딩 성능에 대해 얘기해보려고 합니다.

AMD에서 2011년 CMT구조의 CPU가 출시될 때, 제가 우려했던 부분은 멀티쓰레딩 게임이 없다는 것이었습니다.
SMT는 이론적으로는 싱글 쓰레드 프로그램에서도 성능하락이 없었고, 멀티 쓰레드를 지원하면 성능이 향상되는 구조였습니다.

SMT는 하나의 코어에 디코더를 두개 두는 방식입니다.

CPU는 원래 하나의 쓰레드만 처리할 수 있습니다. 하나의 코어로 여러 개의 쓰레드를 처리하려면 여러 개의 쓰레드를 굉장히 짧은 순간동안 바꿔가며 연산해야 합니다. 이게 우리가 컴퓨터를 하면서 보는 멀티 태스킹입니다.

그런데, 이 과정에서 코어가 연산하지 않는 순간이 생깁니다. 이 때, 디코더를 하나 더 두면, 코어가 연산하지 않는 순간을 줄일 수 있습니다. 이론 상으로는 성능은 감소하지 않습니다.

반면, CMT는 멀티 쓰레드 프로그램에서는 성능향상이 컸지만, 싱글 쓰레드 프로그램에서는 성능하락이 있는 구조였습니다.
때문에 8코어라고 홍보를 했지만, 실제로는 인텔의 듀얼코어에도 못미치는 벤치마킹 결과가 나타났습니다.

이후로도 몇년이 지나도록 반응이 없다가, 2016년 오버워치가 출시되면서 갑자기 비셰라가 업청난 상승세를 타게 됩니다.
8쓰레드를 지원하니 10만원대 CPU가 i5를 앞서는 오버워치 후기가 나왔기 때문입니다.

비셰라는 2013년에 출시된 CPU입니다. 그런데 3년 뒤, 놀랍게도 오버워치 출시 이후 이 CPU가 다나와 추천 피시에 사용됩니다.

이러한 역사는 라이젠에서도 우려되는 부분입니다.
지금까지는 인텔이나 AMD나 8쓰레드 CPU가 주력이었고, 지금의 프로그램은 그에 맞춰서 프로그래밍 되어 있습니다.
그래서 라이젠이 비셰라와 같은 길을 걸을 수 있는 우려가 생기는 겁니다.

그렇다면 우선 짚고 넘어가야 할 부분은, 흔히 벤치마킹 프로그램에서 테스트 하는 16쓰레드나 싱글 쓰레드의 퍼포먼스가 아니라 그 사이의 프로그램의 퍼포먼스 입니다.
멀티 쓰레드 프로그램이지만, 16쓰레드는 아니어서 라이젠의 일부 코어만 활용하는 프로그램의 퍼포먼스를 봐야 합니다.

이게 실제로 사용자가 느끼는 퍼포먼스가 될 것입니다.

인텔의 주력제품인 i7은 4C 8T CPU입니다. 라이젠에 비해 클럭이 높기 때문에 싱글코어 퍼포먼스는 더 좋은 편입니다.
라이젠은 현재 비슷한 가격으로 8C 16T CPU를 제시합니다. 클럭이 낮아서 싱글코어 퍼포먼스는 떨어집니다.

그러면 8쓰레드 게임에서는 라이젠은 i7을 이길 수 없는걸까??
정답은 아니요 입니다.

8개 쓰레드의 프로그램을 8개의 물리코어로 처리하면 같은 8 쓰레드를 사용하더라도 성능이 더 높게 나타납니다.

American Truck Simulator 게임이 CPU의존도가 높아서 이 게임으로 보여주려고 합니다.

Windows 의 Power Plan이 균형 조정일 때

3개의 물리코어가 활성 상태입니다. 6개의 쓰레드를 사용하고 있구요.
전체 CPU이용률은 16%입니다.
130FPS가 나옵니다. 차량이 없어서 프레임 편차는 1~2입니다.

Windows 의 Power Plan이 고성능일 때

코어파킹이 꺼집니다. 코어 0,3,5,7,9,15. 즉, 6개의 쓰레드를 사용하고 있습니다.
차이점이라면 서로 다른 물리코어를 가리켜서 6개의 코어가 활성 상태입니다.
그리고 활성 상태인 물리코어의 가상코어는 코어 1을 제외하고는 연산하고 있지 않습니다.
전체 이용률은 15%입니다.

쓰레드 분배가 고르지 않고 코어 0과 15를 특히 많이 사용하고 있습니다.
155FPS가 나옵니다. 마찬가지로 차량이 없어서 프레임 편차는 1~2입니다.

놀랍게도 6개의 물리코어를 사용할 때 약 20%의 성능 향상이 생깁니다.
고성능 파워 플랜에서 더 높은 성능을 보여줍니다.

연산에 사용되는 쓰레드와 이용률은 같은데 활성 물리 코어만큼 성능이 향상되는 것을 볼 수 있습니다.
같은 양의 연산을 하더라도 물리코어를 사용한다면 6개의 쓰레드를 동시에 처리하게 됩니다.

반면, 같은 양의 연산에 있어 가상코어를 사용한다면 6개의 쓰레드를 "동시에" 처리하는 건 아닙니다. (상단의 SMT설명 참고)
그 외에도 SMT는 캐시와, 버스를 공유하기 때문에 병목의 가능성이 있습니다.
그래서 멀티쓰레드 프로그램이라면 가능한 한 물리코어가 많이 활성화 되는 것이 성능 향상에 도움이 됩니다.
즉, 물리 코어에 쓰레드를 분배하는 것이 성능 향상에 도움이 되는 것입니다.

i7의 경우에도 코어파킹이 작동한다면 4쓰레드 프로그램을 이용할 때 i5보다 성능이 떨어지는 결과가 나타나기도 합니다.

참고 글 1

4세대 i7의 글에도 게이밍에는 HT를 끄는 것을 추천하는 댓글이 많습니다.

그리고 코어파킹과의 이슈에 대한 언급도 이 글에 있습니다.

참고 글 2

여기서는 6700에서도 HT를 켜면 게임 성능이 감소한다고 합니다.

그래서 i7을 위해 8쓰레드 게임을 만들었는데, 이게 왠걸... 비셰라가 갑자기 떠버린 겁니다...

라이젠과 같은 8C 16T CPU에서는 16쓰레드 프로그램이면 좋겠지만, 대부분 게임은 아직 16쓰레드까지는 지원하지 않습니다.
그렇다고 SMT를 끄자니 16쓰레드 프로그램에서는 SMT의 성능이 증가하는 게 뚜렷하게 보입니다.
그래서 게임의 쓰레드를 물리코어에 우선 할당할 필요가 있습니다.

글 하단에서 무작정 따라하는 최적화를 확인하세요.

AMD가 CMT를 버리고 SMT로 전향하면서 멀티 쓰레드를 조금 내려놓고 싱글 쓰레드 퍼포먼스도 챙기는 모습을 보입니다.
하지만 SMT구조에서도 AMD는 멀티 쓰레딩에 강점을 가지고 있습니다.

AMD는 멀티 쓰레드가 미래의 중요한 컴퓨터 기술이 될 것을 강조하는 듯합니다.

출처 : 다나와

1700x는 3.4Ghz up to 3.8Ghz이고
6900k은 3.2Ghz이고 up to 3.7Ghz입니다.
그런데 이 벤치 결과는 상당히 인상적입니다.

라이젠이 싱글 쓰레드에서는 4% 밀리는데, 멀티 쓰레드는 40%에 가까운 차이로 압도하고 있습니다.

출처 : guru3d.com

이러한 양상은 CPU-Z에서도 확인 가능합니다. CPU-Z는 Multi Thread Ratio라는 값이 있습니다.
Multi Thread Ratio는 (멀티쓰레드 점수) / (싱글 쓰레드 점수)의 결과입니다.

즉, 멀티쓰레드 점수가 싱글 쓰레드 점수에 비해 높을수록 Multi Thread Ratio는 증가합니다.
그리고 Multi Thread Ratio가 증가하면 멀티코어 효율이 증가하는 것입니다.

같은 8C 16T인 Intel Core i7 6800K는 Ratio가 7.27입니다.
AMD Ryzen 7 1800x는 Ratio가 8.88입니다.

인텔은 물리코어가 8개임에도 불구하고 8배 조차도 달성하지 못합니다.
하지만 AMD는 8배를 넘는 결과가 나타납니다.

비셰라와 마찬가지로, 쓰레드가 많은 게임이 출시되면 라이젠은 빛을 발할겁니다.

비셰라와 다르게 라이젠은 16개 이상의 쓰레드를 이용하는 게임이 나오면 경쟁 제품을 압도할 것입니다.

멀티태스킹

멀티 코어라고 하면 많은 사람들이 결국은 멀티 태스킹을 떠올리게 됩니다.

라이젠 덕에 8코어 CPU가 비교적 만만한 가격대로 내려오면서 프로그래머나 영상, 디자인쪽이 아닌 게이머들의 관심을 받기 시작했습니다.

그런데 대부분 8코어가 클럭이 낮아서 게임에서 약하다는 결과가 나오면서 오히려 부정적인 인식이 생겼습니다.

"어차피 게임하면서 다른거 하는 사람 없다"라는 반응이 꽤 많이 보입니다.

저도 4C 8T제품을 사용할 때는 같은 생각을 가지고 있었습니다. 왜 게임을 하면서 다른 걸 보려고 하는걸까??

저는 144Hz 모니터를 씁니다. 게다가 민감해서 130FPS도 화면이 밀리거나 끊기는 게 느껴지고, 랭크전에서는 짜증날 정도로 민감한 부분이라 멀티태스킹은 거의 안했습니다.

그런데 8코어가 생기니 게임하면서도, 144FPS를 유지하면서도 다른 작업이 가능해지니 다른 것을 보게 됩니다.

라이젠 사고 나서 가끔은 게임을 두개 켜기도 하고, 친구 방송이나 유튜브를 재생하면서 게임을 하기도 합니다.

프레임 드랍이 없기 때문입니다.

게임 하면서 다른 걸 보지 않았던 게 아니라 게임을 하면서 다른 걸 보지 못했던 겁니다.

그래서 라이젠이 멀티 태스킹에 얼마나 강한지 보여주려고 합니다.

저는 영상처럼 높은 사양을 요구하는 멀티 태스킹은 하지 않습니다.

다만 이러한 성능 상의 여유 덕분에 멀티 태스킹에 더 이상 부담을 느끼지 않게 되었다는 것을 보여주고 싶습니다.

-------------------------------- 녹화 영상 --------------------------------

-----------------------------------------------------------------------------

이 영상은 디스플레이 녹화와 영상 재생을 CPU로 처리했을 때와 GPU로 처리했을 때의 차이를 보여줍니다.

먼저 CPU로 처리하면서 오버워치 프레임을 확인하고, 'GPU로 처리하는 것'을 녹화한 영상을 재생하면서 설명을 진행합니다.

영상 처리를 GPU로 할 경우 최대 143FPS가 나옵니다.

이 때 CPU사용률은 53%입니다. 한타 때는 80FPS까지 떨어질 수 있습니다.

영상 처리를 CPU로 할 경우 최대 254FPS가 나옵니다.

이 때 CPU사용률은 84%입니다. 한타 때에도 최소 120FPS보장됩니다.

같은 상황에서 CPU를 먼저 사용하고 이후 GPU로 처리하면서 오버워치의 FPS를 비교합니다.

CPU로 처리했을 때는 평균 80FPS정도 높게 나옵니다.

GPU로 처리하면 프레임이 낮게 나오는데, 그 뿐 아니라 녹화된 영상 자체가 끊기는 모습을 보여줍니다.

이전 i7-4790k를 사용할 때는 듀얼 모니터 이면서도 게임하다가 할 일이 생각나면 메모장에 할 일을 적었습니다.

그런데 라이젠은 게임하다가 할 일이 생각나면 그냥 할 일을 하면 됩니다. 프레임 감소나 프레임 드랍을 걱정할 필요 없습니다.

(지금은 시작표시줄이 가득해서 뭐가 있는지 모르는 건 비밀)

SenseMI

SenseMI는 라이젠에 탑재된 기술입니다.

Pure Power : CPU온도와 리소스 사용량을 모니터링하여 전력소비를 최소화하는 기술입니다.

전압을 자체적으로 조절할 수 있습니다.

Precision Boost : 25Mhz단위로 클럭을 조절합니다.

XFR : 자동오버클럭입니다. 쿨링 상태에 따라 자체적으로 작동 클럭을 향상시킵니다.

Neural Net Prediction : 신경망 예측 기술입니다. 앱의 행동에 빠른 프로세서 경로를 준비하여 성능을 향상시킵니다.

Smart Prefetch : 앱에서 필요한 데이터를 미리 가져옵니다. 인공지능 기술로 학습기능을 가지고 성능을 향상시킬 수 있습니다.

출처 : AMD.com

성능이 개선되었다는 후기(하드웨어 배틀)가 있습니다.

블소에서 성능차이 없이 CPU 이용률이 감소하고 3차 실행에서는 성능도 증가합니다.

아쉽게도 저는 하나의 게임만 하는 게 아니어서 큰 CPU 이용률 감소를 느끼지 못했습니다.

그래서 추가적인 테스트는 없습니다.

그런데 AMD 공식 페이지의 설명에 따르면 조금 재미있는 부분이 있습니다.

Neural Net Prediction : 프로그램이 CPU를 사용하는 맵을 "임시"로 생성

Smart Prefetch : 응용 프로그램이 자체 데이터에 액세스하는 방법을 학습

위 설명에 따르면 Smart Prefetch에는 "임시"라는 단어가 없습니다.

처음 하드웨어 배틀 후기가 떴을 때 PC방의 라이젠은 가격이 비쌀 것이라는 짤도 있었는데 사실이 될지도 모릅니다.

Windows 업데이트(2017.03.16)

쓰레드 분배 개선 업데이트가 되었습니다. 그 외에도 버그 개선 업데이트가 있었습니다.

몇몇 명령어를 사용할 때 충돌 현상 해결됬다고 합니다. 오버클럭 안정화 테스트에서 문제가 있던 분 다시 시도해보세요!

쓰레드 분배의 효과는 아래 사진으로 볼 수 있습니다.

앞서 American Truck Simulator를 통해 설명했던 부분입니다.

업데이트 이전에는 8쓰레드 프로그램에서 아이러니하게도 10개의 쓰레드를 사용합니다.

업데이트 이후 물리코어에 쓰레드를 할당해줍니다.

첫번째 사진에서는 들쭉날쭉 하지만, 두 번째 사진에서는 코어를 최대한 사용합니다.

이용률을 정확히 알 수 없지만 서로 비슷해 보입니다.

American Truck Simulator에서 본 것 같이, 이용률은 비슷한데, 물리코어에 우선 할당함으로써 20%의 성능 향상이 생겼습니다.

물리코어에 우선 할당하니 코어 파킹을 활성화하면 성능이 크게 떨어지던 부분이 해소됬습니다.

정리하며... 마지막 푸념 글

게임에서 다소 약한 모습을 보이더라도 충분히 강력한 성능을 가지고 있으며, 멀티 태스킹이나 영상처리에 있어서는 경쟁 제품보다 우수한 성능을 보여주고 있습니다.

이런 성능에도 경쟁 제품 대비 100만원가량 더 싼 가격이라는 것이 라이젠의 경쟁력입니다.

인텔도 신제품이 공개될 때마다 소프트웨어 최적화가 덜되어 이전 모델보다 성능이 떨어진다는 후기/벤치마킹이 나오기도 했습니다.

얼마 되지 않은 카비레이크도 이런 대우를 받기도 했습니다.

라이젠이 GTX 1080에서 대역폭 문제가 있다는 부분도 GTX 1080ti에서 오히려 격차가 감소하는 모습을 보이며 라이젠의 문제가 아닌 것을 증명해 주었습니다.

당분간은 성능 이슈가 계속 나타날 것이고, 그것이 점차 해소되는 방향으로 움직일 것입니다.

다만 보드의 문제는 이해하기 어려운 부분이 없지않아 있습니다.

분명히 AM4와 B350은 작년 9월 제품이 출시됐습니다. 소캣과 칩셋 공개는 그 전에 이루어졌을 것입니다.

하지만 6개월, 반년이 지나 아직도 바이오스 문제가 생기고 있습니다.

램 호환성, 코어 끄기 문제는 모든 램을 써볼 수 없고 모든 게임을 플레이 할 수 없으니 이런 부분은 이해 할 수 있습니다.

그런데 Racing GT나 F-Stream Utility는 왜 여태까지 안정화 하지 못한건지 모르겠습니다.

Racing GT는 보드 출시 전부터 프로그램이 있었지만 실행이 안됐습니다.

F-Stream은 3주가 지나서야 프로그램이 홈페이지에 게제되었습니다.

F-Stream은 나름 안정화는 된것 같은데 사실상 불안정한 기능은 전부 제거한 듯이 부실한 모습을 보여줍니다.

어떤 분은 보드가 완벽하게 출시되기 전에 라이젠을 판매한 AMD 잘못이 있다고 합니다.

하지만 그건 아닙니다.

이미 반년을 기다렸습니다.

지금 라이젠 보드 물량이 부족한 건 전 세계적인 현상이고, 이는 보드 회사들이 물량을 충분히 만들지 않은 것입니다.

회사는 손해가 적어야 이익이 커지기 때문에 라이젠이 언론상으로 유명세를 타더라도 실제로 팔릴지 안팔릴지는 확신하기 어렵습니다. 그래서 기존의 AMD보드 판매량 만큼 물량을 공급했을 것입니다. 보드를 소량만 생산했을 것입니다.

그러므로 보드가 안정되기 전에 라이젠이 먼저 출시되어 라이젠의 저력을 보여준 건 빠른 최적화를 위해 오히려 좋은 선택이었다고 봅니다.

이게 2등의 비애입니다. 그리고 이걸 지켜보는 즐거움이 있는 게 2등의 특징이기도 합니다.

이상으로 라이젠 후기를 마칩니다. 계속 인텔을 견제하며 선의의 경쟁 하기 바랍니다!

+ Recent posts