PC

RX 470 WattMan. 오버클럭/언더볼트 팁

2016. 8. 28. 00:05

시작하기 전에

스마트폰 LG Optimus EX이후로 클럭별로 전압조절하게 될줄 몰랐습니다.!
옵티머스때는 CPU 0.3, 0.4, 0.5, 0.7, 0.9, 1.0,1.2Ghz에 대하여 700mV에서 1.2V까지 주었습니다. 그때는 시스템로그를 파일에 쓰게 해서 폰이 멈추거나 다운되면 마지막에 어떤 STATE 였는지 찾아서 전압을 조절했는데요,
안타깝게도 WattMan은 어떤 STATE에서 그래픽이 오작동했는지 알 방법이 없습니다. 그래서 전압에 여유를 주고 오버클럭/언더볼트를 진행하게 됩니다.

Radeon HD 7970은 WattMan자리에 OverDrive가 나오는데, AMD OverDrive였을때는 클럭밖에 조절할 수 없어서 Afterburner를 이용했습니다.
그러다보니 슬라이더 조절하고 적용버튼을 못찾아서... 와트맨 적용 안되네??? 하다가 어제 적용버튼을 찾아서 와트맨을 써봤습니다.

Radeon HD 7970은 1050Mhz에 1250mV인데, RX 470은 1260Mhz에 1150mV네요....신세계...
Radeon HD 7970을 쓰던 시절 저는 1050Mhz에 1250mV이던 것을 언더볼트하여 1144mV로 사용하였습니다.
그런데 날이 더워지니 부스트클럭 1050Mhz을 못버티고 베이스클럭으로 떨어지더군요. 그때가 950Mhz, 1200mV였습니다.
역설적이게도 뜨거워서 클럭을 낮췄더니 더 열을 많이냈고, 결국은 게임중인데도 500Mhz로 다운됐습니다.

그런 제품을 쓰다보니 낮은 state에서도 전압을 내릴수 있는 방법이 나왔으면 좋겠다 생각했습니다.
커스텀 바이오스 제작하는 방법이 있었지만 UEFI를 지원하지 않게 된다고 해서 그냥 참았습니다.

그런데 때마침 저만을 위한 그래픽카드를 AMD에서 출시한 겁니다.!!

하룻동안 만져본 와트맨을 건드려봤습니다.
인터넷에 찾아보니 와트맨이 "이런 기능이 있더라" 는 있지만, 이대로라면 정말 꼼짝없이 모든 STATE 에 대하여 안정성 테스트를 해야할 느낌입니다.ㅠㅠ 그래서 간단히 할 수 있는 방법을 소개해드리려고 합니다.

와트맨 주의사항

게임을 하지 않을 때는 클럭이 낮게 동작해서인지 렉이 상당히 심합니다. 게임을 실행해놓고, 클럭이 높아졌을때 이용하세요
모니터링할때 렉이 상당히 심합니다. 게임하면서 몇초씩 멈추는데 전압을 낮게줬거나 클럭을 높게한거 아닙니다. 나중에 와트맨 유틸리티? 끄고 게임해보시면 멈춤 현상 없습니다

당연하지만 패치됐습니다. 페이지뷰가 많아서 고칠 게 있나 다시 읽어봤는데 뭔 말인지 모르겠더라구요. 너무 오래 전에 패치된 내용이라 까먹었지 뭔가요. (2018.12.20수정)

와트맨 중요사항

블로그나 여러 후기들을 보면 전력제한을 늘리면 성능이 증가한다, 메모리전압을 줄이면 성능이 증가한다고들 합니다.
전력제한은 50으로 할경우 발열만 증가한다고 하니 20정도로 두세요. 메모리는 발열이 큰편은 아니니 크게 욕심내지 마십시오.

제 와트맨 설정입니다.

RX 470이나 RX 480 사용중이신분들은... 제가 state 1부터 state 7까지 전부 기존과는 클럭이나 전압이 다르다고 생각하실겁니다.nn
맞습니다.(2018.12.20수정)

여기서는 간단하게 모든 STATE 에 대하여 오버클럭/언더볼트하는 방법을 공유하려고 합니다.
state 7(클럭이 가장 높은 단계)에서 오버클럭 하는 방법은 쉽습니다.(2018.12.20수정)
전압을 조절하고, 안정화 테스트를 돌려보는거죠. FurMark라는 툴을 이용하시거나, 게임을 직접 플레이해보시면 됩니다.(2018.12.20수정)
개인적으로는 오버워치 로비 화면이 안정화 테스트에 큰 도움이 되더군요.(2018.12.20수정)
메모리 오버클럭을 하실 경우에는 당연히 다른 안정화 테스트 방법을 사용해야 합니다.(2018.12.20수정)

필자 팁

WattMan을 보시면 알수 있듯이, STATE 가 7개나 있습니다. 우리는 이것을 모두 오버클럭/언더볼트하고 안정화 테스트를 할 수 없습니다. 그래서 몇 개의 STATE는 추측하여 전압을 조절하게 됩니다.

위 사진에 검은 줄로(2018.12.20수정) 표시해둔 것처럼 클럭이 올라갈수록 같은 클럭 증가량에도 더 많은 전압 증가가 필요합니다.
"만약 코어클럭이 직선형태로 증가하는 모습이었다면 전압은 역 포물선 형태에 더 가까울 것입니다."

이것은 모든 프로세서, 즉 CPU/GPU 그리고 모바일 기기에도 통용되는 것입니다.

그렇기 때문에 이 모습을 참고하여 오버클럭/언더볼트 한다면 모두 안정화 테스트를 하지 않아도 안정적인 결과를 얻을 수 있습니다.

안정성 테스트

안정화 테스트에 있어서 물론 클럭, 전압 수율이 맞는것도 중요합니다만, 절전기능(SpeedStep, Cool&Quiet)을 이용하게 되면 클럭이 바뀔때의 안정성도 상당히 중요합니다.

RX470 또한 절전기능이 내장되어 있고, 모든 클럭에 대해 언더볼트를 할 것이라면 클럭이 유동적으로 변하는 저사양 게임으로 한번 테스트 해봐야 합니다.(2018.12.20수정)

안정성은 안정화 테스트를 돌려보면 알 수 있습니다. FurMark라는 툴을 이용하거나, 게임을 직접 플레이해보시면 됩니다.(2018.12.20수정)

개인적으로는 오버워치 로비 화면이 안정화 테스트에 큰 도움이 되더군요.(2018.12.20수정)

메모리 오버클럭을 하실 경우에는 당연히 다른 안정화 테스트 방법을 사용해야 합니다.(2018.12.20수정)

오버클럭/언더볼트

본격적으로 오버클럭을 시작합니다.

"오버클러킹, 언더볼팅은 모두 각자에게 책임이 있으며, 필자는 책임지지 않습니다."
이 문구는 WattMan을 처음 실행할 때도 나오는 문구입니다.-AMD도 책임지지 않습니다.-

  1. 위 사진에 그려둔 그래프를 생각하면서 STATE 7을 오버클럭을 합니다. 저는 1360까지 성공했고, 안정성을 위해 1345로 내렸습니다.
    안정화 테스트 중 화면 또는 컴퓨터가 멈추거나 꺼지는 등 비정상적인 반응이 있으면 클럭을 조금씩 줄여나갑니다.(2018.12.20수정)

    WattMan설정을 스크린샷으로 복사합니다.

  2. 이젠 STATE 6의 전압을 낮출 겁니다.
    클럭의 단계가 올라갈수록 전압은 같거나 더 높아야 합니다. 그렇기 때문에 STATE 6에 사용할 클럭과 전압을 그대로 STATE 7에 넣어주고 적용합니다.(2018.12.20수정)

    비정상적인 반응이 있으면 클럭을 낮춥니다. STATE 6는 STATE 7의 상태로 열이 감당되지 않을 때에 클럭이 발열 조절을 위해 클럭이 낮아질때 사용될 구간입니다. 수율에 맞춰서 최대한 타이트하게(Tight) 안정화를 해줍니다.

    앞서 말씀드린 것처럼, 절전기능이 적용되면 클럭이 바뀔 때의 안정성도 중요하기 때문에 안정화 된 값에서 10Mhz정도 낮춰줍니다.(2018.12.20수정)

    1번 단계에서 찍은 스크린샷에 따라 STATE 7을 오버클럭한 상태로 만듭니다.

    WattMan설정을 스크린샷을 찍어 복사합니다.

  3. STATE 5에 대해 2번과 같은 동작을 반복합니다.

    1100Mhz까지는 간단한 웹서핑 중에도 자주 올라갑니다. 그러니 언더볼트를 한다면 좀더 적은 전력소모를 보여줄 겁니다.

    하지만 이 쯤 부터는 전압이 충분히 낮기 때문에 4번 단계로 건너뛰어도 무방합니다. .(2018.12.20수정)

  4. STATE 1은 클럭은 그대로 두고 800mV로 언더볼트합니다. 보통은 잘 작동할겁니다.(2018.12.20수정)

  5. STATE 2도 일반적으로 800mV로 작동할 것입니다.

    하지만 3번에서 말씀드린 것처럼 전압을 여유롭게 주어도 됩니다.(2018.12.20수정)

  6. STATE 3과 STATE 4는 다른 클럭을 참고해 추정합니다.

    전압이 충분히 낮아지면 전압이 바뀌어도 (언더볼트를 위해 노력한 만큼) 전력 효율이 크게 변하지 않습니다.

    안정화에 스트레스 받지 마시고 전압을 여유롭게 줍니다. 각 STATE의 전압 대비 클럭이 포물선 형태를 유지하게끔 하되 중간 부분은 전압을 여유롭게 줍니다

    사진을 보면 전압 증가폭은 점점 커지고, 클럭 증가폭은 점점 감소합니다. 이런 모양에 따라 보기 좋게 클럭과 전압을 조절합니다. (2018.12.20수정)

  7. 본인이 하는 게임에서 그래픽카드가 주로 머무는 STATE 를 기억해두고, 게임이 불안정하면 해당하는 클럭을 언더클럭/오버볼트합니다.

    이후 6번의 설명에 따라 양 옆 STATE도 보기 좋게 클럭과 전압을 조절합니다.

ps. state 0는 300Mhz/800mV입니다.

2018.12.20 개정

AMD와 Nvidia 차세대 그래픽 폴라리스 VS 파스칼

2016. 2. 18. 22:48

얼마 전, AMD의 기대를 받고 있는 ZEN아키텍처 기반 CPU에 대한 소식을 전해줬다. 이번엔 AMD의 그래픽이다.

그래픽도 그동안 CPU처럼 정체된 모습을 보였다. 무려 3세대 동안(7000 Series, 8000 Series, rx 200 Series rx 300 Series)이나 뚜렷한 발전이 없었고, 심지어는 차세대 그래픽과 BIOS가 호환되기도 한다.

이번 그래픽의 코드네임은 폴라리스다. 그 동안 AMD는 전성비(전력 대비 성능 비)가 낮아서 노트북에 고성능 그래픽을 넣을 수 없었다. 그런데 폴라리스는 경쟁사 그래픽 대비 60%의 전성비를 갖고 있다고 한다. 또한 아키텍처 개선이 미묘했던 전 세대와 달리 이번엔 대부분 개선이 이루어졌다.

물론 AMD만 개선되는 건 아니다. Nvidia도 개선됬다. 이번엔 차세대 그래픽 프로세서의 루머와 알려진 정보를 바탕으로 비교해본다.

전성비

우선 AMD의 폴라리스. 전력 효율이 하드웨어와 소프트웨어의 개선으로 GTX950 대비 동일 성능 60%정도의 전력소비를 갖는다.
이전 세대가 동일 성능 대비 경쟁제품에 비해 전력소비가 큰걸 감안하면 전성비가 대폭 향상되었음을 알 수 있다.

Nvidia도 전 세대에 비해 전력소비가 40%감소했다고 강조하고 있다. 위의 발표대로라면 전성비는 막상막하일 것이다.

제조 공정

현재 AMD의 폴라리스는 14nm FinFET공정으로 알려져있고, 엔비디아의 파스칼은 16nm FinFET공정으로 알려져 있다. 엔비디아는 이전처럼 TSMC를 통해 그래픽을 생산할 예정인데, AMD는 알려지지 않았지만 14nm FinFET을 제조할 수 있는 글로벌 파운드리나 삼성을 통해 제작할 예정이다.

14nm / 16nm는 기존의 28nm대비 40%이상 미세화되었고, FinFET은 같은 성능에서 더 낮은 전류를 사용하고 최대전류가 증가하여 더 큰 성능을 낼 수 있을 것으로 기대하고 있다.

그래픽 메모리

그래픽 메모리는 두 제품 모두 2세대 HBM을 이용할 것으로 보인다.HBM은 기존 메모리에 비해 대역폭이나 전력소비가 2배 이상 좋아진다.
하지만 이전 AMD에서 플래그십 모델에만 HBM 메모리를 사용한 것을 보아 이번에도 플래그십 모델에만 사용할 것으로 전망하고 있다.

대신 하이엔드/퍼포먼스급 그래픽에는 GDDR5X그래픽을 사용할 것으로 보인다. GDDR5X는 GDDR5에 비해 대역폭이 두배 향상된다.
폴라리스와 파스칼은 차세대 그래픽에서 비슷한 양상을 보이고 있는데, 물론 차이점도 있다.

GPU 디자인

위에서 말했듯이 폴라리스는 아키텍처의 대부분이 바뀐다. 이 변화의 이점은 공개되지 않아 제품이 출시되어야 알 수 있다.

엔비디아는 NVLink라는 기술을 도입한다. PCIe를 대신할 인터페이스로 PCIe는 CPU와 그래픽이 연결된다면, NVLink는 CPU와 GPU뿐 아니라 GPU와 GPU끼리도 직접 연결될 수 있다.

또한 PCIe는 16GB/s의 대역폭을 갖고있는 반면, NVLink는 80GB/s를 갖고 있어서 대역폭이 크게 개선될 것이다.

Unified Memory라는 기술을 지원한다. 이를 통해 애플리케이션 개발자들은 데이터가 GPU메모리와 시스템 메모리중 어디에 있는지 몰라도 된다.

필자는 유니파이드 메모리는 (분명히 이들의 목적을 다르지만) AMD의 HSA와 비슷한 기능을 하게 될 것으로 생각한다.

유니파이드 메모리 기술은 C/C++언어에서 메모리를 공유하는 기능을 한다.

반면 AMD는 OpenCL을 통해 소수연산을 CPU로 할지, GPU로 할지 자동으로 결정한다(AMD는 경쟁사 대비 그래픽이 강하기 때문에 (애플리케이션 개발자가 그래픽연산으로 넘겨주지 않아도)자동으로 그래픽 연산을 한다면 최대 80배 빠른 성능을 낼 수 있다.). 이때 그래픽과 CPU사이에 빠른 연계를 위해 메모리를 공유하게 된다. (HSA제품이 대표적으로 PS4, 시스템메모리=그래픽메모리=HBM)

HSA가 효율성이 좋지만, 현재 C/C++언어가 더 널리 사용되고 있고 엔비디아 소비자가 많은 만큼 개발자가 유니파이드 메모리를 활용할 가능성이 높다.

목표의 차이

AMD는 역시나 색감을 강조하고 있다. 필자는 AMD 그래픽을 사용하는데, 중고로 조립할때 매물 많은 엔비디아를 선택했다가 후회를 했다(색감은 개인차가 있다는 것을 말해둔다)

엔비디아는 기존처럼 성능을 중심으로 한 홍보에 나섰다. 이번엔 자율주행 차량에 탑재될 Drive PX 2를 앞세워 성능을 강조했다.

파운드리의 경쟁

앞서 말한 바와 같이 엔비디아는 TSMC AMD는 14nm공정기술을 갖고 있는 GF나 삼성이 될 것으로 예상하고 있다. 기존엔 AMD도 TSMC였지만, TSMC의 물량공급이 부족해서 AMD가 호기일때 제대로 판매하지 못한 적도 있다.

다만 엔비디아도 TSMC에서 애플과 화웨이에 우선공급한다면, AMD에게 호기가 올 수 있다.

반면에, AMD에 공급할 것으로 알려진 GF, 삼성의 수율과 제조문제를 보면 이 둘의 결과는 어떻게 될지 미지수다

출처 : 보드나라

AMD, Zen기반 서버용 프로세서 공식 스펙

2016. 2. 18. 16:20

Zen기반 서버용 옵테론 프로세서가 8채널 32코어로 출시된다고 CERN 공식 문서에서 확인됐습니다.

기존의 Zen은 SMT(인텔의 Hyper Threading)기술을 이용하고, 14nm공정으로 출시됩니다. 또한, 아키텍처 개선으로 클럭당 성능이 기존 제품에 비해 40%가 증가한다고 발표했습니다. 그래서 AMD와 소비자의 기대가 작지 않습니다.

그런데 Zen을 기반으로 한 서버용 프로세서의 스펙 일부가 공개됐습니다.


이번에도 경쟁사보다 많은 코어수를 갖고 있는데요, 거기에 클럭당 성능도 증가하면서 또한 AMD의 큰 기대를 받고 있습니다.

CPU는 최대 32코어이고, 64쓰레드를 적용했고, DDR4 8채널을 지원한다고 합니다.

서버의 특성상 많은 코어가 필요하고 기존의 옵테론도 가격대비 많은 코어수로 가성비가 좋았습니다.

이번에도 경쟁사보다 많은 코어수를 갖고 있는데요, 거기에 클럭당 성능도 증가하면서 또한 AMD의 큰 기대를 받고 있습니다.

+ Recent posts