본문 바로가기

IT 리뷰/제품리뷰

RTX2080 TI RTX2070 GTX1080 성능 스펙 비교

반응형

RTX2080 TI RTX2070 GTX1080 성능 스펙 비교

그래픽카(VGA) 전문 기업인 엔비디아의 Gamescom 2018  행사가 무사히 끝났습니다.


본 행사는 지난달 엔비디아의 차세대 GeForce 하드웨어를 출시 준비 가운데 RTX 2080 / RTX 2080 TI 가 발표 되었는데요 기존의 루머에서 벗어난 보다 자세한 정보를 담아보았습니다.


NVIDIA의 새로운 Turing GPU 아키텍처의 TSMC의 12nm "FFN"프로세스를 기반으로 구축된 NVIDIA는 게임 렌더링 방식"과 PC 비디오 카드 평가 방식의 전체 패러다임 전환을 목표로 하는 높은 목표를 가지고 있습니다.

 

엔비디아의 CEO은 2006 년 테슬라 GPU 아키텍처 (G80 GPU) 이후 튜링 엔비디아의 가장 중요한 GPU 아키텍처를 소개했으며 해당 기능면에서 볼 때 매우 기대가 됩니다.


지금까지 NVIDIA의 첫 번째 그래픽카드는 고급형으로 출시되었으며  GeForce RTX 2080 Ti, RTX 2080 및 RTX 2070은 모두 한 달 간격으로 출시예정입니다.


RTX2080 TI RTX2070 GTX1080 성능 스펙 비교


NVIDIA의 제품 스펙은 그대로 유지되면서 RTX 2080 Ti의 주력 그래픽카드인 반면 RTX 2080은 최고급 그래픽카드로서 RTX 2070은 가격을 조금 다운시켜 많은 사람들이 즐길 수 있도록 제작된 그래픽 카드입니다.




3장의 그래픽카드 모두 다음 9월 10월 동안 출시될 예정이며  RTX 2080 년 9월 20일부터 판매를 시작합니다.


Ti 및 RTX 2080, / RTX 2080 Ti는 파트너사의 경우 999 달러부터 시작하며, RTX 2080은 699 달러부터 시작합니다.


한편 RTX 2070은 10 월에 출시될 예정이며 파트너사는 499 달러부터 시작합니다. 


이는 기존의 그래픽카드 가격 대비 모두 120 달러에서 300 달러 사이의 가격 정도 비싼 금액이며 NVIDIA의 자체 참조 용 Founders Edition 카드는 다시 돌아가며 기본 가격보다 100 ~ 200 달러의 프리미엄을 받게 됩니다.


그리고 아쉽게도 NVIDIA는 이미 사전 주문을 하고 있으므로 지금 제품을 구매하려는 사람들은 해당 혜택을 받기가 어렵습니다.
 


RTX2080 / RTX2070 / GTX1080 


NVIDIA GeForce 사양 비교
모델명

RTX2080 Ti

RTX2080
RTX2070
GTX1080
쿠다 코어
4352
2944
2304
2560
코어 클럭
1350MHz
1515MHz
1410MHz
1607MHz
부스트 클럭
1545MHz
1710MHz
1620MHz
1733MHz
메모리 클럭
14Gbps GDDR6
10Gbps GDDR5X

메모리 Bit

352 비트
256 비트
VRAM
11GB
8GB

정밀도.

13.4 TFLOPs
10.1 TFLOPs
7.5 TFLOPs
8.9 TFLOPs
Tensor Perf.
440T OP  
(INT4)
 
N / A
레이 퍼프.
10 초

8 초

6 초

RTX-OPS
78T
60T
45T
TDP
250W
215W
175W
180W
GPU

Big Turing

Non Turing

Non TuringGP104
트랜지스터 수
18.6B
 
7.2B
아키텍처

Turing

부활절
제조 공정
TSMC 12nm "FFN"
TSMC 12nm "FFN"
TSMC 12nm "FFN"
TSMC 16nm
출시일
09/20/2018
09/20/2018
10/2018
05/27/2016
출시 가격
999 달러
699 달러 
499 달러 
599 달러 



NVIDIA의 Turing 아키텍처 : RT & Tensor 코어

Turing 보드 전체의   레이 트레이싱과 래스터 화를 결합하여 두 기술의 장점을 활용하는 하이브리드 렌더링을 지원합니다.


그리고 이번 발표는 올해 초부터 NVIDIA의 RTX 발표가 본질적으로 지속되었기 때문에 발표가 약간 희박하다고 생각한다면 나머지 부분은 여기에 있습니다.


이번 제품의 가장 큰 변화는 더 빠르고 효율적인 하드웨어 성능인 레이트레이싱 가속화를 제공하기 위해 튜링과 함께 더 많은 레이트레이싱 하드웨어를 포함하게 될 것이라는 점입니다. 


Turing 아키텍처의 새로운 점은 NVIDIA가 RT 코어라고 부르는 것으로서 이 코어는 현재로서는 완벽하게 알려지지 않았지만 전용 레이트레이싱 프로세서로 사용됩니다.


 이 프로세서 블록은 광선 - 삼각형 교차 검사와 경계 체적 계층 구조 (BVH) 조작을 가속화합니다. 후자는 광선 추적을 위해 객체를 저장하기 위한 매우 보편적인 데이터 구조입니다.


NVIDIA는 초고속 GeForce RTX 부품이 초당 100억 (기가) 광선을 전송할 수 있으며  가속되지 않은 파스칼은 광선 추적 성능이 25 배 향상되었습니다.
 


Turing 아키텍처는 또한 Volta의 텐서 코어 전달하며 실제로 Volta보다 향상되었습니다. 


텐서 코어는 여러 NVIDIA 이니셔티브의 중요한 측면입니다. Turing 가방 속의 NVIDIA의 다른 툴은 AI denoising을 사용하여 텐서 코어가 탁월한 이미지를 정리함으로써 장면에서 필요한 광선의 양을 줄이는 것입니다. 



물론 이것이 텐서 코어가 유일한 특징은 아니며 NVIDIA의 전체 AI / 신경 네트워킹 제국은 모두 내장되어 있습니다.


따라서 Gamescom 군의 주요 관심사는 아니지만 NVIDIA의 가장 강력한 신경 네트워킹 하드웨어가 출시될 것이라는 사실도 확인되었습니다.



더 넓은 범위의 GPU로 하이브리드 렌더링을 살펴보면 흥미로운 점은 이러한 개별적인 속도 향상에도 불구하고 NVIDIA의 전반적인 성능 약속은 극단적이지 않다는 점입니다.


이 회사는 파스칼에 비해 6배의 성능 향상을 약속했으며  RT 코어를 사용하더라도 광선 추적은 일반적으로 여전히 상당한 리소스입니다.



특히 게이밍 문제의 경우 하이브리드 렌더링의 이점은 잠재적으로 중요하지만 개발자를 사용하는 방법에 크게 의존할 것입니다. 


퍼포먼스 관점에서 볼 때 레이트레이싱과 하이브리드 렌더링은 렌더링 품질을 향상시키고 현재의 알고리즘의 성능을 향상시키는 기능이 아니며 오늘날의 GPU 성능에서 레이트레이싱을 시도했다면 성능은 매우 느릴 것입니다.


이러한 품질이 점은 일반적으로 그래픽 성능의 조명 및 그림자 및 주위 빛 반사에 집중되며 세 가지 모든 기능은 본질적으로 빛의 속성에 기반을 두고 있습니다.


단순한 용어로는 빛으로 움직이며, 지금까지는 다양한 알고리즘이 관련된 작업이나 "미리 베이킹 (pre-baking)"장면을 카피해 왔으며  현재의 알고리즘은 꽤 좋은 편에 속하지만 그렇다고 정확하지는 않습니다. 


전반적으로 하이브리드 렌더링은 GeForce RTX 20 시리즈의 lynchpin 기능입니다. 


Gamescom과 SIGGRAPH 프레젠테이션을 통해 NVIDIA가 이 분야에 많은 투자를 해왔고 앞으로도 이 기술에 대한 GeForce 브랜드의 성공을 확신할 수 있습니다. 
 
RT 코어 및 텐서 코어는 반 고정 기능 하드웨어로서 래스터 화에는 사용할 수 없으며 할당된 트랜지스터는 그렇지 않은 경우 더 많은 레스터 하드웨어 전용 트랜지스터 일 수 있습니다.




따라서 NVIDIA는 더 큰 파스칼을 구축하기보다는 하이브리드 렌더링 경로로 이동하여 기회비용 측면에서 엄청난 의미심장 한 움직임을 보이고 있습니다.


결과적으로, NVIDIA는 2001 년과 2002 년에 픽셀 및 버텍스 쉐이더 (Direct X8 및 Direct X9 시대 기술)를 도입하면서 이전에 실제로 보았던 소비자 렌더링에서 패러다임의 변화를 시도하고 있습니다.



Microsoft의 Direct X Raytracing (DXR) 이니셔티브는 NVIDIA의 다른 개발자 및 소비자 이니셔티브만큼 중요하며 NVIDIA는 보다 나은 이미지 품질을 제공하기 위해 래스터화와 레이트레이싱을 혼합하는 기술에 대해 일반인과 개발자 모두에게 판매합니다.


또한 무어의 법칙은 계속 느려지고 고정된 기능 하드웨어가 효율성을 높이는 수단이 되어 더욱 전문화되고 고정된 기능 단위로 작업하는 아이디어를 개발자가 쉽게 이해할 수 있어야 합니다.


지포스 RTX2080TI / RTX2080 / 타이탄V / 타이탄XP / GTX1080TI / GTX1080

 

RXT 2080 Ti
(GDDR6)

RTX 2080 
(GDDR6)

타이탄 V (HBM2)

타이탄 XP
 

GTX 1080 Ti

GeForce GTX 1080

총용량
11GB
8GB
12GB
12GB
11GB
8GB
핀당 흑백
14Gb / s
1.7Gb / s
11.4 Gbps
11Gbps
칩 용량
1GB (8Gb)
4GB (32GB)
1GB (8Gb)
번호 칩 / KGSD
11
8

3

12
11
8

칩당 스택

56GB / 초
217.6GB / 초
45.6GB / 초
44GB / 초
버스 너비
352 비트
256 비트
3092 비트
384 비트
352 비트
256 비트
버스 너비
616GB / 초
448GB / 초
652.8GB / 초
547.7GB / 초
484GB / 초
352GB / 초
DRAM 전압
1.35V
1.2 V (Ω)
1.35V

Turing SM : 전용 INT 코어, 통합 캐시, 가변 비율 음영

전용 RT 및 텐서 코어와 함께 Turing 아키텍처의 Streaming Multiprocessor (SM) 자체도 새로운 트릭을 배우고 있습니다. 

특히 Volta의 새로운 변화 중 하나를 계승했는데 Integer 코어가 부동 소수점 CUDA 코어의 패싯이되는 것과는 대조적으로 자체 블록으로 분리된 되었습니다.
 
여기에 있는 장점은 적어도 Volta에서 보았던 것 만 큼이면 주소 생성과 Fused Multiply Add (Fused Multiply Add) 성능이 향상된다는 것으로 Turing의 여러 측면에서 볼 수 있듯이 더 많은 이점이 있습니다 



Turing SM에는 NVIDIA가 "통일된 캐시 아키텍처"라고 부르는 것이 포함되어 있습니다. NVIDIA의 공식 SM 다이어그램을 아직 기다리고 있기 때문에 이것이 Volta에서 보았던 것과 동일한 종류의 통일인지는 확실하지 않습니다


L1 캐시가 병합된 곳 공유 메모리 - 또는 NVIDIA가 한 걸음 더 나아간 경우. 여하튼 NVIDIA는 NVIDIA가 파스칼 또는 볼타 (후자가 더 가능성이 있는)를 의미하는지 명확하지 않은 "이전 세대"의 두 배 대역폭을 제공한다고 말합니다.


마지막으로 SIGGRAPH Turing 보도 자료에 숨어있는 것도 가변 비율 음영에 대한 지원입니다. 


비교적 젊고 곧 출시될 그래픽 렌더링 기술로서 특히 NVIDIA가 얼마나 정확하게 구현하고 있는지에 대한 정보는 제한적입니다. 


그러나 매우 높은 수준에서 NVIDIA의 멀티 레스 셰이딩 기술인 차세대 사운드처럼 들리는데, 개발자가 다양한 효과적인 해상도로 화면의 다른 영역을 렌더링 하여 품질 (및 렌더링 시간)을 그것은 가장 유익합니다.



RXT 2080 2070 GDDR6 지원

GPU가 사용하는 메모리는 외부 회사에서 개발 한 것이므로 큰 비밀은 없습니다.


JEDEC과 삼성전자, SK 하이닉스, 마이크론은 모두 GDDR5와 GDDR5X의 후속 주자로 GDDR6 메모리를 개발했으며 NVIDIA는 Turing 지원하기로 했습니다.


제조업체에 따라 1 세대 GDDR6은 일반적으로 NVIDIA의 후반 세대 GDDR5 카드의 2배, NVIDIA의 최신 GDDR5X 카드보다 40 % 빠른 메모리 대역폭의 핀 당 최대 16Gbps를 제공합니다.


참고 포스팅


반응형