TwojePC.pl © 2001 - 2024
|
|
Wtorek 11 czerwca 2019 |
|
|
|
Rzut oka na wewnętrzną budowę GPU Navi Autor: Wedelek | 19:37 |
(7) | Premiera Radeonów RX 5700 i RX 5700XT to świetna okazja by bliżej przyjrzeć się wewnętrznej budowie GPU Navi i zmianom jakie zaszły względem Vegi. Na wstępie zaznaczam, że wbrew pozorom najnowsze Radeony nie korzystają w pełni z architektury RDNA, a Navi to tak naprawdę hybryda RDNA i czwartej wersji GCN. Skoro to mamy już wyjaśnione, to przejdźmy do budowy pełnego GPU, które możemy znaleźć w modelu RX 5700XT. Już na samym początku rzuca się w oczy całkowicie przemodelowany blok CU (Compute Unit), który jednak nadal budują 64 procesory strumieniowe. Łącznie, przy 40 blokach CU daje nam to 2560 procesorów strumieniowych, a więc wyraźnie mniej niż w Vedze 64, gdzie było 4096SP (64CU).
Jak można się było spodziewać mniejsza ilość jednostek oznacza o wiele niższą wydajność w obliczeniach, ale nie w grach. Dzieje się tak dlatego, że AMD inaczej rozplanowało ułożenie poszczególnych elementów i mimo pozornych podobieństw (taka sama ilość SP) bloki CU w Vedze oraz Navi bardzo się od siebie różnią. Przykładowo miejsce jednego, wspólnego planisty i jednostki skalarnej zajęły dwa takie elementy, ale kosztem inaczej zrealizowanych rejestrów. Ponadto pojawiła się nowa, współdzielona pamięć pierwszego poziomu o pojemności 512KB. Zapewnia ona dwukrotnie wyższą przepustowość niż pamięć L2, której jest 4MB, a przy tym opóźnienia w dostępie do danych są mniejsze o 21%. To znacznie poprawia szybkość komunikacji jednostek arytmetyczno logicznych z cache. Poprawki na tym polu objęły zresztą nie tylko pamięć L1, ale i L2 oraz L0.
Wreszcie AMD inaczej podeszło do kwestii obliczeń dokonywanych na zadanych danych. Miejsce czterech jednostek SIMD16 podłączonych do jednego planisty zajęły dwa SIMD32 z własnymi planistami. Co ciekawe jak by nie patrzeć jest to krok wstecz, bo rozwiązanie zastosowane w RDNA jest tak naprawdę mniej efektywne od tego znanego z GCN. Jeden blok w Vedze mógł bowiem wykonać maksymalnie obliczenia na szesnastu elementach, co zajmowało cztery cykle zegarowe, a RDNA może wykonać zaledwie połowę takich obliczeń, choć na większej partii informacji. Przewaga nowej architektury wynika jednak z szybkości przetwarzania prostych instrukcji. Okazuje się, że każdy SIMD32 może przetworzyć jedną instrukcję na cykl zegarowy, a to oznacza, że dane dostaniemy cztery razy szybciej niż w przypadku GCN.
W skomplikowanych obliczeniach stara architektura jest więc wydajniejsza, ale w grach operujących na prostych obliczeniach, gdzie trudno wykorzystać na raz wszystkie jednostki to RDNA pokazuje przysłowiowy pazur.
Przewaga RDNA drzemie również w znacznie usprawnionym algorytmie kompresji koloru, który jest nie tylko wydajniejszy, ale też umożliwia podprogramom (shaderom) szybkie zapisywanie i odczytywanie wartości bezpośrednio do/z rejestru. Nie trzeba więc już tracić czasu na żmudne kompresowanie i dekompresowanie danych.
Wszystkie te usprawnienia sprawiają, że w grach wydajność pojedynczego bloku CU jest o 25% wyższa w porównaniu do GCN, a po dodaniu do tego wyższych zegarów i niższych opóźnień wynikających z litografii 7nm możemy mówić o 50% poprawie.
Kliknij w obrazek aby go powiększyć – szkoda marnować wzrok 😊
|
| |
|
|
|
|
|
|
|
|
|
K O M E N T A R Z E |
|
|
|
- mnie ciekawi jaka będzie wydajność (autor: Mario2k | data: 11/06/19 | godz.: 23:46)
W kopaniu Ethereum ewentualnie innych krypto.
- @ Mario2k (autor: power | data: 12/06/19 | godz.: 00:40)
Duzej roznicy nie bedzie.
Na plus jest wysokie taktowanie pamieci GDDR6 i usprawnienia w architekturze GPU (o 1.25x wieksza wydajnosc nowych rozbudowanych jednostek i o 1.5x wieksza wydajnosc na Wat).
Na minus jest mniejsza liczba jednostek wykonawczych.
- @temat. (autor: Mariosti | data: 12/06/19 | godz.: 01:15)
Jak pamiętam z początków obecnej architektury nvidii, czyli zasadniczo z fermii, to właśnie takie podejście z mniejszymi wave'ami ale 2x per CU i osobnymi schedulerami to jest dokładnie to z czego korzysta nvidia, a to co do tej pory miało amd to jakby zaszłość z VLIV4.
To może być autentycznie krok w bardzo dobrym kierunku.
- czyli AMD wycofuje się z dobrodziejstwa inwentaża dodanego przez Maharadżę, (autor: Qjanusz | data: 12/06/19 | godz.: 09:14)
usprawniając wcześniejsze podejście i wyciągając z tego obiecujące prognozy. Zobaczymy jak to wyjdzie poza prezentacjami.
- hmmm (autor: mlc | data: 12/06/19 | godz.: 11:09)
niby jest trochę zmian, do tego 7nm, a de facto i tak te karty wypadają blado przy nVidii, niestety.
- Mnie interesuje czy ta Navi , która zaraz się pojawi (autor: Mario1978 | data: 12/06/19 | godz.: 11:14)
będą jednocześnie hybrydą co także zakładałem , że będzie prognozując dodanie do GCN coś takiego jak superSIMD jest w pełni dalej dzieckiem Pana Koduriego czy jednak mamy tutaj do czynienia dodatkową ingerencję w kod genetyczny tej archi po odejściu tego pana do Intela.
AMD z tego wynika nazywając to Hybrydą nie chce ujawniać wszystkich zmian jakie tu zaszły i zobaczymy je dopiero w pełnej wersji Navi na przyszły rok.
Czyli nie spodziewam się niczego innego jak dodatkowego wzrostu IPC w przyszłorocznej Navi , która będzie miał wsparcie także dla wyspecjalizowanych obliczeń i będzie tak na prawdę pierwszą generacją nowej archi nazwaną RDNA gen.2.
- ... (autor: MBR[PL] | data: 12/06/19 | godz.: 12:55)
Czyli powtórka z wprowadzenia GCN. W GCN 1.0 w 2012 wprowadzono sporo nowości (więcej niż teraz w Navi) ale architekturę w pełni dojrzałą ujrzeliśmy dopiero w GCN 1.1 rok później (pełna obsługa DX12, AMD FreeSync itp)
|
|
|
|
|
|
|
|
|
D O D A J K O M E N T A R Z |
|
|
|
Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.
|
|
|
|
|
|
|
|
|
|