„Arm Mali-G77 GPU“ - visi įmanomi ir suderinami variantai

Autorius: Randy Alexander
Kūrybos Data: 3 Balandis 2021
Atnaujinimo Data: 1 Liepos Mėn 2024
Anonim
ARM Mali-G77 "Valhalla" победит Adreno?
Video.: ARM Mali-G77 "Valhalla" победит Adreno?

Turinys


Greta savo naujojo „Cortex-A77“ procesoriaus branduolio „Arm“ pristatė naujos kartos GPU, skirtą naujos kartos išmaniesiems telefonams SoC. „Mali-G77“, nepainiojant su naujuoju „Mali-D77“ ekrano procesoriumi, žymi „Arm’s Bifrost“ architektūros pradžią ir persikėlimą į „Valhall“.

Akimirksniu pateksime į smulkias naujosios architektūros detales. Pirmiausia pažiūrėsime į tai, ko vartotojai turėtų tikėtis padidindami našumą.

„Mali-G77“ veiklos apžvalga

„Arm“ gali pasigirti net 40 procentų padidinusi grafikos našumą su naujojo tipo „Mali-G77“ įrenginiais, palyginti su šių dienų „Mali-G76“ modeliais. Šis skaičius atsižvelgia į procesą ir architektūrinius patobulinimus. „Mali-G77“ yra konfigūruojamas nuo 7 iki 16 šešiabriaunių šerdžių, o kiekviena šerdis yra beveik tiksliai tokio pat dydžio kaip G76 šerdis. Tai reiškia, kad aukščiausios klasės išmanieji telefonai greičiausiai bus pristatyti su tokiu pačiu GPU branduolių skaičiumi, kaip tai daroma šiandien - kažkur mažamečių paauglių. Tai leidžia mums atlikti spekuliatyvius esamų mikroschemų veikimo įvertinimus.


Žvelgiant į populiarųjį „Manhattan GFXBench“ etaloną, 40 proc. Padidėjęs našumas atveria nemažą pranašumą prieš dabartinės kartos aparatinę įrangą. „Qualcomm“ naujos kartos „Adreno“ lustui reikės savo reikšmingo našumo patobulinimo, kad būtų išlaikytos lygios žaidimo sąlygos. Atrodo, kad lentelės pasisuko Armos naudai.

Išmintinga architektūra: žaidimų našumas padidėja nuo 20 iki 40%, o mašinų mokymasis padidina 60%

Remiantis šiuo gana neapdorotu rutulio stūmimu, atrodo, kad 10 branduolių „Mali-G77“ (konfigūraciją, kurią dažnai matome iš „Huawei“), atrodo, kad beveik paryškins šios kartos mobiliosios grafikos aparatūros aukščiausią liniją. 12 branduolių konfigūracija, paprastai matoma „Samsung“ „Exynos“, suteikia didelę reikšmę naujausiam „Arm“ GPU. Žinoma, tikrieji etalonai priklausys nuo kitų veiksnių, įskaitant proceso mazgą, GPU talpyklos atmintį, LPDDR atminties konfigūraciją ir jūsų išbandomos programos tipą. Taigi paimkite aukščiau pateiktą diagramą su didelėmis druskos dozėmis.


Kalbant tik apie naują architektūrą, Arm teigia, kad „Mali-G77“ siūlo vidutiniškai 30 procentų pagerinti energijos vartojimo efektyvumą ir našumą. „INT8 dot“ produkto palaikymas taip pat suteikia didžiulį 60 proc. Padidėjimą mašininio mokymosi programoms. Žaidimų našumo lūkesčiai gali būti nuo 20 iki 40 procentų didesni, priklausomai nuo pavadinimo ir siūlomo grafikos darbo krūvio tipo.

Norėdami tiksliai suprasti, kaip Arm pasiekė šį spektaklio pakilimą, įsigilinkime į architektūrą.

Susipažinkite su Valhall, „Bifrost“ įpėdiniu

„Vahall“ yra „Arm“ antros kartos skaliarinis GPU architektūra. Tai yra 16 pločio metmenų vykdymo variklis, kuris iš esmės reiškia, kad GPU vykdo 16 instrukcijų lygiagrečiai ciklui, procesoriui ir šerdims. Tai yra daugiau nei 4 ir 8 pločiai „Bifrost“.

Kitos naujos architektūrinės savybės yra dinamiškas komandų planavimas, visiškai valdomas aparatine įranga, ir visiškai naujas instrukcijų rinkinys, išlaikantis operatyvinį ekvivalentiškumą Bifrost. Kiti apima „Arm“ AFBC1.3 suspaudimo formato palaikymą, FP16 atvaizdavimo taikinius, sluoksninį atvaizdavimą ir viršūnių šederių išėjimus.

„Mali-G77“ daro 33% daugiau matematikos nei G76.

Raktus pagrindiniams architektūros pokyčiams suprasti galima rasti apžiūrėjus vykdymo bloką šerdies viduje. Ši GPU dalis yra atsakinga už numerių graužimą.

Vykdymo variklio viduje

„Bifrost“ kiekviename GPU branduolyje buvo trys vykdymo varikliai arba du - kai kurie žemiausios klasės „Mali-G52“ modeliai. Kiekviename variklyje yra „i-cache“, registracijos failas ir metmenų valdymo blokas. „Mali-G72“ variklyje kiekvienam ciklui tenka 4 instrukcijos, kurios padidėjo iki 8 praėjusių metų „Mali-G76“. Pasiskirstę po šias tris šerdis, per ciklą galite gauti 12 ir 24 32 bitų slankiojo kablelio (FP32) sulydyto dauginimo ir kaupimo (FMA) instrukcijas.

Naudojant „Valhall“ ir „Mali-G77“, kiekviename GPU branduolyje yra tik vienas vykdymo variklis. Kaip ir anksčiau, šiame variklyje yra metmenų valdymo blokas, registras ir aplankas, kuris dabar yra dalijamas dviem procesoriais. Kiekvienas apdorojimo įrenginys apdoroja 16 metmenų instrukcijų per ciklą, iš viso 32 FP32 FMA nurodymai viename šerdyje. Tai 33 procentai padidina Mali-G76 instrukcijų pralaidumą.

Įjungimas buvo perkeltas iš trijų į vieną vykdymo bloką vienam GPU branduoliui, tačiau dabar G77 branduolyje yra du apdorojimo blokai.

Be to, kiekviename iš šių apdorojimo elementų yra du nauji matematinių funkcijų blokai. Naujasis konvertavimo vienetas (CVT) tvarko pagrindinius sveikojo skaičiaus, logikos, šakos ir konvertavimo nurodymus. Specialiųjų funkcijų vienetas (SFU) pagreitina sveikųjų skaičių dauginimą, padalijimą, kvadratinę šaknį, logaritmus ir kitas sudėtingas sveikojo skaičiaus funkcijas.

Standartinis FMA įrenginys matė keletą pakeitimų, palaikančių 16 FP32 instrukcijų per ciklą, 32 FP16 ar 64 INT8 taškinių gaminių instrukcijas. Šios optimizacijos padidina 60 procentų mašinų mokymosi programų našumą.

Keturių faktūrų žemėlapių kūrėjas

Kitas svarbus „Mali-G77“ pakeitimas yra keturių tekstūrų žemėlapių kūrimas, palyginti su dvigubos struktūros kartografu ankstesnėje kartoje. Tekstūros žemėlapių sudarytojas yra atsakingas už 3D daugiakampių vaizdavimą scenoje į 2D atvaizdą, kurį matote ekrane. Jis yra atsakingas už mėginių ėmimą, interpoliavimą ir filtravimą, kad būtų išlygintas kampuotas ir judantis turinys, kad būtų išvengta atšiaurių ir žemos kokybės kraštų.

Vaizdo kokybei gerinti išlieka nebrangūs anti-alias, tačiau svarbiausias pranašumas yra dvigubas tekstūros našumas. Tekstūros vienetas dabar apdoroja 4 bilinearinius tekstilės elementus per laikrodį, palyginti su 2 ankstesniais, 2 trilinearinius tekstilės elementus per laikrodį, ir apdoroja greitesnį FP16 ir FP32 filtravimą.

Keturių kvadratų struktūros kartografuotojas yra padalijamas į du kelius, suteikiant trumpesnį siūlų, sriegių, turinčių talpyklos talpyklą, vamzdyną. Praleistas kelias, kuris tvarko formato konvertavimą ir tekstūros išspaudimą, pasižymi platesne L2 talpyklos sąsaja. Tai taip pat naudinga dirbant kompiuteriu, kai dažnai reikia iš atminties ištraukti naujus duomenis.

Viską sujungti į „Mali-G77“

Arm padarė keletą kitų „Mali-G77“ patarimų, kad sutaptų su pagrindiniais Valhalo architektūros pokyčiais. Valdymo blokas yra supaprastintas dėka vieno vykdymo bloko projekto, tuo tarpu vidinis dinaminis planavimo įrenginys iš tikrųjų suteikia galimybę lankstesnes instrukcijas išduoti kiekvienos šerdies viduje. Didesnis kiekvienos šerdies pralaidumas, duomenų kelias taip pat yra trumpesnis ir mažesnis, todėl vos 4 ciklai iš 8 anksčiau.

Naujasis dizainas taip pat geriau suderintas su „Vulkan“ API, supaprastinant vairuotojų aprašus, kad vairuotojo galvos būtų mažesnės, ir pagerėja „metalo“ savybės.

Apibendrinant galima pasakyti, kad „Mali-G72“ ir „Valhall“ daro svarbius „Bifrost“ pakeitimus, kurie žada reikšmingą žaidimų ir mašinų mokymosi programų našumo padidėjimą. Svarbu tai, kad dizainas patenka į tuos pačius energijos ir ploto biudžetus, kaip ir „Bifrost“, užtikrindamas, kad mobilieji įrenginiai galės pasiūlyti didesnį našumą, nesijaudindami dėl šilumos, energijos ir silicio sąnaudų. Remiantis spektaklio projekcijomis, „Mali-G77“ turėtų sugebėti gerai parodyti „Qualcomm“ kito generolo Adreno pinigus.

Žemė drebėjimai vyruoja nuo švelniai erzinančio iki detruktyviai bauginančio. Tačiau yra keleta programų, kurio uteikia jum pranašumą. Patebėjome dviejų kirtingų rūšių uragano programa. Pirmieji juo ...

Gali būti unku rati tinkama „eBook“ kaitytojų programa (dar vadinama „eReader“). Yra daugybė el. Knygų rūšių, daugybė failų formatų, kuriuo reikia pręti, tada yra įvairių rūšių knygo (romanai, komika...

Įdomu Svetainėje