Sivustot

Nvidia paljastaa seuraavan sukupolven Fermi-arkkitehtuurin

io-techin viikon tekniikkakatsaus podcast (10/2019)

io-techin viikon tekniikkakatsaus podcast (10/2019)
Anonim

. konferenssi "GPU-teknologiakonferenssiin", mutta se on silti Nvidia-show kautta ja läpi. Toimitusjohtaja Jen-Hsun Huang kesti jonkin aikaa keynotensa paljastamaan yhtiön seuraavan suuren GPU-arkkitehtuurin, koodinimellä "Fermi". Tämä on sirukuvaprosentit kutsuttu GT300: lle, GT200: n sukupolven seuraajalle, joka käyttää kortteja kuten GeForce GTX 285.

Chipigantti oli hyvin varovainen asentamaan siru ei ole uusi grafiikkapiiri vaan uusi " laske ja grafiikka" siru, tässä järjestyksessä (kursivointi kaivoksessa). Itse asiassa lähes kaikki paljastuu uudesta sirusta liittyy sen laskennallisiin ominaisuuksiin, eikä perinteisesti grafiikka-suuntautuneisiin tavaroihin, kuten tekstuuriyksiköihin ja paluusuhteisiin. Tiedämme, että siru on valtava arviolta 3,0 miljardia transistoria ja sitä tuotetaan 40 nm prosessissa TSMC: ssä. Tämä on noin 40 prosenttia enemmän transistoreita kuin RV870-siru uusissa Radeon 5800 -sarjan DirectX 11 -kortteissa, jotka juuri julkaistiin kilpailija AMD. Chipillä on 512 prosessointiyksikköä (Nvidia kutsuu niitä CUDA-ytimiä), jotka on järjestetty kukin 32 ytimen 16 "suoratoistoprosessoriin". Tämä on enemmän kuin kaksinkertainen 240 ydin GT200: ssa, ja ytimissä on merkittäviä parannuksia.

Kolmannen sukupolven suoratoistoprosessori (SM)

32 CUDA-ytimiä SM: ssä, 4x yli GT200

  • 8x huippunopea kaksinkertainen tarkka liukuluku suorituskykyä yli GT200
  • Dual Warp Scheduler, joka järjestää ja lähettää kaksi 32 lankaa
  • kelloa kohden
  • 64 kt RAM-muistia, jossa on jaettu muistin ja L1-välimuistin konfiguroitava osiointi
  • Toinen 32- ja 64-bittinen tarkkuus

Täydellinen 32-bittinen kokonaislatausreitti, jossa on 64-bittinen ja 64-bittinen tarkkuus

  • Unified Address Space with Full C ++ Support
  • Optimoitu OpenCL ja DirectCompute
  • Parannettu muistialijärjestelmä
  • NVIDIA: n rinnakkainen DataCache -hierarkia, jossa on konfiguroitava L1 ja Unified L2
  • Säilytys

Muistin käyttöohjeet, jotka tukevat siirtymistä 64-bittiseen osoitteeseen

  • Ensimmäinen GPU, jossa ECC-muistituki
  • Parantunut atomi-muistitoiminto suorituskyky
  • NVIDIA GigaThread -moottori
  • 10x nopeampi sovelluskontekstikytkentä

Samanaikainen ytimen suorittaminen

  • Epäonnistuneiden lohkojen lohkon toteutus
  • Kaksi päällekkäistä muistinsiirtomoduuria
  • On paljon lisäominaisuuksia, tämän sirun suorituskyky suorassa laskentatehtävässä, kuten paljon nopeampi kaksinkertaisen tarkkuuden liukuluku laskentataajuus. Nykyiset Nvidia-GPU: t laskevat kaksinkertaisen tarkkuuden murto-osalla yhden tarkkuuden operaatioiden nopeudesta. Kaksinkertaisen tarkkuuden liukulukujen on nyt oltava puolet yhden tarkkuuden suorituskyvystä, mikä on valtava parannus. Myös suuret välimuistin ja aikataulutusparannukset ovat ilmeisiä. Lue lisää arkkitehtuurista Nvidian uudella Fermi-sivulla, joka sisältää PDF-asiakirjan.
  • Joten milloin voit ostaa grafiikkakortin, joka käyttää tätä sirua? Nvidia ei sano. Yrityksen edustajat ovat sanoneet, että he "parantavat sirua", mikä tarkoittaa, että työskentelynäytteet ovat vasta äskettäin palanneet valmistuslaitoksesta. Koulutettu arvaus aiemmasta historiasta sanoo, että joulukuussa on optimistinen julkaisupäivä, ja vuoden 2010 ensimmäisen neljänneksen laaja saatavuus on todennäköisempi. Odota, että levyt ovat kalliita. Nvidia ei paljasta sirukokoa, mutta transistorien määrän perusteella arvioimme 450-500 mm

2

. Yhdessä 384-bittisen muistiliittymän lisäkorttikustannusten ja haasteiden kanssa, kun saat hyvän tuoton tällaisesta valtavasta sirusta suhteellisen uudella 40nm: n valmistusprosessilla, ja katsot kortteja, jotka todennäköisesti ovat tehokkaampia ja kalliimpia kuin AMD: n juuri julkaisut Radeon 5800 -sarjan kortit. Seuraa Jason Cross Twitterissä tai käy hänen blogissaan.