Avaleht
uus teema   vasta Uudised »  Arvuti ja internet »  Aasta lõpus tuleb välja eraldi kaart füüsikamootorite jooksutamiseks? märgi kõik teemad loetuks
märgi mitteloetuks
vaata eelmist teemat :: vaata järgmist teemat
mine lehele eelmine  1, 2, 3, 4, 5, 6, 7, 8, 9  järgmine
Hinnavaatlus :: Foorum :: Uudised :: Ärifoorumid :: HV F1 ennustusvõistlus :: Pangalink :: Telekavad :: HV toote otsing
autor
sõnum Saada viide sõbrale. Teata moderaatorile
otsing:  
Ho Ho
HV Guru
Ho Ho

liitunud: 16.02.2002




sõnum 28.03.2006 11:40:27 vasta tsitaadiga

ossa kirjutas:
Selline link ka
Ok, ATI väidab et tema on osavam. Huvitav kui paljudele arendajatele meeldiks kasutada ühe tootja propertiary teeke et mängudes füüsikat arvutada? Havoc FX'il on vähemalt see hea omadus et on üks API erineva raua jaoks.

Pealegi enne ei tasu ühtki GPU tootja juttu puhta kullana võtta kui nad oma väiteid tõestada ei suuda. Siiani olen ma näinud ainult paari üksikut slaidi, ei mingit in-action videot ega kirjeldust milleks nende süsteemid täpselt suutelised on ning kui palju nad sellega GPU peaülesande täitmisele mõeldud ressurssidest ära kulutavad.

Valdav osa videokaarte ei ole suutelised uuemaid mänge vedama korraliku pildikvaliteediga. Kui neile veel anda lisakoormus füüsika näol siis muutub olukord veelgi nutusemaks. Siiani tundub et GPU peal on mõttekas füüsikat jooksutada ainult SLI/CF süsteemis olevate high-end kaartidega. Järelikult ega see GPU füüsika siis niiväga odav lõbu ei ole.
ossa kirjutas:
kuni korralike mänge füüsikakaardi kasutamiseks poelettidel veel pole, pole ka selle kaardiga minul vähemalt midagi teha icon_lol.gif
Siin peaks olema kirjas kõik lähemal ajal välja tulevad PhysX'i toega mängud.
http://physx.ageia.com/titles.html

_________________
Teach a man to reason and he'll think for a lifetime
Common sense - so rare that it's a damn superpower
Vaadates paljude inimeste sõnavõtte siin ja mujal jääb üle ainult klassikuid tsiteerida - "I weep for humanity"
Kommentaarid: 106 loe/lisa Kasutajad arvavad:  :: 0 :: 1 :: 86
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
stepzter
HV veteran
stepzter

liitunud: 11.11.2001




sõnum 28.03.2006 12:27:36 vasta tsitaadiga

Herr Kurm kirjutas:
sisuliselt on tegu erinevate asjadega. Üks on mõeldud tekstuuride liigutamiseks, teine füüsika käitamiseks.
Ja kohe kindlasti ei saa 1900xt vms hakkama selliste asjadega nagu see physix kaart kuna eesmärgid on erinevad

Sisuliselt on tegu mikroprotsessoritega. Esmane eesmärk nendel on tõepoolest erinev kuid tähtis on, millisel määral see arhitektuuri mõjutanud on. Ma väidaks, et nö. tekstuuride liigutamine erineb lihtsast vooprotsessorist põhiliselt tekstuurimisüksuse poolest ja füüsika käitamine nõuab võimalust kasutada ruumilisi andmestruktuure. Tekstuurimisüksus on käsitletav väikeste lisafunktsionaalsustega maatriksist interpoleeritud väärtuste lugemisüksusena. Mitte küll põhiline komponent füüsika arvutamisel, aga mitte ka täiesti kasutu. Küsimus on rohkem selles, kas graafikakiip saab hakkama algoritmilist keerukust vähendavate andmestruktuuride kasutamisega. Lugemise osas on asi selge - on mitmeid näiteid, kus seda juba on tehtud. Kirjutamise osas on asi keerulisem ja see on ilmselt asi, mis mõningal määral piirab graafikakiipide effektiivsist füüsikaliste probleemide lahedamisel. Aga mil määral piirab on ebaselge ja ilma mingite implementeerimise kogemusteta väita eesmärgi põhjal, et graafika kiibid ei ole samaks võimelised on täiesti alusetu.

Ma kahtlustan, et järgmise põlvkonna kiipides on graafikakaartide tootjad teinud ära ühe viimastest olulistest sammudest graafikakiipide üldotstarbelisteks vooprotsessoriteks muutmise teel - lisanud write scatter funktsionaalsuse.
Kommentaarid: 26 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 26
tagasi üles
vaata kasutaja infot saada privaatsõnum
Vananematu
HV veteran
Vananematu

liitunud: 28.09.2003




sõnum 28.03.2006 14:47:25 vasta tsitaadiga

Kuram, see CellFactor ( http://physx.ageia.com/footage.html ) näeb ikka eriti jõhker välja video pealt icon_eek.gif . Samas kas mängu tegijatel nüüd mingil määral kergemaks ei lähe, et ei pea nii väga destructive environmente sisse toppima, kui saab päris arvestatava effekti juba selliste explosionite ja sodi lendamisega kätte.. Et lõpuks on ikka next gen mängudel aint tipp-ilus pilt ja füüsika siis seekord. Aga tundub, et võimalused jällegi mängudes avarduvad, kuidas ümbruskonnaga ringi käiia.
Kommentaarid: 31 loe/lisa Kasutajad arvavad:  :: 0 :: 1 :: 28
tagasi üles
vaata kasutaja infot saada privaatsõnum
Ho Ho
HV Guru
Ho Ho

liitunud: 16.02.2002




sõnum 29.03.2006 14:10:08 vasta tsitaadiga

Veidike tehnilisem artikkel PPU arhitektuuri kohta: http://www.blachford.info/computer/articles/PhysX1.html

If this arrangement is used in the final implementation the PPU should be capable of a theoretical 208 instructions per cycle (6 multiply-adds + 1 Integer) x 16 VPEs. This is nearly 3 times what the Cell processor in the PS3 can theoretically do and up to 50 times what any current conventional (single core) desktop processor can theoretically do. This equates to 96 GigaFLOPS for each 500MHz, the clock speed has not been announced but should be in the 500MHz - 1GHz range.

Mitte segi ajada neid numbreid reaalse arvutusvõimsusega. Kui nad ütlevad et 50x rohkem kui CPU'd siis peavad nad silmas operatsioone takti kohta, mitte ajaühiku kohta.

[edit]

Väga tabav ütlus tollest artiklist:

Making objects behave “properly” is all very good but you’d be correct to ask why gamers should care.
The answer can be summed up in one word: BOOM!

_________________
Teach a man to reason and he'll think for a lifetime
Common sense - so rare that it's a damn superpower
Vaadates paljude inimeste sõnavõtte siin ja mujal jääb üle ainult klassikuid tsiteerida - "I weep for humanity"
Kommentaarid: 106 loe/lisa Kasutajad arvavad:  :: 0 :: 1 :: 86
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
Winterwind
One
Winterwind

liitunud: 19.05.2002



Autoriseeritud ID-kaardiga

sõnum 29.03.2006 17:40:18 vasta tsitaadiga

link :: Asus releases Ageia PhysX card details


tsitaat:
TAIWANESE GIANT Asustek said it will be the only company to manufacture
and sell the 256MB Ageia PhysX card - the high end model
Kommentaarid: 1007 loe/lisa Kasutajad arvavad:  :: 3 :: 1 :: 727
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
Herr Kurm
Piiratud kasutaja
Herr Kurm

liitunud: 25.03.2004




sõnum 29.03.2006 17:54:49 vasta tsitaadiga

keegi hinna osas spekuleerida julgeb?
_________________
-logod, firmaidentiteet, küljendamine, flash-
-portfolio-
Kommentaarid: 25 loe/lisa Kasutajad arvavad:  :: 2 :: 1 :: 19
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
Winterwind
One
Winterwind

liitunud: 19.05.2002



Autoriseeritud ID-kaardiga

sõnum 29.03.2006 17:57:25 vasta tsitaadiga

Herr Kurm kirjutas:
keegi hinna osas spekuleerida julgeb?

299 taala oli mu arust icon_rolleyes.gif
Kommentaarid: 1007 loe/lisa Kasutajad arvavad:  :: 3 :: 1 :: 727
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
Ho Ho
HV Guru
Ho Ho

liitunud: 16.02.2002




sõnum 29.03.2006 18:01:20 vasta tsitaadiga

Hinnanguid on olnud 250-299, arvatavasti on need olnud tolle tippsõna kohta. Tõenäoliselt saab nõrgemaid kaarte veidi odavamalt.
_________________
Teach a man to reason and he'll think for a lifetime
Common sense - so rare that it's a damn superpower
Vaadates paljude inimeste sõnavõtte siin ja mujal jääb üle ainult klassikuid tsiteerida - "I weep for humanity"
Kommentaarid: 106 loe/lisa Kasutajad arvavad:  :: 0 :: 1 :: 86
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
stepzter
HV veteran
stepzter

liitunud: 11.11.2001




sõnum 29.03.2006 21:52:05 vasta tsitaadiga

tsitaat:
If this arrangement is used in the final implementation the PPU should be capable of a theoretical 208 instructions per cycle (6 multiply-adds + 1 Integer) x 16 VPEs.

Sama valemi järgi teeb R580 (4 MADD + 4 ADD) * 48 = 576 "käsku" per takt.
Muud eriti huvitavat seal artiklis ei olnudki kirjas. Võrdlemisi selgusetuks jäi, kuidas see arhitektuur mälupöörduste latentsusega peaks hakkama toime tulema.
Kommentaarid: 26 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 26
tagasi üles
vaata kasutaja infot saada privaatsõnum
Le Inc
HV Guru
Le Inc

liitunud: 06.09.2002



Autoriseeritud ID-kaardiga

sõnum 30.03.2006 09:28:06 vasta tsitaadiga

link :: HardOCP mõtteid Ageia kaardist.

Seal on ka CellFactori video link antud, ehk reaalne mäng mis kasutab nö. "füüsilisi" efekte. Teine sõnum mis läbi kostis oli kiire vajadus tarkvara järele mis uusi efekte ära kasutaksid, eriti just selliseid mänge kus füüsikakaart on mängimiseks 100% vajalik. Ühesõnaga oleks super-head ja milljoneid koopiad müüdavat mängu mis ilma Ageia kaardita hakkama ei saaks, siis tuleksid ka ostjad kaasa. Mis muidugi on väga ebatõenäoline icon_biggrin.gif
Kommentaarid: 56 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 54
tagasi üles
vaata kasutaja infot saada privaatsõnum
ossa
HV kasutaja


liitunud: 18.11.2004



Autoriseeritud ID-kaardiga

sõnum 30.03.2006 15:25:40 vasta tsitaadiga

Jälle üks kuum kartul arvutisse icon_lol.gif , veel korpuse vente juurde icon_cry.gif
Ma arvan, et sellise korraliku kaasakiskuva mängu väljalaskmisega läheb veel üksjagu aega 8)
aga pluss on see, et asi areneb jälle ühes uues suunas 8)
Kommentaarid: 20 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 20
tagasi üles
vaata kasutaja infot saada privaatsõnum
project
HV Guru
project

liitunud: 18.02.2004




sõnum 30.03.2006 20:42:00 vasta tsitaadiga

No nüüd ei jää muud üle kui ühte korralikku romu rallit ootama jääda icon_wink.gif
Kommentaarid: 92 loe/lisa Kasutajad arvavad:  :: 0 :: 1 :: 84
tagasi üles
vaata kasutaja infot saada privaatsõnum
jt234
HV veteran
jt234

liitunud: 12.04.2005




sõnum 08.04.2006 16:10:36 vasta tsitaadiga

Mis siinile see tuleb?
_________________
Dima oli siin
Kommentaarid: 129 loe/lisa Kasutajad arvavad:  :: 2 :: 0 :: 121
tagasi üles
vaata kasutaja infot saada privaatsõnum
486
HV Guru

liitunud: 19.04.2004




sõnum 08.04.2006 16:12:03 vasta tsitaadiga

jt234 kirjutas:
Mis siinile see tuleb?


agp icon_razz1.gif

_________________
zero
Kommentaarid: 46 loe/lisa Kasutajad arvavad:  :: 3 :: 2 :: 39
tagasi üles
vaata kasutaja infot saada privaatsõnum
Ho Ho
HV Guru
Ho Ho

liitunud: 16.02.2002




sõnum 08.04.2006 16:13:42 vasta tsitaadiga

pci ja pcie 1x peaks esialgu olema, hiljem võivad ka pcie4x peale teha.
_________________
Teach a man to reason and he'll think for a lifetime
Common sense - so rare that it's a damn superpower
Vaadates paljude inimeste sõnavõtte siin ja mujal jääb üle ainult klassikuid tsiteerida - "I weep for humanity"
Kommentaarid: 106 loe/lisa Kasutajad arvavad:  :: 0 :: 1 :: 86
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
jt234
HV veteran
jt234

liitunud: 12.04.2005




sõnum 08.04.2006 16:14:20 vasta tsitaadiga

486 kirjutas:
jt234 kirjutas:
Mis siinile see tuleb?


agp icon_razz1.gif

irw icon_biggrin.gif ma saaks panna küll... icon_razz.gif
tänks ho-ho

_________________
Dima oli siin
Kommentaarid: 129 loe/lisa Kasutajad arvavad:  :: 2 :: 0 :: 121
tagasi üles
vaata kasutaja infot saada privaatsõnum
Scart
HV Guru
Scart

liitunud: 04.02.2002




sõnum 10.04.2006 22:24:43 vasta tsitaadiga

link :: kae siit

niisiis, asjad on kohal
Kommentaarid: 119 loe/lisa Kasutajad arvavad:  :: 5 :: 2 :: 101
tagasi üles
vaata kasutaja infot saada privaatsõnum
ikruusa
HV kasutaja

liitunud: 01.03.2003




sõnum 11.04.2006 01:29:03 vasta tsitaadiga

stepzter kirjutas:
Herr Kurm kirjutas:
sisuliselt on tegu erinevate asjadega. Üks on mõeldud tekstuuride liigutamiseks, teine füüsika käitamiseks.
Ja kohe kindlasti ei saa 1900xt vms hakkama selliste asjadega nagu see physix kaart kuna eesmärgid on erinevad

Sisuliselt on tegu mikroprotsessoritega. Esmane eesmärk nendel on tõepoolest erinev kuid tähtis on, millisel määral see arhitektuuri mõjutanud on.


Just. Tuletagem meelde, et kuidas lauaarvuti CPU omastas ka digitaalse signaaliprotsessori e. DSP võimed. MMX: tehti 47 uut käsku ja kasutati FPU registreid. SSE - lisati 8 uut 128 bitist registrit ja hunnik käske. SSE2 ja SSE3 on ainult uusi käske lisanud. SSE3 paar käsku on ehk threadide sync'imise puhul rohkem seotud ka HyperThreadingu jaoks tehtud arh. muudatustega, kuid ei midagi muud peale seotuse.
Kõik need laiendused evivad ühte tähtsat DSP oskust - SIMD töötlust. Muidugi X,Y eraldi registreid/andmesiine ning andmete liikumise teele "ettejäävaid" MAC üksusi ei ole. SIMD aga on tõenäoliselt nii mõnegi DSP-ga PCI kaarte teinud ja meeletu arvutusvõimsuse lubadustega firma põhja lasknud. Kui SIMD laiendust poleks tehtud, siis oleks meil kõigil siin mingid acceleration kaardid pesades.

Ehk seega - lisad näpuotsaga transistore juurde - mõni register ja käsudekooder kah "paar bitti" targemaks - ja sinu CPU'st või GPU'st või PPU'st saab AHVIPUU või mõni muu puu või kuidas soovite.

Ja see, et lisatakse juurde - pole kahtluski. Esiteks otsitakse jätkuvalt kõike, millega saab kiirelt arendustööd teha. Selline "väike" firma nagu Tensilica - vaadake hoolikalt, kes on on nende meeste portfellis http://www.tensilica.com/company/customer_profiles.htm. Ja kes mõtles shaderid välja? Kuidas sattus shading language OpenGL või DirectX teekidesse ja muidugi lõpuks ka GPU'desse? Ehh... keegi pisike Pixar alustas kogu kaklust icon_smile.gif
Ega siis küünal vaka alla ei jää ja ega ei suurtel (ostavad ära) ega väikestel (müüvad maha) rahahimu otsa pole saanud.
Ma ei imesta üldse, kui varsti on müüa GPU+UDUU ning kogu see komplutt on toetatud DirectX 12 ja OpenGL 3.0 poolt.
Ja mida paganat - otsige http://www.opengl.org/ esilehelt 6 v. 7 artikkel "Spherical Harmonics Generator using an OpenGL API-based interface" ja lugege introt. Et siin ei räägita füüsikast vä?

Ennustamine pole küll mingi tark tegevus, aga noh tuli siin jutuks.
Kommentaarid: 11 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 11
tagasi üles
vaata kasutaja infot saada privaatsõnum
Ho Ho
HV Guru
Ho Ho

liitunud: 16.02.2002




sõnum 11.04.2006 13:27:20 vasta tsitaadiga

stepzter küsis siin vahepeal et kuidas on lahendatud mälupöördus ja cached. Mõni päev tagasi kirjutati sellest nii:
http://www.beyond3d.com/forum/showpost.php?p=734086&postcount=1
tsitaat:
Still PPU has large internal memory in itself. It has various internal memories instead of cache, and has the organization that does explicit and programmable transfer between internal and external memories.

The patent explains memories such as dual-bank Inter-Engine Memory (IEM) connected to VPU, multi-purpose Scratch Pad Memory (SPM), DME Instruction Memory (DIM) which does instruction queuing, and so on. Hedge suggested that those memories in the patent are in the actual implementation by saying "they are probably included" in PPU.

Among those memories IEM is used in the way that looks like traditional data cache. According to the patent, DME loads a data set required for operation of processing units into IEM explicitly. Unlike cache memory, low-latency access is possible in IEM and apparently it could implement a large number of I/O ports. As the result, it could achieve huge internal memory bandwidth.

"One of the important factors in a physics architecture is it requires huge on-chip memory bandwidth. Our PPU has 2Tb(Tera-bit)/sec on-chip memory bandwidth," says Hedge.

In short, removing complicated cache control made it possible that PPU has L2-cache size internal memory with L1-cache latency and huge bandwidth, and it's suitable for physics algorithms according to them.
Lingil on asjast veidi pikemalt juttu.
_________________
Teach a man to reason and he'll think for a lifetime
Common sense - so rare that it's a damn superpower
Vaadates paljude inimeste sõnavõtte siin ja mujal jääb üle ainult klassikuid tsiteerida - "I weep for humanity"
Kommentaarid: 106 loe/lisa Kasutajad arvavad:  :: 0 :: 1 :: 86
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
Cyberlord
HV Guru

liitunud: 02.12.2003




sõnum 11.04.2006 15:53:33 vasta tsitaadiga

Omg tahan osta juba!
Ega vist ennem juunit eriti loota pole...Asus lubas mais hakata neid välja andma ja bfg toodab juba praegu aga minuteada seda bfg`d siia eesti kanti ei tooda.
Kommentaarid: 545 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 449
tagasi üles
vaata kasutaja infot saada privaatsõnum
stepzter
HV veteran
stepzter

liitunud: 11.11.2001




sõnum 11.04.2006 19:52:36 vasta tsitaadiga

No seda, et Cell ja Aegeia PPU vägagi ühte nägu on, oli aru saada juba sellest eelmisest artiklist. Kui võrrelda Celli, PPU ja R580 'e pixel shaderi osa (vertex shaderiga ei ole piiratud mälumudeli tõttu suurt halligi peale hakata mujal kui graafikas) arhitektuure, siis FPU osas on pilt umbes selline:
Cell: 8 x 4vec MADD (@3+GHz!!!)
PPU: 16 x 6vec MADD
R580: 4 x 48vec MADD + ADD
Nagu näha on R580'l granulaarsuse osas tugev puudujääk. Tegelikult on tehnilistel põhjustel R580 granulaarsus veel 2x kehvem, kui siit välja tuleb, andmesõltuvate hargnemiste seisukohalt ei oleks sugugi vale käsitleda R580't kui 2x96.
Mälumudelid on Cell'il ja PPU'l üsna sarnased, esimesel on küll lokaalset mälu suhtarvudena võttes 2x rohkem. R580'l on lokaalset mälu umbes samapalju kui PPU'l, kuid R580's on mälupöörduste latentsuse peitmine/paralleliseerimine lahendatud riistvaraliselt, mis vähendab natukene paindlikkust. Cell'is ja PPU's käib see tarkvaraliselt: küsid 4 sammu pärast töödeldava jupi jaoks vajalikud andmed ära, töötled vahepealsed 3 tükki ära ja selleks ajaks on mälust vajalikud andmed kohale ka jõudnud.

Kokkuvõttes võiks väita, et GPUde praeguste inkarnatsioonide lipulaev kipub veel asju liiga suurte tükkidena hammustama, mis arvatavasti siiski tekitab üsna paljudes füüsika töötlemise ülesannetes liiga suuri kadusid. Lisaks veel puudub mäluaadressitega hangeldamiseks jms. pudipadi jaoks hirmus kasulik integer ALU. Eks aeg näitab, mis järgmistest põlvkondadest oodata võib.
Kommentaarid: 26 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 26
tagasi üles
vaata kasutaja infot saada privaatsõnum
ikruusa
HV kasutaja

liitunud: 01.03.2003




sõnum 12.04.2006 01:22:42 vasta tsitaadiga

stepzter, vähe sellest, et seal pole integer ALU't - minu vähese info põhjal ei saa GPU'd üldse tavapärasel moel programmeerida. S.t. sellist mootorit, mis suudaks programmi täita ( a la if (a > b) {b++;} ) - sellist võimalust polegi. GPU'd juhib ikka CPU ja viimasele paistavad vist ainult video RAM, hunnik registreid ja loetud hulk käske, mida GPU'le närimiseks võib saata.
Jah neid massiive või vektoreid ridamisi (SIMD) omavahel korrutada/liita (ehk need samad 4 x 48vec MADD näitajad) - seda tehakse videokaardi peal kiiresti küll. Aga kui tõesti peaks ka midagi targemat (otseselt programmi) täitma hakkama, siis peab selle programmi ka GPU jaoks eraldi kirjutama (nagu praegu shaderite puhul).
Tõenäoliselt piisab GPU jaoks sellisest embedded stiilis CPU-st, mis tarbib 1-3mW/MHz. Ehk näiteks kui GPU käib 500 MHz, siis vajalik lisapower uue revolutsioonilise oskuse jaoks oleks 0.5-1.5 W icon_smile.gif Ehk pole probleem. Tehniliselt ei ole mitte mingist servast probleemi, aga kuidas see GPU uus tarkus mugavalt kasutusele võtta ja ära standardiseerida - selles on küsimus. Aga kui mingid suvalised hakkavad siin oma PPU'dega tõmblema, siis see on ainult vesi veskitele.
Muidu see PPU paistab üsna sümpaatne. Mitu eraldi mälu - selle kohta võiks öelda mitte dual-, aga multi-channel memory design. Loogish, et selle jaoks ka täpselt disainitud soft käib kiiresti. Integreeritud mäluks on lineaarselt adresseeritav mälu ja mitte cache: ise tirid vägisi oma andmed kohale ja ise tead, mis seal on, palju seal on ja kas üldse ära mahub. Cache on universaalne lahendus - misiganes proge saab võitu. Tavaline integreeritud mälu on mitteuniversaalne lahendus - esiteks see kood ei pruugi muu prose peal enam käia, teiseks pead kõik oma proged just ainult nii kirjutama.
Kui eesmärgiks on aga puhas kiirus, siis mõlemad arh. lahendused on ju OK ja üsna sarnased DSP lahendustele: mitu eraldi mälu mitme eraldi mälusiini otsas (mida see "eraldi" muud ikka tähendab).
Kommentaarid: 11 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 11
tagasi üles
vaata kasutaja infot saada privaatsõnum
stepzter
HV veteran
stepzter

liitunud: 11.11.2001




sõnum 12.04.2006 16:59:37 vasta tsitaadiga

ikruusa kirjutas:
stepzter, vähe sellest, et seal pole integer ALU't - minu vähese info põhjal ei saa GPU'd üldse tavapärasel moel programmeerida. S.t. sellist mootorit, mis suudaks programmi täita ( a la if (a > b) {b++;} ) - sellist võimalust polegi. GPU'd juhib ikka CPU ja viimasele paistavad vist ainult video RAM, hunnik registreid ja loetud hulk käske, mida GPU'le närimiseks võib saata.

Sinu vähene info on vananenud. Pixel shaderis töötab "if (a > b) {b++;}" alates NV40 ja R520'st, vertex shaderis, kui mälu mind ei peta, siis tunduvalt varem. Lisaks andmesõltuvale siirdele on muide ka funktsiooni välja kutsumise käsk täiesti olemas.
Praegustel GPU'del üks põhilisi probleeme on see, et käsuvõtu üksus suudab ainult üsna pisikesest lokaalsest mälust käske lugeda. Tuleviku GPU'delt ootakski ehk seda, et suudavad piiramatult suuri programme kasutada ja tiba pisema granulaarsusega tingimuslauseid täita. Unifitseeritud shaderi arhitketuuri puhul on see ilmselt pooleldi kohustuslik, kuna vertex shaderites tüüpiliselt kasutatavad algoritmid kipuvad olema oluliselt madalama koherentsusega, kui pixel shaderites. Kui ATI R600 on nii palju XBox 360'e Xenos'el põhinev, kui kõlakad uskuda lasevad, siis võiks oodata 16x4=64 elemendiliste tehete kaupa branchimist. (R580 osas tegin enne näpuka, see branchib 48 pikseli kaupa, ehk 192'se vektori kaupa)
ikruusa kirjutas:
Jah neid massiive või vektoreid ridamisi (SIMD) omavahel korrutada/liita (ehk need samad 4 x 48vec MADD näitajad) - seda tehakse videokaardi peal kiiresti küll. Aga kui tõesti peaks ka midagi targemat (otseselt programmi) täitma hakkama, siis peab selle programmi ka GPU jaoks eraldi kirjutama (nagu praegu shaderite puhul).

Ka mitmetasemelise mälumudelile (st. lokaalse mäluga protsessoreid) tuleb olemasolev tarkvara ümber kohendada, kaasaarvatud erinevate suurustega mälutasemete puhul. Programmeerimiskeele osas on asi nö. tarkvaraline probleem, mis mõningaid enamvähem arvestatavaid lahendusi juba omab. (vt. (Accelerator: simplified programming of graphics processing units for general-purpose uses via data-parallelism, Glift: Generic GPU Data Structures ja Brook for GPUs: Stream Computing on Graphics Hardware)

ikruusa kirjutas:
Kui eesmärgiks on aga puhas kiirus, siis mõlemad arh. lahendused on ju OK ja üsna sarnased DSP lahendustele: mitu eraldi mälu mitme eraldi mälusiini otsas (mida see "eraldi" muud ikka tähendab).

GPU lahendused on ka sarnased, kuigi mitte nii ilmutatult. Ka nendel on nö. lineaarselt adresseeritav lokaalne mälu hiiglasliku registrikogumi näol. (R580'l 16kB per paralleelne piksel, ehk 48x16=768kB kokku)
Kommentaarid: 26 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 26
tagasi üles
vaata kasutaja infot saada privaatsõnum
ikruusa
HV kasutaja

liitunud: 01.03.2003




sõnum 13.04.2006 13:28:54 vasta tsitaadiga

Sa mainisid, et GPUdel puudub praegu integer ALU ja oskus mäluaadressidega tegutseda. Ma ei ole veel sinu neid linke lugenud, aga preventiivne küsimus: kuidas siis osatakse mingil aadressil olevat programmi täita? "if (a > b) {b++;}" oli võib-olla liiga lihtne... ma mõtlesin programmikoodi kui sellist. Et kuskil mäluaadressil asub kood, mida tuleb hakata GPU'l täitma. Pole sellisest tehnoloogiast lihtsalt veel kuulnud. Eks ma muidugi püüan uurida icon_smile.gif
Teisalt kui hästi järgi mõelda, siis hakkab sellise asja jaoks juba ka mingit ajajaotamist ja lisatarkust vaja minema. Mingi pisike kernel peaks juba hakkama nii renderdamist kui ka nt. füüsikamootori elu kuidagi korraldama. Minu arvates oleks tegelikult selline asi graafikakaardi peal ebaoptimaalne ja ka raskelt teostatav (kuid mitte võimatu).
Peale sellist väljaütlemist tuleks PPU-le kõva pluss punkt anda icon_smile.gif Aga kuna ikkagi see on väga räigelt seotud mängude jõudlusega, siis GPU-de tegijad ei saa siin jääda neutraalseks. Selles ongi asja võlu ja jube huvitav on näha, et mis edasi saab.
Vanemad inimesed räägivad seda ka, et tühipaljas raud ei tee veel midagi. Kui on vaja midagi korda saata, siis selleks on vaja ka häid arendusvahendeid. Kui sa teed väga hea CPU, aga selle jaoks pole head C kompilaatorit ja debugerit, siis lähed põhja. Paralleel PPU'ga on sarnane. Kui neil meestel on head arendusvahendid mängutegijatele välja pakkuda, siis edasi lähebki tõeliselt põnevaks thumbs_up.gif
Kommentaarid: 11 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 11
tagasi üles
vaata kasutaja infot saada privaatsõnum
Ho Ho
HV Guru
Ho Ho

liitunud: 16.02.2002




sõnum 13.04.2006 13:45:18 vasta tsitaadiga

ikruusa kirjutas:
Kui neil meestel on head arendusvahendid mängutegijatele välja pakkuda, siis edasi lähebki tõeliselt põnevaks
Füüsika jaoks pole eriti keerukaid arendusvahendeid tarvis ning midagi on neil isegi olemas: http://www.ageia.com/developers/tools.html
_________________
Teach a man to reason and he'll think for a lifetime
Common sense - so rare that it's a damn superpower
Vaadates paljude inimeste sõnavõtte siin ja mujal jääb üle ainult klassikuid tsiteerida - "I weep for humanity"
Kommentaarid: 106 loe/lisa Kasutajad arvavad:  :: 0 :: 1 :: 86
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
näita postitusi alates eelmisest:   
uus teema   vasta Uudised »  Arvuti ja internet »  Aasta lõpus tuleb välja eraldi kaart füüsikamootorite jooksutamiseks? mine lehele eelmine  1, 2, 3, 4, 5, 6, 7, 8, 9  järgmine
[vaata eelmist teemat] [vaata järgmist teemat]
 lisa lemmikuks
näita foorumit:  
 ignoreeri teemat 
sa ei või postitada uusi teemasid siia foorumisse
sa ei või vastata selle foorumi teemadele
sa ei või muuta oma postitusi selles foorumis
sa ei või kustutada oma postitusi selles foorumis
sa ei või vastata küsitlustele selles foorumis
sa ei saa lisada manuseid selles foorumis
sa võid manuseid alla laadida selles foorumis



Hinnavaatlus ei vastuta foorumis tehtud postituste eest.