Opteron és Cell chipek az IBM új szuperszámítógépében
2006. szeptember 6. 10:32, szerda
Lapértesülések szerint a Nagy Kék Roadrunner, azaz Gyalogkakukk néven építené meg legújabb szuperszámítógépes rendszerét, amely az Opteron és Cell processzorokkal átszakítaná az 1 petaflopos álomhatárt.

Hirdetés

A jelenleg listavezető Blu Gene/L rendszereket is messze maga mögött hagyó új fejlesztés az elsősorban nukleáris fegyverek fejlesztésére szakosodott Los Alamos Nemzeti Laboratóriumban kapna helyet, ahol valószínűleg nem fagylaltgyártásra koncentrálnának. A projektben foglaltak végrehajtása - amennyiben a kivitelezést jóváhagyják - még szeptemberben elkezdődne, a munkálatok pedig jövőre fejeződnének be. Az IBM ezzel jó időre bebiztosítaná pozícióját a szuperszámítógépes ranglista élén, az USA pedig tovább folytathatná a nukleáris fegyverek "élettartamával" kapcsolatos vizsgálatait.

A Cnet értesülése szerint az IBM a napokban nyerte meg a májusban kiírt pályázatot, amelynek első lépcsőjére a felelős kongresszusi albizottság 35 millió dollárt különített el. A terv érdekessége, hogy a vállalat hibrid, kettős megoldást javasolt, az erőgépben ugyanis az AMD Opteron szerverprocesszorait használnák fel általános célokra, míg a Cell chipeket egyfajta gyorsítóként alkalmaznák. Érvelésük szerint a hagyományos fejlesztések nagy számban történő felhasználása a megugró fogyasztás miatt nem megfelelő, így mindenképpen szükség van a speciális célokra kifejlesztett chipekre is.


Az IBM első Cell processzor-alapú szervere

Pontosan ezt a feladatot hivatott elvégezni a Cell, amely az IBM-Toshiba-Sony hármas jóvoltából a PlayStation 3 konzol igényeire válaszul született meg. A kombinációval a cég számításai szerint elérhető az 1 petaflopos álomhatár, amivel messze maguk mögött hagynák a jelenlegi listavezetőket. A Blue Gene/L ugyanis 280 terafloppal vezeti a Top500 mezőnyét, ehhez képest a Roadrunner rögtön négyszeres ugrást jelentene. Ehhez hasonló hibrid megoldásként csak a Protein Explorer (Blue Protein), illetve a Tokióban lévő Tsubame rendszer szerepel az első között, előbbi a 15., utóbbi a 7. helyen.

A hírhez sem az IBM, sem a kutatólabor nem fűzött kommentárt, a bejelentésre azonban várhatóan a napokban sort kerítenek.
Kapcsolódó linkek
Laptopok

Már 49 900 Ft-tól!

E-book olvasók

Már 17 043 Ft-tól!

Tablet PC-k

Már 23 140 Ft-tól!

LCD monitorok

Már 19 800 Ft-tól!

részletek » részletek » részletek » részletek »
Megosztás
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
 

IT/Tech, Hardver
Tudomány, Mobil, Film, Játék
Hirdetés



Hozzászólások
A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
2007. nov. 14. 11:03 | válasz | #67
á hagyd ezt már többedszerre játszák le, sőt DEZ már máshol is sokat beszlgetett erröl.

Én egyébként a summa 512ram miatt kritizálom a PS3at, sok sikert igy az 1080ps játékok texturáihoz.

btw ezt érdemes megnézni nem gyenge és azért sejteti 512ram is sokmindenre elég: http://hardwired.hu/dl.php?id=5293&dl=1
item   2001. 10. 04. óta regisztrált VIP fórumozó 2001. 10. 04. óta regisztrált VIP fórumozó 2001. 10. 04. óta regisztrált VIP fórumozó
2006. dec. 18. 19:48 | galéria | válasz | #66
Srácok srácok, nyugalom! Egy jót derültem ezeken a kommenteken! Féreértés ne essék nem a szakmai hozzáértéseteken,hanem az egymás győzködésén! Amúgy szeretem olvasni a kommentjeiteket mert az átlag usernél több infóval rendelkeztek a hasonló témákban. PEACE...
dez  
2006. szept. 27. 16:31 | válasz | #65
Nono, éppenhogy többmindenről beszéltünk, közte a nagyrészt in-orderességről, illetve az egyszerűbb branch-predictionről, de másról is, és elhangzott olyan is, hogy erős butítás, stb. Egyszóval nem lehetett tudni, hogy a szóban forgó részben mikre gondolsz, 2 dologra vagy több dologra.
2006. szept. 26. 10:50 | válasz | #64
Elég alaposan átbeszéltük már a témát, szóval pontosan tudhattad, hogy mire gondolok. Ne csak olyat idézz, amikor épp nem részleteztem.
dez  
2006. szept. 25. 16:20 | válasz | #63
Nézd, ezt írtad: "Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban)." Korábban meg ilyesmiket írtál, hogy 'nagyon erősen lebutított mag, amiben nincs branch prediction (pedig van), stb.'. Nem pedig azt, hogy fejlett, de nagyrészt in-order mag, egyszerűsített branch predictionnel. Ebből nem derül ki, hágy kidobott fícsörre gondolsz, de arra mutat, jópárra. Szóval te magyarázkodsz. Én meg magyarázok. Nem ugyanaz. :)
2006. szept. 25. 11:56 | válasz | #62
Hiába magyarázkodsz, soha nem volt szó annál a kettőnél több "kidobott fícsörről".
dez  
2006. szept. 22. 16:04 | válasz | #61
Nem is tudom, ki hamisítja itt is a történelmet... Nem, nem 2 fícsörről volt szó, csak utólag "pontosítottad" erre, amikor már leírtam, mit is tud.
Eredetileg ezt írtad:
"Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban)."
Ez alapvetően úgy értelmezhető, hogy annyi minden ki van dobva, hogy ami marad, az egy 386-szerű proci.
2006. szept. 22. 15:17 | válasz | #60
Volt szó 2 (azaz kettő) darab fícsörről. Mint azt magad is kifejtetted többször is, ennél jóval több dologban különbözik egy mai proci egy 386-ostól. Ezért is írtam, hogy "ebből a szempontból". Szóval, ez azt jelenti, hogy a két említett fícsör kidobása (egyszerűsítése) nagy visszalépés a régebbi procik irányába. Nem is konkrétan az az érdekes, hogy 386 vagy P1 vagy mi, hanem hogy jelentős visszalépés. És a másik fontos dolog, hogy nincs szó a többi fícsörről, csak erről a kettőről.
dez  
2006. szept. 21. 18:47 | válasz | #59
Kértelek, hogy magyarázd meg, miről is beszéltél. Ezt válaszoltad:

"pontosan a "kidobott fícsörök"-ről (pontosabban az out-of-order és a branch prediction logika drasztikus egyszerűsítéséről) van szó"

És korábban meg ezt írtad:

"Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban)."

Hogy máshogy lehet ezt értelmezni, mint hogy a '"kidobott fícsörök" (pontosabban az out-of-order és a branch prediction logika drasztikus egyszerűsítése)' miatt szerinted "egy 386-oshoz hasonlít tudásban".

Az az óvodás, ahogy ki akarod magyarázni magad egy egyértelmű tévedésből. Ahelyett, hogy egyszerűen elismernéd, hogy oké, tévedtél.
2006. szept. 21. 17:04 | válasz | #58
"Minden másról??? Nem, csak arról, hogy az out-of-order és a branch prediction logika drasztikus egyszerűsíte miatt még messze nem lesz tudásban egy 386-oshoz hasonló a PPE."

Még mindíg nem fogod fel, hogy nem ezt mondtam? Komolyan, kezd ez az egész két óvodás vitájára hasonlítani.

"Ez nem igaz, csak próbálod magad kimenteni."

???
dez  
2006. szept. 20. 20:27 | válasz | #57
dez  
2006. szept. 20. 20:27 | válasz | #56
Minden másról??? Nem, csak arról, hogy az out-of-order és a branch prediction logika drasztikus egyszerűsíte miatt még messze nem lesz tudásban egy 386-oshoz hasonló a PPE.

"Nem derült ki a környezetéből sem, ezért reagáltam egyáltalán. És egyébként azt sem mondtam, hogy tudásban azonos lenne a PPE egy 386-tal, tehát még így is hülyeséget mondtál. Ha egy picikét pontosabban idéztél volna (vagy legalább elfogadtad volna a pontosításomat), akkor nem vitatkoznák itt már megint teljesen értelmetlenül."

Ez nem igaz, csak próbálod magad kimenteni.
2006. szept. 20. 16:42 | válasz | #55
Látod, megint beszélsz mindenféléről, aminek semmi köze a témához.
2006. szept. 20. 16:40 | válasz | #54
"Na, akkor azt magyarázd még meg, hogy milyen szempontból is, ha nem bizonyos kidobott fícsörök szempontjából?"

De pontosan a "kidobott fícsörök"-ről (pontosabban az out-of-order és a branch prediction logika drasztikus egyszerűsítéséről) van szó. Te beszélsz itten össze-vissza minden másról.

"Kár, hogy abból a mondatból nem derül ki, hogy teljesítményre vagy tudásra vonatkozik-e. A környezetéből viszont igen..."

Nem derült ki a környezetéből sem, ezért reagáltam egyáltalán. És egyébként azt sem mondtam, hogy tudásban azonos lenne a PPE egy 386-tal, tehát még így is hülyeséget mondtál. Ha egy picikét pontosabban idéztél volna (vagy legalább elfogadtad volna a pontosításomat), akkor nem vitatkoznák itt már megint teljesen értelmetlenül.
dez  
2006. szept. 19. 19:34 | válasz | #53
Mármint a fejlett SIMD egyég és L2 a magon[/-ban] már a PPE-ben van.
Ja, a 386-ban még L1 cache sem volt. Meg pipeline-ok sem... :D
dez  
2006. szept. 19. 19:10 | válasz | #52
Miért fájna? Csak egyszerűen nem igaz, ennyi az egész.

Tehát, kimondhatjuk, hogy olyan dolgok, mint superscalar architektúra, FPU + fejlett SIMD egyéség + L2 a magon, számodra a "tökéletesen lényegtelen" kategória? Hm.

És még az sem igaz, hogy P1, mivel tudtommal a P1-ben nincs a VMX-nek megfelelő fejlett SIMD egyég (~SSE3, csak sokkal több regiszterrel), és mintha 64 bites sem lenne... (Az SMT-t félretéve, hiszen az azon kívüli dolgokról beszélünk.)
dez  
2006. szept. 19. 18:29 | válasz | #51
"Ismétlem : Ebből a szempontból, nem úgy általában."

-- Na, akkor azt magyarázd még meg, hogy milyen szempontból is, ha nem bizonyos kidobott fícsörök szempontjából?

"Valahol igen, de én konkrétan az idézett mondatra reagáltam."

-- Á, ez lenne az "ellentámadás"...!? :D Kár, hogy abból a mondatból nem derül ki, hogy teljesítményre vagy tudásra vonatkozik-e. A környezetéből viszont igen...
2006. szept. 19. 08:38 | válasz | #50
Ja, és ha neked a 386 fáj, felőlem lehet pentium 1 is. Tökéletesen lényegtelen.
2006. szept. 19. 08:37 | válasz | #49
"Az is baromság, kedves BiroAndras, hogy a Cell PPE-je egy 386-oshoz hasonlít tudásban."

Ismétlem : Ebből a szempontból, nem úgy általában.

De Már kb. 10x annyit foglalkoztunk ezzel, mint amennyit az egész ér.

"És ha kicsit visszanézel, láthatod, hogy én nem teljesítményről beszéltem. Lévén a "386, csak nagy órajelen" is szerepelt valahol"

Valahol igen, de én konkrétan az idézett mondatra reagáltam.
dez  
2006. szept. 16. 16:36 | válasz | #48
Az is baromság, kedves BiroAndras, hogy a Cell PPE-je egy 386-oshoz hasonlít tudásban. Lásd alább. Esetleg azt mondhatnád, hogy bizonyos dolgokban a Pentium 1-hez, bizonyos dolgokban meg a Pentium Prohoz hasonlít. Viszont egy sor dologban jóval fejlettebb azoknál is.

És ha kicsit visszanézel, láthatod, hogy én nem teljesítményről beszéltem. Lévén a "386, csak nagy órajelen" is szerepelt valahol, aminek még lehetne nagy a teljesítménye, ha elég magas az az órajel.
2006. szept. 15. 18:42 | válasz | #47
"Ezt, hogy "Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban)." hogy lehet másképp érteni, mint úgy, hogy a kidobott fícsörök miatt egy 386-oshoz hasonlít tudásban?"

1. Tudásban, nem teljesítményben.
2. Ebből a szempontból, nem úgy általában.

Te ezzel szemben ezt írtad : Egy szóval sem mondtam, hogy pl. egy csúcs-Opteronnal is felveszi a versenyt a Cell PPE-je általános műveletvégzésben. De egy 386-nál, amit te mondtál, sokkal de sokkal jobb.

Itt egyértelműen teljesítményről beszélsz, ami baromság.
dez  
2006. szept. 14. 21:31 | válasz | #46
Igen, az előbb én is rátaláltam, csak máshol. Hát, azért kicsit húzós magánembereknek.

Így azért kérdéses, hogy tényleg lesz-e full Linux (hivatalosan) a PS3-hoz, hisz úgy "túl olcsón" juthat bárki bármire használható szép (mat.szám.) teljesítményhez. De majd meglátjuk.

Persze, a hatásfok csökken, de 2db-nál még nem, de pár darabnál sem feltétlenül.

16 ezer procira szétosztani valamit már nagyon nem könnyű, de ha sikerül, akkor elég jó teljesítmény jöhet ki. Ne felejtsük el, hogy itt nem 1-1 core-os procikról van szó, aminek az idejéből szépen elvesz az adatok fogadása/küldése. Hanem az adatok lokális ramba töltéséről a PPE gondolsokhat. Onnan/oda meg kvázi megszakítás nélkül dolgozhatnak az SPE-k.
shabba  
2006. szept. 14. 20:47 | válasz | #45
shabba  
2006. szept. 14. 20:42 | válasz | #44
Egy korábbi cikkből kiindulva, szerintem egy 2 celles lap kerülhet annyiba.

Cell processzoros gyorsítókártyát jelentett be a Mercury Computer Systems

Ezen a bővítő kártyán egyetlen cell van, hasonló sw körítés, hasonló 512mb xdr ram, viszont kisebb 2.4Ghz-es frekin és 8000 dolcsit kérnek érte. Szóval nem lennék meglepve ha az IBM 19 rongyot kérne egyetlen blade kártyáért. A 7 kártyás keret pedig jóval száz ezer fölött lenne.

A hatásfok azért biztos csökken a cpu-k számával. Az SG cikkben említett 16 ezer cell és 16 ezer opteron procis konfig esetén biztos hogy ez még fokozottabban igaz. A 32 ezer proci aggregált peak teljesítményét biztos hogy nem fogja hozni egy komlex rendszer.
dez  
2006. szept. 14. 20:08 | válasz | #43
Végre, már ideje volt. De most mi kerül majd 19e dollárba? Egy 2 Celles lap? Vagy egy blade keret?

Egyébként nem tudom, miért ír ilyeneket a HWSW (állandóan), hogy "Ezek összesített elméleti csúcsteljesítménye meghaladja a 3,2 teraflopsot (64 biten 300 gigaflopsot), igaz ezt teljes egészében szinte képtelenség a valóságban kiaknázni, egy ilyen klaszter estetében 50 százalékos hatékonyság már jónak számít.", amikor az IBM már bizonyította, hogy jópár feladatban, köztük a Linpackban normális keretek közötti optimizációval 75-92%-os kihasználás érhető el.
dez  
2006. szept. 14. 15:42 | válasz | #41
Ezt, hogy "Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban)." hogy lehet másképp érteni, mint úgy, hogy a kidobott fícsörök miatt egy 386-oshoz hasonlít tudásban?
dez  
2006. szept. 14. 15:40 | válasz | #40
"De full in-order. A branch prediction az amit nem vettek ki teljesen."

Mondom, hogy nem full in-order. Lásd:
"In order to improve performance from its in-order pipeline, the PPE utilizes delayed-execution pipelines and allows limited out-of-order execution of load instructions. This allows the PPE to get some of the advantages of out-of-order execution without any significant increase in complexity."
2006. szept. 14. 13:22 | válasz | #39
"Nos, mint már szó volt róla (de a túl sok szó között nagyon elvész a lényeg), az in-orderről annyi mondható el negatívumként, hogy némileg kevésbé hatékony, mint az out-of-order (hozzátéve, hogy a PPE sem full in-order), és jóval nagyobb hangsúly helyeződik a fordító optimizálási képességére (a run-time "optimizálás" nagy része ide van áthelyezve, azzal sok-sok tranyót megspórolva) - utóbbi jósága sokban ellensúlyozza az elsőt."

Nos, mint már szó volt róla, nem ilyen egyszerű a helyzet, de nincs kedvem megint újrakezdeni az egészet.
2006. szept. 14. 13:20 | válasz | #38
"Ezt írtad (arra reagálva, hogy a PPE HW SMT-s):
"Hát bizonyos esetekben esetleg lehet jobb, de általában nem az. Egy tipikus egy szálon futó gamelogic kód szerintem semmi hasznát nem veszi. Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban).""

Tehát azt írtam, hogy EBBŐL A SZEMPONTBÓL. És egyébként se értem, hogy minek lovagolsz ezen, már rég megbeszéltük.

"Tehát, bár HW SMT-s, de egyéb szempontból egy 386-hoz hasonlít tudásban."

Olvasási, vagy szövegértési problémáid vannak. Az "egyéb szempontból", és az "ebből a szempontból" közt óriási különbség van.
2006. szept. 14. 13:13 | válasz | #37
"De, pontosan azt mondtad, hogy a PPE egy magas órajelű 386-nak felel meg, miért tagadod?"

Azért tagadom mert nem ezt írtam. Egyébként is az előbb órajelről nem beszéltél, idézem : de egy 386-nál, amit te mondtál, sokkal de sokkal jobb.

"És nem visszalépés, csak más filozófia."

Visszalépés abból a szempontból, hogy régebben már volt ilyen megoldás. Ez önmagában nem jelenti szükségképp azt hogy rosszabb. A Core2 is visszalépés a P4-hez képest a P3 felé, de sikerült csak a rossz megoldásoktól megszabadulni.
Viszont a cell-nél a visszalépés azt is jelenti, hogy az azóta felhalmozott tapasztalatot ki lehet dobni a technológiával együtt, és újra kell tanulni sokmindent. Ennyi hátránya biztosan van, és az még nem biztos, hogy a régi-új filozófia beválik.

"Mint már írtam neked, pl. az Itanium is in-orderes."

Mint már írtam neked, az Itanium nem sikerült túl jól, így nem lehet ebből következtetést levonni.

"Ráadásul a PPE nem full in-order, hanem egyfajta hibrid!"

De full in-order. A branch prediction az amit nem vettek ki teljesen.
dez  
2006. szept. 13. 21:55 | válasz | #36
És ugye az a "többi kidobott fícsör" is az in-order rendszer miatt vált fölöslegessé.

Nos, mint már szó volt róla (de a túl sok szó között nagyon elvész a lényeg), az in-orderről annyi mondható el negatívumként, hogy némileg kevésbé hatékony, mint az out-of-order (hozzátéve, hogy a PPE sem full in-order), és jóval nagyobb hangsúly helyeződik a fordító optimizálási képességére (a run-time "optimizálás" nagy része ide van áthelyezve, azzal sok-sok tranyót megspórolva) - utóbbi jósága sokban ellensúlyozza az elsőt.
dez  
2006. szept. 13. 21:46 | válasz | #35
Ja, és nem beszélve ilyenekről, hogy a 386-osnak csak csak pár (16-32 bites), meghatározott utasításokban használható regisztere volt, miközben a PPE-nek (mint a többi PowerPC procinak) 32db (itt 64 bites) általánosan használható, 128db SIMD regisztere, és jópár speciális regisztere van (és mindebből 2 set, szálanként egy); nagy rugalmasságot adó címzésmódok és kondiciónális végrehajtás; és még jópár ilyesmi.

Te vagy messze nem értesz ehhez annyira, mint megjátszod, vagy néha nagyon nem vagy magadnál.

(Most majd jön a magyarázat, hogy te nem is úgy gondoltad... )
dez  
2006. szept. 13. 21:28 | válasz | #34
Ezt írtad (arra reagálva, hogy a PPE HW SMT-s):
"Hát bizonyos esetekben esetleg lehet jobb, de általában nem az. Egy tipikus egy szálon futó gamelogic kód szerintem semmi hasznát nem veszi. Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban)."

Tehát, bár HW SMT-s, de egyéb szempontból egy 386-hoz hasonlít tudásban. Nos, ez egy jó nagy butaság. Kezdve ott, hogy a 386 még csak superscalar sem volt. Továbbá csak 32 bites volt, nem 64, nem volt benne FPU, MMU, SIMD egység, L2 cache, nuku branch prediction, stb. stb. Kicsit túlértékelted azt, hogy nem out-of-orderes, hanem in-order, némi out-of-order beütéssel...
dez  
2006. szept. 13. 21:10 | válasz | #33
A Cell valóban, de a PPE (Power Processing Element, norm. CPU mag) miért lenne az?
[Jakuza]   "Rest in Peace [Jakuza]" 
2006. szept. 13. 20:00 | galéria | válasz | #32
Olvasni tud e meltosagosuram ?
Bizony bonyolultabb programozas szempontjabol.
dez  
2006. szept. 13. 19:12 | válasz | #31
Túl bonyolult a PPE? :P
dez  
2006. szept. 13. 19:11 | válasz | #30
De, pontosan azt mondtad, hogy a PPE egy magas órajelű 386-nak felel meg, miért tagadod?

És nem visszalépés, csak más filozófia. Mint már írtam neked, pl. az Itanium is in-orderes. Ráadásul a PPE nem full in-order, hanem egyfajta hibrid! De ezt is írtam már. (De mindek...?)
[Jakuza]   "Rest in Peace [Jakuza]" 
2006. szept. 13. 11:02 | galéria | válasz | #29
Pontosan.
Raadasul programozhatosag (tul bonyolult) szempontjabol is visszalepes.
2006. szept. 13. 10:58 | válasz | #28
"De egy 386-nál, amit te mondtál, sokkal de sokkal jobb."

Értsd már meg, hogy nem erről beszéltem. Arról van csak szó, hogy a PPE az utasítás végrehajtás menete szempontjából nagy visszalépés a mai procikhoz képest.
dez  
2006. szept. 11. 20:31 | válasz | #27
PPE-hez: persze nem árt, ha a sűrűbben hozzáfért adatok nagy része befér a cache-ekbe, vagy szekvenciálisan olvashatók a ramból, mert itt jóval nagyobb a latency, mint A64-nél. (De a sávszélesség is.)
dez  
2006. szept. 11. 19:22 | válasz | #26
Egy szóval sem mondtam, hogy pl. egy csúcs-Opteronnal is felveszi a versenyt a Cell PPE-je általános műveletvégzésben. De egy 386-nál, amit te mondtál, sokkal de sokkal jobb. Kb. egy 2GHz-es (3000+) A64-nek felel meg szerintem. (Egy jó fordító használatával.)

(Az SPE-k sem csak a SIMD kódot ismerik, hanem a teljes PPC utasításkészletet, csak nem az órajelüknek megfelelő teljesítménnyel hajtják azokat végre.)

Nem tudom, egy szuperszámítógépnél mekkora szükség van általános műveletvégzésre a matematikai számítások mellett, de ha van, akkor azért arra jól jönnek az Opteronok. Továbbá, szuperszámítógépről van szó, nagyon sok adat áramlik a procik között, ennek szervezésére és lebonyolítására is jól jön a segítség.
2006. szept. 11. 16:07 | válasz | #25
"Nem érted? Na ne mondd, tudod te azt"

Az irónia nevű izéről hallottál már?
De vehetjük úgy is, hogy a kérdés neked szól. Te bizonygatod, hogy olyan jó a cell önmagában is. Akkor magyarázd meg, hogy az IBM miért bízik kevésbbé a saját procijában.
dez  
2006. szept. 07. 16:14 | válasz | #24
Nos ha 16 GFLOPS-t veszünk a Double Precision LinPack esetén (PPE-t is beleszámolva, mert miért hagynák parlagon a bővített VMX-ét), 16 x 16000 = 256000. És ehhez jön a 16000 Opteron teljesítménye. Így az első hely simán megvan.

A HWSW elméleti maximum FLOPS adata hibás [jellemző, a PS3-at és a Cellt mindig lehúzzák], pontosabban egy korai, 2.4GHz-es példányra vonatkozik. 3.2GHz-en kb. 240 GFLOPS. (25,6 [SPE] x 8 + 35 [PPE])

Nos azért talán nem teljesen mellékes, hogy 16000 Cell S.P. maximuma 3840000 GFLOPS, azaz 3.84 PFLOPS. Jól fog az még jönni sok számításnál. :P
dez  
2006. szept. 07. 15:32 | válasz | #23
Nem érted? Na ne mondd, tudod te azt, hiszen állandóan kántálod: a Cell általános feladatvégrehajtási (nem mat. számítási) teljesítménye kisebb, mint egy Opteroné, és a nagy mennyiséű adathoz (ami nem fér a fél mega L2-be) való totál random hozzáférés nagy latency-vel jár (bár a sávszél elég jó, szekvenciális olvasás esetén nincs probléma).

Hozzáteszem, a Cellből később lesz több változat is, több PPE-vel és/vagy több SPE-vel.
shabba  
2006. szept. 07. 13:27 | válasz | #22
Hmm ebben a cikkben az szerepel 16 ezer opteron és 16 ezer cell lesz a rendszerben.

http://www.hwsw.hu/hirek/32021/ibm_szuperszamitogep_roadrunner_los_alamos_national_laboratory_cell_playstation_3.html

Itt pedig a LinPack benchmark top 500-as tesztjéről azt írja a FAQ, hogy nem a single és double precision a lényeg, hisz egyes rendszereknél a singe precision már alapban 64 bitet jelent. A benchmark tesztnek 64 bit vagy a fölötti pontosságon kell lefutnia, 32 bites pontosságról nem igazán írnak.

http://netlib2.cs.utk.edu/utk/people/JackDongarra/faq-linpack.html

Márpedig az 1 pflops-ot ez a rendszer csak 32 bites pontosság mellett fogja teljesíteni, kiindulva az IBM által prezentált LinPack mérési adatokból. Az meg mérés szempontjából nem lesz hiteles eredmény a top500-ba. 64 bit pontosság mellett nem hisz hogy le fogja gyűrni BlueGene-t.
2006. szept. 07. 10:03 | válasz | #21
Csak azt nem értem, hogy ha ilyen durva a cell, akkor minek csomagolnak mellé 1-1 opteront.
dez  
2006. szept. 07. 04:00 | válasz | #20
Ja tényleg, valamit el is felejtettem: az alábbi számok csak az SPE-ken alapultak, pedig a PPE (normal CPU mag bővített VMX egységgel) még több FLOPS-ot tud, mint 1db SPE, szal azt is hozzá lehetne adni.
2006. szept. 06. 21:47 | válasz | #19
cell meg core2 meg hasonló inteles procik ég és föld a kettő

IBM-Toshiba-Sony nem véletlen hogy ezek + még néhány cég anno villámgyorsan összefogtak hogy végre legyen már egy sokkal értelmesebb felépítésü proci is
dez  
2006. szept. 06. 21:35 | válasz | #18
Nos DP-ben 1kx1k 9.46, 2kx2k 11.05, viszont SP-ben 4kx4k 155.5.

Még hozzátenném, ezek 3.2GHz-en értendők, 90nm-en. Egy rosszul szellőző PS3-ben is mennek ennyit, valamivel jobb hűtéssel simán mennek 4GHz-en (~5GHz volt a csúcs). Jövőre meg már 65nm-en készülnek...
dez  
2006. szept. 06. 21:22 | válasz | #17
Bizony, fontos szempont a Cell brutális sávszéle is, hogy a parallel architektúrák támogatása. Itt visszájára fordul a kritikusok vesszőparipája: "a FLOPS nem minden". :)

Apropó FLOPS, sajnos sokan nem fogják fel, hogy az S is hozzá tartozik a mértékegységhez, az jelzi az időegységet. Mint a km/h-nál a h.

Még egy megjegyzés a cikkhez: a Cell eleve nem csak a PS3-ba készült, már a kezdetekkor terveztek más alkalmazást is.
dez  
2006. szept. 06. 21:16 | válasz | #16
Várjuk meg, mikor épít 4-core Core2-esekből szuperszámítógépet az Intel. (És mennyiért.)
dez  
2006. szept. 06. 21:14 | válasz | #15
Magam is ezt az oldalt akartam linkelni.

Megjegyzések:
Double prec. Linpack 1kx1k-ben tényleg csak ~30%-kal gyorsabb, mint egy 3.6-os P4. (2kx2k-ban valamivel gyorsabb. Single-ben meg 6x-os, de ezt írtad.)

De ne csak ezt az egy adatot nézzük! Alább több alkalmazásnál akár 1db SPE is 2x gyorsabb, mint egy P4... 8 SPE így 16x-os teljesítményt hoz.

Bizonyos dolgokban meg 35x gyorsabb.

Kb. 2 éve írtam egyszer az IBM-nek (valamilyen Celles infó emailre), és rákérdeztem erre a Single Precision dologra, tehát hogy ez elég-e tudományos célokra. Azt válaszolták, hogy a legtöbb esetben elegendő.
2006. szept. 06. 17:58 | válasz | #14
Nem gondolod, hogy az USA nukleáris program előnyben részesedik a játékkonzolokhoz képest, meg ehhez adnám még hogy a Cell-t az IBM gyártja, tehát nem kell neki várnia, hogy legyen elég a piacon. A hír szerint egyébként 2007-ben lesz kész. Akkor az 1 PFLOPS azt hiszem elég komoly lesz (szerintem a jelenlegi BlueGene marad még egy évig a csúcs és az még csak picit több mint 1/4 PFLOPS. Különben sem lehet egy ilyen rendszert a Core 2-hez hasonlítani, igaz, hogy a Core 2 fogyasztása már nem olyan magas mint a NetBurst volt, de azért még mindég több mint a Cell, ugyanakkor a Core 2 nem lett Massive Paralell architektúrákra tervezve, míg a Cell igen és sokkal könyebben (olvasd) olcsóbban skálázható. Szóval senkinek sem fog az eszébe jutni, hogy Core 2-ből szuperszámítógépet építsen (persze lesz esetleg cluster rendzser belőlle, de az nem fogja meg sem közelíteni a PFLOPS-ot).

Aztán a cikkben ki kellene javítani a dolgokat, mert "petaflopos" nem létezik, nem flop hanem FLOPS, vagyis FLoating point Operations Per Second.
shabba  
2006. szept. 06. 16:40 | válasz | #13
Ahogy az oldalon is szerepel a SP max peak teljesítménye a cellnek 230 GFLOPS, DP-nél ez már lecsökken 21 GFLOPS-ra. És mire szélesebb körben hozzáférhető lesz a Cell, úgy hogy elég számú fölös kapacitás legyen a konzolos eladásokon felül egy ilyen project beindításához az még odébb lesz. Aztán utána még meg is kell építeni a rendszert. Mire elkészül szerintem lesz vagy 2010 addigra meg már az akkori eredményekhez mérten kell nézni ezt az 1 PFLOPS-ot.

Mire jővőre elérhetők lesznek jobban a Cell procik, addigra már az Intel is 4 coreos Core2-eseket fog gyártani. Double precisionban azok már biztos le fogják nyomni a Cell-t és SP-ben is egyre jobban a nyakára fog mászni, bár ott soká lesz még mire utolérik.
shabba  
2006. szept. 06. 16:29 | válasz | #12
Ha beírod gugliba a linpack+cell mágikus szavakat akkor elsőnek egy ibm-es tesztet dob ki:

http://www-128.ibm.com/developerworks/power/library/pa-cellperf/

Kár hogy az összehasonlításban az Intelnek csak a régi NetBurst architectúrájú procija szerepel, kíváncsi lennék egy Core2-es WoodCresttel mit produkálna.

Mindesetre ebből is látszik hogy single precisionban a cell nagyon jó közel 6x gyorsabb mint P4-es. Viszont double precision esetén az előny minimálisra csökken úgy ~35%-os. Ezt szerintem az új Core2-es architechtúra lazán behozta, főleg azonos 3.2Ghz-es sebességen összevetve.

Persze szépek ezek a single precision eredmények a Cell-től de tudományos számításoknál nem hiszem hogy ilyennel szoktak számolni, ott azért a standard a double precision floating point.
mir  
2006. szept. 06. 15:40 | válasz | #11
s/terrabyte/terraflops/
mir  
2006. szept. 06. 15:40 | válasz | #10
ahhoz az ,,osszedobnak'' reszhez csak annyit szolnek hozza, hogy a top100-ba bekerulo szuperszamitogepek messze a legdragabb reszegysege az interconnect, majd ezutan kovetkeznek a szerverek amikbe beleteszik a ramot, ezutan jon a RAM, majd _legvegul_ a processzorok. Raadasul az a 2 terrabyte messze all a valosagtol, ha akar a LinPack futtatasa eseten elerik a 100 GFLOPSt mar baromi joljarnak, de szerintem joval lentebb lesz az.
mir  
2006. szept. 06. 15:37 | válasz | #9
raadasul a 256 is mindossze az elmeleti korlat, a gyakorlat ennel joval rosszabb lesz, raadasul nem minden muveletre jon ossze a 256 sem (es mint mondtad nem is single precession :) )
2006. szept. 06. 14:33 | válasz | #8
Izé...27, de jó lenne ha ezen a fórumon is lehetne a hsz-eket módosítani...
2006. szept. 06. 14:32 | válasz | #7
És így "csak" kicsit több mint 500 proci kéne. 25 db 20 procis szervert összedobnak és kész is...na jó, 22.
2006. szept. 06. 14:27 | válasz | #6
Én úgy tudom,hogy 2Tera Flop körül van, nem?
shabba  
2006. szept. 06. 14:27 | válasz | #5
Szerintem egy szuperszámítógépen nem single precisionnal fognak számolni, főleg nem nukleáris kutatásoknál. Akkor pedig a 256 gflops máris nem annyi.
2006. szept. 06. 13:54 | válasz | #4
A cell nyers teljesítménye 256gflpos. Ez alapján kb. 4000 darab kell. Ennél sokszor több procis gépek is vannak.
2006. szept. 06. 13:33 | válasz | #3
Csak a lényeg hiányzik a hirböl :)
Hány Cell ill. Opteron kell az 1 petaFlops hoz ?
Cat  
2006. szept. 06. 11:24 | galéria | válasz | #2
floating point operations per second, azaz a másodpercenkénti lebegőpontos számítások mennyisége.

Egy csúcs pc kb. 10 GFLOPS
2006. szept. 06. 11:12 | válasz | #1
Valaki segítene mit is jelent a "flop" ?
Köszi