![]() |
| |
| Főoldal | IT/Tech | Tudomány | Játék | Mobil | Digicam | Film | Letöltés | Tárhely |
Szolgáltatások További cikkek Kiemelt cikkek |
Világcsúcs: egymilliárd rekordos adatbázis!
2006. január 24. 10:33, kedd - Forrás: SG.hu
A Wellcome Trust Sanger intézet "World Trace Archive" nevű, DNS-szekvenciákat nyilvántartó adatbázisának mérete elérte az egymilliárd rekordot.
Ez a milliárdos rekordmennyiség minden más ismert adattárnál nagyobb. Összehasonlításképp: a British Library 13 millió tételt tartalmaz, az amerikai kongresszusi könyvtár 115 milliót, míg a Trace Archive egymilliárd különálló információs egységet tárol. Az egyes genetikai adatrekordok átlagosan 864 karakter hosszúságúak. A tudósok a génszekvenciák között kereshetnek, és egymáshoz illeszthetik azokat a különböző élőlények (egerek, halak, legyek, baktériumok és persze az ember) teljes géntérképének összeállításához. Az adatok a világ bármely pontjáról korlátozás nélkül hozzáférhetők a génkutatók és szakemberek számára, akik egy adott betegség vagy gén tanulmányozása során könnyen letölthetik az adott területhez kapcsolódó már feltárt genetikai információt. Az egészség és a betegségek biológiai hátterét tanulmányozó tudományos és kereskedelmi szervezetek orvosbiológus kutatói aktívan használják ezeket az adatokat. Martin Widlake, a Wellcome Trust Sanger intézet adatbázis-szolgáltatásokért felelős igazgatója ezt mondta: "22 ezer gigabájtos méretével a Trace Archive a világ tíz legnagyobb UNIX-adatbázisa között van. Ez nem rossz teljesítmény egy 850 dolgozót foglalkoztató kutatási szervezettől, amely Cambridge határában található. "Az adathalmaz növekedésével egyre nagyobb problémát jelent az adatok elérése" - folytatta Martin Widlake. "Az egész adatbázisból egy adott génszekvenciát előkeresni olyan, mintha egyetlen mondatot keresnénk a British Library anyagában, ami meglehetősen munkaigényes feladat. A Sanger intézet csapata mindamellett olyan új módszereken dolgozik, amelyek könnyebbé teszik az adatok keresését és elérését." Ezt a hatalmas mennyiségű adatot egy Oracle Database 10g adatbázis kezeli. A feldolgozott adatokat négy HP ES45 szerverből álló fürt tölti fel az adatbázisba. A Winter Corporation 2005-ös, adatbázisokról készült felmérése szerint (amely a világ legnagyobb adatbázisait sorolja fel) a Trace Archive az ötödik helyezést éri el olyan óriások mögött, mint az AT&T, a Yahoo és egyéb globális vállalatok. A Winter listáján az Oracle-adatbázisok a legtöbb kategóriában az első helyen állnak. Így például Oracle-alapokon működik a világ legnagyobb kereskedelmi adatbázisa, a világ legnagyobb tudományos adatbázisa és a legnagyobb Linux alapú adatbázis is. Nyomozás a DNS után A Wellcome Trust Sanger intézetet 1992-ben alapították az ember és az egér génállományának feltérképezésére irányuló brit projekt központjaként. Az intézet az emberi génszekvenciák megközelítőleg egyharmadának, illetve az egerek esetében egyötödének feltérképezéséért felelős. A DNS-szekvenciák meghatározásánál a genetikai kód minden egyes "betűjét" (bázisát) fluoreszkáló anyaggal jelölik meg. A szekvenciát robotok olvassák ki, amelyek az egyes bázisokat a vörös, zöld, sárga vagy kék fluoreszcens fény mérési értékének csúcsaként érzékelik. A bázisoknak ez a leképezése a "nyom". Egy-egy ilyen nyers adatfájl nagyjából 200 KB méretű. A nyomot a robot szoftvere értelmezi, és hozzárendeli a megfelelő betűket (szaknyelven: "behívja" a bázisokat). A szekvenciát így kereshető karaktersorozattá alakítja. A közel egybillió karakterben történő kereséshez (egymilliárd rekord átlagosan 864 bázisról, továbbá néhány korábbi verziójú régebbi rekord) egyre gyorsabb programokra van szükség. Kapcsolódó cikkek
![]() VIA: itt az 50 dolláros minipécé Érdekes megoldással próbálkozik a jelenleg inkább helyét kereső gyártó, amely árában még az évekig oly sokat tárgyalt százdolláros laptopot is leveri, ám belső összetétele miatt komoly kétségeket támaszt jövőjét illetően.A táblagépek terén a Samsung megelőzte az AmazontAz idei esztendő első negyedévében a dél-koreai társaság sikeresen megelőzte az amerikai riválisát a tábla PC piacon és feljött a második helyre.A közösségi hálózatok felgyorsítják az információáramlástAz már korábban is ismert volt, hogy a közösségi honlapok a többi hálózatnál hatékonyabban képesek szétosztani az információkat, matematikailag azonban először sikerült ezt bizonyítani.Nehezen őrizhető meg a kulturális örökségünkA jelenlegi európai szerzői jog jelentős mértékben megnehezíti a különböző művek hosszú távú archiválását, éppen ezért lehetővé kellene tenni a könyvtárak számára az internetes tartalmak automatikus lementését, viszont korlátozni kellene a kópiák felhasználását - ezt sürgeti Eric Steinhauer, a Hageni Távegyetem könyvtárosa.
| Hirdetés
Cikkek Hírek |
Hozzászólások Bejelentkezéshez klikk ide (Regisztráció a fórum nyitóoldalán)
|