Újraalkotják a robotok az emberi beszédet
2005. május 27. 11:48, péntek
Bemutatták Japánban az első olyan robotot, ami a beszéd utánzásához az emberekéhez hasonló hangképző szerveket használ, mint az artikuláláshoz elengedhetetlen nyelv, gége és ajkak.

A Waseda Egyetem Waseda Talker 4, röviden WT-4 robotja mélyebb betekintést nyújthat a tudósoknak, hogyan írányítja az agy a kommunikációt, valamint új módszerekhez és kommunikációs eszközökhöz vezethet el azok számára, akik nem képesek a beszédre. Léteznek olyan humanoid robotok is, melyek mesterséges tüdővel és hangszálakkal vannak ellátva, azonban a WT-4 túlmutat ezeken: nem csupán a fenti két dolgot egyesíti magában, de van gépesített nyelve, szájpadlása, ajka és foga, mely mind hozzájárul az artikuláláshoz.

A robot pillanatnyilag a japán ábécét és 50 különböző szótagot képes kimondani. Előbbi öt magánhangzóból és tizenöt mássalhangzóból áll, és aki már próbálkozott a nyelv elsajátításával, az tanúsíthatja, hogy kimondásuk nem is olyan könnyű feladat. A hangképző szerveket közös munkára bírni egyáltalán nem egyszerű, sőt kifejezetten időigényes feladat, mivel minden szervnek eltérő a mozgástartománya. A tüdő például csak egy szabadságfokú: a levegőt a torok felé préseli, a nyelv ezzel szemben hét szabadságfokú.

Klikk ide! Klikk ide!
Klikk a képekre a nagyobb változathoz

Az emberek agyukra hagyatkoznak a rendszer összehangolását illetően. A Waseda Egyetem robotja egy számítógépes modellen alapul, ami meghatározza minden egyes szerv működéshez szükséges paramétert, hogy együtt szavakat tudjanak alkotni. A modell egy hallás visszajelző rendszerbe is be van kapcsolva, mellyel a robot utánozza az emberi hangot. Miután valaki belemond egy szót a géphez csatlakoztatott mikrofonba, egy, a modellen alapuló szoftver elemzi a hangot, majd beállítja a nyelv, az ajkak, a fogak, a szájpadlás és a hangszálak mozgási paramétereit.

A kutatók az ember által kimondott szavakat a gép általi utánzással összevetve tovább finomíthatják a rendszert, valamint megfigyelhetik, hogyan befolyásolják a hangképző szervek változásai a végeredményt, például a hangmagasság módosulását a hangszálak feszességének függvényében. Ha sikerül tökéletesíteni, akkor a rendszer olyan számítógépes eszközöknél is alkalmazhatóvá válik, melyek a vokális képességekkel nem rendelkezők helyett beszélnek.

Letölthető videók:
  • 1. videó (aiueo)
  • 2. videó (sasisuseso)
  • 3 .videó (papipupepo)
  • 4. videó (mimika)
    Megosztás
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
     

  • IT/Tech, Hardver
    Tudomány, Mobil, Film, Játék
    Az internet szabadságáért tüntettek Budapesten Az internet szabadságáért és a Hamisítás Elleni Kereskedelmi Megállapodás, az ACTA ratifikálása ellen tiltakoztak szombat délután mintegy ezren a fővárosban.King Arthur II - The Role-playing Wargame Kiadó: Paradox Interactive Fejlesztő: Neocore Games Honlap Rendszerkövetelmények: Minimum: Dual Core E2180 2,0 GHz-es processzor, 1,5 GB RAM, GeForce 8800 GTS vagy Radeon HD 3850 X2 grafikus kártya, 16 GB szabad hely a merevlemezen Ajánlott: Core 2 Quad Q6600 2,4 GHz-es processzor, 2 GB RAM, GeForce GTX 460 SE vagy Radeon HD 5830 grafikus kártya, 16 GB szabad hely a merevlemezen Hasonló játékok: King Arthur, King Arthur: The Druids, King Arthur: The Saxons, Total War-sorozat Kategória: stratégia A játékosok közül bizonyára nagyon sokan emlékeznek még 2009 zimankós novemberére, amikor a magyar játékfejlesztés történelemkönyvébe egy újabb fontos fejezetet írt a hazai Neocore Games csapata.Harmadára csökkentették a Sigma SD1 árátA Sigma gyártástechnológiai változtatásokra hivatkozva radikálisan átalakította csúcskategóriás készüléke, az SD1-es árazását.LG Optimus Vu és Miracle, új Nokia Egyszerre három új okostelefonról futott be hír a napokban, bár ezek közül csak kettőről tudjuk, hogy nagyjából mire is számíthatunk.Félmillió állás az appfejlesztésben Csak a tengerentúlon majdnem félmillió új állást köszönhetnek az okostelefonra és tábla PC-re fejlesztett appok megjelenésének és immár széleskörű alkalmazásának, bár ez a terület gyorsan változik.
    Hirdetés



    Hozzászólások
    A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
    Bejelentkezéshez klikk ide
    (Regisztráció a fórum nyitóoldalán)
    Tetsuo  
    2005. jún. 05. 03:54 | válasz | #31
    Még zongorát sem tudnak úgy szimulálni, hogy egy zongorista meg ne hallja a különbséget..
    2005. máj. 30. 12:55 | válasz | #30
    nemá c3πo japánul tudjon elöször... :)
    2005. máj. 30. 12:00 | válasz | #29
    Istenem nekem nem kell hogy bexéljen elég ha tud mosogatni, főzni és takarítani!!:DD
    2005. máj. 29. 22:56 | válasz | #28
    Már látom a jövőt, mint az A.I.-ban "szaxizó" robotprostik....
    benli  
    2005. máj. 28. 19:55 | válasz | #27
    Ha nem sikerül majd átalakítják valamilyen exrém shopp eszköznek. Széles szájú békákat már árulnak ha jól tudom. :-) Remélem azért az agy feltérképezése azért sikeres lesz, mert ott sok minden megszületik és eltűnik.
    2005. máj. 28. 19:00 | válasz | #26
    A hetedik irány a negyedik dimenzió irányába mutat....
    :) :) :) :) de akkor kell lennie nyolcadik iránynak is.. azt hiszem...
    dez  
    2005. máj. 28. 17:24 | válasz | #25
    Nem forog a nyelve (olyan jól)...? :D
    2005. máj. 28. 12:53 | válasz | #24
    "A tüdő például csak egy irányba mozog, a levegőt a torok felé préseli, míg a nyelv hét különböző irányra képes."
    A hetetik irányra nem mindenki képes, kitaláljátok melyik az?
    fel, le, jobbra, balra, előre hátra, ?


    És miért kell neki az a pléh láb, bádogemer?
    Mberke  
    2005. máj. 28. 10:28 | válasz | #23
    Nem lenne egyszerübb ha virtuálisan szimulálnák le a hangképző szerveket, majd a hangot hangszórón szólaltatnák meg? Nem annyira látványos, de olcsóbb lenne és praktikusabb!
    2005. máj. 28. 10:18 | válasz | #22
    :DD
    2005. máj. 28. 07:19 | galéria | válasz | #21
    Erről a Bill és Ted haláli túrája jutott eszembe :)))
    Ott csak háttérzenészek voltak a robik, de hát fejlődik a világ
    Egyébként tutira a lábából nyeri ki a ..... zokszigént
    dez  
    2005. máj. 28. 01:39 | válasz | #20
    Most jut az eszembe, már van is olyan program, amit nem hogy teljesen jó beszédet tud (pontosabban az nem tud, de tudhatna), hanem énekelni. Úgy hívjálk Yamaha Vocaloid.
    dez  
    2005. máj. 28. 01:36 | válasz | #19
    Te viccet is faarccal adsz elő? :p
    2005. máj. 27. 23:20 | válasz | #18
    ezt továbbgondolva...
    lesznek majd éneklő robotok programozható hangszínnel. És mindig ott leszenk a TOP 10 be. MErt a programozók mindig az adott időszak/kor Hangideálját programozzák bele.

    lesz hörgős robot.
    britni szpirsz utánzat
    lesznek robot bandák.. Lehetőleg öten és fiunak öltöztetve
    meg lesznek. sikertelen Időszakos robot énekesek. akik a bárokban fognak énekelni...
    2005. máj. 27. 23:16 | válasz | #17
    de miért csináltak neki lábat? Az is kell a hangképzéshez?

    azért egy "görbe bögre..." mondókát megnéznék tőle.
    2005. máj. 27. 19:07 | galéria | válasz | #16
    A RIAA már biztos tiltakozik, mert Britney Spears számok eléneklésére is képes lehet a robot
    2005. máj. 27. 17:59 | válasz | #15
    Ez a cucc pont ezt teszi, fizikailag szimulalja az emberi hangkepzo szerveket.
    2005. máj. 27. 17:32 | galéria | válasz | #14
    öööööö

    "Miután valaki belemond egy szót a géphez csatlakoztatott mikrofonba, egy, a modellen alapuló szoftver elemzi a hangot,... "

    ><

    "Ha sikerül tökéletesíteni, akkor a rendszer olyan számítógépes eszközöknél is alkalmazhatóvá válik, melyek a vokális képességekkel nem rendelkezők helyett beszélnek."
    dez  
    2005. máj. 27. 17:31 | válasz | #13
    Igen, mert azok túl egyszerűek (hangmintákat játszanak le egymás után, csak a hangerőt, -magasságot és sebességet variálva). De lehetne a fenti szerkezetet, vagy épp az emberi hangképző szerveket szimulálni is (fizikailag).
    Pharaoh   2001. 04. 25. óta regisztrált VIP fórumozó 2001. 04. 25. óta regisztrált VIP fórumozó 2001. 04. 25. óta regisztrált VIP fórumozó
    2005. máj. 27. 16:27 | galéria | válasz | #12
    "A robot pillanatnyilag a japán ábécét és 50 különböző szótagot képes kimondani."

    Mivel a japán ábécé szótag ábécé ez a kettő ugyan az. Az és szót ki kéne cserélni pl egy vagyisra.

    Falabu  
    2005. máj. 27. 15:52 | galéria | válasz | #11
    Azért ezeket a mesterséges hangképzőszerveket nemcsak arra lehet majd felhasználni, hogy robotokat hangosítsunk vele, hanem pl egy néme embernek adhatják vissza a hangját!

    Hajra Japcsik!!!!
    2005. máj. 27. 15:09 | válasz | #10
    Majd fog.. de magyarul ki fogja megtanítani???
    2005. máj. 27. 14:18 | válasz | #9
    De nem mond értelmes szavakat. Csak sistereg.
    bobka  
    2005. máj. 27. 14:16 | galéria | válasz | #8
    csak nehogy a terroristák kezére jusson!
    Caro  
    2005. máj. 27. 14:02 | válasz | #7
    Ugyammá'!
    Majd bedobjuk az EMP-t oszt' annyi. :)
    Kalwa  
    2005. máj. 27. 13:09 | válasz | #6
    Így van! Közeleg a végítélet napja
    2005. máj. 27. 12:03 | válasz | #5
    Készülnek a terminátorok vazze!
    Az amcsik a pilóta nélküli járművekkel szórakoznak, a japcsik hozzák a robottestet, már csak lassan az MI hiányzik(?) és kész az első T101-es modell.
    2005. máj. 27. 12:03 | válasz | #4
    Nem tudom feltünt e, hogy eddigi próbálkozások milyen messze vannak az emberi beszédhangoktól?
    Nézzük pl. a Microsoft Speach programot.
    DOT  
    2005. máj. 27. 12:02 | válasz | #3
    Tök jó ezeknek a japóknak. Hogy mikre rá nem érnek :D
    2005. máj. 27. 11:58 | válasz | #2
    Látom a videok nevéből, hogy alap a japán nyelv. :)
    Csak hát nekik van 5 magángangzojuk, nekünk meg 14, azért nem mindegy ;)
    2005. máj. 27. 11:54 | válasz | #1
    Ez mind jó de ennek mi az értelme. Nem lenne egyszerübb hangszórós hang előálítást csinálni ugy nem kellene annyi mindent összehangolni csak a hang fekvenciákra kellene figyelni.