Egy programozókból, nyelvészekből, adatelemzőkből, designerekből álló csapat összeállt, hogy létrehozzon egy alkalmazást, ami lehetővé teszi, hogy a közösségi rádiók hangarchívumai kereshetővé váljanak bárki számára. Az adatbázist kutatók, diákok, fejlesztők is használhatják, bárki, aki hangfelismerési technológiával dolgozik.
A Google-támogatásból megvalósuló kezdeményezés célja, hogy segítsenek a Tilos és Civil Rádió közösségének, hallgatóinak abban, hogy korábbi rádióadásokban könnyedén böngésszenek, témák és kulcsszavak alapján.
Mint a Nyelv és Tudomány oldalán írják, az internetes keresőkben megszoktuk, hogy bármi kikereshető néhány szó begépelésével, de a hanganyagoknál ez már keményebb dió: egyelőre csak címek alapján lehet korábbi adásokban keresni, ha érdeklődünk egy téma iránt. A céljuk a projekttel az, hogy ez megváltozzon, és hozzáférhetőbbé tegyék a rádiók adásait, hanggyűjteményét mindenki számára.
Ahhoz, hogy a projekt megvalósulhasson, egy mesterséges intelligenciát szükséges megtanítani arra, hogy a magyar beszédet, hangzó szövegeket lejegyezze. Vagyis meg kell tanítani egy gépet arra, hogy hogyan beszélnek az emberek magyarul. A beszéd sokféle, a beszéd nagyon emberi. Sokszínűek vagyunk abban, hogyan ejtjük ki a szavakat, hogyan hangsúlyozunk, hogyan mondjuk ki a gondolatainkat magyarul. Hogy minél pontosabban felismerje a mesterséges intelligencia a magyar beszélt szöveg a hallgatók hangmintáját kérik, hogy a magyar adatbázis minél gazdagabb, teljesebb, sokszínűbb lehessen.
Jelenleg 29 óránál jár az adatbázis, céljuk, hogy ez a szám legalább 150-200-ra növekedjen. A Nyelv és Tudomány oldalán találhatók meg a konkrét instrukciók ehhez.
Két magyar médiás projekt is nyert a Google News Initiative Europe pályázaton
Döntött a Médiatanács, ki kapja az elnémított Civil Rádió volt budapesti frekvenciáját
További hírek érhetők el a Media1-en. Követhet minket Facebookon is.