• contact@elte-dh.hu
  • 1088 Budapest, Múzeum krt. 6-8.

A SZOLGÁLTATÁSRÓL

Drámakorpusz az ELTE BTK Digitális Bölcsészet Tanszéken fejlesztett, folyamatosan bővülő adatbázis, amely a magyar drámairodalom szövegeit teszi elérhetővé és kereshetővé a felhasználók számára. A korpuszba kerülő drámák elsődleges forrása a Magyar Elektronikus Könyvtár; a szövegeket TEI XML formátumba kódolva, részletes annoticáióval ellátva egységesítettük. Ez a formátum nemcsak a szövegek felhasználóbarát megjelenítését teszi lehetővé, hanem egyben a keresőfelület működésének is az alapja. A keresőfelület segítségével az egyes drámák, egy drámán belül egy konkrét szereplő, vagy akár drámacsoportok szövegeinek nyelvi elemeire tudunk rákeresni: konkrét szavakra, szófajokra, grammatikai szerkezetekre. A szavak grammatikai tulajdonságainak felismertetésére a Nyelvtudományi Intézetben fejlesztett e-magyar programot használtuk. A program segítségével automatizált módon meg tudtuk adni a drámákban szereplő összes szó szótári alakját, szófaját és morfoszintaktikai jellemzőit. E jellemzők szerepeltetésével számos keresést egyszerűbben végezhetünk el, illetve olyan módon is kereshetünk, amelyre nem lenne lehetőség abban az esetben, ha a korpusz csupán a drámaszövegeket tartalmazná. Például ha kíváncsiak vagyunk arra, hogy az „ördög” szó mely művekben, milyen szövegkörnyezetben fordul elő, akkor nem kell külön rákeresnünk a szó összes alakjára (ördög, ördögök, ördögöt, ördögöket stb.), hanem a szavak szótári alakjának az adatbázisban való szerepeltetése révén egy kereséssel listázhatjuk az összes ilyen szöveghelyet. Mivel a szavak szófaját és morfoszintaktikai jellemzőit is tartalmazza az adatbázis, nem csupán szavakra, hanem grammatikai jellemzőkre is kereshetünk. Például rákereshetünk az összes olyan szöveghelyre, amely a melléknév + ördög szerkezetet tartalmazza, de akár a középfokú melléknév + ördög szerkezeteket is listázhatjuk. Ezek a keresések elsősorban olyan gyakoriságvizsgálatok számára teremtenek alapot, amelyeken keresztül az egyes művek tematikus és stiláris szerveződésére is következtetni lehet (pl. a leggyakrabban hasznát főnevek listája; szereplők nyelvének összehasonlítása, stb.), ezáltal a drámák vagy a drámatörténet kvantitatív szempontú megértéséhez járulhatnak hozzá. A Drámakorpusz ezen túl részét képezi a DraCor (https://dracor.org/) nemzetközi adatbázisnak is HunDraCor néven. Ennek köszönhetően a fenti jellemzőkön túl elérhetők a drámák karakterhálózatának, valamint a jelenetekben megszólalók arányának vizualizációi is. A karakterhálózatokban az egyes karakterek mint csomópontok, a közöttük lévő interakciók mint élek szerepelnek, így egy átfogó képet adnak egy dráma szereplőinek egymáshoz fűződő kapcsolatáról. Ekkor elsősorban nem a szereplők nyelvi kidolgozottságáról, hanem dramaturgiai funkciójáról tudhatunk meg többet: mennyire tekinthető egy karakter központi szereplőnek, hány másik szereplővel tartja a kapcsolatot, mennyiben nélkülözhető a hálózat stabilitásának szempontjából, stb. A jelenetekben megszólalók száma pedig a dráma felépítéséről (pl. tömegjelenetek a dráma elején és/vagy végén), illetve a monológok, dialógok és csoportos jelenetek arányát mutatják. Az ELTE Drámakorpusz nem egy befejezett projekt, az adatbázis folyamatosan bővül újabb szerzőkkel és drámákkal, ahogyan a keresőfelület lehetőségeit is gazdagítani tervezzük.   A projekt fejlesztésében részt vettek: Palkó Gábor (koncepció, adatmodell) Szemes Botond (koncepció) Bajzát Tímea Borbála (TEI XML specifikáció) Fellegi Zsófia (TEI XML specifikáció) Horváth Péter (annotáló szkriptek) Indig Balázs (nyelvi elemzés) Kundráth Péter (keresőeszköz)   A szövegek TEI XML formátumának létrehozói: Dióssy Anna Hegedüs Fanni Kalmár Balázs Pantyelejev Natali Sziráki Sarolta