• contact@elte-dh.hu
  • 1088 Budapest, Múzeum krt. 6-8.

A SZOLGÁLTATÁSRÓL

Drámakorpusz az ELTE BTK Digitális Bölcsészet Tanszéken fejlesztett, folyamatosan bővülő adatbázis, amely a magyar drámairodalom szövegeit teszi elérhetővé és kereshetővé a felhasználók számára. A korpuszba kerülő drámák elsődleges forrása a Magyar Elektronikus Könyvtár; a szövegeket TEI XML formátumba kódolva, részletes annoticáióval ellátva egységesítettük. Ez a formátum nemcsak a szövegek felhasználóbarát megjelenítését teszi lehetővé, hanem egyben a keresőfelület működésének is az alapja.

A keresőfelület segítségével az egyes drámák, egy drámán belül egy konkrét szereplő, vagy akár drámacsoportok szövegeinek nyelvi elemeire tudunk rákeresni: konkrét szavakra, szófajokra, grammatikai szerkezetekre. A szavak grammatikai tulajdonságainak felismertetésére a Nyelvtudományi Intézetben fejlesztett e-magyar programot használtuk. A program segítségével automatizált módon meg tudtuk adni a drámákban szereplő összes szó szótári alakját, szófaját és morfoszintaktikai jellemzőit. E jellemzők szerepeltetésével számos keresést egyszerűbben végezhetünk el, illetve olyan módon is kereshetünk, amelyre nem lenne lehetőség abban az esetben, ha a korpusz csupán a drámaszövegeket tartalmazná. Például ha kíváncsiak vagyunk arra, hogy az „ördög” szó mely művekben, milyen szövegkörnyezetben fordul elő, akkor nem kell külön rákeresnünk a szó összes alakjára (ördög, ördögök, ördögöt, ördögöket stb.), hanem a szavak szótári alakjának az adatbázisban való szerepeltetése révén egy kereséssel listázhatjuk az összes ilyen szöveghelyet. Mivel a szavak szófaját és morfoszintaktikai jellemzőit is tartalmazza az adatbázis, nem csupán szavakra, hanem grammatikai jellemzőkre is kereshetünk. Például rákereshetünk az összes olyan szöveghelyre, amely a melléknév + ördög szerkezetet tartalmazza, de akár a középfokú melléknév + ördög szerkezeteket is listázhatjuk. Ezek a keresések elsősorban olyan gyakoriságvizsgálatok számára teremtenek alapot, amelyeken keresztül az egyes művek tematikus és stiláris szerveződésére is következtetni lehet (pl. a leggyakrabban hasznát főnevek listája; szereplők nyelvének összehasonlítása, stb.), ezáltal a drámák vagy a drámatörténet kvantitatív szempontú megértéséhez járulhatnak hozzá.

A Drámakorpusz ezen túl részét képezi a DraCor (https://dracor.org/) nemzetközi adatbázisnak is HunDraCor néven. Ennek köszönhetően a fenti jellemzőkön túl elérhetők a drámák karakterhálózatának, valamint a jelenetekben megszólalók arányának vizualizációi is. A karakterhálózatokban az egyes karakterek mint csomópontok, a közöttük lévő interakciók mint élek szerepelnek, így egy átfogó képet adnak egy dráma szereplőinek egymáshoz fűződő kapcsolatáról. Ekkor elsősorban nem a szereplők nyelvi kidolgozottságáról, hanem dramaturgiai funkciójáról tudhatunk meg többet: mennyire tekinthető egy karakter központi szereplőnek, hány másik szereplővel tartja a kapcsolatot, mennyiben nélkülözhető a hálózat stabilitásának szempontjából, stb. A jelenetekben megszólalók száma pedig a dráma felépítéséről (pl. tömegjelenetek a dráma elején és/vagy végén), illetve a monológok, dialógok és csoportos jelenetek arányát mutatják.

Az ELTE Drámakorpusz nem egy befejezett projekt, az adatbázis folyamatosan bővül újabb szerzőkkel és drámákkal, ahogyan a keresőfelület lehetőségeit is gazdagítani tervezzük.

A projekt fejlesztésében részt vettek:

Palkó Gábor (koncepció, adatmodell)

Szemes Botond (koncepció)

Bajzát Tímea Borbála (TEI XML specifikáció)

Fellegi Zsófia (TEI XML specifikáció)

Horváth Péter (annotáló szkriptek)

Indig Balázs (nyelvi elemzés)

Kundráth Péter (keresőeszköz)

A szövegek TEI XML formátumának létrehozói:

Dióssy Anna

Hegedüs Fanni

Kalmár Balázs

Pantyelejev Natali

Sziráki Sarolta