• contact@elte-dh.hu
  • 1088 Budapest, Múzeum krt. 6-8.

A szolgáltatásról

A Regénykorpusz az ELTE BTK Digitális Bölcsészet Tanszék szolgáltatása. A korpusz 100 magyar nyelven írt regényt tartalmaz, összesen 81 szerzőtől. A korpusz jelenlegi terjedelme 7 000 000 token, a gyűjteményben található regények első megjelenési dátuma az 1840-től 1920-ig terjedő periódusra esik. A projektum folyamatos fejlesztés és bővítés alatt áll.A regénykorpuszba kerülő szövegek forrása a Magyar Elektronikus Könyvtár. A művek szövegtesteit olyan formára alakítottuk, hogy azok a számítógép számára is olvashatók legyenek, majd automatikus eljárással különféle annotációs címkékkel láttuk el őket. Ennek révén alkalmasak a nyelvészeti és poétikai szempontok alapján történő keresésre és elemzésre. A projektet az Felsőoktatási Intézményi Kiválósági Program támogatta, jelenleg a Digitális Örökség Nemzeti Laboratórium keretei között végezzük a korpusz további fejlesztéseit.

A projekttel kapcsolatos előadások és publikációk: 

Palkó Gábor Irodalmi korpuszok a távoli olvasás horizontján előadás:
https://mtabtk.videotorium.hu/hu/recordings/40982/irodalmi-korpuszok-a-tavoli-olvasas-horizontjan

Vétek Bence: European Literary Text Collection (ELTeC) – Distant reading for european languages előadás:
https://elte-dh.hu/wp-content/uploads/2020/09/1.-Introduction-to-TEI-XML_c.pdf

A projektben részt vettek:

Palkó Gábor
Fellegi Zsófia
Horváth Péter
Vétek Bence
Takács Emma
Szemes Botond
Szlávich Eszter
Bajzát Tímea