• contact@elte-dh.hu
  • 1088 Budapest, Múzeum krt. 6-8.

Az ELTE Digitális Bölcsészet Tanszék Sketch Engine korpuszlekérdezője

A Sketch Engine egy nyelvészek és lexikográfusok által kedvelt korpuszlekérdező rendszer, mely a betöltött szövegkorpuszok nyelvészeti vizsgálatát teszi lehetővé. Két változata érhető el:

  1. A teljesértékű Sketch Engine felhőben futó változata, előre betöltött korpuszokkal: https://www.sketchengine.eu/
  2. A NoSketch Engine, nyílt forráskódú változat, amely saját gépre telepíthető, nem tartalmaz előre betöltött korpuszokat: https://nlp.fi.muni.cz/trac/noske (Docker változat: https://github.com/ELTE-DH/NoSketch-Engine-Docker)

Az ELEXIS projekt keretében 2022 április 1-ig a teljesértékű Sketch Engine elérhető volt ingyenesen az ELTE polgárai számára (https://www.sketchengine.eu/elexis/) a tanszékünktől függetlenül.

Ez a lehetőség megszűnt, a továbbiakban fizetés ellenében lehet használni: https://www.sketchengine.eu/price-list/#academic

A digitális bölcsészet tanszék üzemeltet egy NoSketch Engine példányt (https://sketchengine.elte-dh.hu/), melybe az általunk használt és készített korpuszokat töltöttük be.

Ez az EDUID-vel bárki számára elérhető ingyenesen. A betöltött korpuszok csak közvetetten is non-profit tudományos céllal használhatók.

A betöltött korpuszok a következők:
  • Magyar Webcorpus 2.0 (Nemeskey Dávid, 2020)
  • Webaratás hírkorpusz (Indig Balázs et al., 2020)
  • Covid korpusz (Varga Éva Katalin et al., 2022)
    • Forrás: Magyar hírportálok (6 db)
    • Méret: 4,6 millió szó
    • Hivatkozandó pubklikáció: Varga, Éva Katalin ; Zimonyi, Ákos ; Indig, Balázs ; Sárközi-Lindner, Zsófia ; Palkó, Gábor Durva influenza vagy veszélyes világjárvány?: a Covid19 terminológiája a médiában In: Navracsics, Judit; Bátyi, Szilvia (szerk.) Nyelvek, nyelvváltozatok, következmények II. : Fordítástudomány, terminológia, retorika, kognitív nyelvészet, kontrasztív nyelvészet, interkulturális kommunikáció, névtan Budapest, Magyarország : Akadémiai Kiadó (2022) p. 1 https://mersz.hu/dokumentum/m1020nynyk2__1/
    • – Leírás: A Semmelweis egyetem Szaknyelvi Intézetével együttműködésben készült (https://dh-lab.hu/teams/sote-szaknyelvi-intezet/), terminológiai kutatások céljából
  • Erdélyi hírkorpusz
    • Forrás: Erdélyi magyar hírportálok (3 db)
    • Méret: kb. 21,3 millió szó
    • Hivatkozandó pubklikáció: Varga, Éva Katalin ; Márton, Emese ; Indig, Balázs ; Sárközi-Lindner, Zsófia ; Palkó, Gábor Erdélyi és anyaországi orvosi terminológia pandémia idején ALKALMAZOTT NYELVTUDOMÁNY in press p. in press (2022)
    • – Leírás: A Semmelweis egyetem Szaknyelvi Intézetével együttműködésben készült (https://dh-lab.hu/teams/sote-szaknyelvi-intezet/), terminológiai kutatások céljából
  • Susanne corpus:

 

Saját NoSketch Engine példány üzemeltetéséhez, illetve korpuszok betöltéséhez segítséget tudunk nyújtani az alábbi elérhetőségeken:

Adminsztrativ kapcsolattartó neve, email címe: Palkó Gábor p……@btk.elte.hu

Technikai kapcsolattartó neve, email címe: Indig Balázs i……@btk.elte.hu