Vana kirjakeele korpus
Pilt
Lehekülg Wanradti-Koelli katekismusest (1535)

Eesti vana kirjakeele korpus sisaldab 15. kuni 19. sajandi tekste. Vanemad tekstid on morfoloogiliselt märgendatud, st neist tekstidest saab infot otsida sõnade tänapäevases kirjaviisis algvormide ning vormiinfo järgi.

  • 15. ja 16. sajandist on korpusesse lisatud kõik teadaolevad ja säilinud eestikeelsed tekstid (v.a nimeloendid), nii käsikirjad kui ka trükised.
  • 17. sajandist on korpusesse lisatud enamik säilinud trükitekste.
  • 18. ja 19. sajandist on lisatud valik trükitekste. Märgendatud on osa tekstidest.
  • 19. sajandi II poolest on lisatud vallakohtute protokollid, mis on automaatselt märgendatud; vt täpsemalt M.-L. Pilvik, K. Muischnek, G. Jaanimäe, L. Lindström, K. Lust, S. Orasmaa, T. Türna "Möistus sai kuulotedu: 19. sajandi vallakohtuprotokollide tekstidest digitaalse ressursi loomine".

Et tekstid on märgendatud (pool)automaatselt, esineb paratamatult vigu. Palume lahkesti neist meile teada anda ja täname kõiki, kelle abiga oleme juba saanud muuta korpust täpsemaks.

doi:10.15155/TY.0005 (https://doi.org/10.15155/TY.0005)
DataCite DOI: https://doi.org/10.15155/1-00-0000-0000-0000-00075l
ID: http://hdl.handle.net/11297/1-00-0000-0000-0000-0002-6

Vana kirjakeele korpuse koostamine algas 1995. aasta sügisel, kui professor Mati Erelti algatusel loodi TÜ eesti keele õppetooli juurde vana kirjakeele töörühm. Rühma juhiks sai dotsent Valve-Liivi Kingisepp. Kõige vanemaid tekste asusid koos temaga analüüsima Jaak Peebo, Külli Habicht ning Epp Ehasalu. 1996. aastal liitus uurimisrühmaga Külli Prillop, kelle esialgseks põhitööks oli märgendustarkvara arendamine ning korpuse veebipõhise kasutajaliidese loomine. Korpusetekste on sisestanud ja märgendanud ka paljud tudengid ning kraadiõppurid. (Vt Kingisepp, V.-L.; Prillop, K.; Habicht, K. 2004. Eesti vana kirjakeele korpus: mis tehtud, mis teoksil. Keel ja Kirjandus, 4, 272−280.)

Korpuse märgendamisel (v.a vallakohtuprotokollid) kasutatakse tarkvara Vakker (vt Prillop, Külli 2004. Kuidas märksõnastada vanu eestikeelseid tekste? − Keel ja Kirjandus, 2, 90−99).

Vana kirjakeele korpuse loomist on toetatud riiklikest programmidest "Eesti keel ja rahvuslik mälu" (EKRM04-9), "Eesti keel ja kultuurimälu" (EKKM09-88, EKKM14-298; vallakohtuprotokollid EKKM17-458), "Eesti keele keeletehnoloogiline tugi" (EKKTT06-13). Korpuse veebiliidese aitas luua Ränivägi OÜ.

Vana kirjakeele uurimisrühma algusaegade kroonika

Kontakt: kulli.prillop /ät/ ut.ee