САДРЖАЈ

КСЈ


 
  • Корпус српског језика КСЈ је дијахрони корпус направљен је на узорку од 11 000 000 речи који обухвата српски језик од 12. века до савременог језика. Свака реч у корпусу је детаљно граматички обрађена, а обрада је рађена ручно. Део корпуса који обухавата савремени језик састоји се од око 6000 0000 речи и подељен је на подузорке дневне штампе, поезије, литерарне прозе и научних и политичких текстова. Аутор пројекта је проф. Ђорђе Костић.
  • Корпус српског језика КСЈ је део ширег пројекта под називом Квантитативни опис структуре срппског језика КОССЈ чији је циљ детаљан опис свих аспеката српског језика у терминима вероватноћа. Пројекат обухвата квантитативни опис фонолошке и слоговне структуре, инфлексионе морфологије, одредница и граматичких облика речи у српском језику. 
  • Рад на корпусу српског језика КСЈ започет је средином педесетих година у Институту за експерименталну фонетику и патологију говора под руководством проф. Ђорђа Костића. 1996. године, заједничким напорима Института за експерименталну фонетику и патологију говора и Лабораторије за експерименталну психологију Филозофског факултета у Београду пројекат је настављен, а материјал је пребачен у електронски облик.