-
Корпус српског језика КСЈ је дијахрони
корпус направљен је на узорку од 11 000 000 речи који обухвата српски језик
од 12. века до савременог језика. Свака реч у корпусу је детаљно граматички
обрађена, а обрада је рађена ручно. Део корпуса који обухавата савремени
језик састоји се од око 6000 0000 речи и подељен је на подузорке дневне
штампе, поезије, литерарне прозе и научних и политичких текстова. Аутор
пројекта је проф. Ђорђе Костић.
-
Корпус српског језика КСЈ је део ширег
пројекта под називом Квантитативни опис структуре срппског језика КОССЈ
чији је циљ детаљан опис свих аспеката српског језика у терминима вероватноћа.
Пројекат обухвата квантитативни опис фонолошке и слоговне структуре, инфлексионе
морфологије, одредница и граматичких облика речи у српском језику.
-
Рад на корпусу српског језика КСЈ започет
је средином педесетих година у Институту за експерименталну фонетику и
патологију говора под руководством проф. Ђорђа Костића. 1996. године, заједничким
напорима Института за експерименталну фонетику и патологију говора и Лабораторије
за експерименталну психологију Филозофског факултета у Београду пројекат
је настављен, а материјал је пребачен у електронски облик.