ИСТОРИЈАТ КОРПУСА                                       КСЈ

Проф. Ђорђе Костић (1909 - 1995)
Рад на корпусу српског језика КСЈ започет је 1956. године у Институту за експерименталну фонетику и патологију говора у Београду. Аутор и руководилац пројекта био је проф. Ђорђе Костић. Корпус је настао као део ширег пројекта чији је циљ био аутоматско препознавање говора и текста и машинско превођење, којим је такође руководио проф. Костић. Рад на корпусу трајао је до 1962. године када је, из разлога који нису везани за науку, морао да буде обустављен. 
На изради корпуса учествовало је око 60 језичких стручњака различитих профила (лингвисти, статистичари, инжењери итд.) и око 200 техничких сарадника. С обзиром на технолошке могућности педесетих година, целокупан рад на корпусу обављен је ручно. У првој фази постављен је систем граматичког кодирања који се састојао од преко 2000 различитих кодова, чиме су обухваћени сви граматички облици у српском језику. На посебно припремљеном тексту језички стручњаци су ручно граматички обрадили сваку реч у корпусу, а накнадним уазбучавањем направљен је већи број фреквенцијских речника (преко 27000 страна).
1996. године, заједничким напорима Института за експерименталну фонетику и патологију говора и Лабораторије за експериументалну психологију Филозофског факултета у Београду почиње пребацивање језичког материјала у електронски облик и делимично осавремењивање система граматичког кодирања. Овај део пројекат је у току.
Садржај


Детаљније информације: аутор пројекта, конструкција корпуса,
машинско превођење