|
Проф. Ђорђе Костић (1909 - 1995) |
Рад на корпусу српског језика КСЈ започет је 1956. године у Институту за експерименталну фонетику и патологију говора у Београду. Аутор и руководилац пројекта био је проф. Ђорђе Костић. Корпус је настао као део ширег пројекта чији је циљ био аутоматско препознавање говора и текста и машинско превођење, којим је такође руководио проф. Костић. Рад на корпусу трајао је до 1962. године када је, из разлога који нису везани за науку, морао да буде обустављен. | |
На изради корпуса учествовало
је око 60 језичких стручњака различитих профила (лингвисти, статистичари,
инжењери итд.) и око 200 техничких сарадника. С обзиром на технолошке могућности
педесетих година, целокупан рад на
корпусу обављен је ручно. У првој фази постављен је систем граматичког
кодирања који се састојао од преко 2000 различитих кодова, чиме су обухваћени
сви граматички облици у српском језику. На посебно припремљеном тексту
језички стручњаци су ручно граматички обрадили сваку реч у корпусу, а накнадним
уазбучавањем направљен је већи број фреквенцијских речника (преко 27000
страна).
Садржај1996. године, заједничким напорима Института за експерименталну фонетику и патологију говора и Лабораторије за експериументалну психологију Филозофског факултета у Београду почиње пребацивање језичког материјала у електронски облик и делимично осавремењивање система граматичког кодирања. Овај део пројекат је у току. |
||
Детаљније информације: аутор пројекта, конструкција корпуса, машинско превођење
|