УЗОРАК                                                                    КСЈ
Корпус српског језика КСЈсадржи 11 000 000 речи и обухвата српски језик од 12. века до савременог језика. КСЈ је хронолошки подељен на два дела. Први део се састоји од око 5000 000 речи и обухвата српски језик од 12. до 19. века, док други део, који се састоји од око 6000 000 речи,  обухвата савремени језик. Део узорка који се односи на језик од 12. до 18 века садржи четири подузорка: 
Jезик од 12. до 18 века садржи четири подузорка: а. језик од 12. до 17 века у коме се налазе дела најзначајних писаца тог временa (Доментијан, Теодосије, Пајсије, архиепископ Данило и др.), као и старе српске повеље и писма.
Језик 18. и почетка 19. века обухвата дела Милована Видаковића, Герасима Зељића, Јоакима Вујића и осталих значајних аутора тог периода, 
Сабрана дела Вука Ст. Караџића обухватају српске народне песме, српске народне приповетке, превод Новог завета, Рјечник, преписку Вука Ст. Караџића и његове језичко-полемичке и историјско-географске списе
Језик друге половине 19. векапредстављен је делима Бранка Радичевића, Његоша, Јована Јовановића-Змаја и Марка Миљанова.

Узорак савременог језикаподељен је на пет подузорака: 
а. литерарна проза (140 дела)
б. поезија (204 збирке песама)
в. дневна штампа (дневни лист «Политика» у периоду од 1945. до 1957.) 
г. научни текстови (160 дела из различитих области науке) 
д. политички текстови.
Сваки подузорак садржи око 1000 000 речи, са изузетком сабраних дела Вука Ст. Караджића која садрже око 2000 000 речи.
Сва дела су граматички су обрађена у целости, са изузетком подузорака дневне штампе, научних текстова и литерарне прозе који су узорковани по одређеном принципу. 

СадржајДодатне информације: 12. – 17. век, 18. век, Вук Ст. Караџић, 19. век, савремени језик.