UD-Romanian-Nonstandard
Autori: Cătălina Mărănduc, Augusto Perez
Treebank pentru limba română diacronică al Universității Alexandru Ioan Cuza din Iași, adnotat în formalismul Universal Dependency Grammar.
Din cele 21.403 fraze ale resursei, 2.500 reprezintă folclor din România și din Republica Moldova, iar restul sunt texte vechi din secolele XVI-XVII. Menționăm că o parte din treebank UAIC (4.000 fraze) a fost transpus de către Augusto Perez în format UD și inclus într-un alt treebank, UD-Romanian RRT în anul 2015.
Dimensiunea resursei: 21.403 fraze și 449.959 cuvinte și semne de punctuație, adnotate manual