presă scrisă
secolul al XIX-lea
parte de vorbire
lemă
grup nominal
Accesul la această resursă este restricționat. Pentru a o descărca adresați-vă unui membru al echipei.
Autor: Daniela Gîfu
O colecție de texte (articole din presa vremii) provenite din patru provincii istorice (Moldova, Transilvania, Țara Românească și Basarabia), tipărite în perioada 1817-2015, criptată în grafia latină. Este singura resursă pe care o putem considera suficient de reprezentativă pentru a reflecta folosirea cultivată a limbii române și care acoperă cvasi-complet perioada precizată. RODICA se dorește a face obiectul cercetării similarității lingvistice din cele patru provincii românești. Pașii întreprinși: achiziția de date textuale brute, ștergerea drepturilor de autor, OCR în unele cazuri, transliterații interpretative în altele (până în anul 1862 s-a scris cu grafie slavonă), stocarea, curățarea datelor, completarea metadatelor, prelucrarea lingvistică, analiza statistică și interpretarea rezultatelor. A fost etichetat la parte de vorbire și lemă, este adnotat la nivel de cuvânt vechi etichetat cu “NotInDict”.
Ex: “... mai iantăi acistu al mieu prostatnic poem cătrŭ domnievoastrŭ” (din Cuvânt înainte de Dumitru Balica).
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<POS_Output>
<S>
<W LEMMA="mai" MSD="Rg" POS="ADVERB" id="null.242" offset="1323">mai</W>
<W Case="direct" Definiteness="no" EXTRA="NotInDict" Gender="masculine" LEMMA="iantăi" MSD="Afpmprn" Number="plural" POS="ADJECTIVE" id="null.243" offset="1327">iantăi</W>
<W Case="direct" Definiteness="no" EXTRA="NotInDict" Gender="masculine" LEMMA="acistu" MSD="Afpmsrn" Number="singular" POS="ADJECTIVE" id="null.244" offset="1334">acistu</W>
<W Case="direct" Gender="masculine" LEMMA="al" MSD="Tsmsr" Number="singular" POS="ARTICLE" Type="possessive" id="null.245" offset="1341">al</W>
<W EXTRA="NotInDict" LEMMA="mieu" MSD="Y" POS="ABBREVIATION" id="null.246" offset="1344">mieu</W>
<W Case="direct" Definiteness="no" EXTRA="NotInDict" Gender="masculine" LEMMA="prostatnic" MSD="Afpmsrn" Number="singular" POS="ADJECTIVE" id="null.247" offset="1349">prostatnic</W>
<W Case="direct" Definiteness="no" Gender="masculine" LEMMA="poem" MSD="Ncmsrn" Number="singular" POS="NOUN" Type="common" id="null.248" offset="1360">poem</W>
<W Case="direct" Definiteness="no" EXTRA="NotInDict" Gender="masculine" LEMMA="cătr" MSD="Afpmsrn" Number="singular" POS="ADJECTIVE" id="null.249" offset="1365">cătr</W>
<W Case="direct" Definiteness="no" EXTRA="NotInDict" Gender="masculine" LEMMA="domnievoastrŭ" MSD="Afpmsrn" Number="singular" POS="ADJECTIVE" id="null.250" offset="1370">domnievoastrŭ</W>
</S>
</POS_Output>