corpus
1984
George Orwell
parte de vorbire
lemă
grup nominal
referințe anaforice
anafora
adnotare manuală
POS tagging
lemma
nominal group
NP
COREF
anaphora
coreferential links
manual annotation
Accesul la această resursă este restricționat. Pentru a o descărca adresați-vă unui membru al echipei.
Autori: Dan Cristea, Oana Postolache, Cecilia Bolea
Varianta românească a textului literar „1984”, autor George Orwell, adnotat la grup nominal, a fost adnotat și la referințe anaforice, s-a adăugat eticheta “COREF”, 10 fisiere.
Exemplu:
<NP ID="NP5" HEADID="TOK13-14">
<W ID="W18" root="Winston" pv="Noun" Type="proper" RO="TOK13">Winston</W>
<W ID="W19" root="Smith" pv="Noun" Type="proper" RO="TOK14">Smith</W>
</NP>
<NP ID="NP8" HEADID="TOK24">
<W ID="W30" root="vânt" pv="Noun" Type="common" Gender="masculine" Number="singular" Definiteness="yes" RO="TOK24">vântul</W>
</NP>
<NP ID="NP9" HEADID="TOK25" COREF="NP8">
<W ID="W31" root="care" pv="Pronoun" Person="third" Case="direct" RO="TOK25">care</W>
</NP>
<NP ID="NP10" HEADID="RSPLIT0" COREF="NP5">
<W ID="W32" root="el" pv="Pronoun" Type="pers" Person="third" Gender="masculine" Number="singular" Case="accusative" RO="RSPLIT0">-l</W>
</NP>