Corpus de adnotări la referințe anaforice

corpus

1984

George Orwell

parte de vorbire

lemă

grup nominal

referințe anaforice

anafora

adnotare manuală

POS tagging

lemma

nominal group

NP

COREF

anaphora

coreferential links

manual annotation

Accesul la această resursă este restricționat. Pentru a o descărca adresați-vă unui membru al echipei.

Versiuni
Încărcată de
Petru Rebeja
Data încărcării
Nov. 24, 2021
Descriere

Autori: Dan Cristea, Oana Postolache, Cecilia Bolea

Varianta românească a textului literar „1984”, autor George Orwell, adnotat la grup nominal, a fost adnotat și la referințe anaforice, s-a adăugat eticheta “COREF”, 10 fisiere.

Exemplu: 

<NP ID="NP5" HEADID="TOK13-14">

<W ID="W18" root="Winston" pv="Noun" Type="proper" RO="TOK13">Winston</W>

    <W ID="W19" root="Smith" pv="Noun" Type="proper" RO="TOK14">Smith</W>

</NP>

        <NP ID="NP8" HEADID="TOK24">

        <W ID="W30" root="vânt" pv="Noun" Type="common" Gender="masculine" Number="singular" Definiteness="yes" RO="TOK24">vântul</W>

    </NP>

    <NP ID="NP9" HEADID="TOK25" COREF="NP8">

        <W ID="W31" root="care" pv="Pronoun" Person="third" Case="direct" RO="TOK25">care</W>

    </NP>

    <NP ID="NP10" HEADID="RSPLIT0" COREF="NP5">

        <W ID="W32" root="el" pv="Pronoun" Type="pers" Person="third" Gender="masculine" Number="singular" Case="accusative" RO="RSPLIT0">-l</W>

    </NP>

Tip resursă
corpus
Referințe
  1. G. Pavel, O. Postolache, I. C. Pistol, D. Cristea (2007). “Rezolutia anaforei pentru limba română”. In Corina Forăscu, Dan Tufiş, Dan Cristea (eds.): Lucrările atelierului „Resurse lingvistice şi instrumente pentru prelucrarea limbii române, Iaşi, noiembrie 2006”, Editura Universității “Alexandru Ioan Cuza” Iași, România, ISSN 1843-911X, p. 101-106, link: https://profs.info.uaic.ro/~consilr/editii_ant/2006/pages/volum.pdf  
  2. O. Postolache, O. (2004) RARE – Robust Anaphora Resolution Engine. Teză de disertaţie în  Lingvistică Computaţională, Facultatea de Informatică, Universitatea „Al.I.Cuza” Iaşi.
  3. O. Postolache,  D. Cristea (2004): Designing Test-beds for General Anaphora Resolution, in Proceedings of the Discourse Anaphora and Anaphor Resolution Colloquium – DAARC, St. Miguel, Portugal, link: https://profs.info.uaic.ro/~dcristea/papers/Postolache&Cristea-DAARC2004BW.pdf