Corpus de adnotări la referințe anaforice

Accesul la această resursă este restricționat. Pentru a o descărca adresați-vă unui membru al echipei.

Autori: Dan Cristea, Oana Postolache, Cecilia Bolea

Varianta românească a textului literar „1984”, autor George Orwell, adnotat la grup nominal, a fost adnotat și la referințe anaforice, s-a adăugat eticheta “COREF”, 10 fisiere.

Exemplu: 

<NP ID=”NP5″ HEADID=”TOK13-14″>

<W ID=”W18″ root=”Winston” pv=”Noun” Type=”proper” RO=”TOK13″>Winston</W>

    <W ID=”W19″ root=”Smith” pv=”Noun” Type=”proper” RO=”TOK14″>Smith</W>

</NP>

        <NP ID=”NP8″ HEADID=”TOK24″>

        <W ID=”W30″ root=”vânt” pv=”Noun” Type=”common” Gender=”masculine” Number=”singular” Definiteness=”yes” RO=”TOK24″>vântul</W>

    </NP>

    <NP ID=”NP9″ HEADID=”TOK25″ COREF=”NP8″>

        <W ID=”W31″ root=”care” pv=”Pronoun” Person=”third” Case=”direct” RO=”TOK25″>care</W>

    </NP>

    <NP ID=”NP10″ HEADID=”RSPLIT0″ COREF=”NP5″>

        <W ID=”W32″ root=”el” pv=”Pronoun” Type=”pers” Person=”third” Gender=”masculine” Number=”singular” Case=”accusative” RO=”RSPLIT0″>-l</W>

    </NP>

  • Corpus
  1. G. Pavel, O. Postolache, I. C. Pistol, D. Cristea (2007). “Rezolutia anaforei pentru limba română”. In Corina Forăscu, Dan Tufiş, Dan Cristea (eds.): Lucrările atelierului „Resurse lingvistice şi instrumente pentru prelucrarea limbii române, Iaşi, noiembrie 2006”, Editura Universității “Alexandru Ioan Cuza” Iași, România, ISSN 1843-911X, p. 101-106, link: https://profs.info.uaic.ro/~consilr/editii_ant/2006/pages/volum.pdf  
  2. O. Postolache, O. (2004) RARE – Robust Anaphora Resolution Engine. Teză de disertaţie în  Lingvistică Computaţională, Facultatea de Informatică, Universitatea „Al.I.Cuza” Iaşi.
  3. O. Postolache,  D. Cristea (2004): Designing Test-beds for General Anaphora Resolution, in Proceedings of the Discourse Anaphora and Anaphor Resolution Colloquium – DAARC, St. Miguel, Portugal, link: https://profs.info.uaic.ro/~dcristea/papers/Postolache&Cristea-DAARC2004BW.pdf 

Leave a Reply

Your email address will not be published. Required fields are marked*