Accesul la această resursă este restricționat. Pentru a o descărca adresați-vă unui membru al echipei.
Autori: N. Curteanu, A. Moruz, C. Butnariu, E. Amihăesei
Strategia de parsare SCD utilizează trei clase de marcheri având funcţii de delimitare a structurilor sintactice, şi anume de tip XG, clauzal sau interclauzal. Aceste clase sunt prezentate în cele ce urmează.
a) Clasa M1 – cuprinde marcheri ce delimitează structurile XG
Clasa de marcheri M1 corespunde nivelului X1 (X = N, V, A), i.e. din marcheri aplicaţi construcţiilor de nivel X1 (sau XG). Aceste construcţii sintactice sunt alcătuite dintr-un nucleu semantic (o categorie A, V, N), înconjurat de modificatori (adjective sau adverbe) şi/sau de cuantificatori (care include determinatorii, negaţia, etc) şi/sau prepoziţii care exprimă cazul (NG) sau aspectul (VG).
Clasa M1 a fost divizată în cateva subclase utile pentru delimitarea structurilor XG, conform regulilor specificate mai sus.
Astfel,
M11 = { M11N , M11P }
M11N = {apariţia unui substantiv comun, obiectual, nepredicaţional, sau a unui substantiv propriu}
M11P = {apariţia unui pronume}
M12 = {M12N, M12V}
M12N = {apariţia unui modificator al unui substantiv (adjectiv, pronume adjectival)}
M12V = {apariţia unui modificator al unui verb (adverb)}
b) Clasa M2 – cuprinde marcheri care introduc o clauză (finită sau nefinită)
Clasa M2 poate fi împărţită în urmatoarele subclase:
M20 – conţine un singur element, şi anume virgula (,).
M21 – conţine marcheri ce introduc o relaţie de coordonare, cum ar fi “şi”, “sau”, “ca şi”, etc.
M22 – marcher ce semnalează prezenţa trasăturii nefinit asociate categoriei V
M23 – marchează apariţia trăsăturii de predicaţionalitate, ce poate fi asociată oricarei categorii N, A, V
M24 – marcher ce semnalează apariţia unui grup verbal finit, sau a trăsăturii finitasociate unui verb, introducând astfel o clauză finită
M25 – marcher ce introduce subordonată relativă (atributivă)
c) Clasa M3 – conţine marcheri inter-clauzali şi de discurs
Marcherii din această clasă reprezintă funcţii sau relaţii ce au ca argumente două sau mai multe clauze finite (nefinite).
Clasa M3 este împărţită în urmatoarele subclase (în ordinea descrescătoare a priorităţii de introducere a relaţiilor de dependenţă):
M31 – cuprinde marcheri inter-clauzali (discurs) care introduc o dependenţă de subordonare, precum “(“ “ca”, “ca să”, “unde”, “cum”, etc.
M32 – conţine marcheri interclauzali (discurs) ce introduc o relaţie de tip coordonator
M33 – conţine marcheri inter-clauzali (discurs) care introduc o clauză supra-ordonată (ridicarea cu cel puţin un nivel a dependenţei clauzale), cum ar fi “atunci”, altfel”, etc.
M34 – cuprinde semne de punctuaţie care separă propoziţii (fraze). Sunt incluşi aici : “:”, “.”, “?”, “!”, “;”, etc.
Ca o remarcă, un element din clasa M1 (M12V) poate aparţine şi clasei M31 în cazul în care adverbul respectiv are şi rol de marcher inter-clauzal.
De asemenea, marcherul din clasa M2, M25 are întotdeauna şi rol inter-clauzal, introducând o subordonată relativă.
Exemplu de iesire:
<clauza id=’6′>
<TOK id=’TOK66′ mark=’M14′>La</TOK>
<TOK id=’TOK67′ mark=’M11P’>unul</TOK>
<TOK id=’TOK68′ mark=’M14′>din</TOK>
<TOK id=’TOK69′ mark=’M11N’>capete</TOK>
<FVGIN ID=’FVGIN_5′ mark=’M24′>
<TOK id=’TOK70′ mark=’M11P’>se</TOK>
<TOK id=’TOK71′ mark=’M24′>afla</TOK>
</FVGIN>
<TOK id=’TOK72′ mark=’M13′>un</TOK>
<TOK id=’TOK73′ mark=’M11N’>afiº</TOK>
<TOK id=’TOK74′ mark=’M12V’>mult</TOK>
<TOK id=’TOK75′ mark=’M12V’>prea</TOK>
<TOK id=’TOK76′ mark=’M12N’>mare</TOK>
<TOK id=’TOK77′ mark=’M14′>pentru</TOK>
<TOK id=’TOK78′ mark=’M11N’>interior</TOK>
</clauza>
<clauza id=’7′>
<MRK ID=’MRK12′ mark=’M20′>
<TOK id=’PUNCT5′ mark=’M20′>,</TOK>
</MRK>
<MRK ID=’MRK13′ mark=’M25′>
<TOK id=’TOK79′ mark=’M25′>care</TOK>
</MRK>
<FVGIN ID=’FVGIN_6′ mark=’M24′>
<TOK id=’TOK80′ mark=’M24′>înfãþiºa</TOK>
</FVGIN>
<TOK id=’TOK81′ mark=’M11N’>figura</TOK>
<TOK id=’TOK82′ mark=’M12N’>enormã</TOK>
<MRK ID=’MRK14′ mark=’M20′>
<TOK id=’PUNCT6′ mark=’M20′>,</TOK>
</MRK>
<TOK id=’TOK83′ mark=’M12N’>latã</TOK>
<TOK id=’COMP2′ mark=’M14′>de peste</TOK>
<TOK id=’TOK84′ mark=’M13′>un</TOK>
<TOK id=’TOK85′ mark=’M11N’>metru</TOK>
<MRK ID=’MRK15′ mark=’M20′>
<TOK id=’PUNCT7′ mark=’M20′>,</TOK>
</MRK>
<TOK id=’TOK86′ mark=’M14′>a</TOK>
<TOK id=’TOK87′ mark=’M13′>unui</TOK>
<TOK id=’TOK88′ mark=’M11N’>bãrbat</TOK>
<TOK id=’COMP3′ mark=’M12V’>în jur de</TOK>
<TOK id=’TOK89′ mark=’M13′>patruzeci</TOK>
<MRK ID=’MRK16′ mark=’M21′>
<TOK id=’TOK90′ mark=’M32′>ºi</TOK>
</MRK>
<TOK id=’TOK91′ mark=’M13′>cinci</TOK>
<TOK id=’TOK92′ mark=’M14′>de</TOK>
<TOK id=’TOK93′ mark=’M11N’>ani</TOK>
<MRK ID=’MRK17′ mark=’M20′>
<TOK id=’PUNCT8′ mark=’M20′>,</TOK>
</MRK>
<TOK id=’TOK94′ mark=’M14′>cu</TOK>
<TOK id=’TOK95′ mark=’M13′>o</TOK>
<TOK id=’TOK96′ mark=’M11N’>mustaþã</TOK>
<TOK id=’TOK97′ mark=’M12N’>neagrã</TOK>
<MRK ID=’MRK18′ mark=’M21′>
<TOK id=’TOK98′ mark=’M32′>ºi</TOK>
</MRK>
<TOK id=’TOK99′ mark=’M12N’>stufoasã</TOK>
<MRK ID=’MRK19′ mark=’M21′>
<TOK id=’PUNCT9′ mark=’M20′>,</TOK>
<TOK id=’TOK100′ mark=’M32′>ºi</TOK>
</MRK>
<TOK id=’TOK101′ mark=’M14′>cu</TOK>
<TOK id=’TOK102′ mark=’M11N’>trãsãturi</TOK>
<TOK id=’TOK103′ mark=’M12N’>frumoase</TOK>
<MRK ID=’MRK20′ mark=’M21′>
<TOK id=’TOK104′ mark=’M21′>dar</TOK>
</MRK>
<TOK id=’TOK105′ mark=’M12N’>dure</TOK>
<MRK ID=’MRK21′ mark=’M34′>
<TOK id=’PTERM_P2′ mark=’M34′>.</TOK>
</MRK>
</clauza>
- embeddings
- Curteanu, N. (2006): Local and Global Parsing with Functional (F)X-bar Theory and SCD Linguistic Strategy (I. + II.). Computer Science Journal of Moldova, Vol. 14, no.1, 2006, p. 74-102 (Part I.), Vol. 14, no.2, 2006, p. 155-182, (Part II.), http://www.math.md/files/csjm/v14-n1/v14-n1-(pp74-102).pdf
- Curteanu, Neculai; Mihai Moruz; Diana Trandabăţ; Cecilia Bolea; Iustin Dornescu, (2006): The Structure and Parsing of Romanian Verbal Group and Predicate, Proceedings of the ECIT2006 – 4th European Conference on Intelligent Systems and Technologies, Iasi, Romania, Septembrie 21-23, 2006, pp. 93-105.
- Curteanu, N., D. Trandabăţ, M. Moruz (2006): Structura grupului verbal, predicaţia lexicală şi reprezentarea logică a predicatului în limba română. In Lucrările atelierului RESURSE LINGVISTICE ŞI INSTRUMENTE PENTRU PRELUCAREA LIMBII ROMÂNE, (Ed. C. Rorăscu, D. Tufiş, D. Cristea), Editura Univ. “Al.I. Cuza” Iaşi, ISBN: 978-973-703-208-9, pp. 143-148.
- Curteanu, N., E. Zlavog, C. Bolea (2005): Sentence-Level and Discourse Segmentation / Parsing with SCD Linguistic Strategy, în Volumul “Intelligent Systems” (H.-N. Teodorescu, J. Watada, J.G. Aluja, M. Mihaila Eds.), Performantica Press, Iasi 2005, p. 153-168.
- Curteanu, N., D. Gâlea, C. Butnariu, C. Bolea (2004): Marcu’s Clause-like Discourse Segmentation Algorithm and SCD Clause Segmentation-based Parsing, Proceedings ECIT-2004 Conference, p. 59-86, Iaşi, România.