[dexonline] Canonicalizare Lexeme in DEXOnline

Adrian Scoica adrian.scoica at gmail.com
Thu Nov 17 02:28:17 EET 2011


2011/11/16 Catalin Francu <cata at francu.com>

> Salutare,
>
> Hm, detectare de plagiat, uite un software care în România ar trebui să
> lucreze în foc continuu, că are muuuult de depistat. :-D :-D
>
> Din păcate nu, noi nu avem un stemmer (așa-i zice). Pentru nevoile
> noastre, ne descurcăm cu procesul invers: generăm flexiunile și le stocăm
> pe toate în tabelul InflectedForm. Dacă vreți să lucrați și la partea asta,
> ar fi un proiect interesant, care nu s-a mai publicat până acum pentru
> limba română sub o licență liberă. Doar că v-ar trebui un curs de NLP,
> cred. Spuneți-mi dacă vă interesează și vă pun în legătură cu Radu Borza.
> El e omul cu NLP-ul în proiectul nostru. :-)
>

Ok. Totusi, daca imi aduc bine aminte, exista o tabela in baza de date a
DEXOnline care contine transformari pentru clase de substantive. Nu mai tin
minte daca erau doar reguli de formare ale pluralului sau cuprindeau si
alte inflexiuni. Pareau sa arate ca niste reguli de rescriere ale unei
gramatici (de data aceasta, in sensul formal :D).

Cel mai probabil vom avea nevoie si de o asemenea componenta in proiectul
nostru, iar daca nu se descurcam in alt mod, vom folosi direct baza de date
de forme cu inflexiuni.


> Cătălin
>
>
> 2011/11/16 Adrian Scoica <adrian.scoica at gmail.com>
>
>> Salut,
>>
>>   Eu si Filip Buruiana incercam sa scriem specificatiile software
>> pentru un detector de plagiat si printre altele avem nevoie de un
>> modul care sa ne ajute sa aducem lexemele parsate la forma canonica
>> (de exemplu "oamenilor -> om".
>>
>>   DEXOnline face deja ceva similar, si din cate imi aduc aminte
>> dintr-o discutie de anul trecut cu Catalin, se vorbea despre un set de
>> reguli de transformare ce pot fi aplicate in sens invers, dar nu
>> cunosc mai multe detalii.
>>
>>   Cum este rezolvata de fapt aceasta problema?
>>   Exista documentatie in acest sens?
>>   Putem eventual folosi un serviciu dintr-o clona instalata local a
>> site-ului sau este suficient de simplu cat sa implementam nativ?
>>
>>   Multumesc anticipat,
>>       Adrian Scoica.
>>
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.rosedu.org/pipermail/dexonline/attachments/20111117/16c6c480/attachment-0001.html>


More information about the dexonline mailing list