[dexonline] Canonicalizare Lexeme in DEXOnline

Catalin Francu cata at francu.com
Wed Nov 16 20:48:33 EET 2011


Salutare,

Hm, detectare de plagiat, uite un software care în România ar trebui să
lucreze în foc continuu, că are muuuult de depistat. :-D :-D

Din păcate nu, noi nu avem un stemmer (așa-i zice). Pentru nevoile noastre,
ne descurcăm cu procesul invers: generăm flexiunile și le stocăm pe toate
în tabelul InflectedForm. Dacă vreți să lucrați și la partea asta, ar fi un
proiect interesant, care nu s-a mai publicat până acum pentru limba română
sub o licență liberă. Doar că v-ar trebui un curs de NLP, cred. Spuneți-mi
dacă vă interesează și vă pun în legătură cu Radu Borza. El e omul cu
NLP-ul în proiectul nostru. :-)

Cătălin

2011/11/16 Adrian Scoica <adrian.scoica at gmail.com>

> Salut,
>
>   Eu si Filip Buruiana incercam sa scriem specificatiile software
> pentru un detector de plagiat si printre altele avem nevoie de un
> modul care sa ne ajute sa aducem lexemele parsate la forma canonica
> (de exemplu "oamenilor -> om".
>
>   DEXOnline face deja ceva similar, si din cate imi aduc aminte
> dintr-o discutie de anul trecut cu Catalin, se vorbea despre un set de
> reguli de transformare ce pot fi aplicate in sens invers, dar nu
> cunosc mai multe detalii.
>
>   Cum este rezolvata de fapt aceasta problema?
>   Exista documentatie in acest sens?
>   Putem eventual folosi un serviciu dintr-o clona instalata local a
> site-ului sau este suficient de simplu cat sa implementam nativ?
>
>   Multumesc anticipat,
>       Adrian Scoica.
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.rosedu.org/pipermail/dexonline/attachments/20111116/07df9010/attachment-0001.html>


More information about the dexonline mailing list