[dexonline] Canonicalizare Lexeme in DEXOnline
Catalin Francu
cata at francu.com
Wed Nov 16 20:48:33 EET 2011
Salutare,
Hm, detectare de plagiat, uite un software care în România ar trebui să
lucreze în foc continuu, că are muuuult de depistat. :-D :-D
Din păcate nu, noi nu avem un stemmer (așa-i zice). Pentru nevoile noastre,
ne descurcăm cu procesul invers: generăm flexiunile și le stocăm pe toate
în tabelul InflectedForm. Dacă vreți să lucrați și la partea asta, ar fi un
proiect interesant, care nu s-a mai publicat până acum pentru limba română
sub o licență liberă. Doar că v-ar trebui un curs de NLP, cred. Spuneți-mi
dacă vă interesează și vă pun în legătură cu Radu Borza. El e omul cu
NLP-ul în proiectul nostru. :-)
Cătălin
2011/11/16 Adrian Scoica <adrian.scoica at gmail.com>
> Salut,
>
> Eu si Filip Buruiana incercam sa scriem specificatiile software
> pentru un detector de plagiat si printre altele avem nevoie de un
> modul care sa ne ajute sa aducem lexemele parsate la forma canonica
> (de exemplu "oamenilor -> om".
>
> DEXOnline face deja ceva similar, si din cate imi aduc aminte
> dintr-o discutie de anul trecut cu Catalin, se vorbea despre un set de
> reguli de transformare ce pot fi aplicate in sens invers, dar nu
> cunosc mai multe detalii.
>
> Cum este rezolvata de fapt aceasta problema?
> Exista documentatie in acest sens?
> Putem eventual folosi un serviciu dintr-o clona instalata local a
> site-ului sau este suficient de simplu cat sa implementam nativ?
>
> Multumesc anticipat,
> Adrian Scoica.
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.rosedu.org/pipermail/dexonline/attachments/20111116/07df9010/attachment-0001.html>
More information about the dexonline
mailing list