Salutare,<div><br></div><div>Hm, detectare de plagiat, uite un software care în România ar trebui să lucreze în foc continuu, că are muuuult de depistat. :-D :-D</div><div><br></div><div>Din păcate nu, noi nu avem un stemmer (așa-i zice). Pentru nevoile noastre, ne descurcăm cu procesul invers: generăm flexiunile și le stocăm pe toate în tabelul InflectedForm. Dacă vreți să lucrați și la partea asta, ar fi un proiect interesant, care nu s-a mai publicat până acum pentru limba română sub o licență liberă. Doar că v-ar trebui un curs de NLP, cred. Spuneți-mi dacă vă interesează și vă pun în legătură cu Radu Borza. El e omul cu NLP-ul în proiectul nostru. :-)</div>

<div><br></div><div>Cătălin<br><br><div class="gmail_quote">2011/11/16 Adrian Scoica <span dir="ltr"><<a href="mailto:adrian.scoica@gmail.com">adrian.scoica@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

Salut,<br>
<br>
   Eu si Filip Buruiana incercam sa scriem specificatiile software<br>
pentru un detector de plagiat si printre altele avem nevoie de un<br>
modul care sa ne ajute sa aducem lexemele parsate la forma canonica<br>
(de exemplu "oamenilor -> om".<br>
<br>
   DEXOnline face deja ceva similar, si din cate imi aduc aminte<br>
dintr-o discutie de anul trecut cu Catalin, se vorbea despre un set de<br>
reguli de transformare ce pot fi aplicate in sens invers, dar nu<br>
cunosc mai multe detalii.<br>
<br>
   Cum este rezolvata de fapt aceasta problema?<br>
   Exista documentatie in acest sens?<br>
   Putem eventual folosi un serviciu dintr-o clona instalata local a<br>
site-ului sau este suficient de simplu cat sa implementam nativ?<br>
<br>
   Multumesc anticipat,<br>
<span class="HOEnZb"><font color="#888888">      Adrian Scoica.<br>
</font></span></blockquote></div><br></div>