Salutare,<div><br></div><div>Hm, detectare de plagiat, uite un software care în România ar trebui să lucreze în foc continuu, că are muuuult de depistat. :-D :-D</div><div><br></div><div>Din păcate nu, noi nu avem un stemmer (așa-i zice). Pentru nevoile noastre, ne descurcăm cu procesul invers: generăm flexiunile și le stocăm pe toate în tabelul InflectedForm. Dacă vreți să lucrați și la partea asta, ar fi un proiect interesant, care nu s-a mai publicat până acum pentru limba română sub o licență liberă. Doar că v-ar trebui un curs de NLP, cred. Spuneți-mi dacă vă interesează și vă pun în legătură cu Radu Borza. El e omul cu NLP-ul în proiectul nostru. :-)</div>


<div><br></div><div>Cătălin<br><br><div class="gmail_quote">2011/11/16 Adrian Scoica <span dir="ltr"><<a href="mailto:adrian.scoica@gmail.com">adrian.scoica@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">


Salut,<br>

<br>

   Eu si Filip Buruiana incercam sa scriem specificatiile software<br>

pentru un detector de plagiat si printre altele avem nevoie de un<br>

modul care sa ne ajute sa aducem lexemele parsate la forma canonica<br>

(de exemplu "oamenilor -> om".<br>

<br>

   DEXOnline face deja ceva similar, si din cate imi aduc aminte<br>

dintr-o discutie de anul trecut cu Catalin, se vorbea despre un set de<br>

reguli de transformare ce pot fi aplicate in sens invers, dar nu<br>

cunosc mai multe detalii.<br>

<br>

   Cum este rezolvata de fapt aceasta problema?<br>

   Exista documentatie in acest sens?<br>

   Putem eventual folosi un serviciu dintr-o clona instalata local a<br>

site-ului sau este suficient de simplu cat sa implementam nativ?<br>

<br>

   Multumesc anticipat,<br>

<span class="HOEnZb"><font color="#888888">      Adrian Scoica.<br>

</font></span></blockquote></div><br></div>