<br><div class="gmail_quote">2011/11/16 Catalin Francu <span dir="ltr"><<a href="mailto:cata@francu.com">cata@francu.com</a>></span><br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
Salutare,<div><br></div><div>Hm, detectare de plagiat, uite un software care în România ar trebui să lucreze în foc continuu, că are muuuult de depistat. :-D :-D</div><div><br></div><div>Din păcate nu, noi nu avem un stemmer (așa-i zice). Pentru nevoile noastre, ne descurcăm cu procesul invers: generăm flexiunile și le stocăm pe toate în tabelul InflectedForm. Dacă vreți să lucrați și la partea asta, ar fi un proiect interesant, care nu s-a mai publicat până acum pentru limba română sub o licență liberă. Doar că v-ar trebui un curs de NLP, cred. Spuneți-mi dacă vă interesează și vă pun în legătură cu Radu Borza. El e omul cu NLP-ul în proiectul nostru. :-)</div>
</blockquote><div><br>Ok. Totusi, daca imi aduc bine aminte, exista o tabela in baza de date a DEXOnline care contine transformari pentru clase de substantive. Nu mai tin minte daca erau doar reguli de formare ale pluralului sau cuprindeau si alte inflexiuni. Pareau sa arate ca niste reguli de rescriere ale unei gramatici (de data aceasta, in sensul formal :D).<br>
<br>Cel mai probabil vom avea nevoie si de o asemenea componenta in proiectul nostru, iar daca nu se descurcam in alt mod, vom folosi direct baza de date de forme cu inflexiuni.<br><br></div><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">


<div><br></div><div>Cătălin<div><div></div><div class="h5"><br><br><div class="gmail_quote">2011/11/16 Adrian Scoica <span dir="ltr"><<a href="mailto:adrian.scoica@gmail.com" target="_blank">adrian.scoica@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">

Salut,<br>
<br>
   Eu si Filip Buruiana incercam sa scriem specificatiile software<br>
pentru un detector de plagiat si printre altele avem nevoie de un<br>
modul care sa ne ajute sa aducem lexemele parsate la forma canonica<br>
(de exemplu "oamenilor -> om".<br>
<br>
   DEXOnline face deja ceva similar, si din cate imi aduc aminte<br>
dintr-o discutie de anul trecut cu Catalin, se vorbea despre un set de<br>
reguli de transformare ce pot fi aplicate in sens invers, dar nu<br>
cunosc mai multe detalii.<br>
<br>
   Cum este rezolvata de fapt aceasta problema?<br>
   Exista documentatie in acest sens?<br>
   Putem eventual folosi un serviciu dintr-o clona instalata local a<br>
site-ului sau este suficient de simplu cat sa implementam nativ?<br>
<br>
   Multumesc anticipat,<br>
<span><font color="#888888">      Adrian Scoica.<br>
</font></span></blockquote></div><br></div></div></div>
</blockquote></div><br>