[rosedu-general] Proiecte Google Summer of Code 2013: Mahout

Dan Filimon dangeorge.filimon at gmail.com
Tue Apr 9 15:39:35 EEST 2013


Salut!

Către studenții care vor să participe la Google Summer of Code [1]:

Ești interesat de machine learning la scară largă? Vrei să vezi cum arată
sistemele folosite în producție la companii ca Yahoo!, Twitter, Adobe sau
Amazon [2]?

Atunci aruncă o privire pe proiectele propuse de Mahout [3] pentru GSOC
2013 [4]!

Apache Mahout este o bibliotecă de învățare automată pentru lucru cu
cantități mari de date. Mulți algoritmi sunt implementați ca MapReduce-uri
(folosind Hadoop) deși pot fi rulați și local pe seturi mai mici.

Avem 3 proiecte până acum [4] și ele sunt incrementale. Nu trebuie să ai
experiență de machine learning ca să contribui.
În principiu scopul este integrarea mai strânsă dintre diferiții algoritmi
și unificarea formatelor diferitelor tool-uri ca să facem viața mai simplă
pentru utilizatorii noștri.

În caz că ai alte idei, poți propune și tu proiecte care ți se par
interesante (ceea ce e chiar încurajat!).

Înscrie-te pe listele de discuție la [5] și vezi cum ți se pare atmosfera,
aruncă o privire pe cod și află mai multe despre GSOC [6]!

Disclaimer:
Legătura mea personală cu proiectul este că lucrearea mea de licență este
despre algoritmi online de clustering (StreamingKMeans în particular) și
implementez asta în Mahout. Sunt committer și deși eu am făcut issue-urile,
nu mă voi putea implica efectiv ca mentor full-time la vreun proiect vara
asta.

Legat de numărul de locuri/proiecte, depinde de Apache (câte slot-uri
primim) și de câți mentori se oferă voluntari.

Oricum, pentru ajutor legat de clustering (în special la codul meu...) la
proiectul despre îmbunătățirea API-ului ca și pentru o vedere de ansamblu
voi putea răspunde la întrebări.

Întrebări, aici, sau ideal la dev at mahout.apache.org.

[1] http://www.google-melange.com/gsoc/homepage/google/gsoc2013
[2] https://cwiki.apache.org/MAHOUT/powered-by-mahout.html
[3] http://mahout.apache.org/
[4]
https://issues.apache.org/jira/issues/?filter=12323652&jql=project%20%3D%20MAHOUT%20AND%20labels%20%3D%20gsoc2013
[5]
http://cwiki.apache.org/confluence/display/MAHOUT/Mailing+Lists%2C+IRC+and+Archives
[6]
http://www.google-melange.com/document/show/gsoc_program/google/gsoc2013/help_page
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.rosedu.org/pipermail/rosedu-general/attachments/20130409/03d339ce/attachment-0001.html>


More information about the rosedu-general mailing list