Adatbányászatról tartottak meetupot a SZTAKI kutatói

Jure Leskovec, Anand Rajaraman és Jeff Ullman Mining of Massive Datasets című könyvét dolgozza fel fejezetről-fejezetre az a meetup-sorozat, aminek célja a big data és az adatbányászat technológiai hátterének megismertetése. Az MMDS Meetupot Bergmann Júlia, Horváth Dániel, Illényi Zsófia és Zeleny Klaudia indították, az első előadást Illényi Zsófia tartotta.

A téma a MapReduce modell volt, ami egy map és egy reduce függvényből áll, célja pedig a szerverek közti feladatelosztás, amire nagy szükség van, ha bigdatával dolgozunk: ilyenkor rengeteg adatot kell átvilágítani, amiken egyben végigmenni szinte lehetetlen, helyette szeletekre bontva végezhető rajtuk ugyanaz a művelet egyidőben. Mivel egy szerver sem működik hibamentesen, időről-időre előfordul meghibásodás, ezt viszont automatikusan kezeli a rendszer, külső beavatkozás nélkül.

A meetup-sorozat innentől a Mining of Massive Datasets fejezeteit fogja kitárgyalni. A következő előadás témája a hasonló elemek keresése lesz. A könyv egyébként ingyenesen elérhető ezen a linken.