Adatkezelési technológiák

Data Group logoAz adatkezelési technológiák széleskörű felhasználási területtel rendelkeznek, hiszen a legtöbb vállalati alkalmazás nagy tömegben keletkező adatok feldolgozására épül. Az automatizált adatgyűjtési módszerek széleskörű elterjedésével egyre fokozódik a folyamatokról, felhasználókról és különféle tevékenységeikről felhalmozódó adatok intelligens feldolgozása iránti igény. A nagy adathalmazok hatékony feldolgozása, az abban rejlő összefüggések kinyerése és üzleti célkora való felhasználása számos különleges technikát igényel.

Csoportunk az alábbi témakörökhöz kapcsolódó kutatási és fejlesztési feladatokkal foglalkozik:

Párhuzamos és elosztott módszerek kutatása

A nagy adathalmazok hatékony kezelésének egyik lehetősége a párhuzamos és elosztott módszerek alkalmazása a folyamat során. Kutatásunk két fő területe a többprocesszoros rendszerekben és a PC klaszterekben rejlő lehetőségek kiaknázása. A klaszteres megoldások kialakításának támogatására és tesztelésére készült egy Piramis nevű keretrendszer is.

Adatbányász algoritmusok fejlesztése

Az adatbányászat rejtett összefüggések keresésével foglalkozik nagy adathalmazokban. Ez a terület igen sokrétű, különböző problémákkal és megoldási lehetőségekkel rendelkezik. Csoportunk fő profilja az adatbányászaton belül a gyakori minta-bányászat, a klaszterezés és az osztályozás. A kutatások eredményeinek tesztelésére elkészült egy XDataMiner alkalmazás, mely gyakori minta-bányászati algoritmusokat implementál, valamint jelenleg is fejlesztés alatt áll egy komplex tudás modellező és adatbányászati rendszer, a KMDM (Knowledge Modeler and Data Miner).

Hatékony adatkezelési technológiák

  • Előfeldolgozás – hatékony, cache tudatos adatkezelési struktúrák és modellek kialakítása a nyers adatok tömör tárolása és olyan átalakítása érdekében, mely megkönnyíti a későbbi feldolgozási lépések elvégzését.
  • Memórián kívüli adatkezelés kérdései – óriási adathalmazok kezelése esetén óhatatlanul is felmerül az igény olyan módszerek iránt, amelyek hatékonyan működnek abban az esetben is, ha az egyszerre feldolgozandó adatmennyiség jóval meghaladja a rendelkezésre álló memóriakapacitást
  • Multidimenziós adatvizualizáció – a kinyert információk emberek számára is könnyen feldolgozható formába történő alakítása több dimenzió megjelenítésének segítségével.

 

A fenti területeken végzett több éves kutatómunka eredményeképpen két doktori disszertáció, hat diplomamunka, és több mint 100 cikk született. A közeljövőben a tématerületen további két doktori védés várható. A kutatásban két Phd-vel rendelkező kutató, egy oktató és három doktorandusz is aktívan részt vesz.