Morgan Stanley - Tematikus, strukturált, nyomtatott oldalak szövegének felismerése Javában

2016-2017 tavasz

Téma leírása

Karakter- ill. szövegfelismerési probléma esetén ma már rengeteg szolgáltatás és könyvtár áll a fejlesztő rendelkezésre. A legtöbbjük általános célú, csupán a képet alakítja szöveggé, de semmiféle támpontot nem nyújt bizonyos elemek azonosításához. Pedig strukturált oldalak  digitalizálása esetén ez a következő lépés, amelyet el kell végezni.

A hallgató(k) feladata olyan alkalmazás készitse, amely számlák képéből egy külső karakterfelismerő program által előállitott nyers szövegből a számlák adatait (eladó adatai, vásárlás helye és időpontja, vásárolt tételek, mennyiségek és összegek stb.) kinyeri.

Feltételek

  • Angol szöveg (dokumentáció) olvasás alapján történő megértése

Külső partner: Morgan Stanley

Maximális létszám: 2 fő