Szöveg elemeinek kategorizálása

2021-2022 ősz

Nyelvtechnológia

Téma leírása

Szövegek feldolgozásánál egy fontos lépés lehet a tulajdonnevek észrevétele és kategorizálása (NER - Named Entity Recognition), illetve az egyes szavak szófaji besorolása (POS - part of speech). Ennek manapság számos eszköze létezik a klasszikus Viterbi algoritmustól kezdve a mélytanulási rendszerekig.

A hallgató feladata a félév során egy ilyen rendszer megalkotása lesz, amely képes a szekvenciákat labelelni, legyen az NER tagging vagy POS tagging.

Maximális létszám: 1 fő