Sažetak
Dijaloški sustavi su računalni programi razvijeni sa svrhom interakcije s korisnicima radi pružanja neke automatizirane usluge. Interakcija, koja može kombinirati tekst, govor i druge modalitete na ulazu i izlazu, trudi se približiti svakodnevnoj ljudskoj te se procjenjuje na temelju prirodnosti, inteligencije i efikasnosti. Ovaj rad osvrnut će se pretežito na podatkovne glasovne tehnologije temeljene na korpusima ; odnosno, sustave koji koriste strojno učenje u svrhu optimizacije vlastitih komponenti na temelju podataka prikupljenih iz ljudskih dijaloga (engl. human conversational data). Ukratko će se dotaknuti onovnih teoretskih postavki dijaloških sustava, te dati uvid u mogućnosti njihove aplikacije u suvremenom okruženju (pružanje informacija, navigacijski sustavi, zdravstvene usluge, virtualni glasovni asistenti poput Appleove Siri, Amazonove Alexe te Googleova Google Assistanta). U glavnom fokusu naći će se upravo dijaloški korpusi kao temelj rada, razvoja i istraživanja ovih sustava. Poseban naglasak bit će na njihovoj kategorizaciji (preciznije, prema vrsti i metodama prikupljanja dijaloga, temi te veličini korpusa), a bit će pružen i kratak pregled najpoznatijih javno dostupnih skupova podataka prikladnih za uvježbavanje i daljnji razvoj u okviru danih kriterija.
Ključne riječi
dijaloški korpus, dijaloški čin, dijaloški sustav, strojno učenje