Sažetak
Okosnicu istraživanja opisanom u članku čini popis germanizama formiran iz rječnika hrvatskoga jezika, rječnika stranih riječi i doktorskih disertacija koje se bave proučavanjem germanizama u hrvatskom jeziku. Pripremljeni popis germanizama omogućio je njihovu računalnu analizu u medijskom prostoru, odnosno hrvatskom mrežnom korpusu hrWaC- u koji obuhvaća tekstove objavljenje na internetu u razdoblju od 4 godine. Jezične tehnologije potpomognute naknadnom ručnom obradom podataka omogućile su utvrđivanje učestalosti korištenja germanizama u pisanim tekstovima. Metodama automatske detekcije germanizama pronašli smo germanizme u svim njihovim oblicima koji su danas u uporabi u suvremenim tekstovima čime je ujedno stvoren i čestotni rječnik germanizama. Provedenim istraživanjem utvrđena je zastupljenost germanizama u tekstovima suvremenog hrvatskog jezika. Iako ukupni broj germanizama koji se danas pojavljuje u hrvatskim rječnicima i ostalim konzultiranim izvorima iz kojih je formiran osnovni popis iznosi 17 988 lema, u uporabi je u suvremenim tekstovima dokazano 8 400 lema. Potvrđenih 8 400 lema dokaz su tomu da se leksičko blago hrvatskog jezika zabilježeno u rječnicima nije izgubilo u suvremenom hrvatskom jeziku, nego je sustavno ušlo u korpus hrvatskog jezika te postoji u tekstovima koji nisu nužno standardnojezični.
Ključne riječi
medijski prostor ; hrvatski web-korpus ; računalna analiza ; germanizam ; lema