Veliki jezični modeli – potraga za umjetnom inteligencijom

stručni rad

Veliki jezični modeli – potraga za umjetnom inteligencijom

Reni Banov

Vrsta prilog u časopisu

Tip stručni rad

Godina 2025

Časopis Poučak : časopis za metodiku i nastavu matematike

Volumen 26

Svesčić 102

Stranice str. 25-33

ISSN 1332-3008

EISSN 1849-1650

Status objavljeno

Sažetak

Unazad deset godina zamjećujemo veliki porast zanimanja za rješenjima ostvarenim primjenom umjetne inteligencije na konkretnim problemima iz različitih područja, pa se ona, primjerice, koristi za e-trgovine na međumrežju, za obrazovne aktivnosti, za autonomnu navigaciju, za upravljanje u robotici, te u brojnim drugim područjima. Međutim, niti jedno od brojnih rješenja nije privuklo medijsku pozornost kao nedavna primjena umjetne inteligencije za generiranje i “razumijevanje” tekstualnih zapisa prirodnih jezika. Takvi se modeli u pravilu nazivaju velikim jezičnim modelima (eng. Large Language Models, skraćeno LLM) jer su pripremljeni procesom učenja neuronskih mreža na velikim skupovima ulaznih podataka, prvenstveno iz tekstualnih zapisa (novinski i znanstveni članci, mrežne stranice, komunikacija na forumima itd.) s međumrežja. Iako je primjena takvih modela prividno neograničena, ona u brojnim aspektima ljudske komunikacije pokazuju manjkavosti. U ovom članku pokušat ćemo razjasniti osnovne matematičke pojmove povezane s tim modelima, te djelomično prikazati pozitivne i negative strane njihove primjene.

Ključne riječi

LLM; veliki jezični modeli; umjetna inteligencija

Veliki jezični modeli – potraga za umjetnom inteligencijom

Veliki jezični modeli – potraga za umjetnom inteligencijom

Sažetak

Ključne riječi

Ostale publikacije

Automatizacija dostupnosti virtualnog okruženja pomoću PowerCLI

Usporedba performansi i implementaijce prosljeđivanja grafičkih kartica na hyper-v i kvm hipervizorima

SMB Over QUIC: A Performance Evaluation