Foto: Katolička škola Šibenik

Jezik u digitalnom svijetu

Mnogo se već rasprave o Matičinu prijedlogu Zakona o hrvatskome jeziku zbilo i prije nego što je sam prijedlog došao u Sabor na prvo čitanje, a onda je u njemu uslijedila i višesatna rasprava. Ne kanim se ovdje zadržavati na općim mjestima koja jasno navode potrebu za ovakvim zakonom: mnoge države u Europi i svijetu imaju takav zakon; on predstavlja očekivanu civilizacijsku razinu; brana je od presezanja za hrvatskim jezikom i kulturom iz susjedstva; priječit će utjecaj mnogoljudnih svjetskih jezika (osobito engleskoga); nezaobilazna je sastavnica hrvatskoga identiteta; održavat će se obiteljska i nacionalna tradicija; osigurat će se hrvatski jezik kao kolijevka individualnoga razmišljanja u onoj mjeri u kojoj svaki jezik uobličuje pogled na svijet svojih govornika itd.; već bih se radije osvrnuo na područje kojega su se raspravljači izvan i u Saboru tek ovlaš dotaknuli.

Riječ je o članku 16. prijedloga Zakona u kojem se određuje sastavljanje i provođenje Nacionalnoga plana hrvatske jezične politike i to osobito onaj dio koji mi kao računalnome jezikoslovcu profesionalno na srcu leži, a to je „unaprjeđenje jezičnih tehnologija za hrvatski jezik“.

U nadirućoj poplavi digitalizacije ljudskih djelatnosti i ljudskih odnosa ni jezik nije mogao bio pošteđen obvezatnoga uključivanja u digitalni svijet. Kako bi se omogućila nesmetana uporaba nekoga jezika u tome okružju, potrebno je razviti jezične tehnologije koje će ljudima-korisnicima raznih digitalnih sustava omogućiti jednostav(nij)u uporabu toga jezika. Kako je svaki jezik jedinstven u svojoj strukturi, tj. u leksiku, gramatici i uporabi, za svaki je jezik potrebno utrošiti otprilike jednaku količinu istraživač-godina ne bi li se jezične tehnologije za taj jezik dovele do prihvatljive razine.

To ulaganje u razvoj podjednako je zahtjevno i za njemački i za litavski i za engleski i za slovenski. Jedina je razlika da kod mnogoljudnih jezika dio financijske potpore može na se preuzeti industrija koja će naći interesa za ulaganje u takva pretkonkurentska istraživanja, a kod maloljudnih jezika ta potpora pada najčešće na leđa države tj. državnoga proračuna.

Razvoj jezičnih tehnologija ne smije biti stihijski, a za hrvatski je jezik započeo prije tridesetak godina potporama MZT-a, a osobit je uzlet doživio oko i nakon pristupanja EU, kad su krenule potpore i iz toga smjera. Mnogi su čitatelji zacijelo upoznati s velikim računalnim korpusima tj. usustavljenim zbirkama tekstova na hrvatskome (ili preciznije e-tekstova) koji nam pružaju osnovne podatke o cjelovitosti hrvatskoga jezika ili kojega njegova posebnoga varijeteta, npr. Hrvatski nacionalni korpus (https://filip.ffzg.unizg.hr) ili drugi specijalizirani korpusi. Takvi korpusi jasno uključuju sve vrste tekstova koji su nastali na hrvatskome jeziku, a ne uključuju one tekstove koji su nastali na drugim jezicima, ma kako god ti jezici bili hrvatskome bliski. Već se na toj razini definira gdje su granice hrvatskoga jezika.

Također, mnogima su poznati i sustavi za strojno prevođenje koje su razvili domaći stručnjaci, npr. Prevoditelj za predsjedanje Vijećem EU-a (https://hr.presidencymt.eu) iz 2020. ili nacionalna platforma za jezične tehnologije Hrvojka (https://hrvojka.gov.hr), najnovija horizontalna usluga koju nudi javna administracija u Hrvatskoj.

Međutim, kao i ostale tehnologije i jezične tehnologije stalno napreduju, pa ih valja slijediti. Najnoviji napredak predstavljaju tzv. veliki jezični modeli koji omogućuju vjernu uporabu prirodnoga jezika u području umjetne inteligencije, a najpoznatiji su npr. ChatGPT, ­GPT-4 ili BARD koji je Google uključio kao dodatak svojoj mrežnoj tražilici. Premda se ti veliki jezični modeli mogu primijeniti i na hrvatski jezik, oni su svi nastali ponajprije u okrilju divovskih američkih digitalnih tvrtki kojima je na prvome mjestu dobit, a rijetko kad i javno dobro. Korisnici zapravo nemaju nikakav uvid u to kako se ti veliki jezični modeli razvijaju, kako se ažuriraju ili prilagođavaju korisniku tj. što mu zapravo prikazuju, a što skrivaju.

Stoga je potrebno razviti svima otvorene vlastite velike jezične modele, najvjerojatnije u suradnji s ostalim državama-članicama Unije, kako bi se osigurala transparentnost njihove uporabe. I to pripada u područje skrbi o hrvatskome jeziku i ona je predviđena ovim zakonskim prijedlogom.

Razvoj jezičnih tehnologija za pojedini jezik nesumnjivo omogućuje jeziku da ostane živ i uporabiv u digitalnome okružju, a osobito u komunikacijskim kanalima 21. stoljeća. Ma kakvi god oni postali krajem ovoga stoljeća, nije vjerojatno da ćemo kao vrsta homo sapiens uskoro razviti telepatiju, pa ćemo zacijelo i dalje morati komunicirati na nekom prirodnom jeziku.

Ako za hrvatski jezik ne budemo imali razvijene jezične tehnologije koje će olakšati njegovu uporabu u tim komunikacijskim kanalima, onda će ljudi koji ih koriste, iz čiste komocije, posegnuti za onim jezikom za koji takve tehnologije postoje. Toga će trenutka hrvatski postati funkcionalno nepismen ili „digitalno nepismen“ jezik jer se postojanje jezičnih tehnologija za neki jezik danas može smatrati novim stadijem pismenosti. Takav će jezik ostati onkraj digitalne razdjelnice i ubrzo će izumrijeti jer će dotad njegovi govornici početi koristiti neki drugi jezik i postati govornici nekoga drugoga jezika.

Hrvatski se jezik ne može održati konzerviranjem ili zaustavljanjem u vremenu jer je živ jezik koji fleksibilno, a opet stabilno, mora služiti društvu i svojoj jezičnoj zajednici za prijenos (digitalni ili nedigitalni) svih onih obavijesti koje mu/joj trebaju. Hrvatski se jezik može očuvati omogućivanjem njegova stabilnoga funkcioniranja i u digitalnom svijetu, a to se postiže jedino razvojem i uspostavom kvalitetne jezičnotehnološke podrške uporabi hrvatskoga i u takvu okružju.

Upravo se u ovome prijedlogu Zakona o hrvatskome jeziku dalekovidno obuhvaća i podupire i ta dimenzija uporabe hrvatskoga jezika i zato mu dajem svesrdnu podršku.

Marko Tadić
Vijenac