S03E07 Slovenščina 3.0
Povzetek
Andraž "Brodul" Brodnik in Oto Brglez sta v Portorožu v sklopu konference Make IT 2024 govorila z dr. Markom Bajcem iz FRI.
dr. Marko Bajec je vodja Laboratorija za podatkovne tehnologije na UL FRI. Kjer se zadnja letapospešeno ukvarjajo z jezikovnimi in govornimi tehnologijami.
V okviru projekta RSDO (Razvoj slovenščine v digitalnem okolju) je vodil projekt “govorne tehnologije”, v okviru katerega so razvili razpoznavalnik slovenskega govora ter strojni prevajalnik za par slovenščina, angleščina. (Orodja: Prevajalnik, Razpoznalnik, Terminološki portal in ostalo na slovenscina.eu,...
Govorne tehnologije razvijajo naprej v okviru spinoff-a Vitasis. Njihove rešitve (razpoznava slovenskega govora, sinteza govora, strojno prevajanje) so že prisotne v zdravstvu, telekomunikacijah, državni upravi, RTV,...
Raziskovalno gledano je na področju jezikovnih in govornih tehnologij veliko izzivov in zadnje čase tudi priložnosti. Nekaj teh Marko s koleg naslavlja s projekti, kot so PoVeJMo: Prilagodljiva obdelava naravnega jezika s pomočjo Velikih Jezikovnih Modelov, ARIS, 2023-2026, Mezzanine: teMeljnE raZiskave Za rAzvoj govorNih vIrov in tehNologij za slovEnščino, ARIS, veliki temeljni projekt, 2023-2025, ProteVerb: Pravni, etični in tehnološki vidiki obdelave besedilnih in govornih virov podatkov za znanstvene, raziskovalne in razvojne namene, Ministrstvo za digitalno preobrazbo, 2022-2024,…
Slovenščina spada med “male jezike”, zato je potrebna inovativnost, saj prenos znanja iz velikih jezikov včasih ni izvedljiv.
Nekaj teh praktičnih, organizacijskih, pravnih ter tehničnih izzivov smo razkrili tudi v našem pogovoru.
Strojni povzetek epizode ✨*
Obnova podcast epizode z dr. Markom Bajcem
Gostitelj Oto Brglez in sovoditelj Andraž Brodnik sta gostila dr. Marka Bajca, priznanega strokovnjaka na področju računalništva in informacijskih tehnologij. Osrednja tema pogovora je bila prihodnost slovenskega jezika v digitalni dobi, izzivi pri njegovi digitalizaciji ter širši vplivi tehnologije na ohranjanje in razvoj slovenskega jezika. Epizoda je raziskala tako tehnične kot tudi kulturne vidike digitalizacije jezika, pri čemer so gostitelji in gost obravnavali možnosti, ki jih ponuja sodobna tehnologija.
Ključne točke pogovora
Slovenski jezik v digitalni dobi
- Dr. Bajec je pojasnil, kako je slovenščina prešla skozi različne faze razvoja – od zgodnjih zapisov in kodifikacije do uporabe digitalnih orodij, kot so slovarji in prevajalniki.
- V sodobnem času vstopamo v tretjo fazo, ki temelji na uporabi velikih jezikovnih modelov. Ti modeli omogočajo napredne funkcionalnosti, kot so glasovni pomočniki, avtomatski prevodi in analiza podatkov, ki so ključne za ohranitev jezikovne enakopravnosti.
- Gostitelj in gost sta izpostavila, da so ti koraki nujni za preprečevanje jezikovne marginalizacije, ki bi lahko nastopila ob prevladi tujih jezikov v digitalnem prostoru.
Izzivi in priložnosti
- Pogovor se je osredotočil na tveganje, da bi slovenski jezik ostal digitalno nepokrit, kar bi pomenilo, da bi bili uporabniki prisiljeni uporabljati rešitve v tujih jezikih. To bi lahko dolgoročno ogrozilo uporabo slovenskega jezika v javnem in zasebnem življenju.
- Dr. Bajec je poudaril, da je digitalna prisotnost slovenskega jezika bistvena za ohranitev kulturne identitete. Pri tem je ključnega pomena sodelovanje med znanstveniki, tehnološkimi podjetji in javnimi institucijami.
Vloga tehnologije in raziskav
- Kot vodja laboratorija za podatkovne tehnologije dr. Bajec vodi raziskave, ki se osredotočajo na govorne in jezikovne tehnologije, kot so avtomatsko prepoznavanje govora, sinteza govora in analitika velikih podatkov v slovenščini.
- Razpravljali so o tem, kako lahko tehnologija izboljša vsakodnevno življenje. Na primer, glasovni pomočniki, ki razumejo slovenščino, bi lahko olajšali komunikacijo starejšim ali invalidnim osebam.
- Gost je poudaril, da kljub napredku jezikovnih modelov človeški nadzor ostaja ključen. Tehnologija je lahko odličen pomočnik, vendar končne odločitve, zlasti na občutljivih področjih, kot je medicina, morajo sprejemati ljudje.
Slovenski jezik v medicini
- Pogovor je raziskal možnost uporabe jezikovnih tehnologij v medicini, kjer bi sistemi lahko analizirali simptome, podane v slovenščini, in predlagali potencialne diagnoze.
- Dr. Bajec je opozoril, da takšne tehnologije že obstajajo, vendar še niso popolnoma zanesljive. Zdravniki lahko tehnologijo uporabljajo kot orodje za pomoč pri odločanju, vendar mora končna odgovornost ostati na strokovnjaku.
- Gost je izpostavil, da moramo biti previdni pri zaupanju umetni inteligenci, saj lahko napake vodijo do napačnih sklepov. Kljub temu pa je tehnologija lahko izjemno koristna pri dostopu do obsežnih podatkov, ki jih posamezni zdravniki sami ne morejo analizirati.
Perspektive za prihodnost
- Dr. Bajec je predstavil optimistično vizijo, v kateri bi slovenski jezik postal enakovreden drugim velikim jezikom v digitalnem prostoru. To vključuje razvoj tehnologij, ki omogočajo njegovo uporabo v vsakodnevnem življenju, izobraževanju, poslovanju in kulturi.
- Razpravljali so o pomenu vlaganja v raziskave in razvoj, saj lahko le tako zagotovimo, da slovenščina ostane živ jezik tudi v digitalni dobi.
- Gost je poudaril, da lahko Slovenija postane zgled drugim državam z majhnimi jeziki, kako ohraniti jezikovno identiteto v času tehnoloških sprememb.
Zaključek
Epizoda je osvetlila ključne izzive in priložnosti za slovenski jezik v digitalni dobi. Dr. Bajec je z izjemnim znanjem in strastjo izpostavil, kako lahko sodobna tehnologija postane zaveznik pri ohranjanju in razvoju jezika. Pogovor je navdihujoč za vse, ki verjamejo v moč tehnologije za ohranjanje kulturne dediščine, in je hkrati poziv k aktivnemu sodelovanju pri oblikovanju prihodnosti slovenščine.
⚠️ Strojni povzetek je napisan s pomočjo umetne inteligence in lahko vsebuje nepravilnosti. ⚠️