Live hören
Jetzt läuft: Spirit von Kwesta feat. Wale

AI: Koliko su pouzdani programi za prevođenje? COSMO bosanski/hrvatski/srpski 11.10.2023 25:35 Min. Verfügbar bis 10.10.2024 COSMO Von Nenad Kreizer


Download Podcast

AI: Koliko su pouzdani programi za prevođenje?

Stand: 11.10.2023, 18:17 Uhr

Nenad Kreizer, Saša Bojić, Amir Kamber, Nada Pester

Do koje mjere se može pouzdati u prijevode preko internetskih stranica? Gdje mašina ne može zamjeniti čovjeka? Mogu li se strojni prijevodi bez razmišljanja upotrijebiti i u službene svrhe ili će sudski tumač i prevoditelj i dalje biti neizbježan? Nova tehnologija otvara nove mogućnosti ali i skriva mnoge zamke. Koje? Reći će nam predsjednik Društva sudskih tumača i prevoditelja Hrvatske Tomislav Kojundžić. Repotrer Saša Bojić testirao je programe za prevođenje i došao do zanimljivih rezultata.

Saša Bojić se malo detaljnije pozabavio mašinskim prevođenjem i pošao je od interneta. Tu ima više mašinskih prevodilaca. Koji se ističu kao dobri?

Postoje tri mašine koje – prema oceni računarskih revija kao što su Chip ili PC Magazin, to rade bolje od drugih. To su Google, Deepl i Pons. Osim toga, tome moram da dodam i četvrtu koja radi na principu veštačke inteligencije i to je ChatGPT.

Osnovno pitanje glasi: koliko su te mašine pouzdane i za šta mogu da se koriste, a gde su pre nepodesne.

Naravno da sam odmah poželeo da ih podvrgnem teškom testu. Evo jedne kratke rečenice iz pesme poznatog srpskog pesnika sa preloma 19. na 20. vek, Vladislava Petković Disa, dakle iz pesme „Možda spava“ koju mnogi smatraju i najlepšom u srpskoj književnosti. Ta rečenica glasi: „Al slutim, a slutiti još jedino znam“.

Globus i Smartphone sa programom za prevođenje

Najpre da naglasim da se svaka od prevodilačkih mašina diči time da može da prepozna jezik kada se u nju ukuca neki tekst. Tako su Google i Pons ovu rečenicu odmah smestili u hrvatski jezik, a Deepl u – slovenački. Može se reći da ta rečenica isto zvuči i na hrvatskom i na srpskom jeziku pa su je dva mašinska prevodioca po sistemu „fifti-fifti“ dodelila hrvatskom. To je za mene odraslog sa srpskohrvatskim jezikom najmanji problem. Kako je Deepl, međutim, došao na slovenački, drugo je pitanje. No, da čujemo kako su ove tri mašine prevele pomenutu rečinu na nemački jezik.

Google je ovako preveo: „Aber ich habe eine Ahnung, und die Ahnung ist das einzige, was ich weiss“. Prevod je po smislu tačan. Rečenica na nemačkom jeste rogobatna i ovakvi prevodioci ne mogu da rade prepeve. Ali jasno je šta je rečeno.

Da vidimo prevod Deepla. On glasi: „Entweder habe ich einen Verdacht, oder ich habe einen Verdacht, das ist alles, was ich weiss.“ Znači „Ili imam sumnju ili imam sumnju. To je sve što znam.“

Ovde već imamo reč koja je pogrešno prevedena, „ali“ je pretvoreno u „ili“. No eto da kažemo „izdaleka“ može da se shvati šta je pisao Dis hteo da kaže.

I evo i prevoda Ponsa. Još jednom, originalna rečenica glasi: „Al slutim, a slutiti još jedino znam“, i Ponsov prevodilac na nemački je preveo kao: „Ich lebe noch, und ich weiss es nur“. Totalni promašaj: „Još živim, i ja to samo znam“, tu više nema ni traga od ideje velikog pesnika.

A šta je sa ChatGPT-jem? On radi po principu veštačke inteligencije i funkcioniše kao jezički model, dakle, sa njim si morao da vodiš nekakav dijalog?

Tako je, sa njim se dopisujemo preko polja u koja se ukucava tekst. Njemu treba malo objasniti šta se traži. Tako sam mu ja napisao:

„Molim te da mi sledeću rečenicu prevedeš sa srpskog na nemački jezik: "Al slutim, a slutiti još jedino znam".

Za jednu sekundu je stigao odgovor koji glasi: „Naravno, rečenica se prevodi na nemački jezik kao: „Aber ich ahne, und ahnen ist das Einzige, was ich noch kann“. Dakle potpuno precizan prevod u kojem je jasno ne samo šta je rečeno, već i kako je rečeno. Ubedljivo najbolji rezultat. Pesnički aspekt, prepev, toga nema, ali ovo mu je zaista najbliže. I tako sam morao da ga proverim još jednom:

Zadao sam mu rečenicu iz serije „Salaš u malom ritu“ koja glasi: „Krtice krtiče krtičnjake“. Prevod ChatGPT-ja glasi: „Maulwürfe graben Maulwurfshügel.“

Ali moram da kažem i kako je isti iskaz preveo PONS: „Maulwürfe Maulwürfe Maulwürfe Maulwürfe“.

Zar je ChatGPT toliko nadmoćan?

Prst pritiska ikonicu aplikacije za previđenje

Odgovor glasi: da, kao prevodilac u svakom slučaju. No, situacija je u ovom trenutku takva da sa njegovim prevodima, bez obzira na to što su u ovim mojim testiranjima bili korektni, valja biti oprezan. Možda bih u nekakvom očajanju mogao da uzmem njegove prevode bez provere, ali u svakoj životnoj situaciji koja je važna, to bi mi bilo ravno kockanju sa sudbinom.

To o čemu si govorio su bili prevodi poetskih izraza, to je književnost a ne svakodnevni ili stručni jezik. Pretpostavljam da sa svakodnevnim jezikom mašinski prevodioci imaju manje problema.

Svakako. No, valja reći da postoji više vrsta mašinskih prevodilaca. Oni koje možemo otvoriti u internet-pregledaču su jedna stvar. Ali postoje i spravice veličine mobilnih telefona koje se nose u džepu i imaju mikrofon. Ako recimo odem u Rusiju onda bi to izgledalo ovako: negde nasred ulice zaustavim nekog čoveka, naravno ljubazno, izvadim tu spravicu i u mikrofon izgovorim pitanje: „Ima li ovde u blizini dobar riblji restoran?“ i pritisnem dugme: prevedi, iz sprave će se začuti glas koji kaže:

 „Здесь поблизости есть хороший рыбный ресторан?“ – naravno on to izgovori mnogo bolje od mene. I stvar je rešena. Dakle, za tako osnovne potrebe u stranoj zemlji ovakvi prevodioci su više nego dovoljni. U najpoznatije sprave te vrste spadaju prevodioci firme Vasco koji koštaju oko 400 evra i prevode sa i na više od 100 jezika. Dakle oni se koriste kao da pored tebe stoji simultani prevodilac.

predsjednik Društva sudskih tumača i prevoditelja Hrvatske Tomislav Kojundžić

Predsjednika Društva sudskih tumača i prevoditelja Hrvatske Tomislav Kojundžića pitali smo za njegov sud koliko se može osloniti na programe na internetu za prevođenje tekstova?

Umjetna inteligencija koristi jezične korpuse, ona iz njih crpe svoje podatke i tako što je veći jezični korpus, to su i srodni prevoditelji bolji. Recimo, ja sam isprobao kombinacije njemački i engleski. Oni u tim segmentima funkcioniraju izvrsno. Međutim, s hrvatskim je problem što baza iz koje se umjetna inteligencija može zapravo učiti i programirati nije toliko velika, pa onda ni naravno, rezultati nisu toliko dobri.

Jesu li ti programi zapravo promijenili vaš svakodnevni rad? Govorimo o, recimo, sudskim tumačima , o onome što ljudima zapravo najčešće treba. Kad govorimo o Njemačkoj, neki dokument prevesti neku neki tekst, važan, recimo, recepte, neke dijagnoze. Može li se tu pouzdati u to strojno prevođenje?

Jedan od najvećih problema je, kad govorimo konkretno o sudskom tumačenju i prevođenju je zaštita podataka. U biti se mnogi od nas i ne usude koristiti se tim velikim bazama podataka, jer u tekstovima često ima i osobnih podataka i stvari koje ne mogu ići u javnost jer nikad ne znamo na kojem će serveru i gdje će to završiti. Međutim, općenito mogu reći da nam jesu promijenili način rada. Ono gdje ja mogu reći da koristim umjetnu inteligenciju je kad mi treba možda neka svježa ideja ili možda neka druga formulacija.

Vi govorite o tome da se ti programi razvijaju, dakle, što im je veća baza podataka, da su to bolji. U kojim segmentima će tu opstati čovjek, hoće li uopće biti nezamjenjiv?

Usudio bih se reći da će to uvijek biti književno prevođenje jer je ono posebno i ono što uvijek treba znati da zapravo se tu ne radi o prevođenju samo riječi. Prevoditelj koji prevodi npr. knjigu ili bilo koji drugi književni tekst, on sa sobom donosi svoje čitavo ljudsko iskustvo, svoje razumijevanje, način na koji ljudi funkcioniraju i način na koji društvo funkcionira. Taj dio neće najvjerojatnije nikad moći na taj način postići strojno prevođenje. Zatim, ono što stroj ne može prenijeti je ljudska emocija. Nedavno sam prevodio u bolnici i vidio sam koliko je zapravo osobi kojoj sam prevodio bilo važno da od mene nije dobila samo točan sadržaj, nego da je zapravo dobila i prenesenu neku emociju jer je bila u jako teškoj situaciji. Tu je došao do izražaja i onaj neverbalni sadržaj. Dakle, to je isto nešto što od strojeva bar dosad još ne možemo očekivati. Treće područje su oblasti u kojima postoji jako veliki rizik, odnosno gdje je jako važno da prijevod bude vrlo precizan. To npr. mogu biti stvari koje pišu liječnici, službeni postupci pred sudom, gdje se jednostavno ne može dozvoliti da se potkrade neka greška jer te greške mogu imati jako dalekosežne posljedice. Znači, to su dijelovi gdje će čovjekova riječ uvijek biti zadnja.

Da li je reč o softveru koji se nalazi u samoj mašini?

Ne – Vasco prevodi uz pomoć veštačke inteligencije preko interneta. To znači da se u spravici nalazi SIM-karta preko koje je prevodila stalno povezan sa internetom. O njoj vlasnik ne mora da se stara, ona funkcioniše u svim državama. Ne plaća se i važi doživotno. Jedino što meni lično nije jasno je da li i kako radi i u slučaju da recimo firma Vasco ode pod stečaj. O tome nigde ništa ne piše.

I šta kažu korisnici takvih sprava, da li se kupovina isplatila?

Na osnovu informacija do kojih sam došao listajući bezbrojne forume o tome, zaključio sam da stvar radi dosta pouzdano ali i da greši, tako da je ponekada potrebno dovijanje u zadavanju prevoda i naravno u tumačćenju odgovora. Svaki Vasco-uređaj ima dva glavna dugmeta za prevođenje sa dva jezika. Prvo dugme pritisnem kada hoću da u mikrofon izgovorim rečenicu na mom maternjem jeziku i dobijem prevod na recimo ruski. Drugo dugme pritisnem dok mi Rus odgovara kako bih posle toga dobio prevod odgovora na moj maternji jezik.

Laptop auf einem Schreibtisch mit der Künstlichen Intelligenz Website Chat GPT.

To praktično znači povratak onih spravica koje su se prodavale još početkom devedesetih godina?

Da – tada su to bile naprave koje su imale format džepnih računara i nisu mogle da govore. No, imale su čitavu minijaturnu tastaturu za ukucavanje teksta a njihov fond reči je bio ograničen memorijom koja je bila bedno mala. Ukucaš rečenicu, ona se vidi na ekranu, pritisneš dugme za prevođenje na neki od šest do osam jezika – toliko je tada mogla podnese memorija – i to što dobiješ na ekranu kao prevod, moraš sam da pročitaš naglas ili jednostavno pokažeš sagovorniku na čiji jezik si preveo tu rečenicu. Ali to su bili prevodi sa kojima je u najboljem slučaju moglo da se preživi, ali ni to nije sigurno, nikada se nije znalo kakva će reakcija uslediti i sve je bilo u igri – od osmeha do šamarčine.

Da se vratimo ovim najmodernijim – zašto je to zapravo poseban aparat a ne aplikacija za mobilni telefon?

Upravo zato što ima više memorijskih resursa, što se za njegovo korišćenje ne plaća roaming ni u jednoj zemlji, i što može da se naravno koristi nezavisno od mobilnog telefona a to može biti vrlo praktično. No glavna stvar je što je iskustvo pokazalo da su odvojeni samostalni aparati pouzdaniji i imaju obično veći fond reči i prevoda od aplikacija. Oni su posebno dobri i fleksibilni za korisnike koji često imaju kontakte sa drugim jezicima. Za one koji tu i tamo nekuda otputuju telefonske aplikacije su sasvim dovoljne.

Koliko firmi trenutno proizvodi elektronske prevodioce kao posebne aparate?

ekran prevodioca

Ima ih dosta ali su u svetskim razmerama trenutno najrelevantniji prevodioci firmi Vasco o kojoj pričam sve vreme, ali i firmi Simvalley, Pocketalk i Vormor. Vasca sam uzeo za primer samo zato što ima najkompletniju opremu, pa tako i kameru i ekran, kamerom može da se slika bilo koji tekst na stranom jeziku, recimo jelovnik u nekom restoranu, i to može da se prevede.

I na kraju valja pomenuti i prevode u kojima veštačka inteligencija adaptira ne samo izgovoren tekst u audio-formatu, već i video-snimak.

To je pravo čudo. To rade servisi kao što je HeyGen. Sve što je potrebno jeste da se snimim mobilnim telefonom, da se jasno vidim u kadru i izgovorim tekst na nekom jeziku. Posle toga se to upload-uje na HeyGenov server i veoma brzo se dobija isti taj video-snimak na kojem sada ja – mojim glasom – govorim recimo turski, ali se pri tome na snimku moja usta pomeraju u skladu sa turskim jezikom. Ili sa bilo kojim drugim jezikom, tako da ne postoji utisak da je ton loše sinhronizovan. To zapravo znači da će uskor recimo svaki političar, predavač, pa i novinar ili bilo ko drugi, moći da se obraća javnosti neke zemlje na njenom maternjem jeziku, kao što to radi papa. I naravno samo je pitanje vremena kada će taj proces prilagođavanja videa da se ubrza toliko da se odvija skoro u realnom vremenu. Pa možda i stoprocentno u realnom vremenu.