Studija slučaja / UmjetnaInteligencija.info

Kada AI asistent od jednostavnog zadatka napravi ozbiljan slučaj: jedan PDF, jedna pogrešna interpretacija i pitanje povjerenja

Na jednom javno dostupnom PDF dokumentu pokazujemo kako zadatak tipa “pročitaj dokument i napiši što u njemu piše” može završiti netočnom interpretacijom, službenom reklamacijom prema OpenAI-u, izradom strožeg prompta i ponovljenim testom na istom izvoru.

Bit ovog članka: nije riječ o napadu na umjetnu inteligenciju kao takvu, nego o preciznom prikazu jednog konkretnog slučaja u kojem je AI asistent dobio jednostavan zadatak rada s dokumentom, ali je u ključnom dijelu izašao izvan izvora i time otvorio ozbiljno pitanje pouzdanosti za objavljivi sadržaj.

Studija slučaja Rad s PDF izvorom Source-grounded analiza OpenAI reklamacija Prompt engineering

Otvori izvorni PDF dokument Otvori Anthropic Research stranicu

Zadatak

AI je trebao samo pročitati jedan PDF dokument i napisati sažetak onoga što u dokumentu piše.

Greška

Model je metodološku mjeru iz rada preformulirao kao tvrdnju o stvarnoj uporabi AI-ja u praksi.

Posljedica

Zbog sumnje u pouzdanost rezultata poslana je službena reklamacija prema OpenAI-u.

Drugi test

Nakon toga je sastavljen novi, stroži prompt i isti zadatak je ponovljen na istom dokumentu.

Sadržaj

Zašto je ovaj slučaj važan
Hodogram slučaja
Početni zadatak: pročitati PDF i sažeti bitno
Gdje je nastala ključna greška
Zašto ova greška nije sitnica
Što je napisano u službenoj reklamaciji prema OpenAI-u
Što je odgovorio OpenAI Help Center chat
Što je odgovorio OpenAI support e-mail
Detaljan prompt za strogo čitanje dokumenta bez interpretacije
Ponovljeni test: isti zadatak, ali uz stroži prompt
Što ovaj slučaj stvarno pokazuje
Praktične pouke za redakcije, tvrtke i profesionalne korisnike AI-a
Dodatak A: izvorni problematični sažetak AI asistenta
Dodatak B: cjeloviti rezultat drugog pokušaja

Zašto je ovaj slučaj važan

Velik broj poslovnih korisnika, urednika, savjetnika i autora danas koristi AI asistente za zadatke koji ne izgledaju posebno rizično: pročitati dokument, izdvojiti bitno, prevesti nalaze, složiti osnovu za članak ili pripremiti internu analizu. Na papiru, to djeluje kao idealan posao za AI.

Problem je u tome što stvarni rizik često ne izgleda spektakularno. Model ne mora izmišljati cijeli dokument da bi rezultat postao nepouzdan. Dovoljno je da u jednoj ključnoj točki napravi semantički pomak: da metodološki termin iz izvora prevede u svakodnevnu tvrdnju koja zvuči razumljivije, ali više nije isto što i original.

Upravo to se dogodilo u ovom slučaju. AI asistent je dobio jasan zadatak da pročita jedan PDF dokument i napiše sažetak. U jednom bitnom dijelu nije ostao unutar jezika izvora, nego je pojam iz dokumenta preoblikovao u tvrdnju o stvarnoj uporabi AI-ja na tržištu rada. Time je promijenio smisao originala.

Središnje pitanje ove studije slučaja: može li se AI asistentu danas povjeriti i jednostavan posao čitanja jednog dokumenta bez rizika da će samostalno, bez upozorenja, prijeći iz sažimanja u interpretaciju?

Jedan PDF
Jedan naizgled jednostavan zadatak
Jedna ključna pogreška
Jedna formalna reklamacija
Jedan ponovljeni test

Hodogram slučaja

1. AI asistent dobio je zadatak čitanja PDF-a

Zadatak nije bio istraživački ni kreativni. Trebalo je pročitati dokument Labor market impacts of AI: A new measure and early evidence i pripremiti vjeran sažetak za čitatelje.

2. U prvom sažetku pojavila se ključna interpretacijska greška

Model je iz metodološkog izraza rada prešao u jezik koji sugerira stvarnu uporabu AI-ja “u praksi danas”, iako izvor to tako nije tvrdio.

3. Korisnik je zaustavio daljnji rad na toj verziji

Procjena je bila da je pogreška preozbiljna da bi se ostatku sažetka moglo vjerovati bez dubinske provjere.

4. Prema OpenAI-u je poslana službena reklamacija

Najprije je prijavljen razgovor kroz sam ChatGPT, zatim je pokrenut Help Center chat, a potom i formalniji pisani prigovor na engleskom jeziku.

5. OpenAI je odgovorio u chatu i e-mailom

Odgovori su potvrdili da modeli mogu dati netočne ili previše samouvjerene odgovore, da za ozbiljan rad treba dodatna zaštita i da je ljudska provjera i dalje važna.

6. Sastavljen je novi, mnogo stroži prompt

Prompt je osmišljen tako da AI ostane unutar dokumenta, ne uvodi interpretaciju, navodi lokacije tvrdnji i ne prikazuje nejasne brojke kao točne.

7. Isti zadatak je ponovljen

AI manager je ponovio zadatak nad istim PDF-om, ali ovaj put uz prompt koji je upravo radi ove pogreške dodatno postrožen.

8. Rezultat drugog pokušaja objavljen je bez uljepšavanja

U dodatku ovog članka nalazi se i drugi odgovor u izvornom obliku kako bi čitatelj sam mogao procijeniti koliko je novi postupak discipliniraniji.

Početni zadatak: pročitati PDF i sažeti bitno

AI asistent nije dobio otvoreni istraživački zadatak niti je od njega traženo da slobodno tumači dokument. Tražilo se nešto mnogo jednostavnije i operativno jasnije:

Što se tražilo

pročitati PDF dokument,
izdvojiti ključne nalaze,
posebno istaknuti relevantne brojke i liste poslova,
napisati sažetak namijenjen čitateljima.

Što se nije tražilo

slobodna interpretacija,
nadopisivanje značenja izvora,
pretvaranje metodoloških pokazatelja u tržišne tvrdnje,
“olakšavanje” teksta po cijenu promjene smisla.

Drugim riječima, osnovni zahtjev bio je strogo izvoran: “napiši što dokument kaže”, a ne “napiši što misliš da dokument zapravo znači”.

Zašto je to važno: u radu s dokumentima upravo ta razlika određuje je li AI pomoćnik za vjeran nacrt ili nepredvidiv suautor koji ponekad sam mijenja smisao izvora.

Gdje je nastala ključna greška

Glavni problem nije bio u tome što AI asistent nije znao pročitati broj iz tablice. Problem je bio semantički i metodološki: model je izraz iz dokumenta preveo u drugačiji tip tvrdnje.

U izvornom dokumentu, u dijelu koji se odnosi na Figure 3, autori pišu da figura prikazuje:

“the top ten most exposed occupations using our task coverage measure”

To je precizan iskaz koji govori o:

most exposed occupations — najizloženijim zanimanjima,
task coverage measure — mjeri koja proizlazi iz njihove metodologije.

AI asistent je, međutim, u prvom sažetku napisao:

“Ovo je najvažnija lista iz rada jer pokazuje gdje se AI u praksi najviše koristi danas.”

Što piše u originalnom dokumentu

“the top ten most exposed occupations using our task coverage measure”

Dokument ostaje unutar vlastite metodologije i vlastitih pojmova.

Što je napisao AI asistent

“pokazuje gdje se AI u praksi najviše koristi danas”

To zvuči jednostavnije i čitatelju je možda lakše razumljivo, ali to nije ista tvrdnja.

Zašto je razlika važna

“Exposure” i “task coverage measure” nisu automatski isto što i stvarna tržišna uporaba AI-ja po zanimanjima. Upravo tu je došlo do promjene značenja izvora.

Na izravno pitanje je li pogriješio, AI asistent je kasnije odgovorio:

“Da. Tu sam pogriješio u formulaciji.”

Time je i sam potvrdio da je u početnoj verziji prešao iz vjernog prijenosa izvora u slobodniju interpretaciju. To je ključni trenutak cijelog slučaja.

Zašto ova greška nije sitnica

U ozbiljnom radu s dokumentima najopasnija pogreška često nije dramatična ni lako uočljiva. Naprotiv, najopasnija je ona koja na prvi pogled djeluje razumljivo, tečno i uvjerljivo — ali nije posve vjerna izvornom tekstu.

U ovom slučaju greška je ozbiljna iz više razloga:

Promijenjeno je značenje izvora. Dokument govori jezikom metodologije, a AI ga je pretvorio u jezik stvarne uporabe “u praksi danas”.
Srušeno je povjerenje u ostatak sažetka. Kada jedna ključna formulacija nije pouzdana, korisnik s pravom počinje sumnjati i u druge tvrdnje i brojke.
AI nije uštedio vrijeme nego ga je dodatno potrošio. Umjesto brzog nacrta, korisnik mora ručno provjeravati, ispravljati i vraćati model na sadržaj dokumenta.
Rizik je posebno velik za objavljivi sadržaj. Članak koji se poziva na konkretan dokument mora biti ne samo čitljiv nego i precizan prema izvorniku.

Suština problema: korisnik je tražio od AI asistenta da odradi jedan posao — čitanje dokumenta i sažimanje sadržaja. Zbog pogreške je završio radeći dva posla: prvo zadavanje zadatka, a zatim ručnu kontrolu i hvatanje netočnosti.

Što je napisano u službenoj reklamaciji prema OpenAI-u

Nakon što je postalo jasno da je AI asistent samostalno izašao izvan izvora, prema OpenAI-u je poslana službena reklamacija. Njezin sadržaj bio je vrlo konkretan i usmjeren na kvalitetu rada s izvorima.

Bit reklamacije

AI asistent dobio je PDF dokument i zadatak da ga pročita te vjerno sažme. Umjesto toga, samovoljno je prešao u interpretaciju i formulirao tvrdnju koja nije odgovarala originalnom dokumentu.

Ključna zamjerka

Tamo gdje izvor govori o “most exposed occupations using our task coverage measure”, AI je napisao formulaciju koja zvuči kao tvrdnja o stvarnoj uporabi AI-ja u praksi.

Pitanje upućeno OpenAI-u

Što vodeći stručnjaci u OpenAI-u poduzimaju da se ovakve pogreške ne događaju, posebno u najnovijim modelima, i kako korisnik može imati povjerenje u model za složenije zadatke ako ni jednostavno čitanje jednog dokumenta nije pouzdano?

Time reklamacija nije bila “žalba zato što se odgovor nije svidio”, nego prigovor na source accuracy, instruction following i reliability.

Što je odgovorio OpenAI Help Center chat

U odgovoru Help Center chata OpenAI nije negirao da se takve pogreške događaju. Naprotiv, odgovor je u osnovi priznao da modeli mogu dati netočne ili zavaravajuće odgovore i da korisnik, za važan rad, treba postaviti dodatne zaštitne upute.

Što je podrška praktično priznala

ChatGPT može proizvesti netočne ili zavaravajuće odgovore.
Model može samouvjereno formulirati tvrdnju koja ide dalje od izvora.
Ne postoji jamstvo da će bez zaštitnih uputa uvijek ostati unutar dokumenta.

Što su preporučili

tražiti doslovne citate i oznake stranica ili odjeljaka,
odvojiti izdvojene tvrdnje od sažetka,
PDF analizirati po manjim, preciznijim koracima, osobito kod figura i tablica,
zadržati ljudsku provjeru za ozbiljan rad.

Najvažnija praktična poruka Help Center odgovora: model nema ugrađeno jamstvo da će uvijek ostati strogo unutar dokumenta; za takav rad potrebno je dodatno promptom ograničiti ponašanje i zatim provjeriti rezultat.

Što je odgovorio OpenAI support e-mail

Nakon komunikacije kroz Help Center stigao je i službeni e-mail odgovor podrške, pod brojem predmeta 06594000.

Sažetak tog odgovora bio je sljedeći:

Pitanje iz reklamacije	Sažetak odgovora OpenAI podrške
Što OpenAI radi da smanji ovu vrstu pogreške?	Modeli se kontinuirano poboljšavaju kroz nove metode treniranja, povratne informacije korisnika i evaluacije usmjerene na source-grounded zadatke poput sažimanja i rada s dokumentima.
Koji mehanizmi kontrole kvalitete postoje?	Modeli su trenirani da daju prednost dostavljenom izvoru, slijede korisničke upute i interno se testiraju na činjeničnoj usklađenosti s dokumentima.
Kako korisnik može imati povjerenja za ozbiljan rad?	Za zadatke veće točnosti preporučuje se traženje izravnih citata, referenci i sažetaka strogo ograničenih na tekst te usporedna provjera s izvornim dokumentom.
Kako OpenAI planira poboljšati source-grounded reliability?	Fokus razvoja je na jačem “document grounding”-u, boljem pridržavanju uputa i boljim evaluacijskim benchmarkovima za rad s izvorima.

Iz perspektive korisnika, odgovor je bio korektan, ali općenit. Važno je da nije osporio samu srž prigovora. Time je, barem posredno, potvrđeno da je problem bio stvaran i relevantan.

Praktična poruka e-mail odgovora: OpenAI navodi da radi na poboljšanjima, ali korisniku ne daje jamstvo da će model bez dodatnih zaštita i ljudske provjere ostati potpuno vjeran izvoru.

Detaljan prompt za strogo čitanje dokumenta bez interpretacije

Na temelju odgovora podrške sastavljen je detaljan prompt čiji je cilj bio spriječiti upravo onu vrstu pogreške koja se dogodila u prvom pokušaju: prijelaz iz metodološkog izraza u svakodnevnu interpretaciju koja mijenja značenje izvora.

U nastavku je cjeloviti prompt, bez skraćivanja:

Prikaži / sakrij cjeloviti prompt

ČITANJE DOKUMENTA STROGO PREMA IZVORU BEZ INTERPRETACIJE

ZADATAK: Radiš isključivo kao precizan čitač i analitičar izvora. Tvoj posao nije tumačiti, nadograđivati, pojednostavljivati ili “prepričavati po smislu”, nego vjerno prenijeti što točno piše u dokumentu.

IZVOR:
Dobit ćeš PDF dokument ili link na dokument. Radi isključivo na temelju tog izvora.

GLAVNO PRAVILO:
Ne smiješ unositi vlastitu interpretaciju izvan onoga što je izričito navedeno u dokumentu.
Ako nešto nije izričito navedeno, napiši točno:
“NIJE IZRIČITO NAVEDENO U DOKUMENTU.”

STROGA PRAVILA RADA:
1. Ne koristi vanjsko znanje.
2. Ne zaključuj “što su autori vjerojatno mislili”.
3. Ne pretvaraj metodološke pokazatelje u stvarne tržišne pokazatelje ako to dokument izričito ne kaže.
4. Ne mijenjaj značenje izraza iz dokumenta. Ako dokument koristi izraz kao što je “exposure”, “task coverage”, “observed exposure”, “automation”, “augmentation”, moraš zadržati taj izraz i objasniti ga samo ako ga autori sami objašnjavaju.
5. Ne smiješ napisati da dokument tvrdi nešto što zapravo ne tvrdi.
6. Ako je graf, tablica ili figura nejasna, napiši:
“VRIJEDNOST NIJE DOVOLJNO JASNO ČITLJIVA IZ FIGURE; NEĆU JE PRIKAZATI KAO TOČAN PODATAK.”
7. Ako broj nije eksplicitno napisan u tekstu ili jasno vidljiv u tablici/figuri, nemoj ga predstavljati kao točan broj.
8. Ako moraš procijeniti vrijednost s grafa, to mora biti posebno označeno kao:
“PROCJENA S GRAFA, NIJE EKSPLICITNO NAVEDEN TOČAN BROJ U TEKSTU.”
9. Nikada ne zamjenjuj pojam “izloženost” pojmom “stvarna uporaba”, osim ako dokument to izričito navodi.
10. Ako korisnik traži sažetak, sažetak mora biti izveden isključivo iz prethodno izdvojenih tvrdnji iz dokumenta.

OBVEZNI NAČIN RADA U 4 KORAKA:

KORAK 1 — IDENTIFIKACIJA IZVORA
Na početku napiši:
- Naslov dokumenta
- Autor / organizacija
- Link izvora ako je dostupan
- Vrsta izvora: PDF / web članak / izvještaj / rad
- Kratka napomena: “Analiza se temelji isključivo na sadržaju ovog izvora.”

KORAK 2 — DOSLOVNO IZDVOJENE KLJUČNE TVRDNJE
Prvo izdvoji 5 do 15 najvažnijih tvrdnji iz dokumenta.
Za svaku tvrdnju obavezno navedi:
- Kratki naslov tvrdnje
- Doslovni citat ili vrlo bliski vjerni prijenos
- Stranicu, odjeljak, figuru ili tablicu iz koje tvrdnja dolazi
- Napomenu je li tvrdnja:
  a) izravno napisana u tekstu
  b) iz tablice
  c) iz figure
  d) procjena s grafa

Format svake stavke:
1. [Naziv tvrdnje]
   - Izvorni navod / vjerni prijenos:
   - Lokacija u dokumentu:
   - Status tvrdnje: TEKST / TABLICA / FIGURA / PROCJENA S GRAFA

KORAK 3 — STROGI SAŽETAK BEZ INTERPRETACIJE
Nakon toga napiši sažetak koji se smije temeljiti samo na Koraku 2.
Pravila za sažetak:
- Koristi neutralan, precizan jezik.
- Ne uvodi nove zaključke koji nisu već pokriveni u Koraku 2.
- Ako postoji metodološka ograda u dokumentu, mora biti uključena u sažetak.
- Ako dokument nešto ne tvrdi izravno, nemoj to dopisivati.

KORAK 4 — TABLICE / FIGURE / POSTOCI
Ako korisnik traži tablicu, popis poslova, postotke ili rang-listu, napravi zasebnu sekciju:
“TABLIČNI PRIKAZ IZ DOKUMENTA”

Za svaku stavku obavezno navedi:
- Naziv kategorije / zanimanja / metrike
- Vrijednost
- Jedinicu (%, broj, indeks, itd.)
- Izvor: tekst / tablica / figura
- Napomena:
  - “TOČNO NAVEDENO U DOKUMENTU”
  ili
  - “PROCJENA S GRAFA”

Ako dokument ne daje dovoljno jasan podatak, napiši:
“NEDOVOLJNO JASNO ZA TOČNO PREPISIVANJE.”

POSEBNA PRAVILA ZA FIGURE I GRAFOVE:
- Ne smiješ automatski pretvarati vizualni dojam u činjeničnu tvrdnju.
- Prvo pročitaj naslov figure.
- Zatim legendu figure.
- Zatim osi, mjerne jedinice i oznake.
- Tek onda opiši što figura prikazuje.
- Ako figura koristi specifičnu metodološku mjeru, moraš tu mjeru imenovati točno kako je nazvana u dokumentu.
- Ako korisnik pita “što to znači”, prvo napiši:
  “Doslovno prema dokumentu figura prikazuje…”
  pa tek onda, ako korisnik izričito traži, odvojeno navedi ograničeno objašnjenje.
- Nikada ne predstavljaj metodološku mjeru kao stvarni tržišni udio bez izričite potvrde u dokumentu.

ZABRANJENE VRSTE REČENICA:
Nemoj pisati rečenice poput:
- “Ovo pokazuje gdje se AI najviše koristi danas”
- “To znači da toliki postotak radnika koristi AI”
- “Autori zapravo žele reći”
- “Može se zaključiti da…”
osim ako je to doslovno ili nedvosmisleno navedeno u dokumentu.

UMJESTO TOGA KORISTI FORMULACIJE:
- “Dokument navodi da…”
- “Autori pišu da…”
- “Prema Figure X…”
- “Prema tablici Y…”
- “Prema metodologiji dokumenta…”
- “Ovo nije isto što i stvarna tržišna uporaba, osim ako dokument to izričito navodi.”
- “NIJE IZRIČITO NAVEDENO U DOKUMENTU.”

OBVEZNA ZAVRŠNA KONTROLA PRIJE ODGOVORA:
Prije konačnog odgovora napravi internu provjeru i potvrdi da:
1. Nijedna tvrdnja nije šira od izvora.
2. Nijedan broj nije prikazan kao točan ako nije jasno vidljiv ili eksplicitno naveden.
3. Nijedan metodološki pojam nije pretvoren u drugi pojam.
4. Sažetak ne sadrži interpretaciju izvan dokumenta.
5. Svi ključni navodi imaju označenu lokaciju u dokumentu.

FORMAT IZLAZA:
Odgovor mora imati točno ove naslove:

1. IDENTIFIKACIJA IZVORA
2. KLJUČNE TVRDNJE IZ DOKUMENTA
3. STROGI SAŽETAK
4. TABLIČNI PRIKAZ IZ DOKUMENTA
5. OGRANIČENJA I NEJASNOĆE

U zadnjem odjeljku “OGRANIČENJA I NEJASNOĆE” napiši samo ono što stvarno nije moguće sigurno utvrditi iz dokumenta.

AKO KORISNIK TRAŽI ČLANAK ZA OBJAVU:
Prvo napravi gore navedenu strogu analizu.
Ne piši članak dok korisnik izričito ne potvrdi da je analiza točna.

Ključna zaštitna ideja ovog prompta: AI ne smije “pomoći” tako da promijeni značenje izvora. Ako nešto nije izričito navedeno, mora to reći. Ako nešto nije dovoljno jasno iz figure, ne smije to predstaviti kao točan podatak.

Ponovljeni test: isti zadatak, ali uz stroži prompt

Nakon što je prompt sastavljen, AI manager je ponovio isti zadatak nad istim PDF dokumentom. To je važan dio ove studije slučaja, jer pokazuje da cilj nije bio “srušiti” AI nego provjeriti može li se discipliniranijim promptom smanjiti rizik krive interpretacije.

Ponovljeni test nije zamišljen kao konačni dokaz da je problem riješen. Njegova svrha bila je praktična: provjeriti može li stroža procedura dati odgovor koji je oprezniji u radu s terminima, brojkama, figurama i tablicama te osjetno bliži izvornom dokumentu.

Važno: rezultat drugog pokušaja u ovom članku prikazan je bez sadržajnog uljepšavanja. Time čitatelj može sam procijeniti je li novi pristup doista discipliniraniji od prvog.

Što ovaj slučaj stvarno pokazuje

Ova studija slučaja ne dokazuje da su AI asistenti beskorisni. Pokazuje nešto važnije i realnije: AI može biti vrlo koristan alat, ali i dalje može pogriješiti baš ondje gdje korisnik očekuje da će biti najsigurniji — u jednostavnom poslu vjernog prijenosa onoga što piše u jednom dokumentu.

AI može brzo obraditi dokument, ali može i brzo skliznuti iz sažimanja u interpretaciju.
Najopasnija pogreška nije nužno izmišljeni broj, nego pomak značenja.
Bez strogih uputa model se može ponašati previše samouvjereno.
Bolji prompt može smanjiti rizik, ali ne ukida potrebu za ljudskom provjerom.
Za javno objavljive sadržaje AI i dalje treba tretirati kao asistenta za nacrt, a ne kao posljednju instancu istine.

Urednički zaključak: između tvrdnje “AI mi može pomoći” i tvrdnje “AI mi može napraviti gotov, siguran i objavljiv tekst bez provjere” i dalje postoji ozbiljna razlika.

Praktične pouke za redakcije, tvrtke i profesionalne korisnike AI-a

1. Uvedite standard za rad s izvorima

Nemojte odmah tražiti “lijep članak”. Prvo tražite ključne tvrdnje, citate i lokacije u dokumentu. Tek nakon toga neka AI piše sažetak.

2. Za objavljive tekstove koristite source-grounded način rada

Prompt mora jasno zabraniti slobodnu interpretaciju ondje gdje je cilj vjeran prijenos izvora.

3. Posebno štitite figure, grafikone i tablice

Ako broj nije eksplicitno naveden ili jasno čitljiv, ne smije se prikazati kao točan podatak.

4. Metodološki pojmovi moraju ostati metodološki pojmovi

“Exposure”, “coverage”, “observed exposure” i slični izrazi ne smiju se pretvarati u tržišne tvrdnje ako dokument to sam ne radi.

5. Zadržite ljudsku zadnju riječ

Za sadržaj koji ide u javnost i dalje je nužna urednička ili stručna provjera, bez obzira na razinu samouvjerenosti modela.

6. Gradite interni prompt playbook

Jedan dobar prompt nije dovoljan. Potrebno je imati više provjerenih predložaka za rad s PDF-ovima, tablicama, prijevodima i sažecima.

Dodatak A: izvorni problematični sažetak AI asistenta

Napomena o vjernosti prikaza: tekst niže prenesen je iz prvog odgovora AI asistenta uz minimalnu tehničku prilagodbu za web format. Sadržajna formulacija ostavljena je nepromijenjena upravo zato da bi čitatelj vidio gdje je i kako nastao problem.

Prikaži / sakrij cjeloviti prvi sažetak

Evo sažetka teksta u tekstualnom obliku, složenog tako da su najvažnije informacije na vrhu, a zatim ide lista poslova s postocima izloženosti AI-u.

Sažetak rada “Labor market impacts of AI”

Najvažniji zaključak rada je da je stvarna uporaba AI-ja u poslu još znatno manja od njegove teorijske mogućnosti. Autori uvode mjeru observed exposure, koja ne gleda samo što bi LLM teoretski mogao raditi, nego što se stvarno radi u profesionalnoj uporabi, uz veći naglasak na automatizirane i radne slučajeve uporabe. U ključnim nalazima navode da je AI još daleko od svoje pune teorijske primjene, da su zanimanja s većom stvarnom izloženošću povezana sa slabijim projekcijama rasta zaposlenosti do 2034., da su radnici u najizloženijim zanimanjima češće stariji, obrazovaniji i bolje plaćeni, te da zasad nema sustavnog rasta nezaposlenosti u najizloženijim zanimanjima, iako postoje naznake da je zapošljavanje mlađih radnika usporilo.

Metodologija rada kombinira tri izvora: O*NET bazu zadataka po zanimanjima, Anthropicove podatke o stvarnoj uporabi Claudea i raniji model teorijske izloženosti zadataka iz rada Eloundou i sur. Autori dodatno objašnjavaju da posao ima veću izloženost ako su njegovi zadaci teorijski izvedivi AI-jem, ako se stvarno pojavljuju u poslovnoj uporabi, ako se odvijaju u radnom kontekstu, ako imaju veći udio automatizacije ili API implementacije i ako takvi zadaci čine veći dio ukupne uloge. Također navode da je 97% zadataka opaženih u Claude uporabi već u kategorijama koje su teorijski izvedive za LLM, što pokazuje da postoji jaka veza između teorijske mogućnosti i stvarne uporabe, ali i dalje velik jaz između njih.

Ključni primjer tog jaza vide u širokim skupinama zanimanja. U kategoriji Computer & Math teorijska mogućnost iznosi 94%, dok stvarna pokrivenost kroz Claude trenutno iznosi 33%. U kategoriji Office & Admin teorijska mogućnost iznosi 90%, ali rad naglašava da je stvarna uporaba i tu osjetno niža od teorijskog maksimuma. Drugim riječima, modeli mogu mnogo više nego što se danas stvarno koristi u radu.

Autori pritom ne tvrde da je tržište rada već doživjelo veliki potres. Naprotiv, njihov rezultat pokazuje da je učinak na nezaposlenost zasad statistički nejasan, odnosno da nema jasnog dokaza o sustavnom rastu nezaposlenosti u najizloženijim zanimanjima nakon pojave ChatGPT-ja. Ipak, kod mladih radnika u dobi 22–25 godina nalaze signal da je stopa ulaska u najizloženija zanimanja pala oko 14% u odnosu na 2022., premda i sami upozoravaju da je taj nalaz tek rubno statistički značajan i da može imati više tumačenja.

Važan dodatni nalaz je da je veća observed exposure povezana sa slabijim dugoročnim projekcijama rasta zanimanja. Autori procjenjuju da za svakih 10 postotnih bodova veće pokrivenosti BLS projekcija rasta zaposlenosti pada za oko 0,6 postotnih bodova, iako sami kažu da je ta veza slaba.

Lista poslova s najvećom stvarnom izloženošću AI-u (Figure 3)

Ovo je najvažnija lista iz rada jer pokazuje gdje se AI u praksi najviše koristi danas:

Computer programmers — 74,5%
Customer service representatives — 70,1%
Data entry keyers — 67,1%
Medical record specialists — 66,7%
Market research analysts and marketing specialists — 64,8%
Sales representatives, wholesale and manufacturing, except technical and scientific products — 62,8%
Financial and investment analysts — 57,2%
Software quality assurance analysts and testers — 51,9%
Information security analysts — 48,6%
Computer user support specialists — 46,8%

Vrijednosti su preuzete iz tablice Figure 3: Most exposed occupations u službenom PDF-u; sam tekst dodatno izričito ističe prva tri mjesta: programeri oko 75%, korisnička podrška oko 70% i data entry oko 67%.

Što ova lista stvarno govori

Najizloženiji nisu fizički poslovi, nego poslovi koji se sastoje od rada nad informacijama: pisanje i održavanje koda, korisnička komunikacija po predlošku, unos podataka, obrada medicinske dokumentacije, analiza tržišta, financijska analiza, testiranje softvera i informacijska sigurnost. To znači da je trenutni val AI utjecaja najjači ondje gdje je rad već digitalan, tekstualan, strukturiran i lako prenosiv u API ili workflow.

Tko je zasad najmanje zahvaćen

Rad navodi da 30% radnika ima nultu pokrivenost jer se njihovi zadaci gotovo ne pojavljuju u podacima ili su slabo prikladni za ovakvu vrstu AI uporabe. Kao primjere navode kuhare, mehaničare motocikala, spasioce, barmene, perače posuđa i pomoćnike u garderobi.

Jedna rečenica za članak

Ako želite sažeti cijeli rad u jednoj rečenici, najtočnije bi bilo napisati: AI danas na tržištu rada najviše zahvaća digitalne uredske i analitičke poslove, ali stvarna uporaba još je znatno ispod teorijske mogućnosti modela, pa zasad više vidimo promjene u strukturi zadataka i zapošljavanju mlađih nego jasan val nezaposlenosti.

Dodatak B: cjeloviti rezultat drugog pokušaja

Napomena o vjernosti prikaza: rezultat niže prikazuje odgovor AI asistenta iz ponovljenog testa, nakon uvođenja strožeg prompta. Cilj je da čitatelj vidi kako izgleda odgovor kada je model snažnije vezan uz izvor, njegove termine, ograničenja i eksplicitno navedene brojke.

Prikaži / sakrij cjeloviti rezultat drugog pokušaja

1. IDENTIFIKACIJA IZVORA

Naslov dokumenta: Labor market impacts of AI: A new measure and early evidence
Autori / organizacija: Maxim Massenkoff i Peter McCrory; javno objavljeno na Anthropic Research
Link izvora: https://www.anthropic.com/research/labor-market-impacts
Vrsta izvora: PDF rad / research note
Napomena: Analiza se temelji isključivo na sadržaju ovog izvora.

2. KLJUČNE TVRDNJE IZ DOKUMENTA

Nova mjera “Observed Exposure”
Dokument uvodi novu mjeru AI displacement risk, “observed exposure”, koja kombinira teorijsku LLM capability i real-world usage data, uz veću težinu za automated i work-related uses.
Rani nalaz o učinku na zaposlenost
Autori pišu da rad “test it against early data” i nalazi limited evidence da je AI do sada utjecao na zaposlenost; istodobno izričito navode da pristup “won’t capture every channel” kroz koji AI može preoblikovati tržište rada.
Tri izvora podataka za mjerenje exposure
Dokument navodi da pristup kombinira tri izvora: O*NET, vlastite usage podatke iz Anthropic Economic Indexa i task-level exposure estimates iz Eloundou et al. (2023).
Figure 1 — raspodjela Claude usage prema β
Figure 1 navodi da taskovi s β=1 čine 68% observed Claude usage, a taskovi s β=0 čine 3%. Tekst dodatno kaže da 97% taskova opaženih u prethodna četiri Economic Index izvještaja pada u kategorije β=0.5 ili β=1.0.
Što “Observed Exposure” treba mjeriti
Dokument definira “Observed Exposure” kao pitanje: od taskova koje bi LLM-ovi teoretski mogli ubrzati, koji stvarno vide automated usage u professional settings.
Kada je job exposure viši
Dokument kaže da je exposure veći ako su taskovi teorijski mogući s AI, ako imaju significant usage u Anthropic Economic Indexu, ako su work-related, ako imaju veći udio automated/API patterns i ako AI-impacted taskovi čine veći dio role.
Kako se coverage računa
Dokument navodi da se task računa kao covered ako ima dovoljno work-related usage u Claude trafficu; fully automated implementations dobivaju punu težinu, augmentative use pola težine; zatim se task-level coverage agregira na occupation level, ponderirano udjelom vremena po tasku.
Figure 2 — eksplicitno navedene točne vrijednosti
Tekst uz Figure 2 eksplicitno navodi: Computer & Math = 94% teoretske penetracije, Office & Admin = 90% teoretske penetracije; za observed coverage navodi da Claude trenutno pokriva 33% svih taskova u Computer & Math kategoriji.
Figure 3 — što dokument tvrdi da prikazuje
Dokument kaže da Figure 3 prikazuje “the ten occupations most exposed under this measure” i “top ten most exposed occupations using our task coverage measure.”
Dno raspodjele coverage
Dokument navodi da 30% workers have zero coverage, jer su se njihovi taskovi pojavljivali previše rijetko da bi zadovoljili minimum threshold; kao primjere navodi cooks, motorcycle mechanics, lifeguards, bartenders, dishwashers i dressing room attendants.
Observed exposure i BLS growth projections
Dokument kaže da su BLS growth projections nešto slabije za poslove s višim observed exposure; za svakih 10 percentage point više coverage, BLS growth projection pada za 0.6 percentage points. U istom odlomku piše da je odnos slight i da nema takve korelacije kada se koristi samo Eloundou et al. mjera.
Karakteristike high-exposure workers
Dokument navodi da je more exposed group 16 percentage points češće female, 11 percentage points češće white, gotovo dvostruko češće Asian, da zarađuje 47% more, te ima višu razinu obrazovanja; kao primjer daje graduate degree: 4.5% u unexposed group naspram 17.4% u most exposed group.
Figure 6 — rezultat za unemployment
Dokument navodi da je prosječna promjena u gapu od releasea ChatGPT-a small and insignificant, što sugerira da je unemployment rate više exposed grupe porastao blago, ali je efekt indistinguishable from zero.
Figure 7 — rezultat za young workers
Dokument navodi da u post-ChatGPT razdoblju postoji 14% drop u job finding rate u exposed occupations u odnosu na 2022, ali da je to just barely statistically significant; dokument također kaže da nema takvog pada za workers older than 25.
Metodološke ograde i sljedeći koraci
Dokument navodi da framework neće uhvatiti svaki kanal utjecaja AI-ja; da postoje judgment calls at every step; da future updates trebaju proširiti usage sliku, a Eloundou metric bi se mogao ažurirati; te da bi sljedeći korak mogao biti praćenje recent graduates u exposed areas.

3. STROGI SAŽETAK

Dokument uvodi novu mjeru “Observed Exposure”. Prema samom dokumentu, ta mjera kombinira teorijsku mogućnost LLM-a, stvarno usage ponašanje na Anthropicovoj platformi, work-related kontekst, automated/API weighting i time-weighted agregaciju na razinu zanimanja. Dokument izričito kaže da ta mjera treba pokazati: od taskova koje LLM-ovi teoretski mogu ubrzati, koji stvarno vide automated usage u professional settings.

Dokument također izričito navodi da je stvarni coverage još ispod teorijske capability. To pokazuje na nekoliko mjesta: Figure 1 navodi da taskovi s β=1 čine 68% observed Claude usage, a taskovi s β=0 samo 3%, dok tekst dodaje da 97% opaženih taskova pada u β=0.5 ili β=1.0 kategorije. Uz Figure 2 tekst eksplicitno navodi da je teoretska penetracija 94% za Computer & Math i 90% za Office & Admin, dok Claude trenutno pokriva 33% svih taskova u Computer & Math kategoriji.

Za Figure 3 dokument kaže da prikazuje top ten most exposed occupations using our task coverage measure. Točno prema tablici u dokumentu, na vrhu su Computer programmers (74.5%), Customer service representatives (70.1%) i Data entry keyers (67.1%). Dokument također navodi da je 30% workers na dnu raspodjele s zero coverage. NIJE IZRIČITO NAVEDENO U DOKUMENTU da ti postoci predstavljaju udio svih radnika u tim zanimanjima koji koriste AI. Dokument izričito govori o most exposed occupations i task coverage measure.

Na strani učinaka na tržište rada dokument kaže da je observed exposure povezan sa slabijim BLS growth projections: za svakih 10 percentage point više coverage, projekcija rasta pada za 0.6 percentage points, uz napomenu da je odnos slight. Za unemployment dokument navodi da od releasea ChatGPT-a ne nalazi sistematski rast nezaposlenosti u highly exposed group: prosječna promjena u gapu je small and insignificant i efekt je indistinguishable from zero. Za workers aged 22–25 dokument navodi 14% drop u job finding rate u exposed occupations u odnosu na 2022, ali uz izričitu ogradu da je rezultat just barely statistically significant i da postoje alternativna tumačenja te caveat o mogućem survey mismeasurementu.

Dokument dodatno navodi da su workers u more exposed group stariji, češće female, češće white, gotovo dvostruko češće Asian, više obrazovani i bolje plaćeni; kao primjer daje graduate degree: 4.5% u unexposed group naspram 17.4% u most exposed group. Istodobno dokument sam navodi više ograda: framework neće uhvatiti sve kanale utjecaja AI-ja, postoje judgment calls at every step, a budući radovi trebali bi ažurirati usage podatke i razmotriti kako recent graduates u exposed fields prolaze na tržištu rada.

4. TABLIČNI PRIKAZ IZ DOKUMENTA

Occupation	Observed exposure	Jedinica	Leading automated task	Napomena
Computer programmers	74.5	%	Write, update, and maintain software programs	TOČNO NAVEDENO U DOKUMENTU
Customer service representatives	70.1	%	Confer with customers to provide info, take orders, handle complaints	TOČNO NAVEDENO U DOKUMENTU
Data entry keyers	67.1	%	Read source documents and enter data into systems	TOČNO NAVEDENO U DOKUMENTU
Medical record specialists	66.7	%	Compile, abstract, and code patient data	TOČNO NAVEDENO U DOKUMENTU
Market research analysts and marketing specialists	64.8	%	Prepare reports of findings, illustrating data graphically and translating complex findings into written text	TOČNO NAVEDENO U DOKUMENTU
Sales representatives, wholesale and manufacturing, except technical and scientific products	62.8	%	Contact customers to demonstrate products and solicit orders	TOČNO NAVEDENO U DOKUMENTU
Financial and investment analysts	57.2	%	Inform investment decisions by analyzing financial information to forecast business, industry, or economic conditions	TOČNO NAVEDENO U DOKUMENTU
Software quality assurance analysts and testers	51.9	%	Modify software to correct errors or improve performance	TOČNO NAVEDENO U DOKUMENTU
Information security analysts	48.6	%	Perform risk assessments and test data processing security	TOČNO NAVEDENO U DOKUMENTU
Computer user support specialists	46.8	%	Answer user inquiries regarding computer software or hardware operation to resolve problems	TOČNO NAVEDENO U DOKUMENTU

B. Figure 2 — eksplicitno napisane točne brojke

Naziv kategorije / metrike	Vrijednost	Jedinica	Napomena
Computer & Math — theoretical LLM penetration (β measure)	94	%	TOČNO NAVEDENO U DOKUMENTU
Office & Admin — theoretical LLM penetration (β measure)	90	%	TOČNO NAVEDENO U DOKUMENTU
Computer & Math — Claude coverage / observed exposure	33	%	TOČNO NAVEDENO U DOKUMENTU
Ostale occupational categories iz Figure 2	—	—	NEDOVOLJNO JASNO ZA TOČNO PREPISIVANJE

C. Ostale eksplicitno navedene brojke iz dokumenta

Metrika	Vrijednost	Jedinica	Napomena
Figure 1 — tasks rated β=1 u observed Claude usage	68	%	TOČNO NAVEDENO U DOKUMENTU
Figure 1 — tasks rated β=0 u observed Claude usage	3	%	TOČNO NAVEDENO U DOKUMENTU
Opaženi taskovi u β=0.5 ili β=1.0 kategorijama	97	%	TOČNO NAVEDENO U DOKUMENTU
Workers with zero coverage	30	%	TOČNO NAVEDENO U DOKUMENTU
Svakih +10 pp coverage → BLS growth projection	-0.6	pp	TOČNO NAVEDENO U DOKUMENTU
Figure 5 — AI coverage: No exposure group	0.0	%	TOČNO NAVEDENO U DOKUMENTU
Figure 5 — AI coverage: Top quartile	38.8	%	TOČNO NAVEDENO U DOKUMENTU
Figure 5 — Female: No exposure / Top quartile	38.8 / 54.4	%	TOČNO NAVEDENO U DOKUMENTU
Figure 5 — Bachelor’s degree: No exposure / Top quartile	13.3 / 37.1	%	TOČNO NAVEDENO U DOKUMENTU
Figure 5 — Graduate degree: No exposure / Top quartile	4.5 / 17.4	%	TOČNO NAVEDENO U DOKUMENTU
Figure 5 — Hourly wage: No exposure / Top quartile	22.23 / 32.69	USD	TOČNO NAVEDENO U DOKUMENTU
Figure 7 — less exposed occupations remain stable	2.0	% per month	TOČNO NAVEDENO U DOKUMENTU
Figure 7 — entry into most exposed jobs decreases by about	0.5	pp	TOČNO NAVEDENO U DOKUMENTU
Figure 7 — averaged estimate in post-ChatGPT era	14	% drop	TOČNO NAVEDENO U DOKUMENTU

5. OGRANIČENJA I NEJASNOĆE

Za Figure 2 nisu navedeni točni postoci za sve occupational categories. Dokument numerički eksplicitno navodi samo Computer & Math (94%), Office & Admin (90%) i Computer & Math coverage (33%). Ostale kategorije prikazane su na radar chartu bez numerički ispisanih vrijednosti, pa nisu prikazane kao točni podaci.
Figure 3 nije protumačen kao tržišni udio uporabe AI-ja po zanimanjima. Dokument izričito kaže da Figure 3 prikazuje “top ten most exposed occupations using our task coverage measure.” NIJE IZRIČITO NAVEDENO U DOKUMENTU da ti postoci predstavljaju udio svih radnika u tim zanimanjima koji koriste AI.
Sam dokument navodi da framework ne hvata sve kanale utjecaja AI-ja.
Sam dokument navodi da postoje “judgment calls at every step.”
Rezultat za young workers sam dokument kvalificira kao slabiji signal. Dokument kaže da je 14% drop u job finding rate just barely statistically significant i navodi alternativna tumačenja te caveat o mogućem survey mismeasurementu.

Zaključno

Ova studija slučaja ne govori da AI ne može pomoći. Ona pokazuje nešto važnije i realnije: AI može ubrzati rad, ali još uvijek ne može dosljedno zamijeniti uredničku odgovornost kada je riječ o sadržaju koji mora biti vjeran izvornom dokumentu.

Kada se ovakva pogreška dogodi, najvažnije nije tražiti veliku etiketu ni brzu obranu tehnologije, nego popraviti proces rada: jasniji prompt, odvajanje citata od sažetka, oprez s figurama i tablicama te obavezna ljudska provjera prije objave.

Najkraća poruka ovog slučaja: AI danas može ubrzati rad, ali još nije na razini da ga se bez nadzora koristi za izvorno osjetljive tekstove namijenjene javnoj objavi.

Povratak na vrh članka