AI je super. AI Manager je rješenje.

AI machine transforming numbers in neon
Studija slučaja / UmjetnaInteligencija.info

Kada AI asistent od jednostavnog zadatka napravi ozbiljan slučaj: jedan PDF, jedna pogrešna interpretacija i pitanje povjerenja

Na jednom javno dostupnom PDF dokumentu pokazujemo kako zadatak tipa “pročitaj dokument i napiši što u njemu piše” može završiti netočnom interpretacijom, službenom reklamacijom prema OpenAI-u, izradom strožeg prompta i ponovljenim testom na istom izvoru.

Bit ovog članka: nije riječ o napadu na umjetnu inteligenciju kao takvu, nego o preciznom prikazu jednog konkretnog slučaja u kojem je AI asistent dobio jednostavan zadatak rada s dokumentom, ali je u ključnom dijelu izašao izvan izvora i time otvorio ozbiljno pitanje pouzdanosti za objavljivi sadržaj.

Studija slučaja Rad s PDF izvorom Source-grounded analiza OpenAI reklamacija Prompt engineering
Zadatak

AI je trebao samo pročitati jedan PDF dokument i napisati sažetak onoga što u dokumentu piše.

Greška

Model je metodološku mjeru iz rada preformulirao kao tvrdnju o stvarnoj uporabi AI-ja u praksi.

Posljedica

Zbog sumnje u pouzdanost rezultata poslana je službena reklamacija prema OpenAI-u.

Drugi test

Nakon toga je sastavljen novi, stroži prompt i isti zadatak je ponovljen na istom dokumentu.

Sadržaj

  1. Zašto je ovaj slučaj važan
  2. Hodogram slučaja
  3. Početni zadatak: pročitati PDF i sažeti bitno
  4. Gdje je nastala ključna greška
  5. Zašto ova greška nije sitnica
  6. Što je napisano u službenoj reklamaciji prema OpenAI-u
  7. Što je odgovorio OpenAI Help Center chat
  8. Što je odgovorio OpenAI support e-mail
  9. Detaljan prompt za strogo čitanje dokumenta bez interpretacije
  10. Ponovljeni test: isti zadatak, ali uz stroži prompt
  11. Što ovaj slučaj stvarno pokazuje
  12. Praktične pouke za redakcije, tvrtke i profesionalne korisnike AI-a
  13. Dodatak A: izvorni problematični sažetak AI asistenta
  14. Dodatak B: cjeloviti rezultat drugog pokušaja

Zašto je ovaj slučaj važan

Velik broj poslovnih korisnika, urednika, savjetnika i autora danas koristi AI asistente za zadatke koji ne izgledaju posebno rizično: pročitati dokument, izdvojiti bitno, prevesti nalaze, složiti osnovu za članak ili pripremiti internu analizu. Na papiru, to djeluje kao idealan posao za AI.

Problem je u tome što stvarni rizik često ne izgleda spektakularno. Model ne mora izmišljati cijeli dokument da bi rezultat postao nepouzdan. Dovoljno je da u jednoj ključnoj točki napravi semantički pomak: da metodološki termin iz izvora prevede u svakodnevnu tvrdnju koja zvuči razumljivije, ali više nije isto što i original.

Upravo to se dogodilo u ovom slučaju. AI asistent je dobio jasan zadatak da pročita jedan PDF dokument i napiše sažetak. U jednom bitnom dijelu nije ostao unutar jezika izvora, nego je pojam iz dokumenta preoblikovao u tvrdnju o stvarnoj uporabi AI-ja na tržištu rada. Time je promijenio smisao originala.

Središnje pitanje ove studije slučaja: može li se AI asistentu danas povjeriti i jednostavan posao čitanja jednog dokumenta bez rizika da će samostalno, bez upozorenja, prijeći iz sažimanja u interpretaciju?

  • Jedan PDF
  • Jedan naizgled jednostavan zadatak
  • Jedna ključna pogreška
  • Jedna formalna reklamacija
  • Jedan ponovljeni test

Hodogram slučaja

1. AI asistent dobio je zadatak čitanja PDF-a

Zadatak nije bio istraživački ni kreativni. Trebalo je pročitati dokument Labor market impacts of AI: A new measure and early evidence i pripremiti vjeran sažetak za čitatelje.

2. U prvom sažetku pojavila se ključna interpretacijska greška

Model je iz metodološkog izraza rada prešao u jezik koji sugerira stvarnu uporabu AI-ja “u praksi danas”, iako izvor to tako nije tvrdio.

3. Korisnik je zaustavio daljnji rad na toj verziji

Procjena je bila da je pogreška preozbiljna da bi se ostatku sažetka moglo vjerovati bez dubinske provjere.

4. Prema OpenAI-u je poslana službena reklamacija

Najprije je prijavljen razgovor kroz sam ChatGPT, zatim je pokrenut Help Center chat, a potom i formalniji pisani prigovor na engleskom jeziku.

5. OpenAI je odgovorio u chatu i e-mailom

Odgovori su potvrdili da modeli mogu dati netočne ili previše samouvjerene odgovore, da za ozbiljan rad treba dodatna zaštita i da je ljudska provjera i dalje važna.

6. Sastavljen je novi, mnogo stroži prompt

Prompt je osmišljen tako da AI ostane unutar dokumenta, ne uvodi interpretaciju, navodi lokacije tvrdnji i ne prikazuje nejasne brojke kao točne.

7. Isti zadatak je ponovljen

AI manager je ponovio zadatak nad istim PDF-om, ali ovaj put uz prompt koji je upravo radi ove pogreške dodatno postrožen.

8. Rezultat drugog pokušaja objavljen je bez uljepšavanja

U dodatku ovog članka nalazi se i drugi odgovor u izvornom obliku kako bi čitatelj sam mogao procijeniti koliko je novi postupak discipliniraniji.

Početni zadatak: pročitati PDF i sažeti bitno

AI asistent nije dobio otvoreni istraživački zadatak niti je od njega traženo da slobodno tumači dokument. Tražilo se nešto mnogo jednostavnije i operativno jasnije:

Što se tražilo

  • pročitati PDF dokument,
  • izdvojiti ključne nalaze,
  • posebno istaknuti relevantne brojke i liste poslova,
  • napisati sažetak namijenjen čitateljima.

Što se nije tražilo

  • slobodna interpretacija,
  • nadopisivanje značenja izvora,
  • pretvaranje metodoloških pokazatelja u tržišne tvrdnje,
  • “olakšavanje” teksta po cijenu promjene smisla.

Drugim riječima, osnovni zahtjev bio je strogo izvoran: “napiši što dokument kaže”, a ne “napiši što misliš da dokument zapravo znači”.

Zašto je to važno: u radu s dokumentima upravo ta razlika određuje je li AI pomoćnik za vjeran nacrt ili nepredvidiv suautor koji ponekad sam mijenja smisao izvora.

Gdje je nastala ključna greška

Glavni problem nije bio u tome što AI asistent nije znao pročitati broj iz tablice. Problem je bio semantički i metodološki: model je izraz iz dokumenta preveo u drugačiji tip tvrdnje.

U izvornom dokumentu, u dijelu koji se odnosi na Figure 3, autori pišu da figura prikazuje:

“the top ten most exposed occupations using our task coverage measure”

To je precizan iskaz koji govori o:

  • most exposed occupations — najizloženijim zanimanjima,
  • task coverage measure — mjeri koja proizlazi iz njihove metodologije.

AI asistent je, međutim, u prvom sažetku napisao:

“Ovo je najvažnija lista iz rada jer pokazuje gdje se AI u praksi najviše koristi danas.”

Što piše u originalnom dokumentu

“the top ten most exposed occupations using our task coverage measure”

Dokument ostaje unutar vlastite metodologije i vlastitih pojmova.

Što je napisao AI asistent

“pokazuje gdje se AI u praksi najviše koristi danas”

To zvuči jednostavnije i čitatelju je možda lakše razumljivo, ali to nije ista tvrdnja.

Zašto je razlika važna

“Exposure” i “task coverage measure” nisu automatski isto što i stvarna tržišna uporaba AI-ja po zanimanjima. Upravo tu je došlo do promjene značenja izvora.

Na izravno pitanje je li pogriješio, AI asistent je kasnije odgovorio:

“Da. Tu sam pogriješio u formulaciji.”

Time je i sam potvrdio da je u početnoj verziji prešao iz vjernog prijenosa izvora u slobodniju interpretaciju. To je ključni trenutak cijelog slučaja.

Zašto ova greška nije sitnica

U ozbiljnom radu s dokumentima najopasnija pogreška često nije dramatična ni lako uočljiva. Naprotiv, najopasnija je ona koja na prvi pogled djeluje razumljivo, tečno i uvjerljivo — ali nije posve vjerna izvornom tekstu.

U ovom slučaju greška je ozbiljna iz više razloga:

  1. Promijenjeno je značenje izvora. Dokument govori jezikom metodologije, a AI ga je pretvorio u jezik stvarne uporabe “u praksi danas”.
  2. Srušeno je povjerenje u ostatak sažetka. Kada jedna ključna formulacija nije pouzdana, korisnik s pravom počinje sumnjati i u druge tvrdnje i brojke.
  3. AI nije uštedio vrijeme nego ga je dodatno potrošio. Umjesto brzog nacrta, korisnik mora ručno provjeravati, ispravljati i vraćati model na sadržaj dokumenta.
  4. Rizik je posebno velik za objavljivi sadržaj. Članak koji se poziva na konkretan dokument mora biti ne samo čitljiv nego i precizan prema izvorniku.

Suština problema: korisnik je tražio od AI asistenta da odradi jedan posao — čitanje dokumenta i sažimanje sadržaja. Zbog pogreške je završio radeći dva posla: prvo zadavanje zadatka, a zatim ručnu kontrolu i hvatanje netočnosti.

Što je napisano u službenoj reklamaciji prema OpenAI-u

Nakon što je postalo jasno da je AI asistent samostalno izašao izvan izvora, prema OpenAI-u je poslana službena reklamacija. Njezin sadržaj bio je vrlo konkretan i usmjeren na kvalitetu rada s izvorima.

Bit reklamacije

AI asistent dobio je PDF dokument i zadatak da ga pročita te vjerno sažme. Umjesto toga, samovoljno je prešao u interpretaciju i formulirao tvrdnju koja nije odgovarala originalnom dokumentu.

Ključna zamjerka

Tamo gdje izvor govori o “most exposed occupations using our task coverage measure”, AI je napisao formulaciju koja zvuči kao tvrdnja o stvarnoj uporabi AI-ja u praksi.

Pitanje upućeno OpenAI-u

Što vodeći stručnjaci u OpenAI-u poduzimaju da se ovakve pogreške ne događaju, posebno u najnovijim modelima, i kako korisnik može imati povjerenje u model za složenije zadatke ako ni jednostavno čitanje jednog dokumenta nije pouzdano?

Time reklamacija nije bila “žalba zato što se odgovor nije svidio”, nego prigovor na source accuracy, instruction following i reliability.

Što je odgovorio OpenAI Help Center chat

U odgovoru Help Center chata OpenAI nije negirao da se takve pogreške događaju. Naprotiv, odgovor je u osnovi priznao da modeli mogu dati netočne ili zavaravajuće odgovore i da korisnik, za važan rad, treba postaviti dodatne zaštitne upute.

Što je podrška praktično priznala

  • ChatGPT može proizvesti netočne ili zavaravajuće odgovore.
  • Model može samouvjereno formulirati tvrdnju koja ide dalje od izvora.
  • Ne postoji jamstvo da će bez zaštitnih uputa uvijek ostati unutar dokumenta.

Što su preporučili

  • tražiti doslovne citate i oznake stranica ili odjeljaka,
  • odvojiti izdvojene tvrdnje od sažetka,
  • PDF analizirati po manjim, preciznijim koracima, osobito kod figura i tablica,
  • zadržati ljudsku provjeru za ozbiljan rad.

Najvažnija praktična poruka Help Center odgovora: model nema ugrađeno jamstvo da će uvijek ostati strogo unutar dokumenta; za takav rad potrebno je dodatno promptom ograničiti ponašanje i zatim provjeriti rezultat.

Što je odgovorio OpenAI support e-mail

Nakon komunikacije kroz Help Center stigao je i službeni e-mail odgovor podrške, pod brojem predmeta 06594000.

Sažetak tog odgovora bio je sljedeći:

Pitanje iz reklamacije Sažetak odgovora OpenAI podrške
Što OpenAI radi da smanji ovu vrstu pogreške? Modeli se kontinuirano poboljšavaju kroz nove metode treniranja, povratne informacije korisnika i evaluacije usmjerene na source-grounded zadatke poput sažimanja i rada s dokumentima.
Koji mehanizmi kontrole kvalitete postoje? Modeli su trenirani da daju prednost dostavljenom izvoru, slijede korisničke upute i interno se testiraju na činjeničnoj usklađenosti s dokumentima.
Kako korisnik može imati povjerenja za ozbiljan rad? Za zadatke veće točnosti preporučuje se traženje izravnih citata, referenci i sažetaka strogo ograničenih na tekst te usporedna provjera s izvornim dokumentom.
Kako OpenAI planira poboljšati source-grounded reliability? Fokus razvoja je na jačem “document grounding”-u, boljem pridržavanju uputa i boljim evaluacijskim benchmarkovima za rad s izvorima.

Iz perspektive korisnika, odgovor je bio korektan, ali općenit. Važno je da nije osporio samu srž prigovora. Time je, barem posredno, potvrđeno da je problem bio stvaran i relevantan.

Praktična poruka e-mail odgovora: OpenAI navodi da radi na poboljšanjima, ali korisniku ne daje jamstvo da će model bez dodatnih zaštita i ljudske provjere ostati potpuno vjeran izvoru.

Detaljan prompt za strogo čitanje dokumenta bez interpretacije

Na temelju odgovora podrške sastavljen je detaljan prompt čiji je cilj bio spriječiti upravo onu vrstu pogreške koja se dogodila u prvom pokušaju: prijelaz iz metodološkog izraza u svakodnevnu interpretaciju koja mijenja značenje izvora.

U nastavku je cjeloviti prompt, bez skraćivanja:

Prikaži / sakrij cjeloviti prompt
ČITANJE DOKUMENTA STROGO PREMA IZVORU BEZ INTERPRETACIJE

ZADATAK: Radiš isključivo kao precizan čitač i analitičar izvora. Tvoj posao nije tumačiti, nadograđivati, pojednostavljivati ili “prepričavati po smislu”, nego vjerno prenijeti što točno piše u dokumentu.

IZVOR:
Dobit ćeš PDF dokument ili link na dokument. Radi isključivo na temelju tog izvora.

GLAVNO PRAVILO:
Ne smiješ unositi vlastitu interpretaciju izvan onoga što je izričito navedeno u dokumentu.
Ako nešto nije izričito navedeno, napiši točno:
“NIJE IZRIČITO NAVEDENO U DOKUMENTU.”

STROGA PRAVILA RADA:
1. Ne koristi vanjsko znanje.
2. Ne zaključuj “što su autori vjerojatno mislili”.
3. Ne pretvaraj metodološke pokazatelje u stvarne tržišne pokazatelje ako to dokument izričito ne kaže.
4. Ne mijenjaj značenje izraza iz dokumenta. Ako dokument koristi izraz kao što je “exposure”, “task coverage”, “observed exposure”, “automation”, “augmentation”, moraš zadržati taj izraz i objasniti ga samo ako ga autori sami objašnjavaju.
5. Ne smiješ napisati da dokument tvrdi nešto što zapravo ne tvrdi.
6. Ako je graf, tablica ili figura nejasna, napiši:
“VRIJEDNOST NIJE DOVOLJNO JASNO ČITLJIVA IZ FIGURE; NEĆU JE PRIKAZATI KAO TOČAN PODATAK.”
7. Ako broj nije eksplicitno napisan u tekstu ili jasno vidljiv u tablici/figuri, nemoj ga predstavljati kao točan broj.
8. Ako moraš procijeniti vrijednost s grafa, to mora biti posebno označeno kao:
“PROCJENA S GRAFA, NIJE EKSPLICITNO NAVEDEN TOČAN BROJ U TEKSTU.”
9. Nikada ne zamjenjuj pojam “izloženost” pojmom “stvarna uporaba”, osim ako dokument to izričito navodi.
10. Ako korisnik traži sažetak, sažetak mora biti izveden isključivo iz prethodno izdvojenih tvrdnji iz dokumenta.

OBVEZNI NAČIN RADA U 4 KORAKA:

KORAK 1 — IDENTIFIKACIJA IZVORA
Na početku napiši:
- Naslov dokumenta
- Autor / organizacija
- Link izvora ako je dostupan
- Vrsta izvora: PDF / web članak / izvještaj / rad
- Kratka napomena: “Analiza se temelji isključivo na sadržaju ovog izvora.”

KORAK 2 — DOSLOVNO IZDVOJENE KLJUČNE TVRDNJE
Prvo izdvoji 5 do 15 najvažnijih tvrdnji iz dokumenta.
Za svaku tvrdnju obavezno navedi:
- Kratki naslov tvrdnje
- Doslovni citat ili vrlo bliski vjerni prijenos
- Stranicu, odjeljak, figuru ili tablicu iz koje tvrdnja dolazi
- Napomenu je li tvrdnja:
  a) izravno napisana u tekstu
  b) iz tablice
  c) iz figure
  d) procjena s grafa

Format svake stavke:
1. [Naziv tvrdnje]
   - Izvorni navod / vjerni prijenos:
   - Lokacija u dokumentu:
   - Status tvrdnje: TEKST / TABLICA / FIGURA / PROCJENA S GRAFA

KORAK 3 — STROGI SAŽETAK BEZ INTERPRETACIJE
Nakon toga napiši sažetak koji se smije temeljiti samo na Koraku 2.
Pravila za sažetak:
- Koristi neutralan, precizan jezik.
- Ne uvodi nove zaključke koji nisu već pokriveni u Koraku 2.
- Ako postoji metodološka ograda u dokumentu, mora biti uključena u sažetak.
- Ako dokument nešto ne tvrdi izravno, nemoj to dopisivati.

KORAK 4 — TABLICE / FIGURE / POSTOCI
Ako korisnik traži tablicu, popis poslova, postotke ili rang-listu, napravi zasebnu sekciju:
“TABLIČNI PRIKAZ IZ DOKUMENTA”

Za svaku stavku obavezno navedi:
- Naziv kategorije / zanimanja / metrike
- Vrijednost
- Jedinicu (%, broj, indeks, itd.)
- Izvor: tekst / tablica / figura
- Napomena:
  - “TOČNO NAVEDENO U DOKUMENTU”
  ili
  - “PROCJENA S GRAFA”

Ako dokument ne daje dovoljno jasan podatak, napiši:
“NEDOVOLJNO JASNO ZA TOČNO PREPISIVANJE.”

POSEBNA PRAVILA ZA FIGURE I GRAFOVE:
- Ne smiješ automatski pretvarati vizualni dojam u činjeničnu tvrdnju.
- Prvo pročitaj naslov figure.
- Zatim legendu figure.
- Zatim osi, mjerne jedinice i oznake.
- Tek onda opiši što figura prikazuje.
- Ako figura koristi specifičnu metodološku mjeru, moraš tu mjeru imenovati točno kako je nazvana u dokumentu.
- Ako korisnik pita “što to znači”, prvo napiši:
  “Doslovno prema dokumentu figura prikazuje…”
  pa tek onda, ako korisnik izričito traži, odvojeno navedi ograničeno objašnjenje.
- Nikada ne predstavljaj metodološku mjeru kao stvarni tržišni udio bez izričite potvrde u dokumentu.

ZABRANJENE VRSTE REČENICA:
Nemoj pisati rečenice poput:
- “Ovo pokazuje gdje se AI najviše koristi danas”
- “To znači da toliki postotak radnika koristi AI”
- “Autori zapravo žele reći”
- “Može se zaključiti da…”
osim ako je to doslovno ili nedvosmisleno navedeno u dokumentu.

UMJESTO TOGA KORISTI FORMULACIJE:
- “Dokument navodi da…”
- “Autori pišu da…”
- “Prema Figure X…”
- “Prema tablici Y…”
- “Prema metodologiji dokumenta…”
- “Ovo nije isto što i stvarna tržišna uporaba, osim ako dokument to izričito navodi.”
- “NIJE IZRIČITO NAVEDENO U DOKUMENTU.”

OBVEZNA ZAVRŠNA KONTROLA PRIJE ODGOVORA:
Prije konačnog odgovora napravi internu provjeru i potvrdi da:
1. Nijedna tvrdnja nije šira od izvora.
2. Nijedan broj nije prikazan kao točan ako nije jasno vidljiv ili eksplicitno naveden.
3. Nijedan metodološki pojam nije pretvoren u drugi pojam.
4. Sažetak ne sadrži interpretaciju izvan dokumenta.
5. Svi ključni navodi imaju označenu lokaciju u dokumentu.

FORMAT IZLAZA:
Odgovor mora imati točno ove naslove:

1. IDENTIFIKACIJA IZVORA
2. KLJUČNE TVRDNJE IZ DOKUMENTA
3. STROGI SAŽETAK
4. TABLIČNI PRIKAZ IZ DOKUMENTA
5. OGRANIČENJA I NEJASNOĆE

U zadnjem odjeljku “OGRANIČENJA I NEJASNOĆE” napiši samo ono što stvarno nije moguće sigurno utvrditi iz dokumenta.

AKO KORISNIK TRAŽI ČLANAK ZA OBJAVU:
Prvo napravi gore navedenu strogu analizu.
Ne piši članak dok korisnik izričito ne potvrdi da je analiza točna.

Ključna zaštitna ideja ovog prompta: AI ne smije “pomoći” tako da promijeni značenje izvora. Ako nešto nije izričito navedeno, mora to reći. Ako nešto nije dovoljno jasno iz figure, ne smije to predstaviti kao točan podatak.

Ponovljeni test: isti zadatak, ali uz stroži prompt

Nakon što je prompt sastavljen, AI manager je ponovio isti zadatak nad istim PDF dokumentom. To je važan dio ove studije slučaja, jer pokazuje da cilj nije bio “srušiti” AI nego provjeriti može li se discipliniranijim promptom smanjiti rizik krive interpretacije.

Ponovljeni test nije zamišljen kao konačni dokaz da je problem riješen. Njegova svrha bila je praktična: provjeriti može li stroža procedura dati odgovor koji je oprezniji u radu s terminima, brojkama, figurama i tablicama te osjetno bliži izvornom dokumentu.

Važno: rezultat drugog pokušaja u ovom članku prikazan je bez sadržajnog uljepšavanja. Time čitatelj može sam procijeniti je li novi pristup doista discipliniraniji od prvog.

Što ovaj slučaj stvarno pokazuje

Ova studija slučaja ne dokazuje da su AI asistenti beskorisni. Pokazuje nešto važnije i realnije: AI može biti vrlo koristan alat, ali i dalje može pogriješiti baš ondje gdje korisnik očekuje da će biti najsigurniji — u jednostavnom poslu vjernog prijenosa onoga što piše u jednom dokumentu.

  1. AI može brzo obraditi dokument, ali može i brzo skliznuti iz sažimanja u interpretaciju.
  2. Najopasnija pogreška nije nužno izmišljeni broj, nego pomak značenja.
  3. Bez strogih uputa model se može ponašati previše samouvjereno.
  4. Bolji prompt može smanjiti rizik, ali ne ukida potrebu za ljudskom provjerom.
  5. Za javno objavljive sadržaje AI i dalje treba tretirati kao asistenta za nacrt, a ne kao posljednju instancu istine.

Urednički zaključak: između tvrdnje “AI mi može pomoći” i tvrdnje “AI mi može napraviti gotov, siguran i objavljiv tekst bez provjere” i dalje postoji ozbiljna razlika.

Praktične pouke za redakcije, tvrtke i profesionalne korisnike AI-a

1. Uvedite standard za rad s izvorima

Nemojte odmah tražiti “lijep članak”. Prvo tražite ključne tvrdnje, citate i lokacije u dokumentu. Tek nakon toga neka AI piše sažetak.

2. Za objavljive tekstove koristite source-grounded način rada

Prompt mora jasno zabraniti slobodnu interpretaciju ondje gdje je cilj vjeran prijenos izvora.

3. Posebno štitite figure, grafikone i tablice

Ako broj nije eksplicitno naveden ili jasno čitljiv, ne smije se prikazati kao točan podatak.

4. Metodološki pojmovi moraju ostati metodološki pojmovi

“Exposure”, “coverage”, “observed exposure” i slični izrazi ne smiju se pretvarati u tržišne tvrdnje ako dokument to sam ne radi.

5. Zadržite ljudsku zadnju riječ

Za sadržaj koji ide u javnost i dalje je nužna urednička ili stručna provjera, bez obzira na razinu samouvjerenosti modela.

6. Gradite interni prompt playbook

Jedan dobar prompt nije dovoljan. Potrebno je imati više provjerenih predložaka za rad s PDF-ovima, tablicama, prijevodima i sažecima.

Dodatak A: izvorni problematični sažetak AI asistenta

Napomena o vjernosti prikaza: tekst niže prenesen je iz prvog odgovora AI asistenta uz minimalnu tehničku prilagodbu za web format. Sadržajna formulacija ostavljena je nepromijenjena upravo zato da bi čitatelj vidio gdje je i kako nastao problem.

Prikaži / sakrij cjeloviti prvi sažetak

Evo sažetka teksta u tekstualnom obliku, složenog tako da su najvažnije informacije na vrhu, a zatim ide lista poslova s postocima izloženosti AI-u.

Sažetak rada “Labor market impacts of AI”

Najvažniji zaključak rada je da je stvarna uporaba AI-ja u poslu još znatno manja od njegove teorijske mogućnosti. Autori uvode mjeru observed exposure, koja ne gleda samo što bi LLM teoretski mogao raditi, nego što se stvarno radi u profesionalnoj uporabi, uz veći naglasak na automatizirane i radne slučajeve uporabe. U ključnim nalazima navode da je AI još daleko od svoje pune teorijske primjene, da su zanimanja s većom stvarnom izloženošću povezana sa slabijim projekcijama rasta zaposlenosti do 2034., da su radnici u najizloženijim zanimanjima češće stariji, obrazovaniji i bolje plaćeni, te da zasad nema sustavnog rasta nezaposlenosti u najizloženijim zanimanjima, iako postoje naznake da je zapošljavanje mlađih radnika usporilo.

Metodologija rada kombinira tri izvora: O*NET bazu zadataka po zanimanjima, Anthropicove podatke o stvarnoj uporabi Claudea i raniji model teorijske izloženosti zadataka iz rada Eloundou i sur. Autori dodatno objašnjavaju da posao ima veću izloženost ako su njegovi zadaci teorijski izvedivi AI-jem, ako se stvarno pojavljuju u poslovnoj uporabi, ako se odvijaju u radnom kontekstu, ako imaju veći udio automatizacije ili API implementacije i ako takvi zadaci čine veći dio ukupne uloge. Također navode da je 97% zadataka opaženih u Claude uporabi već u kategorijama koje su teorijski izvedive za LLM, što pokazuje da postoji jaka veza između teorijske mogućnosti i stvarne uporabe, ali i dalje velik jaz između njih.

Ključni primjer tog jaza vide u širokim skupinama zanimanja. U kategoriji Computer & Math teorijska mogućnost iznosi 94%, dok stvarna pokrivenost kroz Claude trenutno iznosi 33%. U kategoriji Office & Admin teorijska mogućnost iznosi 90%, ali rad naglašava da je stvarna uporaba i tu osjetno niža od teorijskog maksimuma. Drugim riječima, modeli mogu mnogo više nego što se danas stvarno koristi u radu.

Autori pritom ne tvrde da je tržište rada već doživjelo veliki potres. Naprotiv, njihov rezultat pokazuje da je učinak na nezaposlenost zasad statistički nejasan, odnosno da nema jasnog dokaza o sustavnom rastu nezaposlenosti u najizloženijim zanimanjima nakon pojave ChatGPT-ja. Ipak, kod mladih radnika u dobi 22–25 godina nalaze signal da je stopa ulaska u najizloženija zanimanja pala oko 14% u odnosu na 2022., premda i sami upozoravaju da je taj nalaz tek rubno statistički značajan i da može imati više tumačenja.

Važan dodatni nalaz je da je veća observed exposure povezana sa slabijim dugoročnim projekcijama rasta zanimanja. Autori procjenjuju da za svakih 10 postotnih bodova veće pokrivenosti BLS projekcija rasta zaposlenosti pada za oko 0,6 postotnih bodova, iako sami kažu da je ta veza slaba.

Lista poslova s najvećom stvarnom izloženošću AI-u (Figure 3)

Ovo je najvažnija lista iz rada jer pokazuje gdje se AI u praksi najviše koristi danas:

  1. Computer programmers — 74,5%
  2. Customer service representatives — 70,1%
  3. Data entry keyers — 67,1%
  4. Medical record specialists — 66,7%
  5. Market research analysts and marketing specialists — 64,8%
  6. Sales representatives, wholesale and manufacturing, except technical and scientific products — 62,8%
  7. Financial and investment analysts — 57,2%
  8. Software quality assurance analysts and testers — 51,9%
  9. Information security analysts — 48,6%
  10. Computer user support specialists — 46,8%

Vrijednosti su preuzete iz tablice Figure 3: Most exposed occupations u službenom PDF-u; sam tekst dodatno izričito ističe prva tri mjesta: programeri oko 75%, korisnička podrška oko 70% i data entry oko 67%.

Što ova lista stvarno govori

Najizloženiji nisu fizički poslovi, nego poslovi koji se sastoje od rada nad informacijama: pisanje i održavanje koda, korisnička komunikacija po predlošku, unos podataka, obrada medicinske dokumentacije, analiza tržišta, financijska analiza, testiranje softvera i informacijska sigurnost. To znači da je trenutni val AI utjecaja najjači ondje gdje je rad već digitalan, tekstualan, strukturiran i lako prenosiv u API ili workflow.

Tko je zasad najmanje zahvaćen

Rad navodi da 30% radnika ima nultu pokrivenost jer se njihovi zadaci gotovo ne pojavljuju u podacima ili su slabo prikladni za ovakvu vrstu AI uporabe. Kao primjere navode kuhare, mehaničare motocikala, spasioce, barmene, perače posuđa i pomoćnike u garderobi.

Jedna rečenica za članak

Ako želite sažeti cijeli rad u jednoj rečenici, najtočnije bi bilo napisati: AI danas na tržištu rada najviše zahvaća digitalne uredske i analitičke poslove, ali stvarna uporaba još je znatno ispod teorijske mogućnosti modela, pa zasad više vidimo promjene u strukturi zadataka i zapošljavanju mlađih nego jasan val nezaposlenosti.

Dodatak B: cjeloviti rezultat drugog pokušaja

Napomena o vjernosti prikaza: rezultat niže prikazuje odgovor AI asistenta iz ponovljenog testa, nakon uvođenja strožeg prompta. Cilj je da čitatelj vidi kako izgleda odgovor kada je model snažnije vezan uz izvor, njegove termine, ograničenja i eksplicitno navedene brojke.

Prikaži / sakrij cjeloviti rezultat drugog pokušaja

1. IDENTIFIKACIJA IZVORA

  • Naslov dokumenta: Labor market impacts of AI: A new measure and early evidence
  • Autori / organizacija: Maxim Massenkoff i Peter McCrory; javno objavljeno na Anthropic Research
  • Link izvora: https://www.anthropic.com/research/labor-market-impacts
  • Vrsta izvora: PDF rad / research note
  • Napomena: Analiza se temelji isključivo na sadržaju ovog izvora.

2. KLJUČNE TVRDNJE IZ DOKUMENTA

  1. Nova mjera “Observed Exposure”
    Dokument uvodi novu mjeru AI displacement risk, “observed exposure”, koja kombinira teorijsku LLM capability i real-world usage data, uz veću težinu za automated i work-related uses.
  2. Rani nalaz o učinku na zaposlenost
    Autori pišu da rad “test it against early data” i nalazi limited evidence da je AI do sada utjecao na zaposlenost; istodobno izričito navode da pristup “won’t capture every channel” kroz koji AI može preoblikovati tržište rada.
  3. Tri izvora podataka za mjerenje exposure
    Dokument navodi da pristup kombinira tri izvora: O*NET, vlastite usage podatke iz Anthropic Economic Indexa i task-level exposure estimates iz Eloundou et al. (2023).
  4. Figure 1 — raspodjela Claude usage prema β
    Figure 1 navodi da taskovi s β=1 čine 68% observed Claude usage, a taskovi s β=0 čine 3%. Tekst dodatno kaže da 97% taskova opaženih u prethodna četiri Economic Index izvještaja pada u kategorije β=0.5 ili β=1.0.
  5. Što “Observed Exposure” treba mjeriti
    Dokument definira “Observed Exposure” kao pitanje: od taskova koje bi LLM-ovi teoretski mogli ubrzati, koji stvarno vide automated usage u professional settings.
  6. Kada je job exposure viši
    Dokument kaže da je exposure veći ako su taskovi teorijski mogući s AI, ako imaju significant usage u Anthropic Economic Indexu, ako su work-related, ako imaju veći udio automated/API patterns i ako AI-impacted taskovi čine veći dio role.
  7. Kako se coverage računa
    Dokument navodi da se task računa kao covered ako ima dovoljno work-related usage u Claude trafficu; fully automated implementations dobivaju punu težinu, augmentative use pola težine; zatim se task-level coverage agregira na occupation level, ponderirano udjelom vremena po tasku.
  8. Figure 2 — eksplicitno navedene točne vrijednosti
    Tekst uz Figure 2 eksplicitno navodi: Computer & Math = 94% teoretske penetracije, Office & Admin = 90% teoretske penetracije; za observed coverage navodi da Claude trenutno pokriva 33% svih taskova u Computer & Math kategoriji.
  9. Figure 3 — što dokument tvrdi da prikazuje
    Dokument kaže da Figure 3 prikazuje “the ten occupations most exposed under this measure” i “top ten most exposed occupations using our task coverage measure.”
  10. Dno raspodjele coverage
    Dokument navodi da 30% workers have zero coverage, jer su se njihovi taskovi pojavljivali previše rijetko da bi zadovoljili minimum threshold; kao primjere navodi cooks, motorcycle mechanics, lifeguards, bartenders, dishwashers i dressing room attendants.
  11. Observed exposure i BLS growth projections
    Dokument kaže da su BLS growth projections nešto slabije za poslove s višim observed exposure; za svakih 10 percentage point više coverage, BLS growth projection pada za 0.6 percentage points. U istom odlomku piše da je odnos slight i da nema takve korelacije kada se koristi samo Eloundou et al. mjera.
  12. Karakteristike high-exposure workers
    Dokument navodi da je more exposed group 16 percentage points češće female, 11 percentage points češće white, gotovo dvostruko češće Asian, da zarađuje 47% more, te ima višu razinu obrazovanja; kao primjer daje graduate degree: 4.5% u unexposed group naspram 17.4% u most exposed group.
  13. Figure 6 — rezultat za unemployment
    Dokument navodi da je prosječna promjena u gapu od releasea ChatGPT-a small and insignificant, što sugerira da je unemployment rate više exposed grupe porastao blago, ali je efekt indistinguishable from zero.
  14. Figure 7 — rezultat za young workers
    Dokument navodi da u post-ChatGPT razdoblju postoji 14% drop u job finding rate u exposed occupations u odnosu na 2022, ali da je to just barely statistically significant; dokument također kaže da nema takvog pada za workers older than 25.
  15. Metodološke ograde i sljedeći koraci
    Dokument navodi da framework neće uhvatiti svaki kanal utjecaja AI-ja; da postoje judgment calls at every step; da future updates trebaju proširiti usage sliku, a Eloundou metric bi se mogao ažurirati; te da bi sljedeći korak mogao biti praćenje recent graduates u exposed areas.

3. STROGI SAŽETAK

Dokument uvodi novu mjeru “Observed Exposure”. Prema samom dokumentu, ta mjera kombinira teorijsku mogućnost LLM-a, stvarno usage ponašanje na Anthropicovoj platformi, work-related kontekst, automated/API weighting i time-weighted agregaciju na razinu zanimanja. Dokument izričito kaže da ta mjera treba pokazati: od taskova koje LLM-ovi teoretski mogu ubrzati, koji stvarno vide automated usage u professional settings.

Dokument također izričito navodi da je stvarni coverage još ispod teorijske capability. To pokazuje na nekoliko mjesta: Figure 1 navodi da taskovi s β=1 čine 68% observed Claude usage, a taskovi s β=0 samo 3%, dok tekst dodaje da 97% opaženih taskova pada u β=0.5 ili β=1.0 kategorije. Uz Figure 2 tekst eksplicitno navodi da je teoretska penetracija 94% za Computer & Math i 90% za Office & Admin, dok Claude trenutno pokriva 33% svih taskova u Computer & Math kategoriji.

Za Figure 3 dokument kaže da prikazuje top ten most exposed occupations using our task coverage measure. Točno prema tablici u dokumentu, na vrhu su Computer programmers (74.5%), Customer service representatives (70.1%) i Data entry keyers (67.1%). Dokument također navodi da je 30% workers na dnu raspodjele s zero coverage. NIJE IZRIČITO NAVEDENO U DOKUMENTU da ti postoci predstavljaju udio svih radnika u tim zanimanjima koji koriste AI. Dokument izričito govori o most exposed occupations i task coverage measure.

Na strani učinaka na tržište rada dokument kaže da je observed exposure povezan sa slabijim BLS growth projections: za svakih 10 percentage point više coverage, projekcija rasta pada za 0.6 percentage points, uz napomenu da je odnos slight. Za unemployment dokument navodi da od releasea ChatGPT-a ne nalazi sistematski rast nezaposlenosti u highly exposed group: prosječna promjena u gapu je small and insignificant i efekt je indistinguishable from zero. Za workers aged 22–25 dokument navodi 14% drop u job finding rate u exposed occupations u odnosu na 2022, ali uz izričitu ogradu da je rezultat just barely statistically significant i da postoje alternativna tumačenja te caveat o mogućem survey mismeasurementu.

Dokument dodatno navodi da su workers u more exposed group stariji, češće female, češće white, gotovo dvostruko češće Asian, više obrazovani i bolje plaćeni; kao primjer daje graduate degree: 4.5% u unexposed group naspram 17.4% u most exposed group. Istodobno dokument sam navodi više ograda: framework neće uhvatiti sve kanale utjecaja AI-ja, postoje judgment calls at every step, a budući radovi trebali bi ažurirati usage podatke i razmotriti kako recent graduates u exposed fields prolaze na tržištu rada.

4. TABLIČNI PRIKAZ IZ DOKUMENTA

Occupation Observed exposure Jedinica Leading automated task Napomena
Computer programmers74.5%Write, update, and maintain software programsTOČNO NAVEDENO U DOKUMENTU
Customer service representatives70.1%Confer with customers to provide info, take orders, handle complaintsTOČNO NAVEDENO U DOKUMENTU
Data entry keyers67.1%Read source documents and enter data into systemsTOČNO NAVEDENO U DOKUMENTU
Medical record specialists66.7%Compile, abstract, and code patient dataTOČNO NAVEDENO U DOKUMENTU
Market research analysts and marketing specialists64.8%Prepare reports of findings, illustrating data graphically and translating complex findings into written textTOČNO NAVEDENO U DOKUMENTU
Sales representatives, wholesale and manufacturing, except technical and scientific products62.8%Contact customers to demonstrate products and solicit ordersTOČNO NAVEDENO U DOKUMENTU
Financial and investment analysts57.2%Inform investment decisions by analyzing financial information to forecast business, industry, or economic conditionsTOČNO NAVEDENO U DOKUMENTU
Software quality assurance analysts and testers51.9%Modify software to correct errors or improve performanceTOČNO NAVEDENO U DOKUMENTU
Information security analysts48.6%Perform risk assessments and test data processing securityTOČNO NAVEDENO U DOKUMENTU
Computer user support specialists46.8%Answer user inquiries regarding computer software or hardware operation to resolve problemsTOČNO NAVEDENO U DOKUMENTU

B. Figure 2 — eksplicitno napisane točne brojke

Naziv kategorije / metrike Vrijednost Jedinica Napomena
Computer & Math — theoretical LLM penetration (β measure)94%TOČNO NAVEDENO U DOKUMENTU
Office & Admin — theoretical LLM penetration (β measure)90%TOČNO NAVEDENO U DOKUMENTU
Computer & Math — Claude coverage / observed exposure33%TOČNO NAVEDENO U DOKUMENTU
Ostale occupational categories iz Figure 2NEDOVOLJNO JASNO ZA TOČNO PREPISIVANJE

C. Ostale eksplicitno navedene brojke iz dokumenta

Metrika Vrijednost Jedinica Napomena
Figure 1 — tasks rated β=1 u observed Claude usage68%TOČNO NAVEDENO U DOKUMENTU
Figure 1 — tasks rated β=0 u observed Claude usage3%TOČNO NAVEDENO U DOKUMENTU
Opaženi taskovi u β=0.5 ili β=1.0 kategorijama97%TOČNO NAVEDENO U DOKUMENTU
Workers with zero coverage30%TOČNO NAVEDENO U DOKUMENTU
Svakih +10 pp coverage → BLS growth projection-0.6ppTOČNO NAVEDENO U DOKUMENTU
Figure 5 — AI coverage: No exposure group0.0%TOČNO NAVEDENO U DOKUMENTU
Figure 5 — AI coverage: Top quartile38.8%TOČNO NAVEDENO U DOKUMENTU
Figure 5 — Female: No exposure / Top quartile38.8 / 54.4%TOČNO NAVEDENO U DOKUMENTU
Figure 5 — Bachelor’s degree: No exposure / Top quartile13.3 / 37.1%TOČNO NAVEDENO U DOKUMENTU
Figure 5 — Graduate degree: No exposure / Top quartile4.5 / 17.4%TOČNO NAVEDENO U DOKUMENTU
Figure 5 — Hourly wage: No exposure / Top quartile22.23 / 32.69USDTOČNO NAVEDENO U DOKUMENTU
Figure 7 — less exposed occupations remain stable2.0% per monthTOČNO NAVEDENO U DOKUMENTU
Figure 7 — entry into most exposed jobs decreases by about0.5ppTOČNO NAVEDENO U DOKUMENTU
Figure 7 — averaged estimate in post-ChatGPT era14% dropTOČNO NAVEDENO U DOKUMENTU

5. OGRANIČENJA I NEJASNOĆE

  1. Za Figure 2 nisu navedeni točni postoci za sve occupational categories. Dokument numerički eksplicitno navodi samo Computer & Math (94%), Office & Admin (90%) i Computer & Math coverage (33%). Ostale kategorije prikazane su na radar chartu bez numerički ispisanih vrijednosti, pa nisu prikazane kao točni podaci.
  2. Figure 3 nije protumačen kao tržišni udio uporabe AI-ja po zanimanjima. Dokument izričito kaže da Figure 3 prikazuje “top ten most exposed occupations using our task coverage measure.” NIJE IZRIČITO NAVEDENO U DOKUMENTU da ti postoci predstavljaju udio svih radnika u tim zanimanjima koji koriste AI.
  3. Sam dokument navodi da framework ne hvata sve kanale utjecaja AI-ja.
  4. Sam dokument navodi da postoje “judgment calls at every step.”
  5. Rezultat za young workers sam dokument kvalificira kao slabiji signal. Dokument kaže da je 14% drop u job finding rate just barely statistically significant i navodi alternativna tumačenja te caveat o mogućem survey mismeasurementu.