Ako pitate desetero ljudi što je machine learning, dobiti ćete desetak odgovora — od "AI koji uči kao dijete" do "statistika s boljim marketingom". Obje su karikature. Istina je konkretnija i zanimljivija.

Razlika od klasičnog programiranja

U klasičnom programiranju, vi pišete pravila. Ako korisnik klikne na plavi gumb, pokreni akciju X. Ako iznos transakcije prijeđe 10.000 eura, označi je za provjeru. Programer eksplicitno kaže računalu što da radi u svakoj situaciji.

Machine learning radi obrnuto. Umjesto da pišete pravila, dajete modelu primjere i pitate ga da sam otkrije pravila.

Banci ne trebate pisati "označi ovu transakciju kao prevaru ako je izvršena u 3 ujutro iz druge države za iznos koji premašuje prosječnu potrošnju za 500%". Dajete modelu milijune prošlih transakcija — označenih kao "prijevara" ili "legitimno" — i model sam nauči koje kombinacije karakteristika koreliraju s prijevarom.

Kako model zapravo uči

Proces izgleda ovako:

  1. Podaci dolaze — transakcije, slike, tekstovi, mjerenja senzora — s poznatim ishodima (spam/ne-spam, tumor/zdravo, prodano/nije prodano)
  2. Model pogađa — na osnovu nasumičnih početnih parametara, model daje predikciju
  3. Greška se mjeri — koliko je predikcija bila daleko od stvarnog odgovora?
  4. Parametri se prilagođavaju — u smjeru koji smanjuje grešku
  5. Ponavlja se milijunima puta — dok model ne postigne dovoljno malu grešku
Ciklus učenja ML modela: od podataka do prilagodbe parametara Podaci (s oznakama) Model pogađa Greška se mjeri Parametri se prilagođavaju Ovaj ciklus se ponavlja milijunima puta — sve dok greška nije dovoljno mala.

Ono što se zove "neuronska mreža" je samo arhitektura koja organizira taj proces u slojevima. Svaki sloj uči nešto malo složenije od prethodnog — od prepoznavanja rubova na slici, do oblika, do lica, do identiteta osobe. Dublje mreže = apstraktniji koncepti koje uče.

Što model "zna" i što ne zna

ML model nema razumijevanje u smislu u kakvom ga vi imate. Nema znatiželje, nema motiva, nema svjesnosti. Ima jako puno parametara koji su podešeni da reproduciraju uzorke iz podataka za trening.

To zvuči ograničavajuće — i jest. Model koji je naučio na medicinskim snimkama jedne bolnice može podbaciti na snimkama druge bolnice ako su skeneri malo drugačiji. Model koji je naučio prepoznavati prijevare iz 2022. mora se redovito retrainirati jer se načini prijevare mijenjaju.

Ali unutar tih granica: ML rješava probleme koje čovjek ne bi mogao rješiti ni u tisućama sati ručnog rada — jer nema čovjeka koji može ručno pregledati milijun transakcija dnevno i u njima prepoznati statistički sumnjive obrasce.


Izvori i dodatno čitanje