ilustracija robota koji igra poker

Getty Images
Decenijama se smatralo da je poker prekomplikovan za kompjutere

Pasijans, šah, Skrebl i Go. Jednu po jednu, kompjuteri su osvojili neke od najpopularnijih igara na svetu.

Sada je na taj spisak dodat i poker, uprkos tome što se igrači često oslanjaju na blefiranje da bi pobedili protivnike.

Dvanaestog jula, prvi put u istoriji, bot koji igra poker po imenu Pluribus pobedio je simultano nekoliko vrhunskih ljudi u najpopularnijoj kartaroškoj igri: Tekas holdemu bez ograničenja.

Ovo bi mogle da budu loše vesti za pokeraše na internetu, ali da li to može da pomogne čovečanstvu u gomili drugih korisnijih poduhvata?

Zašto je poker težak za kompjutere?

Decenijama je poker bio smatran „suviše složenim“ za mašinsko učenje.

Za razliku od šaha, gde sve figure i potezi mogu otvoreno da se vide, poker je igra „nesavršenih informacija“ – zbog skrivenih karata igrači imaju samo delimično znanje o trenutnom stanju partije.

Noam Braun

CMU
Noam Braun pomaže

Poker je slavan i po blefiranju – pokušaju da se prevare drugi igrači tako da misle da stojite bolje ili lošije nego što stvarno stojite.

Ovi faktori komplikovali su način na koji veštačka inteligencija traži strategiju za dobijanje igre.

Srušene granice

Ali dominacija čovečanstva u pokeru je srušena.

Pluribus, kog je napravio Noam Braun, naučni istraživač iz Fejsbukovog odeljenja za istraživanje veštačke inteligencije, i Tuomas Sendholm, profesor kompjuterskih nauka sa Univerziteta Karnegi Melon, očigledno su uspeli da reše oba ova problema.

U nizu hiljada ruku protiv 13 profesionalnih igrača – od kojih su svi osvojili više od milion dolara igrajući poker – bot je svaki put izašao kao pobednik.

Jedan od Pluribusovih protivnika bio je i Daren Elias, osvajač rekordne četiri titule Svetske poker turneje.

Greg Merson

Getty Images
I Greg Merson je izgubio

Upotrebljivost u stvarnom svetu

Zašto naučnici rade na mašinama koje će pobediti čoveka?

Ukratko: oni smatraju da partija šaha ili pokera može da pomogne veštačkoj inteligenciji da izvrši mnogo složenije zadatke.

„Koristimo poker kao osnovu za fundamentalnije probleme: kako da napravimo veštačku inteligenciju koja može da izađe na kraj sa skrivenom informacijom?“, rekao je Braun za BBC.

„Da bi veštačka inteligencija bila primenjena u stvarnom svetu i imala interakciju sa ljudima i drugim veštačkim inteligencijama, ona mora da bude u stanju da razume da drugi učesnici možda vide svet drugačije od nje i da možda imaju pristup nekim drugim informacijama.“

„Poker je sjajan simulator za takve vrste izazova“, dodao je on.

Go tabla

Getty Images
Moguća upotreba i u zadacima povezanim sa hemijom i inženjerstvom

Kad je AlfaGo, koji je razvila kompanija DipMajnd u vlasništvu Gugla, postao prvi kompjuter koji je pobedio profesionalnog igrača Goa 2015. godine, njegovi tvorci su videli njegovu moguću upotrebljivost u zadacima povezanim sa hemijom i inženjerstvom – potragom za novim materijalima, na primer.

Braun i Sendholm, s druge strane, veruju da Pluribusovo rešavanje problema može da ima buduću primenu u zadacima koji su toliko raznoliki kao finansijski pregovori i navigacija automatizovanih automobila, što su sve situacije koje uključuju mnogo učesnika i nedostajuće informacije.

„Većina životnih situacija su igre nesavršenih informacija“, rekao je Sendholm.

Tomas Sendhold

CMU
I američka vojska je zainteresovana

Kako botovi uče

To je daleko od pustih snova za naučnike: pre dve godine, Libratus, još jedan program koji su napravili Braun i Sendholm, uništio je ljudske protivnike u pokeraškim igrama jedan na jedan u jednom kazinu u Pitsburgu.

Eksperti tvrde da strategija u igrama može da se primeni na vojne simulacije a časopis Vajerd je javio da je Stratedži robot, specijalizovana kompanija za veštačku inteligenciju koju je osnovao Sendholm, zaključio ugovor vredan 10 miliona dolara sa američkom vojskom u avgustu 2018. godine.

„Botovi potencijalno mogu mnogo da nas nauče o našem vlastitom procesu donošenja odluka“, objašnjava matematičar Adam Kučarski, autor knjige „Savršena opklada: Kako nauka i matematika uklanjaju sreću iz kockanja“.

„Najbolji botovi za poker uče kroz proces kontrafaktualne minimizacije kajanja – osvrtanja posle donesene odluke i pitanja: ‘šta bi bilo da sam nešto uradio drugačije?'“

„Gubeći od botova, mislim da ljudski igrači mogu mnogo da nauče o vlastitom pristupu igrama“, dodaje Kučarski.

tenk u nato vežbi

Getty Images
Plaribas bi mogao da se koristi u donošenju strateških vojnih odluka

„E-blef“

Ali kako na kraju Pluribus uspeva da blefira?

E, pa Braun i Sendholm su dali botu da „nauči“ poker igrajući trilion ruku protiv samog sebe i naknadnim proučavanjem vlastite strategije.

Verovatnije je da će strategije upotrebljene za pobede biti korišćene i u budućnosti.

Jedna od tih odluka bila je da se ulaže kad se ima slaba ruka da bi se protivnik naterao da odustane – što je upravo suština blefiranja.

„Ljudi žive u ubeđenju da je blefiranje veoma ‘ljudska’ osobina koju mašine ne mogu da oponašaju“, kaže Braun.

poker

Getty Images
„Ljudi žive u ubeđenju da je blefiranje veoma ‘ljudska’ osobina koju mašine ne mogu da oponašaju“, kaže Braun

„Ali zapravo vidimo da mašine umeju da blefiraju i u stvarnosti mogu da blefiraju bolje od čoveka.“

„Pluribus ne doživljava blefiranje kao nešto prevarantski ili neiskreno, samo ga doživljava kao radnju koja u nekim slučajevima zarađuje najviše novca u slučaju kad ima lošu ruku“, dodaje naučnik.

Pluribus je uspeo da iznenadi i zbog toga koliko „jeftino“ radi. Ovoj veštačkoj inteligenciji je bilo potrebno samo kompjuterskih resursa iz „oblaka“ u vrednosti od 150 dolara, prema istraživačima sa Karnegi Melona, dok se DipMajnd oslanjao na superkompjutere sastavljene od više od 5.000 specijalizovanih procesora, za koje se procenjuje da su koštali milione dolara.

DO NOT DELETE – DIGIHUB TRACKER FOR [49091753]

Povezani tekstovi