ARGI ALDIAN

Umeak bezala ikasten

2019ko maiatzaren 31

00:00

Entzun

Maiatzean zehar Bertsozientzia saioak izan ditugu Gipuzkoan zehar: Beasainen, Zarautzen eta Tolosan. Aurreko urtean idatzi nuen hemen bertan saio horien inguruan. Egia esan polita da ikustea ekitaldiak jada lau urte daramatzala bizirik, eta ibilbide luzea izan dezakeela, gainera. Gaurkoan, Zarauzko saioan eman nuen hitzaldia hartuko dut hizpide, hara joan ez zinetenoi errefortzu bidezko ikasketaren inguruko pintzelada batzuk emateko asmoz.

Hitzaldiaren izenburua zutabe honi jarri diodan berdina zen: Umeak bezala ikasten. Gizakiok ikasteko hainbat era ditugu eta horietako bat errefortzu bidezko ikasketa da. Oso erraza da ulertzeko: ume bat gaizki portatzen denean, zigortu egiten dugu. Zertarako? Ikas dezan egin duena ez dela egin behar. Gaizki dagoela. Aldiz, zerbait ongi egiten duenean, saritu egiten dugu. Zigorren eta sarien logika horren bidez, umeek hainbat portaera ikasten dituzte (sarri baita helduek ere).

Gezurra badirudi ere, ikasteko modu horrek makinekin ere funtzionatzen du. Akaso galdezka ari zara: eta nola zigor edo sari daiteke makina bat? Makinen kasuan ez du funtzionatzen postrerik gabe ala sakelakorik gabe uztearen teknikak. Beste era batera egin behar da.

Demagun xakean jokatzen ikasten duen makina bat egin nahi dugula. Alda dezagun makina hitza ordenagailu hitzarekin. Ordenagailuetan badaude hainbat xake joko: ordenagailuak berak joka dezake, adibidez, gure aurka. Hasieran, ordenagailuak ez daki jokatzen, eta, beraz, haren mugimenduek ez dute zentzurik. Erabakiak ausaz hartzen ditu. Baina partida galtzen duen bakoitzean, guk zero puntu ematen dizkiogu (zehatzago izateko, jokoak ematen dizkio zero puntu). Eta hor dago gakoa: gizakion antzera, guk hala programatu dugulako, ordenagailuak ahalik eta sari gehien jaso nahi du. Berarentzat zeroko bat zigor bat da. Partida irabaztean jasotzen dituen puntuak, berriz, sariak dira. Era horretan, zigorrak ala sariak jasotzen dituen heinean, bere erabakiak fintzen joaten da, estrategia berriak ikasiz eta orokorrean bere joko-maila hobetuz.

Oso gainetik bada ere, horrela funtzionatzen dute errefortzu bidezko ikasketa makinek. Jada urte asko daramatzagu teknika hori erabiltzen eta lortu dira hainbat arrakasta. Netflix plataforman bada dokumental bat AlphaGo makinaren inguruan. Makina hark munduko jokalari onenetariko bati irabazi zion Go jokoan (xakea baino askoz konplexuagoa den mahai-joko bat). AlphaGo-k errefortzu bidezko ikasketa darabil. Oso antzeko ideiak erabili dira robotikan ere. Oraindik ikerketa mailan egon arren, jada ikusi ditugu errefortzu bidez ikasten duten robotak. Adibidez objektuak hartu eta leku batean jartzen.

Ikasketa mota honek milaka aplikazio izan ditzake, jokoak eta robotikaz haratago. Adibidez, ikerlari batzuk medikamentuak ala material berriak diseinatzeko ere aplikatu dute errefortzu bidezko ikasketa. Ikerketa mailan, oraindik, hainbat eta hainbat galdera daude erantzun gabe. Ziur nago teknologia horrek aurrera egin ahala aplikazio harrigarri asko iritsiko zaizkigula. Orduan gogoratu beharko dugu hori guztia txikitatik ongi barneratu dugun ideia sinple batean oinarritzen dela: sariak eta zigorrak. Ez al da harrigarria?

Iruzkinak

Ez dago iruzkinik

Ordenatu

Gehien irakurriak