Roboții capabili de învățare aparțin domeniului de studiu al Inteligenței Artificiale. Se concentrează pe creerea unui program care este capabil de îmbunătățirea treptată într-un anumit domeniu, în baza unor date specifice. Cu cât pot fi furnizate mai multe date, cu atât poate programul să învețe mai bine. Marele beneficiu al roboților capabili de învățare este că aceștia pot învăța fără a fi învățați propriu-zis de cineva. La ce ne putem gândi atunci când spunem "a preda ceva unui program"?

Programarea clasică funcționează prin scrierea unui set de reguli pe care programul ar trebui să le urmeze în baza principiului "dacă-atunci". În cazul în care intervin niște date pe care programul nu le recunoaște (sau de care programatorul a uitat), acesta nu poate continua.

Roboții capabili de învățare funcționează, însă, altfel. Aceștia trec prin toate datele, găsesc o similitudine sau un model care ajută la memorare și învățare. Acest lucru are un avantaj imens în detrimentul programării clasice. Atunci când există multe variabile, o persoană nu va fi în stare să le ia pe toate în calcul și să seteze programul astfel încât acesta să ia totul în considerare. De asemenea, cu cât avem mai multe variabile, cu atât mai robust devine programul și cu atât mai exacte sunt cerințele de hardware și de mentenanță.

Care sunt metodele de învățare ale mașinilor?

Există foarte multe, dar vom descrie numai câteva, pentru a înțelege mai bine acest trend al roboților capabili de învățare.

1. Învățare supervizată vs. Învățare nesupervizată
Diferența dintre acestea două poate fi foarte frumos explicată prin următorul exemplu. Imaginați-vă că aveți un frățior mai mic și vreți să îl învățați literele alfabetului. Îi veți arăta litera D și îi spuneți că va putea recunoaște "D-ul" prin forma sa specifică, care seamnănă cu o "burtică". Dacă după asta el arată spre o altă literă, cum ar fi "P", și încearcă să aplice regula pe care doar ce a învățat-o (dacă litera are o "burtică " atunci e litera D), iar atunci profesorul trebuie să intervină și să îl corecteze.

Dar ce înseamnă asta când vine vorba de învățarea roboților? În cazul învățării supervizate, programul primește un set de date, unde știm intrările și ieșirile. Prin ieșiri ne referim la date istorice (ce, de ce și care a fost rezultatul), și astfel programul, în baza principiului asemănării, poate prezice ce se va întâmpla. Se poate compara cu un expert uman, care a muncit ani de zile într-un anumit domeniu, și care, în baza experienței sale, poate prezice ce se v-a întâmpla.

O altă întrebare, care a apărut imediat după asta a fost: În acest caz, nu e cel mai bine să învețe cu un profesor? Nu chiar. Uneori nu avem datele de ieșire; uneori avem o problemă mult prea generală și abstractă, pentru care ne este imposibil să găsim răspuns.

2. Învățarea prin consolidare
Aceasta este tipul de învățare cu care eu personal lucrez pentru lucrarea mea de licență, și de aceea sunt foarte apropiat de ea. Funcționează prin intermediul consolidării, pentru o decizie corectă și prin intermediul unei pedepse, în cazul unei decizii greșite. În termeni simpli, avem foarte multe opțiuni din care putem alege (până la 100 de opțiuni).

Învățarea prin consolidare înseamnă a lua multe decizii, și a trece prin toate opțiunile (denumite și iterații / epoci) și, mulțumită numeroaselor experimente, robotul va învăța sau va găsi cea mai bună combinație sau secvență de pași posibilă, în baza numărului de dăți în care a fost consolidat sau pedepsit.


Care sunt opțiunile utilizării unui robot cu capacitate de învățare?

Sunt nenumărate. Părerea mea este că singurul lucru care ne-ar putea limita este propria noastră imaginație.

Atunci când recunoaștem punctele tari și cele slabe ale robotului capabil să învețe, a găsi punctul cheie este foarte simplu. Voi folosi doar câteva care sunt cu adevărat utilizate sau care sunt interesante, fie din punct de vedere informațional, fie financiar.


Personalizarea unei persoane pe Internet

Colectarea datelor cu privire la clienți, la produsele pe care aceștia le vizualizează, la articolele care îi interesează – toate acestea pot fi utilizate pentru a deduce ce vor ei să rezolve, ce probleme au, și în baza datelor colectate de la alți utilizatori cu probleme similare, programul poate oferi soluții sau sugera programe utile.

Google sau Facebook funcționează pe același principiu. Acestea, folosindu-se de așa-numitele Cookies, colectează date cu privire la persoane, oferindu-le acestora cele mai relevante rezultate.


Linie online pentru clienți
Până acum, oamenii s-au ocupat întotdeauna de acest aspect. Multe companii ofereau contact telefonic prin intermediul unui serviciu de relații cu clienții. Utilizarea mare a oamenilor, repetarea acelorași întrebări a dus la utilizarea roboților capabil de învățare împreună cu așa-numiții chatbots (un program care răspunde la întrebările oamenilor în timp real). Poate vă gândiți că un calculator nu vă poate sfătui corect, sau că dumneavoastră, om fiind, veți putea remarca imediat diferența. Însă bine cunoscutul Touring Test ne-a convins deja de mai multe ori că inteligența artificială poate fi de multe ori greu de reperat pentru oameni.

Acestea sunt doar câteva dintre multele utilizări ale roboților cu capacitatea de învățare și principiile funcționării lor.


Tomáš Lichanec
Student

Universitatea Tehnică din Košice
Facultatea de Inginerie Electrică și Informatică, Sisteme inteligente, Învățare Automatizată