Zpětnovazební účení

Obrázek uživatele Eillen
Fandom: 
Drabble: 

"Takže, vy si v těch krabičkách po každý hře přidáte nebo uberete korálky, podle toho, jestli ta cesta vedla k výhře nebo prohře. Takže pro prohru seberete z každý krabičky korálek, u výhry přidáte tři, a u remízy přidáte třeba jeden, protože to vlastně k něčemu vedlo, byť ne k výhře. Chápeme se?"

Při představě, že se dají naučit krabičky od sirek tak, aby vždy vyhrály piškvorky, jsem nejdřív nechápala, ale začalo to dávat smysl. A tak jsem jen odkývala, že chápu.

"No a pak je tu k zpětnovazebnímu učení příklad robo psa Rosie. Ale to by bylo na dýl."

Závěrečná poznámka: 

O krabičkovém stroji, který se naučí vždy vyhrávat piškvorky si můžete přečíst něco víc zde: https://aidetem.cz/jak-postavit-krabickovy-stroj-co-nelze-porazit-v-pisk...

No a co se týká robo psa Rosie - to by fakt bylo na dýl :-) Ve zkratce jde o to, že má danou plochu, ve které stojí, před sebou někde míč a jejím úkolem je se k němu dostat a do míče kopnout. Může udělat pohyb vpřed, vzad nebo kopnout. Ale nikdo jí nikdy neřekne, co má dělat. Takže první kolo se nějak pohybuje, když se dostane k míči a kopne do něj (může si předtím ale klidně zvolit couvnutí), získá za to kopnutí bodové hodnocení. A na základě toho si v druhém kole vyhodnotí, že kopnutí do míče jsou body a pokud se zase ocitne před míčem, už nebude váhat, co dělat, ale rovnou kopne. (jsem to brutálně zjednodušila, ale kdyby to někoho zajímalo, tak se o tom dá dočíst v knize Artificial inteligence - a guide for thinking humans od Melanie Mitchell).

Komentáře

Obrázek uživatele Lomeril

Zní to zajímavě - ehm, dá se výcvik robopsa použít i na normálního psa z masa a kostí?

Obrázek uživatele Eillen

Zas tak hluboce to prostudované nemám. Ale bojím se, že to asi neklapne :-)

Obrázek uživatele Aries

ježíš, to je složitý. Krabičky jsem nepobrala, ale aspoň toho psa snad chápu

Obrázek uživatele Eillen

Já u těch krabiček nechápu jednu věc. Jak někoho napadlo fakt vzít krabičky od sirek a takhle offline vlastně naprogramovat stroj. A kde tolik krabiček sehnal... A co udělal s těma sirkama. :-D

Obrázek uživatele Apatyka

Jde mi z toho hlava kolem :D

Obrázek uživatele Eillen

Ten pocit mám u Filozofie umělé inteligence často. Ale pak si to najednou sedne a ten pocit, že konečně chápu. Ten je k nezaplacení :-)

Obrázek uživatele Aplír

Tak jsem se z toho okrabičkovala. (Novotvar pro opupínkovala.)

Obrázek uživatele Eillen

Novotvar se mi líbí!
Ale mrzí mě, že ses okrabičkovala...

Obrázek uživatele neviathiel

Uff, těmhle herním teoriím se vždycky vyhýbám obloukem

Obrázek uživatele Eillen

Mě zase baví, ale chápu, že já jsem v tomhle divná :-)

-A A +A