Zpětnovazební účení
"Takže, vy si v těch krabičkách po každý hře přidáte nebo uberete korálky, podle toho, jestli ta cesta vedla k výhře nebo prohře. Takže pro prohru seberete z každý krabičky korálek, u výhry přidáte tři, a u remízy přidáte třeba jeden, protože to vlastně k něčemu vedlo, byť ne k výhře. Chápeme se?"
Při představě, že se dají naučit krabičky od sirek tak, aby vždy vyhrály piškvorky, jsem nejdřív nechápala, ale začalo to dávat smysl. A tak jsem jen odkývala, že chápu.
"No a pak je tu k zpětnovazebnímu učení příklad robo psa Rosie. Ale to by bylo na dýl."
O krabičkovém stroji, který se naučí vždy vyhrávat piškvorky si můžete přečíst něco víc zde: https://aidetem.cz/jak-postavit-krabickovy-stroj-co-nelze-porazit-v-pisk...
No a co se týká robo psa Rosie - to by fakt bylo na dýl :-) Ve zkratce jde o to, že má danou plochu, ve které stojí, před sebou někde míč a jejím úkolem je se k němu dostat a do míče kopnout. Může udělat pohyb vpřed, vzad nebo kopnout. Ale nikdo jí nikdy neřekne, co má dělat. Takže první kolo se nějak pohybuje, když se dostane k míči a kopne do něj (může si předtím ale klidně zvolit couvnutí), získá za to kopnutí bodové hodnocení. A na základě toho si v druhém kole vyhodnotí, že kopnutí do míče jsou body a pokud se zase ocitne před míčem, už nebude váhat, co dělat, ale rovnou kopne. (jsem to brutálně zjednodušila, ale kdyby to někoho zajímalo, tak se o tom dá dočíst v knize Artificial inteligence - a guide for thinking humans od Melanie Mitchell).
- Pro psaní komentářů se přihlaste.
Komentáře
Zní to zajímavě - ehm, dá se
Zní to zajímavě - ehm, dá se výcvik robopsa použít i na normálního psa z masa a kostí?
Zas tak hluboce to
Zas tak hluboce to prostudované nemám. Ale bojím se, že to asi neklapne :-)
ježíš, to je složitý.
ježíš, to je složitý. Krabičky jsem nepobrala, ale aspoň toho psa snad chápu
Já u těch krabiček nechápu
Já u těch krabiček nechápu jednu věc. Jak někoho napadlo fakt vzít krabičky od sirek a takhle offline vlastně naprogramovat stroj. A kde tolik krabiček sehnal... A co udělal s těma sirkama. :-D
Jde mi z toho hlava kolem :D
Jde mi z toho hlava kolem :D
Ten pocit mám u Filozofie
Ten pocit mám u Filozofie umělé inteligence často. Ale pak si to najednou sedne a ten pocit, že konečně chápu. Ten je k nezaplacení :-)
Skvělé.
Tak jsem se z toho okrabičkovala. (Novotvar pro opupínkovala.)
Novotvar se mi líbí!
Novotvar se mi líbí!
Ale mrzí mě, že ses okrabičkovala...
Uff, těmhle herním teoriím se
Uff, těmhle herním teoriím se vždycky vyhýbám obloukem
Mě zase baví, ale chápu, že
Mě zase baví, ale chápu, že já jsem v tomhle divná :-)