I princippet kan alt, hvad hesten er motiveret for, bruges som en positiv forstærker, hvis man kan finde på et relevant set up. Fx. Ved vi, at heste ikke kun er motiverede for at spise, de er blandt andet også instinktivt motiverede for at være sammen med sin flok, at formere sig, at undersøge ting, samt at lege. Så du har måske undret dig over, hvorfor så mange bruger godbidder, når nu der er andre muligheder? Det er her belønningsværdier (reinforcement values) kommer ind i billedet.
”Hvis i skulle støvsuge hele huset, var det så lige meget hvad I fik for det? Ville I gøre det for en 5’er?” Spurgte Helle børnene? ”Neeeej!” Blev der svaret i kor. ”Hvad så med en 50’er? Ville I gøre det for en 50’er?” Joe, så ville de fleste af børnene gerne støvsuge. ”Tror I, at hestene har det på samme måde?” Spurgte Helle. Jo, det troede børnene også. ”Et klap på halsen, tror I at det er en 5’er eller en 50’er for hesten?” Børnenes øjne blev store, og Helle kunne se, at de fik en stor aha-oplevelse. ”Et klap på halsen er kun en 5’er!” var der en, der sagde med stor iver. Og det er ganske rigtigt, at et klap har en meget lille værdi, hvis overhovedet nogen værdi hos hesten. Børnene på Den Hele Ekvipage Rideskole på Djursland bliver meget tidligt introduceret til læringsteoriens mange fine detaljer, for det er i virkeligheden slet ikke så svært at forstå.
Primære og sekundære forstærkere
Et klap på halsen har ikke nogen medfødt biologisk værdi, og kan derfor kun fungere som en sekundær forstærker. Det vil sige, at det skal indlæres som noget positivt, ved at det kobles til en primær forstærker før det kan bruges. Hesten kan godt lære at forstå klap som et tegn på, at den har gjort det rigtigt, og det kan derfor være brugbart i en træningssituation, på samme måde som verbal ros eller en clicker. Men selv efter korrekt kobling med en primær forstærker, er værdien meget lav, og det er kun forventningen om at der vil følge noget bedre, der gør det virksomt. Et studie af A.Takahashi fra 2016 Hvor man sammenlignede klap på halsen som forstærker med foder, påviste også at klap på halsen kun har en meget lille, hvis overhovedet nogen effekt, og det selvom der var tale om en meget simpel opgave, og ikke som man jo ellers ser det brugt, efter et langt og avanceret dressur program.
Klø og massage
At klø eller massere hesten kan sagtens virke som en forstærker, det er påvist flere gange, senest i en undersøgelse af McBride, Hemmings and Robinson fra 2004 som viste, at det at massere hestens manke førte til sænket puls hos ophidsede heste. Men man skal huske, at det kun er godt at blive kløet eller masseret, hvis man gør det et stykke tid. Et par sekunder er ikke nok til, at hesten får noget ud af det. Et fransk studie af S. Ellis og L. Greening fra 2016 sammenlignede brugen af at klø som forstærker med brugen af foder, og resultatet var ikke overraskende, at brugen af foder er langt mere effektiv, og at brugen af at klø kan være helt ineffektiv for nogle heste.
Frihed og pauser
At slippe hesten fri eller give den en pause i træningen (ikke at forveksle med at slippe pres, som pr definition er negativ forstærkning) kan også ses som en positiv forstærker, men virker umiddelbart kun for heste der også trænes med pres, da en hest der er trænet udelukkende med positiv forstærkning I form af foder og kløture, ikke vil bryde sig om at få træningen afbrudt, bedst som den er i gang med at løse opgaven. Tværtimod kan det at ignorere hesten virke som negativ straf, hvilket kan føre til frustration. Det er vigtigt at huske, at når vi snakker belønningsværdier, så er der nogle generelle tendenser man kan gå ud fra, men det er også meget individuelt. Forvirret over termerne? Læs mere på ”hvad er læringsteori?”
Godbidderne
At tilføre mad har vist sig at være både den mest praktiske og effektive belønning, man kan bruge til dyr i langt de fleste situationer, og derfor er det den mest udbredte form for positiv forstærkning, som bruges i alt fra hundetræning til træning af delfiner og sæler og andre halvvilde dyr i de zoologiske haver. At søge mad er en meget stærkt instinktiv adfærd for de fleste dyr, i særdeleshed heste som har udviklet sig til at spise mange timer i døgnet. Derudover er det vigtigt at vide, at selv når vi snakker foder-belønning, er der stor forskel på belønningsværdien alt efter om du bruger gulerødder, hestebolcher, rugbrød, lucerne eller høpiller eller andre typer af foder eller godbidder, og at denne værdi også afhænger af den enkelte hest. Fx har flere smagstest placeret hestebolcher med banansmag som favoritten, men der er også nogle heste, som ikke kan fordrage banan, og slet ikke vil spise dem.
Clickeren
Som nævnt er clickeren i sig selv ikke nogen god forstærker, i og med at den kun er en sekundær forstærker. Der skal først ske en indlæring hvor den kobles sammen med foder belønning, før den har nogen som helst effekt. Det der gør at clickeren er et ekstremt effektivt trænings værktøj er at den fungere som en markør, der fortæller nøjagtigt hvad det er hesten får belønning for, og dette markør signal mister hurtigt sin værdi hvis vi stopper med at bruge foder også. Så clickeren kan derfor aldrig erstatte foder belønning, den er kun med til at gøre læringen mere præcis og nemmere at forstå for hesten.
Individuelle og situationsbestemte værdier
Det er vigtigt også at vide at belønnings værdier både er individuelle og også situations bestemte. Jeg kom lidt ind på et i afsnittet omkring foderbelønninger, men der er mere i det endnu. Belønningsværdier kan variere fra dag til dag og årstid til årstid. Hopper i brunst kan fx have perioder hvor de slet ikke bryder sig om at blive rørt, og klø og massage vil derfor ikke kunne bruges i trænings sammenhænge der. I perioder med fældning kan klø være en meget attraktiv forstærker, men vær opmærksom på, at hvis det virkelig klør meget på hesten, så bevæger vi os over i en anden kvadrant som hedder negativ straf, fordi det er det at vi stopper med at klø den der motiverer den til at arbejde.
Heste der er meget stressede eller bange vil nogle gange ikke være motiveret for, at tage imod en foderbelønning, dette er ikke fordi hesten ikke har foder motivation, men fordi det sympatiske nervesystem er aktiveret i en grad hvor hesten er i fight/fligh/freeze mode.
Som nævnt tidligere er pauser og frihed kun en positiv forstærker i situation hvor hesten oplever press i forvejen. For en hest som frivilligt deltager i klikkertræning med foderbelønning, vil det føles som en straf når vi slutter lektionen for tidligt eller for brat.
Foderbelønningerne har jeg været omkring, men her kan jeg især nævne at der nærmest ikke er grænse for hvad mine islændere vil gøre for en høpille, men jeg har oplevet at en del af mine elevers heste dårligt gider tygge dem, og slet ikke er interesseret i at skulle gøre noget for at få fat på dem. Sådan har hestene så meget forskellige smagsløg.
Referencer:
Helle Knudsen, Den hele ekvipage ridecenter, Djursland
Amanda K. Warren-Smith & Paul D. McGreevy 2015: Equestrian Coaches’ Understanding and Application of Learning Theory in Horse Training
McLean, A. N. 2003. The Truth about Horses
McGreevy, P. D. 2004. Equine Behavior: A Guide for Veterinarians and Equine Scientists
McBride, S. D., Hemmings, A. and Robinson, K. 2004. A preliminary study on the effect of massage to reduce stress in the horse.
Journal of Equine Veterinary S. Ellis, L. Greening Positively reinforcing an operant task using tactile stimulation and food-a comparison in horses using clicker training (2006)
A. Takahashi, k. Nishiyama Failure to find reinforcement effect of neck patting in horses (equus caballus 2016)
Lansade L., & Calandreau L., (2018) A conditioned reinforcer did not help to maintain an operant conditioning in the absence of a primary reinforcer in horses.
Sankey et al., (2010) The Way to a Man’s Heart Is through His Stomach: What about Horses?