Waarschijnlijk gebruik je positieve versterking al jaren in je voordeel: als je hond doet wat jij wilt, beloon je hem, bijvoorbeeld met een koekje of een spelletje, zodat hij dat gedrag wil herhalen. Hoe leuker je hond jouw beloning vindt, hoe sneller hij leert te doen wat je wilt.
Onbewust kun je deze methodiek ook verkeerd toepassen. En dan ontstaat vaak hardnekkig gedrag dat je niet zo prettig vindt. Je duwt bijvoorbeeld je hond steeds weg als hij tegen je opspringt, toch komt hij steeds weer omhoog. Dan ziet het ernaar uit dat dit duwen je hond iets oplevert! Of misschien schreeuw je tegen hem als hij weer eens hardnekkig jankt. Het feit dat het hardnekkig is, wijst erop dat hij je geschreeuw op een of andere manier belonend vindt! Waarschijnlijk gaat het je hond op dat moment om de aandacht, en of die nu positief of negatief is, maakt hem even niet uit.
Wil je echt het gedrag van je hond begrijpen, weten hoe het is ontstaan en hoe je het kunt aanpassen, dan moet je snappen hoe versterking *oftewel effectief gebruikte beloning* werkt.
Versterking (of bekrachtiging) is een term afkomstig uit het operant conditioneren. Dit leermodel is algemeen van toepassing is op zelfs de primitiefste diersoorten. Om te kunnen overleven is het voor dieren noodzakelijk hun gedrag steeds aan te passen aan nieuwe situaties in hun omgeving – zij moeten dus leren. Volgens het operant conditioneren wordt het gedrag van een dier bepaald door wat daar direct op volgt, dus de gevolgen.
Zo zal het dier een gedrag vaker gaan vertonen, als het gevolgd wordt door versterking. Bijvoorbeeld iets dat de hond prettig vindt. Dan heet het positieve versterking, positief omdat er iets aan de situatie wordt toegevoegd. Negatieve versterking bestaat ook. Dat betekent dat er iets dat de hond onaangenaam vindt (bijv. een onaangenaam gevoel of pijn), ophoudt of wordt weggenomen. Zoals je in een volgende artikel – Straf: een nuttig middel met veel valkuilen – duidelijk zal worden, heeft deze negatieve versterking een keerzijde. Nu concentreren we ons echter op positieve versterking.
Bij positieve versterking is het dus belangrijk wat de hond als leuk, prettig of op een andere manier als belonend ervaart, niet wat jìj denkt dat hij fijn vindt.
Niets beïnvloedt het gedrag van een hond zo grondig als versterking. Als pup vertoont de hond allerlei gedrag. Feitelijk probeert hij uit welk gedrag wel of niet in zijn voordeel is: dus welk gedrag wel of niet wordt versterkt. De versterking gebeurt soms bewust (beloning) of onbewust door jouzelf, maar soms ook ‘toevallig’ door de omgeving. Bijvoorbeeld een omgevallen vuilnisbak, waaruit allerlei lekkers komt rollen (vindt je hond dan). De hond leert hiermee dat vuilnisbakken zeer interessante voorwerpen zijn, die ook in de toekomst nadere aandacht blijven verdienen. Gedrag dat niet wordt versterkt, verdwijnt vanzelf: het levert de hond namelijk niets op en is dus een verspilling van energie. Na ongeveer een jaar vertoont een hond bijna uitsluitend dàt gedrag dat beloond werd, bewust of onbewust, door jou zelf of door de omgeving.
Bijna alles wat een hond doet,
doet hij omdat hij daarvoor in het verleden versterkt werd!
Het is mogelijk dat de hond een bepaald gedrag al herhaalt, terwijl het slechts één keer beloond is. Sterker nog, het moeilijkst af te leren is gedrag dat uiterst zelden wordt versterkt, maar waarvoor de beloning, àls deze dan eindelijk bemachtigd wordt, heel groot is. Dat is ook het grote geheim van de aantrekkingskracht van gokautomaten.
Versterking is dus een heel machtig middel,
als je het maar naar je hand weet te zetten.
Het moment van beloning is heel belangrijk. Het dier moet namelijk een verband kunnen leggen tussen zijn gedrag en de beloning. Als de beloning vlak vóór het gedrag komt of vijf minuten erna, zal de hond nooit een verband zien. Onderzoek heeft aangetoond dat het beste moment van beloning binnen 4/10 seconde na het (begin van het) vertonen van een gedrag is. Dat is ook logisch, want honden zijn over het algemeen erg actieve dieren. Een paar seconden na het gedrag dat je wilt belonen, heeft je hond misschien al vijf andere gedragingen vertoond. Als je bijvoorbeeld bij het aanleren van de zit de beloning 5 seconden nà het moment waarop de hond ging zitten toedient, is de hond inmiddels al opgestaan, heeft hij ergens aan gesnuffeld en naar andere honden gekeken. Dan heb je dus niet het zitten beloond, maar het kijken naar de andere honden!
Een beloning moet dus
tijdens of direct nà het gewenste gedrag
worden toegediend, wil je dat gedrag versterken.
Het is niet altijd makkelijk de beloning op precies het goede moment te geven. Een koekje in je zak heb je niet binnen 4/10 seconde in de mond van je viervoeter. Om deze en andere redenen kan het erg handig zijn een geconditioneerde versterker te gebruiken, een signaaltje dat je hond vertelt: “wat je nù doet is goed en daarvoor krijg je een beloning”.
Dit signaal wordt àltijd gevolgd door een beloning. Het signaal kan een woord zijn, bijvoorbeeld “braaf”, maar ook een klikgeluidje van een clicker. Een dergelijk kort en uniek geluid heeft bepaalde voordelen. Onder andere is het goed te timen en dringt het beter tot de hond door dan de stem. Daardoor kun je veel beter het gewenste gedrag markeren. Meer over clickertraining kun je lezen in Clicker-training: dolfijntraining voor de hond, Veelgestelde clicker-vragen en Clicker-tips.
Het zal duidelijk zijn dat versterking de enige manier is om een hond iets aan te leren. Maar soms wil je een hond juist iets àfleren. Ook daarvoor is positieve versterking geschikt.
Eén manier om met versterking een gedrag af te leren, is de afwezigheid van het gedrag te belonen terwijl je het gedrag zelf negeert.
Als je hond bijvoorbeeld vaak tegen je opspringt in een bepaalde situatie, bijvoorbeeld als je thuiskomt, beloon je hem zolang hij dat nog niet doet – even met iets anders bezig is, een speeltje pakt, gewoon nog net 4 voeten op de vloer heeft, in ieder geval allerlei gedrag *behalve* het tegen je opspringen. Springt hij alsnog tegen je op? Dan ga je rechtop staan, hou je je handen laag of voor je armen voor je borst gekruist, je kijkt over hem heen, je negeert hem. Zodra je hond weer vier poten op de grond heeft, versterk je dat gedrag weer. Blijf je hond belonen zolang hij vier poten op de grond houdt. Vervolgens bouw je de beloningsfrequentie af.
Dit werkt sneller dan het gedrag alleen maar negeren, omdat je je hond direct beloont voor àndere gedragingen dan wat je niet wilt.
Een andere veelgebruikte manier is het aanleren van een gedrag dat de hond niet kan combineren met het ongewenste gedrag.
Zo is in de mand liggen tijdens het eten niet te combineren met naast je stoel zitten bedelen. Leer je hond naar zijn mand gaan als jij dat zegt. Beloon hem veel voor in de mand zijn. Als je aan tafel zit, beloon je je hond heel vaak voor het in de mand blijven liggen terwijl je eet. Komt hij naar je toe, dan stuur je hem weer naar zijn mand. Na een korte pauze laat je hem weer merken dat in de mand liggen veel meer oplevert dan naast jou aan tafel komen bedelen.
Een hond kan ook niet tegelijk tegen iemand opspringen en zitten of liggen. Leer hem weer eerst het gedrag aan en beloon hem vooral heel veel als hij dat in voor hem moeilijke situaties weet vol te houden.
Soms vraagt het bedenken van een dergelijk onverenigbaar gedrag een klein beetje moeite, maar het is een uitstekende om ongewenst gedrag af te leren.
Een laatste manier om een hond iets af te leren, is ervoor te zorgen dat het gedrag helemaal niet meer versterkt wordt. Dan sterft het op den duur uit, want het gedrag werkt niet meer. Dit heet met een mooi woord extinctie of het uitdoven van gedrag. Als het gedrag in het verleden vaker is beloond, zal het wel een tijdje duren voordat het ophoudt. Sterker nog, het gedrag zal in eerste instantie heviger worden!
Bijvoorbeeld, de hond jankt om aandacht. De baas reageerde soms iets eerder, soms iets later, soms vriendelijk (wat is er jongen, moet je uit?), soms boos. Dan reageert de baas een keertje helemaal niet. De hond zal dan in eerste instantie steeds harder gaan janken, omdat dat in het verleden meestal toch nog de gewenste aandacht opleverde. Hij zal dit ook enige tijd volhouden en zelfs gaan blaffen, want de baas reageerde in het verleden ook niet altijd meteen. Maar op een gegeven moment houdt het gedrag toch op, meestal na een laatste, ergste verheviging van zijn ongewenste gedrag. De eerstvolgende keer zal de hond het weer proberen, maar zal hij minder lang aanhouden. En zo verder, totdat de hond het tenslotte helemaal opgeeft.
Bij negeren schuilt echter een addertje onder het gras. Als de baas namelijk niet volhoudt en toch een keer aandacht schenkt aan het gejank, zal de hond het de volgende keer nòg hardnekkiger volhouden: hij heeft nu namelijk geleerd dat de aanhouder wint! Hierbij is dus heel consequent gedrag van de baas vereist, anders beland je van de regen in de drup.
Reden waarom je negeren beter kunt combineren
met het belonen van de afwezigheid van het gedrag
of met het belonen van een ander gedrag.
Maar… Ieder nadeel heeft zijn voordeel! Deze eerste verheviging van gedrag bij het uitblijven van een versterking die de hond gewend is te krijgen, kun je ook in je voordeel gebruiken. Het is namelijk heel nuttig bij het uitbouwen (langer of intenser maken) van gewenst gedrag en het afbouwen van de beloning. Dit wordt veel toegepast bij clickertraining.
Wil je een hond die graag traint, enthousiast werkt of zich gewoon vrolijk aan de huisregeltjes houdt? Die altijd vol aandacht voor je is? Wil je een wereldhond die jou een wereldbaas vindt? Achterhaal dan wat jouw hond in welke situaties geweldig vindt, en gebruik dit in je voordeel. Oefen bewust met veel, liefst uitsluitend, positieve versterking. Want positieve versterking is oneindig veel krachtiger dan de meesten denken. Bovendien is het ook voor jezelf superleuk en motiverend om continu te letten op wat je hond allemaal goed doet. En als je al zijn goeie gedrag niet als vanzelfsprekend ziet, merk je pas dat dat heel veel is! Het is in het begin even wennen en vraagt soms wat denkwerk, maar dan gebruiken we juist datgene wat wij als mens (als het goed is) meer hebben dan de hond: ons verstand!
Sandra Hurkmans