Achtung, Verhaltenskette!
Verhaltensketten sind im belohnungsbasierten Training Fluch und Segen zugleich. Oft sind sie etwas, was wir unbedingt wollen. Und häufig schießen sie uns mit Kaliber .38 volles Rohr ins Knie.
WAS IST ALSO EINE VERHALTENSKETTE?
Eigentlich sagt es der Name schon: Es ist eine Aneinanderkettung unterschiedlicher Verhaltensweisen, die der Hund zeigt, damit – oder lieber BEVOR – er einen Verstärker erhält.
Verstärker sind Dinge, die dafür sorgen, dass ein Verhalten künftig öfter, länger andauernd oder intensiver gezeigt wird. Umgangssprachlich werden sie meistens als Belohnung bezeichnet, wobei nicht jede Belohnung ein Verstärker ist, wohl aber jeder Verstärker eine Belohnung. Kurz gesagt sind Verstärker etwas, das sich für den Hund lohnt.
Das kann vom Menschen kommen. Futter, Spiel, Aufmerksamkeit, Interaktion oder Zugang zu anderweitiger Bedürfnisbefriedigung beispielsweise. Es kann sich aber auch um einen funktionalen Verstärker handeln. Springt ein Hund z.B. in die Leine und rastet aus, wenn er einen Artgenossen sieht und er macht das, weil er diesen Hund vertreiben möchte, dann lohnt sich dieses Verhalten für den Hund, sofern der andere auf Abstand bleibt oder aber der Mensch dieses Hundes immer besser darin wird, Begegnungen mit anderen Hunden zu vermeiden. Das Verhalten “funktioniert”, das Ausrasten hat zur Folge, dass der andere Hund auf die eine oder andere Art und Weise fernbleibt.
Das Thema Verstärker ist ein umfangreiches und ich möchte an dieser Stelle nicht zu tief einsteigen. In unserem Blog findest du dazu einige Artikel, wenn du das Wort “Verstärker” in die Suchleiste eingibst.
Zurück zu den Verhaltensketten:
Ein Hund zeigt also mehrere aneinandergereihte Verhaltensweisen, bevor er einen Verstärker bekommt. Wenn wir den Hund abrufen, ist das eine Verhaltenskette. Sie besteht z.B. aus: Weglaufen/wegrennen – Abstand zum Menschen haben – Orientierung weg vom Menschen – RÜCKRUF – Orientierung hin zum Menschen – Auf den Menschen zulaufen – beim Menschen ankommen – VERSTÄRKER = Belohnung mit Futter, Spiel, etc.
Eine sehr gute und wichtige Verhaltenskette, denn schließlich wollen wir den Hund ja zuverlässig abrufen können, nicht zuletzt um ihm Freilauf ermöglichen zu können. Das Problem dabei ist: ALLES was der Hund an Bausteinen dieser Verhaltenskette zeigt, wird durch die Belohnung am Ende mitverstärkt. Und hinsichtlich des Teils, der vor dem Rückruf-Signal kommt, ist das eher ungünstig. Im belohnungsbasierten Training ist es nämlich so: Jedes positiv aufgebaute Signal wird über kurz oder lang zum SEKUNDÄREN VERSTÄRKER.
Ein sekundärer Verstärker kündigt zuverlässig einen primären Verstärker an. Auf diesem Prinzip basiert das Markertraining bzw. der Clicker. Für den Hund ist ein ausschließlich positiv aufgebauter Rückruf der 6er im Lotto, wenn auch ansonsten bedürfnisorientiert mit ihm umgegangen und belohnungsbasiert trainiert wird, ohne ihn dabei durch zuviel Training zu nerven. Er bekommt tolle Belohnungen, oft Highlights wie super tolles Futter (Leberwurst, Katzen-Nassfutter, o.ä.) oder ein besonders begehrtes Spielzeug und natürlich freuen wir uns riesig darüber, dass der Hund so toll gehört hat und feiern ihn gehörig ab.
Was passiert also, wenn der Rückruf immer dann erfolgt, wenn der Hund gerade am Wegrennen oder auf etwas Spannendes fokussiert ist, die Aufmerksamkeit nicht beim Menschen hat oder besonders weit weg ist?
Richtig, der Hund lernt, dass diese Verhaltensweisen die Chance auf einen Rückruf exorbitant steigern und er wird sie in Zukunft öfter zeigen. Wir “produzieren” also mit den besten Absichten einen Hund, der immer weiter und schneller wegrennt, sich immer mehr nach außen orientiert, weil er GELERNT hat, dass sich dieses Verhalten lohnt. Besonders heftig kann sich das bei lauffreudigen und/oder auf enge Zusammenarbeit mit dem Menschen selektierte Rassen/Typen auswirken. Alle Hunde, die gerne rennen und gerne mit dem Menschen kooperieren, finden den Rückruf ja doppelt geil: Vollspeed wegrennen, Vollspeed zurückrennen und dann noch Bomben-Belohnung absahnen. Besser geht es aus Hundesicht kaum.
Nur für uns hat der Spaß an dieser Stelle dann in der Regel ein Loch.
Wie kommt man also raus aus der Misere? In dem man sich das Wissen um Verhaltensketten und das Matching Law zunutze macht:
Wir unterscheiden ab sofort zwischen Training und Anwendung und geben das Rückruf-Signal zu Trainingszwecken immer dann, wenn der Hund erwünschtes Idealverhalten zeigt. Also beispielsweise, wenn er einen Radius einhält, den wir gut finden. Er von einer schnelleren in eine langsamere Gangart wechselt. Das Erregungslevel moderat ist. Er eh schon mit einem Öhrchen bei uns und nicht stark auf etwas ganz anderes fokussiert ist. Er mittig auf dem Weg läuft. Er sich gerade entschieden hat, sowieso zu uns herzukommen.
Das Training an steigender Ablenkung, wie es immer noch oft empfohlen wird, ist im belohnungsbasierten Training mit ganz ganz großer Vorsicht zu genießen. Aus oben genannten Gründen. Wenn ich immer dann das Rückrufsignal gebe, wenn der Hund besonders abgelenkt ist, z.B. am Mauseloch hängt, auf der Suche nach Wild(geruch) ist, zu anderen Hunden oder Menschen rennt, im Spiel mit anderen Hunden ist, dann wird er genau diese Verhaltensweisen künftig immer öfter zeigen.
Was nicht heißt, dass man seinen Hund nicht abrufen soll oder darf, wenn es notwendig ist. Deshalb der Unterschied zwischen Training und Anwendung. Trainingsrückrufe sollten dann erfolgen, wenn der Hund Idealverhalten zeigt, weil dieses dann automatisch mehr wird und – ganz charmante Nebenwirkung – der Rückruf dadurch immer seltener notwendig wird. Durch das Training wird das Verhalten “auf Signal schnell und ohne Umwege zu meinem Menschen laufen” immer größer im Kopf des Hundes.
Sprich, irgendwann denkt der nicht mal mehr drüber nach, ob er jetzt kommen soll oder nicht. Das Rückrufsignal wird wahrgenommen und bevor der Hund überhaupt weiß, wie ihm geschieht, tragen ihn seine Beine schon in Windeseile zu seinem Menschen zurück. Natürlich braucht es dazu einen gesunden Hund, grundlegend gute Haltungsbedingungen, einen bedürfnis- und bindungsorientierten Umgangsstil, viel gutes Training, die passenden Verstärker und das richtige Trainingsumfeld. Denn das ist eine weitere wichtige Variable im belohnungsbasierten Training: Es kann nur dann richtig umgesetzt werden, wenn der Hund überhaupt Verhalten zeigen kann, das wir verstärken wollen. Befinden wir uns also mit dem Hund in einer Umgebung, in der er die ganze Zeit schwer abgelenkt und super aufgeregt ist, dann wird das nix. Denn selbst wenn er ansprechbar ist und auch noch Belohnungen von uns annehmen kann, verstärken wir in einer Tour die hohe Erregung und die Orientierung nach außen mit.
Besonders hässlich werden Verhaltensketten, wenn es um Situationen geht, die für Hund und Mensch mit großem Stress verbunden sind. Wenn sich beim Rückruf Fehler eingeschlichen haben und man das nicht merkt, dann kommt bei den meisten Leuten früher oder später eine Leine dran (“Weil der so massiv jagt…”). Doof für den Hund, weil seine Bewegungsfreiheit eingeschränkt wird, was wiederum zu Problemen führen kann (z.B. gesteigerte Reaktivität) und oft sehr unangenehm und lästig für den Menschen, weil entspanntes Spazierengehen dann oft nicht mehr möglich ist, weil der Hund an der Leine zieht und die Schleppleine gut gehandelt werden muss, wenn man sie vernünftig nutzen möchte. Beides ist halt erstmal einfach nur ungünstig und lästig, aber nicht super dramatisch. Anders sieht das beispielsweise in Hundebegegnungen aus.
Ich bekomme unfassbar viele Hunde ins Training, die GELERNT haben, dass Ausrasten an der Leine das Verhalten ist, das sich lohnt. Warum? Weil auch da ganz oft Verhaltensketten gebaut werden, die der Mensch so gar nicht auf dem Schirm hat und die ihm – wie zu Anfang geschrieben – mächtig ins Knie schießen.
Am Anfang zeigt der Hund das Verhalten aus seinem emotionalen Zustand heraus, er weiß sich nicht anders zu helfen. Funktionale Verstärker sind am Werk. Bei Hunden, die Angst haben oder vertreiben wollen, führt das Ausflippen dazu, dass Hundekontakte immer weniger werden. Entweder weil das Gegenüber die Flucht ergreift oder der Mensch, der hinten am Hund dranhängt immer mehr Stress kriegt und Begegnungen so gut es geht vermeidet. Zum Thema Meideverhalten verstärken, habe ich auch schon mal was geschrieben, das findest du hier.
Weil das so nicht weitergehen kann, wird dann mit dem Training begonnen – und oft haufenweise unerwünschtes Verhalten mitverstärkt. Ein Grundprinzip beim belohnungsbasierten Training ist, dass vor einem unerwünschten Verhalten immer ein Verhalten kommt, das noch akzeptabel ist und das wir verstärken können. Grundsätzlich ist auf allen vier Pfoten an gespannter Leine stehen und den anderen Hund leise anschauen ja besser als brüllend auf den Hinterbeinen in der Leine hängen. Also könnten wir den Hund – rein theoretisch – ja dafür belohnen. Auf allen vier Pfoten an gespannter Leine stehen und den anderen Hund leise anschauen, wird also mehr werden und brüllend auf den Hinterbeinen in der Leine hängen entsprechend weniger, weil beides gleichzeitig ja nicht geht. Wenn das nächste Mal also ein Hund auftaucht, reagieren wir so rechtzeitig, dass das Markersignal kommt, wenn der Hund noch nicht brüllt und der Hund bekommt dafür beispielsweise eine Futterbelohnung. Dazu braucht man dann den richtigen Abstand und man muss noch auf ein paar andere Dinge achten, aber prinzipiell funktioniert das und das Verhalten des Hundes wird sich bessern, sofern der andere Hund nicht eine gewisse Distanz unterschreitet. DAS wiederum ist ein massiver Verstärker für den Menschen! Sein Tun sorgt dafür, dass der Hund sich besser verhält. Das heißt, der Mensch wird genau so weiter machen und sogar mehr davon. Hin und wieder passiert es dann doch, dass der Hund auslöst, aber auch das ist kein großes Problem mehr, weil man inzwischen auch gelernt hat, dass man den Hund bei unerwünschtem Verhalten ja freundlich unterbrechen kann. Zum Beispiel mit einem positiv auftrainierten Umorientierungssignal.
Was genau passiert also?
Wir verstärken angespanntes Stehen auf hohem Erregungslevel, ggf. sogar Blickfixieren (= Drohverhalten), der Hund zeigt dieses Verhalten irgendwann sehr sehr stabil und wenn er ausflippt, unterbrechen wir ihn mit einem freundlichen “Schau mal!”, er wendet sich uns zu und wir belohnen ihn dafür fürstlich, weil er so ein toller Junge ist. Und schon sind wir mittendrin. Wie beim Beispiel mit dem Rückruf verstärken wir so am laufenden Band eigentlich unerwünschtes Verhalten. Nur weil das Verhalten besser ist, als das, was der Hund vorher gezeigt hat, ist es noch lange nicht gut. Außerdem ist der Hund immer noch nicht entspannt in der Begegnungssituation und von locker flockig an anderen Hunden vorbeizugehen in einem Abstand, der auch wirklich alltagstauglich ist, geschweige denn von bewältigbaren Direktkontakten mit freilaufenden Der-tut-Nixen sind wir meilenweit entfernt.
Auch hier ist der Weg aus der Misere der gleiche, wie beim versaubeutelten Rückruf:
Positiv auftrainierte Signale gibt es ausschließlich dann, wenn der Hund Idealverhalten zeigt.
Das allerniedrigste Kriterium, dass ein Hund bei mir im Training zeigen muss, damit ich ihm ein Signal gebe, ist, ausbalanciert an lockerer Leine stehen zu können. Wenn das nicht geht, dann gibt es keine Signale, die den Hund zu einem Verhalten auffordern oder Wettrüsten mit Belohnungen (je schlechter der Hund reagiert, umso hochwertiger wird der Verstärker, DAMIT der Hund noch reagiert… wieder: was lernt der Hund durch sowas?), sondern ich gehe ans Erregungslevel. Ich halte den Hund gut fest und die Leine so kurz, dass er keinen Anlauf nehmen kann und achte auf festen Stand.
Durch beruhigendes Sprechen, ggf. Anfassen, wenn es dem Hund hilft, ein aufkonditioniertes Entspannungssignal oder was auch immer sich günstig auf die Erregungslage auswirkt, sorge ich dafür, dass der Hund runterkommen kann. Und wenn er dann ausbalanciert an lockerer Leine stehen kann, DANN gebe ich beispielsweise ein Umorientierungssignal, um ihn dabei zu unterstützen, sich vom Auslöser abzuwenden. Was will ich denn in Hundebegegnungen? Und auch in Bezug auf Jagdverhalten, Probleme mit fremden Menschen usw.? Ich will einen Hund, der gelassen bleiben kann und selbstständig gute Entscheidungen trifft. Dazu gehört ein moderates Erregungslevel, was sich wiederum durch eine moderate Muskelspannung zeigt. Ein Hund, der mit nach vorn verlagertem Körperschwerpunkt in der Leine steht, hat KEINE moderate Muskelspannung. Ich will einen Hund, der sich höflich verhält. Den anderen Anstarren ist nicht höflich. Aber all das verstärke ich mit, wenn mein Mindestkriterium nicht ausbalanciert stehen an lockerer Leine ist. Ob ich ein Signal zum Abwenden gebe, wenn der Hund den anderen Hund anschaut, ist immer eine Einzelfallentscheidung, abhängig von der Situation. Grundlegend soll der Hund sich von selbst abwenden. Damit er das kann, muss er aber wissen, dass Abwenden immer eine gute Idee ist und das kriege ich nur hin, wenn ich es im Alltag in allen möglichen Situationen gut verstärke. Denn wie soll der Hund denn sonst in einer für ihn schwierigen Situation überhaupt auf die Idee kommen, dass Abwenden ganz schlau wäre?
Bei mir gilt:
So viel Hilfe (durch Signale und andere Maßnahmen) wie nötig, so wenig wie möglich. Ich möchte selbstwirksame Hunde, die nicht abhängig von meinen Signalen sind. Denn das hängt direkt mit Stressbewältigung und Resilienz zusammen.
Beim belohnungsbasierten Training steckt der Teufel wie so oft im Detail. Deshalb ärgert es mich wirklich immer sehr, wenn ich höre, mit positiver Verstärkung könne man nichts falsch machen, ein falscher Click, eine falsche Belohnung sei nicht so schlimm. Ja, das wäre er wirklich nicht, aber wegen der Verstärkung für den Menschen durch eine erstmal rasche Verbesserung des Verhaltens, BLEIBT es nie bei diesem EINEN, ungefährlichen Click. Und es wird eben mit brutaler Regelmäßigkeit übersehen, dass ein positiv auftrainiertes Signal, wie “Schau mal!” oder eben der Rückruf, in ihrer Wirkung auch nichts anderes sind als ein Click! Und deshalb erlebe ich in meinem Arbeitsalltag reihenweise Hunde, bei denen nachhaltig und effizient – denn das ist belohnungsbasiertes Training nun mal – unerwünschtes Blödsinnsverhalten (aus menschlicher Perspektive) massiv verstärkt wurde. Das macht im Alltag Probleme, es führt dazu, dass es heißt, belohnungsbasiertes Training würde nicht funktionieren, auf jeden Fall dann nicht, wenn es um Aggressionsverhalten geht und nicht zuletzt sind die Menschen dann frustriert, gehen ggf. doch wieder zu einem aversiv arbeitenden Trainer oder geben schlicht und ergreifend auf.
Sie finden sich damit ab, dass sie immer nur dort gehen, wo sonst keiner ist, sie gewöhnen sich daran, dass ihr Hund nie von der Leine darf und entwickeln eine Wut gegenüber anderen Hundehaltern, die sich rücksichtslos verhalten.
Das muss alles nicht sein.
Belohnungsbasiertes Training und ein bedürfnis- und bindungsorientierter Umgang funktionieren IMMER. Aber man muss halt schon wissen, was man da tut. Lernen kann das wirklich jede:r und das ist auch gar nicht so schwer. Die grundlegenden Prinzipien lauten:
- Du kriegst, was du verstärkst. IMMER.
- Das Matching Law greift. IMMER.
- Positiv aufgebaute Signale wirken verstärkend auf Verhalten.
- Unerwünschtes Verhalten durch positiv aufgebaute Signale zu unterbrechen, verstärkt dieses Verhalten.
- Mindestkriterium für Verstärker/Belohnungen ist ein moderates Erregungslevel.
- Unerwünschtes Verhalten durch Co-Regulation der Erregung zu unterbrechen bzw. zu beenden, hat weit weniger unerwünschte Nebenwirkungen, als dafür positiv aufgebaute Signale zu nutzen.
- Selbstreflexion ist notwendig: Prüfe deine eigenen Verstärker. Warum tust du, was du tust?
Und dann gilt: üben, üben, üben. Unter fachkundiger Anleitung, denn selber fällt einem oft gar nicht auf, dass das Timing gerade ungünstig ist, vor allem dann nicht, wenn man durch das Verhalten seines Hundes selber angespannt ist oder unter Stress steht.
Fazit: Belohnungsbasiertes Training ist nicht per se gut. Aber wenn es gut ist, dann ist es das Beste, was Mensch und Hund passieren kann.