Das Matching Law – Gesetz der Anpassung bzw. Übereinstimmung
Was verbirgt sich hinter diesem sperrigen Begriff, über den der eine oder andere beim Thema Lerntheorie sicherlich schon einmal gestolpert ist? Und was für eine Bedeutung hat dieses Gesetz für unser tägliches Training mit Tieren? Übersetzt heißt der Begriff “Matching Law” erst einmal nur “das Gesetz der Anpassung bzw. Übereinstimmung”; und meint nicht mehr, als dass Verhalten in den Relationen gezeigt wird, in denen es belohnt wurde. Das hat die Wissenschaft bewiesen. Das ergibt in der Natur auch Sinn. Eine Katze, die an einem Mäuseloch im Schnitt sechs Mäuse pro Woche fängt und an einem anderen nur zwei, wird auf Dauer drei Viertel ihrer Zeit vor dem ersten Mäuseloch sitzen, ein Viertel vor dem zweiten. Das ergibt für die Katze die optimale Mäuseanzahl und damit Überlebenschancen.
Was heißt das für uns im Hundetraining?
Man kann beispielsweise einem Hund beibringen, vor dem Spazierengehen brav vor der Haustüre zu sitzen und still zu warten, bis es losgeht, indem man ihm vor dem Öffnen der Tür das Signal zum Sitzen gibt. Die Belohnung für das ruhige Sitzen ist in diesem Fall der Spaziergang. Wenn nun aber der Hund ungefähr jedes fünfte Mal aufgeregt bellend vor der Tür steht und der Besitzer im Eifer des Gefechts daraufhin die Tür öffnet, wird der Hund auch für dieses Verhalten mit dem Spaziergang belohnt. Der Hund wird in Zukunft in 80% der Fälle sitzen und warten und in 20% aufgeregt bellen. Das ist erst einmal logisch und keineswegs verblüffend, auch wenn wir es uns als Hundehalter in diesem Beispiel sicherlich anders wünschen würden.
Wie in der Erklärung beschrieben – und hier heißt es, genau hinzuschauen – bezieht sich das Gesetz ja nur auf belohnte Verhaltensweisen.
Betrachten wir nun den begeistert an einem Besucher hochspringenden Hund, der gerne gestreichelt werden will. Nehmen wir an, dass er an sieben Besuchern ganz brav nicht hochspringt, einer davon begrüßt ihn daraufhin mit Streicheln; an dreien springt er doch hoch, zwei davon ignorieren ihn wie geheißen, aber der dritte streichelt ihn dann trotzdem. Was wird nun passieren?
Der Hund hat 50% seiner Belohnungen (Streicheln) fürs Hochspringen bekommen! Er wird beim nächsten Besuch an jedem zweiten Menschen hochspringen. Hoppla!
Eine Lösung kann hier so aussehen: Gezielt das brave Nicht-Hochspringen belohnen und den versehentlichen Trotz-Hochspringen-Streichler nicht mehr einladen – oder gleich an der Tür zwei Gläser Sekt in die Hand drücken … ;-)
Was heißt das noch?
Für alle, die durch Shapen bzw. Formen eines Verhaltens Hund ausbilden, hat das Matching Law auch so seine Tücken. Auf dem Weg zum Endverhalten belohnt man beim Formen immer wieder “unfertige” Zwischenschritte. Hat man nun beispielsweise mit 50 Clicks ein “in die Luft hüpfen” geshapt und belohnt dann noch 25 mal das korrekte Endverhalten, wird der Hund trotzdem in 2/3 (25:50) der Fälle die Zwischenschritte anbieten, die vorher schon häufig belohnt wurden!
Fehlerfreies Lernen
Eine mögliche Lösung hier: Schnelles und fehlerfreies Erlernen mit Locken (Futter über den Kopf des Hundes halten) und Management-Maßnahmen.
(Beim Locken wartet man nicht etwa wie beim Belohnen ein Verhaltensangebot des Hundes ab, sondern löst durch geschickt angebotenes Futter oder unter Einsatz eines Targets ein dem Endverhalten möglichst nahes Verhalten aus. Dieses wird dann verstärkt, wobei die Kunst darin besteht, das anfängliche Locken sehr schnell wieder auszuschleichen. Ansonsten würde das Futter oder der Target mit zum Signal für das Verhalten, und ohne diese Hilfsmittel würde der Hund das auftrainierte Verhalten nicht mehr zeigen.)
Dann kann der Hund in wenigen Durchgängen (z. B. 5) das Endverhalten erlernen. Wenn das nun weitere siebzig Mal belohnt wird, ergibt das ganz andere Relationen. Nun wird der Hund nur noch jedes 15. Mal einen Zwischenschritt (= Fehler) anbieten, obwohl bis dahin gleich viele Leckerchen verfüttert oder andere Verstärker gegeben wurden wie im vorherigen Beispiel.
Mit dieser Technik hat es der Trainer dem Hund leichter gemacht zu verstehen, worum es geht, und ihn weniger oft unabsichtlich auf “falsche Gedanken” (Zwischenschritte) gebracht. Das heißt im Umkehrschluss, dass der Hund zwar zu einem früheren Zeitpunkt etwas weniger Clicks bekommt, dafür aber insgesamt im Training viel weniger frustriert wird. Ein falscher Versuch wird nach Möglichkeit also nicht belohnt! Ist das nicht viel klarer für den Hund? – Oha!
Daumendisziplin oder die Kunst des Nicht-Clickens
Das Optimum ist natürlich, jedes richtige Verhalten zu belohnen und nie ein falsches. Klar! Aber was tun, wenn man es nicht richtig gesehen hat, weil man ungünstig stand oder es so schnell ging? Hilft einem bei dieser Entscheidung auch das Matching Law? Ja!
Schauen wir uns die Übung Nasentarget an. Der Hund soll nur mit der Nase die Spitze des Targetstabes berühren. Manchmal leckt er aber gleichzeitig daran. Also gilt es, nur die Versuche zu belohnen, in denen die Zunge des Hundes drin bleibt.
Beispiel: Von zwölf Versuchen hat der Hund sechsmal ohne Zunge berührt und wurde geclickt und gefüttert, zweimal war die Zunge drin, aber er wurde nicht geclickt, weil der Trainer sich unsicher war, viermal wurde er nicht geclickt, weil die Zunge berührt hat. Das heißt, es gab 100% der Belohnungen dafür, dass der Hund seine Zunge im Maul behielt. Belohnt der Trainer also, wenn er sich nicht sicher war, lieber nicht, dafür aber viele richtige Versuche (wenn auch nicht alle), wird der Hund recht schnell nur noch richtige zeigen.
Belohnt der Trainer allerdings im Zweifel doch, werden immer wieder Versuche mit Zunge belohnt. Und damit bekommt der Hund eine falsche Information.
Klare Informationen übermitteln oder falsche Fährten vermeiden
Im Vergleich: Clickt der Trainer im Zweifel die Zungenberührung mit, werden von acht Clicks zwei für das falsche Verhalten gegeben. Das heißt, der Hund wird beim nächsten Durchgang ganz zuversichtlich im Schnitt jedes vierte Mal die Zunge mit einsetzen, das hatte schließlich das letzte Mal Erfolg!
Erst einmal waren die „im Zweifel für den Angeklagten“-Clicks nett gemeint, denn das Tier bekommt viel positive Rückmeldung durch eine hohe Belohnungsrate. Schließlich kann der Hund ja nichts dafür, dass der Trainer es nicht sehen konnte. Warum ihn also bestrafen, indem der Trainer nicht clickt? Nur, wie das Matching Law zeigt, verschlimmert er die Frustration des Tieres (und seine eigene) im nächsten Durchgang dafür erheblich, weil es auf eine falsche Fährte geschickt wurde.
Darum kennt vielleicht der eine oder andere die Aussage: Im Training sollte man lieber ein richtiges Verhalten (versehentlich) nicht belohnen, als ein falsches (versehentlich) zu belohnen. If in doubt, leave it out! Auf deutsch: Wenn du zweifelst (ob das Verhalten richtig war), belohne es nicht!
Mit diesen Gedanken zur Alltagsrelevanz des Matching Law im Hinterkopf können wir vielleicht dem einen oder anderen Fallstrick des Hundetrainings in Zukunft besser aus dem Weg gehen…
…wenn nun der ein oder andere denkt: “Ja, aber soooo einfach ist das doch dann in Wirklichkeit auch nicht…!” sei ausdrücklich gesagt: STIMMT! Das Matching Law ist ein Aspekt von vielen. Es spielen natürlich weitere Aspekte wie die Qualität des Verstärkers, Verhaltensökonomie, selbstbelohnendes Verhalten, Instinct Drift, das Premack’sche Prinzip und vieles andere mit ins Training hinein. Und genau das macht unser alltägliches Training mit unseren Hunden ja so komplex, vielfältig, individuell und spannend!
Interesse geweckt…?!
Ausbildung zur Trainingsspezialist:in
In dieser 2,5-jährigen Fortbildung für Hundetrainer:innen geht es darum, die eigenen praktischen Trainingsfähigkeiten weiter zu verbessern. Die Fortbildung ist zusammengesetzt aus einem Basis-Block, bestehend aus 7 aufeinander aufbauenden Modulen und einem Aufbau-Block, der weitere 3 Modulen beinhaltet.
Weiterführende Info, Termine, Ausbildungsstart: