Sie sind hier: Home > Artikellinks > Übersetzungen > Das vergiftete Signal  
     
Das vergiftete Signal: Positive und negative diskriminative Reize
Weshalb Clickern und Strafe nicht zusammen passen
 
von Karen Pryor Juni 25, 2002

Verhaltensforscher bezeichnen einen erlernten Reiz, der ein operantes Verhalten auslöst, als einen “diskriminativen Reiz”. Behavioristen unterschieden nicht – so weit ich das weiss – zwischen einem diskriminativen Reiz, der durch positive Verstärkung trainiert wurde und einem der durch negative Verstärkung trainiert wurde.

In der Praxis jedoch gibt es da einen deutlichen Unterschied. Beim Clickertraining (operante Konditionierung mit einem Markersignal) wird zuerst das Verhalten entwickelt, als operantes Verhalten, welches in Erwartung einer positiven Verstärkung frei angeboten wurde. Der diskriminative Reiz wird dann mit dem operanten Verhalten verknüpft und funktioniert dann als Signal für eine Gelegenheit, eine Verstärkung zu verdienen. Jeder diskriminative Reiz signalisiert die Gelegenheit, für ein bestimmtes Verhalten oder für eine Sequenz von Verhalten, eine Verstärkung zu verdienen.

Dieser positiv trainierte diskriminative Reiz öffnet immer „die Türe” zu positiver Verstärkung. Wenn das Verhalten nicht auftritt, ist das einzige Ergebnis, dass keine Verstärkung kommt. Wenn das Verhalten auftritt, ist Verstärkung garantiert. (Wir Clicker Trainer nennen diese Art von Auslösereiz manchmal ein Signal, um dies vom traditionellen Ausdruck Kommando zu unterschieden).

Sobald ein Tier versteht, was ein gegebenes Signal bedeutet, wird das Signal, der positive diskriminative Reiz, selber zum konditionierten positiven Verstärker, so wie der Click. Deshalb kann ein Signal als Verstärker für die Verhaltensweisen verwendet werden, die stattfinden, während das Signal gegeben wird. Man kann zum Beispiel das gut etablierte Signal des einen Verhaltens verwenden, um ein anderes Verhalten zu formen oder um vorangehende Verhaltensweisen in einer Verhaltenskette zu verstärken. Das Signal kann auch als Markersignal verwendet werden, gerade so als wäre es ein Click, um speziell gute Aspekte eines anderen Verhaltens präzise zu markieren. Es scheint auch wahrscheinlich, dass die erwünschte emotionale Antwort, von der wir wissen, dass sie mit dem Click verknüpft ist, auch die Darbietung dieser positiv konditionierten Reize begleitet.

Verhalten, welches mit Korrektur trainiert wurde, kann auch mit diskriminativen Reizen verknüpft sein, die anzeigen, wann dieses spezifische Verhalten auftreten soll. Diese diskriminativen Reize oder Kommandos jedoch, können zu Verstärkung führen oder aber auch nicht. Wenn das Tier das Verhalten nicht zeigt oder es nicht richtig zeigt, kann der Reiz zu Strafe führen (üblicherweise “Korrektur” genannt). Der negative diskriminative Reiz, normalerweise Kommando genannt, ist nun ein konditionierter negativer Verstärker, der die Gelegenheit signalisiert, Strafe zu vermeiden.

Auch wenn das Verhalten komplett mit positiver Verstärkung trainiert wurde und man nun für korrektes Verhalten nach einem diskriminativen Reiz (ein Auslösereiz, ein Kommando, ein Zeichen) clickt, aber auch aversive Korrekturen (Leinenruck, eine verbale Zurechtweisung usw.) für inkorrekte Verhaltensweisen nach dem selben Reiz anwendet, verliert der Reiz augenblicklich seinen Wert als positiver Verstärker. Im besten Falle ist er zweideutig hinsichtlich der Verstärkung. Er ist kein Click. Er löst nicht mehr automatisch die positiven Emotionen aus, die mit einem konditionierten positiven Verstärker assoziiert sind. Er kann nicht mehr länger innerhalb einer Verhaltenskette verwendet werden, um vorangehendes Verhalten zu verstärken.

Auch wenn primäre Verstärker, wie Bestätigung, Spielzeuge und Leckerbissen im Überfluss angeboten werden während oder nach dem Training oder der Ausführung, die diskriminativen Reize selber – die Kommandos – sind nun sowohl Drohungen als auch Versprechungen. Verhalten neigt dazu zusammenzubrechen, interessanterweise sowohl vorangehend als auch nachfolgend auf diese ambivalenten Reize: vorangehend, weil das vorangehende Verhalten ausgelöscht werden kann aufgrund des Ausbleibens eines positiv konditionierten Verstärkers, der nun aus einem aversiven Reiz besteht und nachfolgend, weil Verhalten, dass bestraft werden könnte, eher vermieden wird. Der Wechsel wird in der Einstellung des Lernenden sichtbar, welche von aufmerksamem Eifer zu Widerwillen umkippt, häufig mit sichtbaren Stressäusserungen. Auch wenn auf eine richtige Antwort nach dem diskriminativen Reiz immer eine Belohnung folgt, ist das Signal zweideutig geworden, wenn bei einer falschen Antwort bestraft wird. Es hat seine Eindeutigkeit verloren hinsichtlich der Vorhersage der Folge. Es ist nicht mehr länger “sicher”. Du hast Dein Signal vergiftet.

Copyright 2005 Karen Pryor Clickertraining and Sunshine Books, Inc.
phone: 781-398-0754 — website: www.clickertraining.com

Originalversion in Englisch unter: The poisoned cue: Positive and negative discriminative stimuli

Übersetzung: Simone Fasel

Übersetzung erfolgt mit freundlicher Genehmigung von Karen Pryor.