| von Karen Pryor |
Juni 25, 2002 |
Verhaltensforscher bezeichnen einen erlernten Reiz, der
ein operantes Verhalten auslöst, als einen “diskriminativen
Reiz”. Behavioristen unterschieden nicht – so weit ich das
weiss – zwischen einem diskriminativen Reiz, der durch positive
Verstärkung trainiert wurde und einem der durch negative Verstärkung
trainiert wurde.
In der Praxis jedoch gibt es da einen deutlichen Unterschied. Beim Clickertraining
(operante Konditionierung mit einem Markersignal) wird zuerst das Verhalten
entwickelt, als operantes Verhalten, welches in Erwartung einer positiven
Verstärkung frei angeboten wurde. Der diskriminative Reiz wird
dann mit dem operanten Verhalten verknüpft und funktioniert dann
als Signal für eine Gelegenheit, eine Verstärkung zu verdienen.
Jeder diskriminative Reiz signalisiert die Gelegenheit, für ein
bestimmtes Verhalten oder für eine Sequenz von Verhalten, eine
Verstärkung zu verdienen.
Dieser positiv trainierte diskriminative Reiz öffnet immer „die
Türe” zu positiver Verstärkung. Wenn das Verhalten nicht
auftritt, ist das einzige Ergebnis, dass keine Verstärkung kommt.
Wenn das Verhalten auftritt, ist Verstärkung garantiert. (Wir Clicker
Trainer nennen diese Art von Auslösereiz manchmal ein Signal, um
dies vom traditionellen Ausdruck Kommando zu unterschieden).
Sobald ein Tier versteht, was ein gegebenes Signal bedeutet, wird das
Signal, der positive diskriminative Reiz, selber zum konditionierten
positiven Verstärker, so wie der Click. Deshalb kann ein Signal
als Verstärker für die Verhaltensweisen verwendet werden,
die stattfinden, während das Signal gegeben wird. Man kann zum
Beispiel das gut etablierte Signal des einen Verhaltens verwenden, um
ein anderes Verhalten zu formen oder um vorangehende Verhaltensweisen
in einer Verhaltenskette zu verstärken. Das Signal kann auch als
Markersignal verwendet werden, gerade so als wäre es ein Click,
um speziell gute Aspekte eines anderen Verhaltens präzise zu markieren.
Es scheint auch wahrscheinlich, dass die erwünschte emotionale
Antwort, von der wir wissen, dass sie mit dem Click verknüpft ist,
auch die Darbietung dieser positiv konditionierten Reize begleitet.
Verhalten, welches mit Korrektur trainiert wurde, kann auch mit diskriminativen
Reizen verknüpft sein, die anzeigen, wann dieses spezifische Verhalten
auftreten soll. Diese diskriminativen Reize oder Kommandos jedoch, können
zu Verstärkung führen oder aber auch nicht. Wenn das Tier
das Verhalten nicht zeigt oder es nicht richtig zeigt, kann der Reiz
zu Strafe führen (üblicherweise “Korrektur” genannt).
Der negative diskriminative Reiz, normalerweise Kommando genannt, ist
nun ein konditionierter negativer Verstärker, der die Gelegenheit
signalisiert, Strafe zu vermeiden.
Auch wenn das Verhalten komplett mit positiver Verstärkung trainiert
wurde und man nun für korrektes Verhalten nach einem diskriminativen
Reiz (ein Auslösereiz, ein Kommando, ein Zeichen) clickt, aber
auch aversive Korrekturen (Leinenruck, eine verbale Zurechtweisung usw.)
für inkorrekte Verhaltensweisen nach dem selben Reiz anwendet,
verliert der Reiz augenblicklich seinen Wert als positiver Verstärker.
Im besten Falle ist er zweideutig hinsichtlich der Verstärkung.
Er ist kein Click. Er löst nicht mehr automatisch die positiven
Emotionen aus, die mit einem konditionierten positiven Verstärker
assoziiert sind. Er kann nicht mehr länger innerhalb einer Verhaltenskette
verwendet werden, um vorangehendes Verhalten zu verstärken.
Auch wenn primäre Verstärker, wie Bestätigung, Spielzeuge
und Leckerbissen im Überfluss angeboten werden während oder
nach dem Training oder der Ausführung, die diskriminativen Reize
selber – die Kommandos – sind nun sowohl Drohungen als auch
Versprechungen. Verhalten neigt dazu zusammenzubrechen, interessanterweise
sowohl vorangehend als auch nachfolgend auf diese ambivalenten Reize:
vorangehend, weil das vorangehende Verhalten ausgelöscht werden
kann aufgrund des Ausbleibens eines positiv konditionierten Verstärkers,
der nun aus einem aversiven Reiz besteht und nachfolgend, weil Verhalten,
dass bestraft werden könnte, eher vermieden wird. Der Wechsel wird
in der Einstellung des Lernenden sichtbar, welche von aufmerksamem Eifer
zu Widerwillen umkippt, häufig mit sichtbaren Stressäusserungen.
Auch wenn auf eine richtige Antwort nach dem diskriminativen Reiz immer
eine Belohnung folgt, ist das Signal zweideutig geworden, wenn bei einer
falschen Antwort bestraft wird. Es hat seine Eindeutigkeit verloren
hinsichtlich der Vorhersage der Folge. Es ist nicht mehr länger
“sicher”. Du hast Dein Signal vergiftet.
Copyright 2005 Karen Pryor Clickertraining and Sunshine Books, Inc.
phone: 781-398-0754 — website: www.clickertraining.com
Originalversion in Englisch unter: The
poisoned cue: Positive and negative discriminative stimuli
Übersetzung: Simone Fasel
Übersetzung erfolgt mit freundlicher Genehmigung von Karen Pryor.
|