mardi 26 août 2025

vers plus de renforcement positif ?


le livre d'Hélène Roche éditer chez Belin


D'une façon générale depuis que je travaille seule Val, j'utilise de plus en plus le renforcement positif (RP). Concrètement j'ai de plus en plus recours à la friandise et de moins en moins à des renforcements négatifs (RN), en essayant de me limiter le plus possible à des "stimulis".

J'utilise toujours du renforcement négatif pour certaines choses : bouger de mon espace personnel par exemple. C'est aussi des outils que je maitrise mieux et que j'utilise toujours en premier avec des chevaux que je ne connais pas, que je dois manipuler brièvement (chevaux au pré avec Val notamment). 

Il faudrait que je retrouve l'étude dont le résultat était qu'on pouvait mixer RP et RN sans soucis, voir même que c'était le plus efficace d'avoir plusieurs mode d'éducation selon les contextes. Il n'y a donc aucun problème à les mélanger, tant que les codes et notre langage corporels sont clairs pour le cheval.
J'admire celles qui arrivent à faire absolument tout en RP, en vrai il n'y a aucune limites (y'a qu'à voir ce qu'ils font avec les dauphins ou les animaux des zoo). Mais c'est un chantier beaucoup trop vaste pour moi, faut absolument tout décomposer, réfléchir, anticiper, etc.

Aussi je trouve le renforcement positif beaucoup plus difficile à utiliser que le renforcement négatif. En effet, on doit faire attention à tout : notre langage corporel, le timing, nos codes, notre façon de donner les friandises, etc. Tout doit être beaucoup plus précis en RP. Le timing notamment pour cliquer au bon moment se joue dans des microsecondes.

J'ai fait un stage avec Helene Roche 
sur l'utilisation du clicker voir ici et   et j'ai lu son livre, que je recommande chaudement. J'utilise beaucoup avec Val en mix avec du RN.

Il y a plusieurs mix possibles entre renforcements positifs et négatifs :
- des exo avec uniquement du RN (un stimuli que tu retire),
- des exo RN récompensés avec une friandise (tu retire le stimuli et tu ajoute une récompense),
- des exo RP "purs" : tu rajoute seule la récompense sans avoir mis de stimuli pour avoir le comportement. C'est là où c'est super casse tête, parce que sans toucher ton cheval ni lui mettre aucune pression, tu dois arriver à lui faire comprendre ce que tu attends de lui. Pour ça tu as plusieurs outils :
  • soit "capturer" un comportement que le cheval va faire spontanément (bailler, se coucher, etc), 
  • soit "leurrer" le cheval tu lui montre une friandise ou une cible quand ils ont acquis la cible, pour les faire bouger dans le sens que tu veux,
  • soit tu joue à "chaud/froid" tu créé un dispositif et tu guide petit à petit le cheval vers le comportement que tu souhaites en décomposant beaucoup et en récompensant beaucoup mais en le laissant chercher aussi, c'est là où le dosage est super difficile. Généralement on s'aide d'objets pour qu'ils déclenchent le comportement souhaité,

Le clicker c'est un outil magique, mais ça génère aussi énormément "d'envie" qu'il faut arriver à canaliser sinon ça se transforme en frustration (tu cliques pas assez ou trop, ou tu n'as pas assez décomposer et il ne trouve pas, ou tu stagnes, etc.). Ca génère aussi une façon totalement différente d'interagir avec ton cheval : tu demande à ton cheval de proposer des choses. C'est souvent nouveau car on demande toujours dans toutes les méthode de travail au cheval de ne bouger que sur commande de l'humain. En clicker c'est le cheval qui doit bouger de lui-même ! 
Ce n'est pas incompatible encore une fois, juste ce ne sont pas les mêmes mécanismes d'apprentissage, d'où l'importance de bien délimiter un début et une fin de chaque séance de clicker, sinon c'est très inconfortable pour le cheval de ne pas connaitre dans quel paradigme il se trouve.

Et puis dans la vraie vie, tu fais surtout du mix : je trouve que la limite stimuli/renforcement négatif n'est pas si nette et c'est tant mieux ! De la même façon que tu peux mettre beaucoup trop de pression à un cheval 
en RP sans avoir aucun stimuli : lui demander de se mettre en mouvement en allant toucher une cible alors qu'il n'a aucune envie de bouger. Mais il sait que s'il ne bouge pas, il n'aura pas la friandise, mais ça le soule de bouger quand même ! Tu lui impose une situation fortement inconfortable dans les deux cas, alors que tu as juste installé un cône à 3m de lui.

Je trouve aussi que ça change totalement la façon de considérer les besoins du cheval en général. En effet le but du renforcement positif est de lui apporter ce dont il a le plus envie à l'instant T. Alors la friandise c'est très pratique parce qu'on peut l'emporter partout, le motiver à toute heure du jour et de la nuit, mais ça n'est pas forcément ce dont le cheval a le plus envie à l'instant T. Val adore se rouler (et dormir) en carrière, c'est souvent sa meilleure récompense en fin de travail. De la même façon elle adore trotter ! Même au pré, elle le fait spontanément très souvent sans avoir de stimuli extérieur (peur d'un truc par exemple) et elle exprime des gestes de contentement/excitation (jeté de tête/antérieurs) quand elle le fait. Donc par exemple en balade ou en carrière, juste la laisser libre de trotter, c'est une super récompense pour elle. 
Aussi parfois je me rend compte qu'elle n'a pas du tout envie de mouvement et qu'elle vie sa meilleure vie juste en broutant, ou à faire que des exercices de clicker à l'arrêt, c'est aussi des temps de partage très importants, une façon de lui apporter ce dont elle a envie à l'instant T. 

J'ai d'ailleurs commencé le clicker quand elle était blessée et enfermé au box, donc sans possibilité de mouvements. Il y a une infinité de mouvements et de codes en RP qu'on peut leur apprendre sans bouger un sabot. 


Dans les bases pour commencer le clicker je suis totalement l'approche d'Hélène Roche :

- l'intérêt de l'objet clicker est sans équivoque en précision et généralisation. J'ai longtemps utilisé le "oouuuuiii" vocal. C'est super, les chevaux sont super attentifs aux récompenses vocales, donc être démonstratif et de bonne humeur ils adorent. Attention tout de même à rester dans une attitude corporelle la plus neutre possible et à ne pas s'agiter partout, ça peut générer de l'incompréhension et donc de l'énervement pour le cheval. 
Que ce soit le clicker ou le "ooouuuiii", le but est que le cheval associe un code sonore à la récompense. C'est le principe du clicker : le "click" ou le "clock" avec la langue ne veulent rien dire pour le cheval au début, il faut "charger" le clicker pour créer une association click = récompense. Donc au début on clique et on donne des friandises systématiquement après, mais attention pas n'importe comment ! Le premier exercice appris par le cheval est celui qui sera le plus ancré, donc qu'il va le plus ressortir "dans le doute".
L'inconvénient du "oouuuuiii" c'est que c'est long à dire, et parfois tu n'es pas dans la même humeur et ça se ressent. Le click (avec un clicker) ou le clock (avec la langue) sont plus précis et ne dépendent pas de ton humeur. Mais on peut garder le clock + le "oouuuiiii".

- toujours commencer par des exercices de politesse/immobilité : la statue. C'est le premier exercice qu'on fait pour charger le clicker : on clique quand le cheval se détourne de tes mains ou de ta sacoche, puis tu peux affiner, en clickant quand le cheval reste bien droit, bien figée, la tête dans son axe. Avoir comme exercice le plus ancré l'immobilité ou la "statue" est très pratique en toutes circonstances comme les méthodes. Tu peux complexifier en secouant la banane, agitant tes mains sous son nez, etc. ya pleins de variantes. De même si c'est déjà trop intense pour le cheval, tu peux faire ces exercices en "espace protégé" c'est à dire derrière une barrière si le cheval est trop intense.

- ensuite c'est bien d'aborder rapidement une cible : le cheval doit toucher la cible (une bouteille de lait au bout d'un stick par exemple) avec son nez généralement. Il faut bien retirer la cible du champs de vision du cheval après avoir cliqué. En effet, le cheval doit comprendre que c'est son action de toucher la cible qui génère la récompense, et s'il l'a toujours en vue, il risque de s'emmêler les pinceaux et ne pas bien comprendre s'il doit encore interagir avec la cible ou non. 
Il y a énormément de variantes possibles et ça permet très vite d'orienter le cheval, c'est très pratique ! Tu peux lui apprendre à marcher, tourner, reculer, rester immobile (rester le nez coller de plus en plus longtemps sur la cible). Tu peux aussi apprendre à toucher la cible avec une autre partie de son corps : les fesses pour les aspirations, les épaules, les pieds pour donner les pieds, etc. Tu peux aussi apprendre des cibles au sol avec un tapis que tu peux ensuite mettre dans un van par exemple. etc. C'est infini !

- bien avoir un marqueur de fin et de début des séances de clicker. Avoir un cheval qui propose 150 trucs à la seconde au pansage c'est pénible pour eux comme pour nous. De la même façon que les chevaux qui ressortent la jambette à tout bout de champs. Par exemple avoir une banane de friandises que tu mets que pour la séance de clicker ou finir la séance par un "jack pot" : une récompense spéciale ou pleins de récompenses d'un coup et après c'est fini !

- la règle des 3D : ne changer qu'un seul paramètre à la fois : soit la Distance, soit la Durée, soit la Difficulté. Ca marche aussi en RN ceci dit.
 

Sur Val par exemple j'ai commencé par l'immobilité, elle est super là dessus, même en TREC on s'en sert (j'ai détourné l'exo de politesse, je secoue ou farfouille dans ma poche ou ma banane, elle sait qu'elle ne doit pas bouger, même à 10m, même à cheval). Le bisous aussi c'est top (la cible c'est ton visage que le cheval doit toucher avec son nez). Elle connait aussi la cible avec mon poing fermé à toucher avec le nez, très très pratique au quotidien pour tout + "la main magique" elle colle n'importe quelle partie de son corps quand je tends la main et j'écarte les doigts, tu peux faire du mener avec la main qui reste coller à l'épaule par exemple, ou juste la faire reculer à distance. 

La supériorité du RP c'est surtout pour les soins, c'est d'ailleurs la raison pour laquelle il a été inventé dans les zoo. Le "medical training" est un domaine à part entier du clicker. 

Que ça soit les soins courants, Val a appris à donner les pieds en RP : elle levait le pied en touchant ma main ouverte donc comme cible + code vocal après on rajoute la durée, etc. Elle mets aussi les pieds sur le trépied seule pour le parage (pareil le trépied est la cible). Quand je la pare, je mets un seau vide devant elle et je donne la récompense dans le seau pour ne pas qu'elle bouge. Ce mode de distribution dans un seau est très pratique quand tu travaille sur la distance par exemple.

Mais aussi les soins médicaux, avec son asthme Val subit tout un tas d'actes médicaux à base de piqures de désensibilisation, d'inhalations de ventoline, de soins des yeux, etc. 
Les inhalations dans le masque pour bébé est vraiment l'exercice le plus difficile qu'elle ait appris en RP. En effet la Ventoline et la cortisone la soulage immédiatement quand elle respire mal et nous évite des injections compliquées et douloureuses. Le maque est la cible : elle doit coller sa narine dans la chambre de respiration + souffler dedans. Sans clicker impossible de faire ce soin, je dois tenir le masque d'une main et boucher l'autre narine de l'autre, donc je ne peux pas la tenir. 

Elle a aussi appris les soins des yeux de la même façon : le flacon de soin est la cible et elle doit approcher elle même l'œil (avec ses allergies elle a souvent des irritations oculaires donc je lui met de la crème à la vitamine A hydratante dans les yeux).

Enfin les piqures de désensibilisations que je dois faire tous les mois se font aussi en liberté. Là je suis partie d'une statue (pareil je suis seule, elle ne doit pas bouger), elle sait maintenant dès que je mets le désinfectant qu'elle ne doit pas bouger jusqu'au "click" de fin d'injection. A noter les injections de désensibilisation sont en sous-cutanées donc beaucoup moins douloureuses que celles en musculaires ou en intra-veineuse.