La méthode du renforcement positif

Faire son choix consciemment d’une méthode est une bonne chose mais encore faut il savoir et comprendre ce que l’on peut choisir ! (Je me suis aidé de quelques phrases du livre de Dianne Chrétien Click bonbon !) C’est un peu long mais comment faire court !
Ceci est un sujet ouvert et je serais heureux d’être rectifié si le cas se présente.

On distingue deux parties dans l'enseignement proprement dit du bon chien !

- L’éducation dans la vie de tous les jours (ce que nous admettons et ce qui n’est pas admis)
- le dressage du chien (placement d’un ordre sur un comportement).

Les expériences des scientifiques et l’expérience des hommes ont découverts et développés des théories applicables à l’homme mais également aux animaux, à nos chiens.
Ces éléments théoriques sont : les conditionnements positif et négatif, les renforceurs primaires et secondaires, les marqueurs de bons comportements et de mauvais comportements, les punitions positives et négatives, l’engouement au renforceur primaire, l’aversion à la sanction, l’évasion à la contrainte.




Le chien, cet opportuniste.

Il me paraît important de donner une définition exacte de l'opportunisme : attitude consistant à régler sa conduite selon les circonstances du moment présent, que l'on cherche à utiliser toujours au mieux de ses intérêts.
Tout un chacun cherche à augmenter son bien-être, le chien tout comme nous. Maintenant nous n’oublions pas non plus le facteur moral (l'état d'esprit du chien, s'il est anxieux, bien dans sa tête, joyeux, morose, malade..., s’il est jeune ou non...) et l'intelligence de celui ci. Celle-ci joue aussi un rôle dans le degré d'opportunisme de l'individu.
Le chien vit dans le moment présent, sans aucune préméditation, n'anticipant pas son comportement dans le futur. Il ne fait aucune projection à long terme ou à court terme mais uniquement dans le temps présent.

2 types de renforcement dans l’éducation canine :

- par le renforcement positif : il est obtenu par l’addition ( +) d’une stimulation ou d’un évènement agréable à la suite d’un comportement et qui augmente de ce fait les chances de voir celui-ci se représenter.
- par le renforcement négatif : il est obtenu par la suppression ( - ) d’une stimulation désagréable à la suite d’un comportement, augmentant de ce fait les chances de voir ce comportement se reproduire. Par aversion ou par évasion le chien obéit.
- aversion : (par évitement) le chien empêche un évènement désagréable de se produire en adoptant le comportement adéquat avant que l’évènement déplaisant ne survienne.
Exemples : le chien se tiendra loin de la clôture invisible afin d’éviter le choc électrique, le chien ne vient pas à l’appel de son maître afin d’éviter d’être grondé, le chien en laisse qui ne s’éloigne pas de son maître afin de ne pas être grondé.
- évasion : un évènement désagréable se produit jusqu’à ce que le chien adopte un certain comportement.
Exemples : le maître maintiendra une tension sur le collier jusqu’à ce que le chien se couche. Le klaxon de la voiture se fera entendre jusqu’à que le chien quitte la route.

2 types de punition dans l’éducation canine :

-par la punition négatif: est la disparition d’un comportement quand on cesse le renforcement. Pour obtenir l’extinction d’un comportement indésirable il suffit donc de cesser de renforcer ce comportement. C'est-à-dire de ne plus le faire suivre par une conséquence qui était auparavant agréable.
- par la punition positive : est l’opération qui consiste à ajouter un stimulus aversif, désagréable, en visant à diminuer ou à maintenir basse la probabilité que ce comportement apparaisse à nouveau en des circonstances similaires.

2 types de conditionnement dans l’éducation canine :

- par le conditionnement répondant : répond à un plus, la friandise, ou à un moins par aversion, par évasion.
- par le conditionnement opérant : le chien fait l’opération d’un bon comportement afin d’obtenir un plus.





Le marqueur de bons comportements : le marqueur de bons comportements est un outils indispensable que beaucoup de gens emploient dans la vie courante mais qui est très mal employé et même involontairement. C’est un renforceur secondaire ! Développons un peu cela :

Le renforceur :• Primaire : est quelque chose que le chien apprécie naturellement. Les principaux, la friandise, la nourriture, la main qui caresse, la voix qui caresse.
• Secondaire : est quelque chose que le chien apprend à apprécié et est toujours suivi d’un renforceur primaire. Pour l’humain cela peut être l’argent ! Un bout de papier ressemblant à bien d’autres mais qui peut lui fournir par l’échange de la nourriture. Cela peut être le mot gentil du patron qui signal que son ouvrier fait du bon travail. Ce dernier sait alors qu’il recevra sa paie et que le mois suivant il sera toujours dans l’entreprise. Pour le chien on le conditionne sur un bruit sonore le plus court et toujours le même. Cela peut être un « oui !, ya ! good, OK,… » Mais peut être également un claquement des doigts, de deux cuillères l’une contre l’autre, voir également des vibrations ou un gestuel pour le chien sourd ! Pour les chiens nous utiliseront un petit boîtier que l’on nome clicker émettant un double bruit, clic clac mais qui est cependant considéré comme étant un seul. Ce bruit code va résumer en ce bref moment « oui c’est bien ça que je veux que tu me présentes et tu va être récompensé pour ça ! » (Toujours suivi d’un renforceur primaire.)


De quoi se sert la méthode douce, naturelle (positive)?

• Du renforcement positif.
• Du conditionnement répondant avec un plus agréable.
• Du renforcement opérant.
• Du marqueur de bons comportements.




De quoi se sert la méthode traditionnelle (négative)?
Du renforcement négatif.
• Par aversion
• Par évasion

Du conditionnement répondant.
Du marqueur de mauvais comportements.
Du marqueur de bon comportement



Détaillons un peu tout cela pour ce qui est le dressage du chien et les apprentissages


La méthode douce, naturelle.

Le marqueur de bons comportements : le marqueur de bons comportements est un outils indispensable que beaucoup de gens emploient dans la vie courante mais qui est très mal employé et même involontairement. C’est un renforceur secondaire ! Développons un peu cela :

Le renforceur :
• Primaire : est quelque chose que le chien apprécie naturellement. Les principaux, la friandise, la nourriture, la main qui caresse, la voix qui caresse.
• Secondaire : est quelque chose que le chien apprend à apprécié et est toujours suivi d’un renforceur primaire. Pour l’humain cela peut être l’argent ! un bout de papier ressemblant à bien d’autres mais qui peut lui fournir par l’échange de la nourriture. Cela peut être le mot gentil du patron qui signal que son ouvrier fait du bon travail. Ce dernier sait alors qu’il recevra sa paie et que le mois suivant il sera toujours dans l’entreprise. Pour le chien on le conditionne sur un bruit sonore le plus court et toujours le même. Cela peut être un « oui !, ya ! good, OK,… » Mais peut être également un claquement des doigts, de deux cuillères l’une contre l’autre, voir également des vibrations ou un gestuel pour le chien sourd ! pour les chiens nous utiliseront un petit boîtier que l’on nome clicker émettant un double bruit, clic clac mais qui est cependant considéré comme étant un seul. Ce bruit code va résumer en ce bref moment « oui c’est bien ça que je veux que tu me présentes et tu va être récompensé pour ça ! » (Toujours suivi d’un renforceur primaire.)


• Le chargement du clicker : le chargement du clicker consistera à cliquer et récompenser gratuitement le chien successivement avec un espace temps irrégulier mais assez rapide. Un test sera effectué : le chien se distrait de nous, nous cliquons ! le chien se retourne cherchant à recevoir la friandise.
• Le jeu après chaque séance de travail : cela sera sa récompense final aussi bien pour le chien que pour le maître pour le travail acquit ensemble. Il marquera la fin de la période de travail.
• L’élimination du clicker : il se fera aléatoirement dès que l’apprentissage du comportement est fini. Dès que l’on aura mis l’ordre verbal et/ou gestuel sur le comportement. Le cliker sera remplacé par un mot précis tel que « bien, oui, OK, good, … » mais toujours le même. Il sera suivi d’un clic aléatoire suivi de la friandise.
• L’élimination de la friandise : se fera une fois que le clicker sera éliminé et également aléatoirement pour disparaître progressivement.


Trois façons d’obtenir un comportement :
• capturer un comportement : le chien offre naturellement le comportement sans que le maître intervient. Nous nous servirons du conditionnement opérant, le chien faisant l’opération de pour avoir ce qu’il apprécie. Cela peut être un assis mais également le chien qui va dans son panier, le chien qui fait pipi à un endroit souhaité par le maître, …
• leurrer un comportement : c’est amener le chien dans un comportement grâce à une friandise. Nous nous servirons du conditionnement répondant, le chien répond, suit la friandise. Cela peut être fait pour un assis, pour le faire tourner en rond, ou pour tout autres exercices de déplacement.

• façonner un comportement : c’est décomposer un mouvement en plusieurs petites phases simples progressant dans la difficulté qui mis bout à bout nous donnerons le comportement final. Un assis par exemple pourra être découpé en 4-5 phases de travail.

Le chien offre le comportement
• Sans ordre verbale : le maître doit arriver à ce que son chien lui offre le comportement sans parler, sans donner un ordre. Ordre verbal qu’il ne peut connaître dans son langage de chien !
• Sans ordre gestuelle : de même, le maître doit arriver à ce que son chien lui offre le comportement sans aucun signe, sans donner un ordre. Ordre gestuel qu’il ne peut connaître dans son langage de chien !
• Sans apport de parasite : parler, gesticuler, et même cligner des yeux peut être une distraction à sa concentration sur ce qu’il doit faire pour entendre son renforceur secondaire.

Introduction de l’ordre
• Après le comportement : le chien offre spontanément le comportement ! le nom de l’ordre lui sera donné une fois que le maître lui aura signifié par le clic que c’est bien cela qu’il cherche à faire exécuté à son chien et la friandise suivra. Dans l’ordre : clic « ordre » friandise. Progressivement le chien enregistrera l’ordre à son comportement.
• Avant le comportement : le chien a suffisamment entendu l’ordre après le comportement, alors le maître fera un test. Il appellera son chien et lui donnera son ordre. Le chien s’exécute.
• Qu’il soit verbal ou gestuel ou les deux : le chien associant très vite le langage gestuel qu’il est possible d’introduire directement les deux possibilité en même temps. Il peut entre apporté l’un ou l’autre après. Il peut même être changé pour un autre très facilement !

Travailler avec la règle des trois D : le principe même du clicker training est d’évoluer progressivement de quelque chose de relativement facile pour notre chien vers une difficulté extrêmement grande. Nous prendrons en compte trois difficultés que nous amènerons progressivement au chien dans l’exécution des différents comportements appris. La distraction, la distance, et la durée. Toutes trois sont aussi importantes que l »une de l’autre.
• Distraction : tout est sujet de distraction surtout pour un jeune chien. Un bruit, un papillon, le maître qui gesticule, un chat, un endroit qu’il ne connaît pas, … pour cela chaque apprentissage devra se faire sur un lieu apaisant pour le chien et ne lui fournissant aucune distraction. Ce lieu peut être le salon, la cuisine (si l’on n’y cuisine pas !), la chambre, … une fois que le chien exécute le comportement final il sera offert au chien de le concrétiser dans un environnement un peu plus distrayant et de plus en plus distrayant pour arriver à le faire sur le terrain d’éducation, voir sur le terrain d’un concours.
• Distance : pour un exercice qui requière une distance tel un reste, elle se fera progressivement étapes par étapes, en augmentant la distance en fonction de la réussite de l’exercice. Mais également en réduisant la distraction.
• Durée : de même la durée d’un comportement se fera progressivement étapes par étapes, en augmentant la durée en fonction de la réussite de l’exercice. Mais également en réduisant la distraction et la distance.

Chaque exercice en apprentissage doit être réalisé avec 100 % de réussite ! 95 % est un bon résultat. 80 % est un désastre et pourrait amener le chien à croire qu’il doit offrir un tout autre comportement. C’est pourquoi la règle des trois D est très importante. Si mon chien arrive à donner un assis sur ordre dans la distraction alors je dois travailler la durée très courte dans une distraction réduite. Augmenter la durée progressivement. Puis réduire cette durée en augmentant la distraction, ainsi de suite. Nous jouerons ainsi sur la distance entre le chien et son maître en réduisant la distraction, …


Auteur : Dianne Chrétien.
Ouvrage : Click bonbon
http://pages.infinit.net/clicker/

Réponses

  • rogerlebouledoguerogerlebouledogue Membre, Modérateur, Administrateur
    07:05 modifié
    As tu demandé l'autorisation du rédacteur de cet article avant de le prendre et de le mettre ici ? :?:

    Car, si pas d'autorisation, le post sera supprimé ;)

    Merci ;)

    @+.
  • 07:05 modifié
    As tu demandé l'autorisation du rédacteur de cet article avant de le prendre et de le mettre ici ? :?:

    Car, si pas d'autorisation, le post sera supprimé ;)

    Merci ;)

    @+.

    C'est un résumé fait par un éducateur canin de ma connaissance donc oui, j'ai sa permission.
  • rogerlebouledoguerogerlebouledogue Membre, Modérateur, Administrateur
    07:05 modifié
    Ok, alors tu as tout bien fais ! ;)

    C'est parce que nous aussi, sur le forum il y a quelques articles écrit par des membres, et je ne voudrais pas retrouver nos articles sur des sites, sans notre accord ... ;)

    Merci pour ton post ! ;)

    @+. :P
  • 07:05 modifié
    Ya pas de quoi :) .
  • BoxyBoxy Membre
    07:05 modifié
    c'est complet et chouette! merci!
  • CenzieCenzie Membre
    07:05 modifié
    Jsuis au boulot donc je vais m'imprimer ton article et le lire dans le métro ce soir! ;)

Ajouter un commentaire

Éditeur de texte riche. Pour modifier le style d'un paragraphe, cliquez sur l'onglet pour aller dans le menu de paragraphe. De là, vous pourrez choisir un style. Rien conserve le paragraphe par défaut. Un menu de formatage en ligne s'affichera quand vous sélectionnez le texte. Cliquez sur l'onglet pour rentrer dans ce menu. Certains éléments, tels que les codes d'intégration, les images, les indicateurs de chargement et les messages d'erreurs peuvent êtres insérés dans l'éditeur. Vous pouvez naviguer dessus en utilisant les flèches du clavier au sein de l'éditeur et les supprimer avec la touche supprimer ou la touche retour.