Cours : Apprentissage direct : Conditionnement et Habituation



Quand un organisme (entendons par là, un système organique doté de capacités d'adaptation) est placé plusieurs fois dans une même situation, il modifie sa conduite de façon systématique et relativement durable. Cela correspond à acquérir des connaissances sur le monde qui nous entoure, ou à modifier ces connaissances - souvent dans le but volontaire ou non, d'améliorer son adaptation et l'adéquation de ses comportements futurs (anticipation).

L'apprentissage correspond ainsi précisément à une 
"Modification de la capacité d'un individu à réagir à un stimulus ou à effectuer une action, suite à l'interaction avec l'environnement ou une restructuration cognitive.
C'est là l'essence d'un apprentissage : ce n'est pas la capacité à réagir (qui relève plutôt de l'adaptation), mais la modification de cette capacité, généralement dans le sens d'une amélioration de cette capacité à réagir en face d'une situation similaire à celle au cours de laquelle a eu lieu l'apprentissage. 

Deux origines lui sont liées, bien que strictement, ces deux origines soit un seul et même phénomène. La restructuration cognitive - c'est-à-dire le fait de réfléchir (pour un organisme doté de raisonnement) permet d'apprendre rien que par la réflexion. C'est une forme évoluée d'interaction à l'environnement (puisque les bases sur lesquelles on réfléchit sont elles-mêmes issues de l'environnement). L'apprentissage nait donc de la réflexion ou de l'interaction directe avec l'environnement, et modifie notre façon de réagir à des interactions futures.

Certains apprentissages se font donc de manière directe, par l'expérience et l'interaction à l'environnement. D'autres se font de manière indirecte par l'observation ou l'enseignement...

Apprentissage par expérience directe : (théorie comportementale, béhavioriste)

L'apprentissage par expérience directe est l'apprentissage suite à la confrontation directe avec l'environnement. Ce type d'apprentissage a été défini très tôt dans l'histoire de la psychologie, en constituant l'un des premiers sujets de prédilection du Béhaviorisme, mais également, par la suite, en psychologie du développement. Il existe 3 principaux types d'apprentissage direct :

Habituation

C'est une baisse progressive de l'intensité d'une réaction à mesure que se répète une stimulation dans le temps, sans que cette baisse soit due à la fatigue. Cela commence dès la première présentation d'un objet : quand on le perçoit, puis que cette perception se réitère, notre réaction est d'abord vive, puis s'atténue, jusqu'à parfois disparaître.

C'est par exemple le cas lorsque l'on déménage dans un environnement bruyant. Les premiers jours, le bruit empêche de dormir correctement, et l'on finit par s'habituer. De même, lorsque l'on rentre dans un environnement ayant une odeur forte, l'habituation prend quelques dizaines de minute avant que l'on finisse par ne plus remarquer l'odeur - sauf quand on change à nouveau d'environnement! Certaines habituations sont plus rapides que d'autres. Il y a également des stimulations auxquelles on ne s'habitue pas (par exemple, le feu rouge : mieux vaut ne pas s'habituer aux stimulus qui ont justement pour but de provoquer une réaction!), en fait, on s'habitue surtout aux objets courants.

Conditionnement répondant ou pavlovien

Lorsqu'une stimulation visuelle ou auditive est associée à une stimulation neutre, il se produit une association (en fait, ce type d'apprentissage concerne également les autres sens, mais de manière moins reconnaissable). Le fameux chien de Pavlov avait ainsi appris à saliver lorsque retentissait une clochette - à force de l'entendre juste avant que lui soit donnée sa nourriture. Le chien salivait seulement avec la clochette, même si aucune nourriture ne lui était donnée. Dans ce dernier cas et après plusieurs fois, le chien finissait par ne plus saliver au son de la clochette seule, ce qui montre que l'on peut parfois "désapprendre" un comportement. Certaines thérapies sont basées sur ce principe : avant d'apprendre de nouveaux comportements adaptés, il faut parfois désapprendre les anciens comportements, inadaptés (par exemple, toxicomanie).

L'apprentissage n'est même pas forcément volontaire ou conscient, ni ne concerne exclusivement des capacités contrôlables! Des souris auxquelles on inflige une légère brûlure, avant de leur injecter un agent pathogène, finissent par développer une réaction immunitaire à l'agent pathogène suite à la simple brûlure (qui n'a rien à voir avec les agents pathogènes sur le plan immunologique!).

Conditionnement opérant ou skinnérien.

Le conditionnement opérant repose sur le principe de la carotte et du bâton : un stimulus agréable, du fait qu'il provoque du plaisir, entraîne en retour un renforcement du comportement qui en est l'origine (on a tendance à réitérer des comportements qui nous sont agréables!). A contrario, un stimulus désagréable provoque une aversion ou des conduites d'évitement : on a tout intérêt (et c'est même parfois inconscient) à éviter un objet ou une situation qui nous est désagréable. 

Skinner, l'un des grands chercheurs du siècle dernier, confectionnait des boîtes dans lesquelles il observait les réponses de petits animaux (le chercheur s'en est également pris à des bébés dans certaines expérientations qui ont soulevé quelques tollés...) à leurs propres comportements (et surtout aux conséquences de ces comportements!). Dans une boîte de Skinner, lorsque les conséquences d'un comportement anodin sont positives, on observe des répétitions de ces séquences comportementales, par exemple, des comportements de superstition : un rat qui vient de gagner sans s'en rendre compte un peu de bonne nourriture (par exemple, en abaissant inconsciemment un levier), refera exactement le même chemin qu'il a fait avant d'avoir eu sa pastille si délicieuse, histoire de voir comment il pourrait en avoir une autre...  De même pour nous : si quelque chose d'agréable nous arrive, nous allons tenter de comprendre comment c'est arrivé, pour reproduire cet effet.

Il y a apprentissage par récompense, et à l'inverse, il peut y avoir apprentissage par punition. Lorsque quelque chose de très désagréable nous tombe sur le tête, nous cherchons à l'éviter à l'avenir. De nombreux exemples historiques nous le montrent, en plus de nos expériences personnelles. L'aversion pour un comportement peut même aller jusqu'à la résignation acquise.

La résignation apprise (acquise) peut être due à ce comportement aversif. Richter a démontré par exemple, qu'un rat plongé dans l'eau (sans possibilité de sortie) lutte pendant une soixantaine d'heures avant de mourir de noyade et d'épuisement. Si on tient le rat au dessus de l'eau sans bouger puis qu'on le plonge, (de sorte qu'il voit bien avant d'être dans l'eau, qu'aucune sortie n'est possible) il ne lutte plus au bout de quelques minutes... Claques et bonbons font partie du conditionnement opérant. Des jetons gagnés, par exemple lorsque l'on effectue des tâches dans établissement pour délinquants, en constitue un exemple d'application. Les points fidélités des cartes Carrouf ou des téléphones portables, les prunes des agents de la paix... tout ceci constitue des récompenses ou des punitions destinées à stimuler votre apprentissage!
L'exemple de Hans le cheval en est une démonstration : Hans le cheval est un animal devenu célèbre au début du siècle dernier, car il avait, disait-on, la capacité de compter. Et effectivement, il surprenait les badauds lorsqu'on lui soumettait une opération, et lorsqu'il répondait en frappant le sol du sabot, exactement le nombre de fois correspondant au résultat de l'opération. Mais le truc était pourtant simple : Hans le cheval tapait du sabot, les spectateurs attendaient sans mot dire... et dès que le cheval atteignait presque le résultat, les spectateurs devenaient de plus en plus vigilants, et changeaient de posture dès le résultat atteint, tendant l'oreille et les yeux pour voir et entendre si le cheval n'allait pas faire un claquement de sabot de plus. Cette réaction à l'arrivée du résultat était tout ce dont avait besoin le cheval : il décelait ces modifications de comportement des humains alentours, à l'approche du résultat. Pourquoi et comment avait-il appris ce comportement? Tout simplement parce qu'après chaque bon résultat, le cheval recevait en récompense une petite douceur de foin ou de légume. Certes, le cheval "comptait". Mais il comptait avant tout sur les gens qui l'observaient!
Là encore, nombre sont les thérapies qui se fondent sur ce modèle d'apprentissage, de même que l'éducation, la justice, etc... avec une forme ou une autre de bâton et de carotte! 

Cours suivant : Apprentissage indirect