|
Pierre CAM

Sociologie -
Droit du Travail, LESTAMP - Université de Nantes
Droits de
reproduction et de diffusion réservés ©
LESTAMP -
2005
Dépôt Légal Bibliothèque Nationale de France
N°20050127-4889 |
http://historial.univ-nantes.fr/annees2000_02.html
Etudiants
bruts, étudiants pondérés, étudiants théoriques
Etudiant débutant en sociologie, j’ai découvert cet
outil indispensable pour acquérir ce que Bachelard
nommait le sens du problème : le tri croisé..
Celui qui nous initiait alors avec méthode et rigueur à
lire les configurations sociales et leurs déterminations
était encore un tout jeune enseignant, et c’était
Jean-Paul Molinari. La base de l’outillage pédagogique
était constituée à cette époque par les tableaux issus
des Héritiers (Bourdieu et Passeron,1964). Quelques
décennies plus tard, notre participation commune à
l’Observatoire de la vie étudiante (OVE), nous a amenés
à « plancher » sur l’enquête réalisée par
l’Observatoire. Il nous a fallu découvrir ce que l’on
pourrait nommer en quelque sorte de nouvelles variétés
d’étudiants : les étudiants « bruts », « pondérés » et
« théoriques ». S’agissant de ces variétés, on ne peut
guère espérer en dresser une typologie même “précaire”
car ils ne relèvent a priori d’aucune des catégories
sociologiques de la mosaïque estudiantine (Molinari,
1992). Etudiants créés pour les besoins de la cause
statistique, ces étudiants n’ont d’autre réalité que
celle des fichiers et des feuilles de calcul. Cependant
parce qu’ils sont à la base même de tout travail qui
vise à catégoriser et à quantifier les mondes étudiants,
ils ne peuvent être ignorés dans leur diversité même.
De fait la question portant sur la nature des individus
dénombrés dans les tris croisés est d’autant moins
triviale qu’elle constitue le plus souvent le noyau dur
des critiques adressées aux sondages. Il en va ainsi
pour la distinction entre répondants et non-répondants.
« Eliminer les non-réponses, c’est faire ce qu’on fait
dans une consultation électorale où il y a des bulletins
blancs ou nuls, écrit Pierre Bourdieu, c’est imposer à
l’enquête d’opinion la philosophie implicite de
l’enquête électorale » (Bourdieu, 1973). Cependant ces
rappels à l’ordre épistémologique adressés aux sondeurs
de tout bord ne sont pas toujours suivis d’effet dans
une pratique sociologique qui doit elle-même compter
avec ses propres non-répondants et l’état des techniques
informatiques dont elle dispose. Ainsi, les tableaux
publiés dans Anatomie du goût (Bourdieu, 1976) sur les
goûts et les pratiques culturelles des différentes
classes livrent des pourcentages calculés - faute de
mieux - en excluant les non-réponses. De fait, la
nécessité de comparer les données ou de se plier aux
règles de la représentativité statistique est
corrélative à des exclusions, des pondérations, des
normalisations qui constituent autant d’avatars du
répondant de base. Quel étudiant trouve-t-on en
définitive dans les marges des tableaux croisés des
sociologues d’hier et d’aujourd’hui ? Il n’existe pas de
réponse unique à cette question et les notes
méthodologiques en marge des publications ne permettent
pas toujours de conférer un véritable « statut » aux
étudiants dénombrés. En partant de l’enquête OVE, on
tentera d’esquisser un portrait statistique de ces
anonymes.
De l’étudiant
“réel” à l’étudiant “brut”
Niché dans les lignes des fichiers qui servent à
produire les analyses ultérieures, il y a ce que l’on
peut appeler l’étudiant “brut”. C’est un étudiant
statistiquement “non redressé”, c’est-à-dire d’un strict
point de vue technique, une unité à laquelle
l’instruction “weight pond"[1] n’a pas été appliquée.
Étudiant
de base, c’est celui qui a répondu au questionnaire
postal ou se trouvait présent en TD au moment de la
passation de l’enquête. A ce stade du traitement,
l’étudiant OVE ne diffère guère de l’étudiant des
Héritiers. Mais l’étudiant brut n’est pas pour autant
l’étudiant “réel”. S’il n’est pas encore élaboré
statistiquement, l’étudiant “brut” est déjà un avatar de
l’étudiant interrogé. Les réponses de celui-ci ont en
effet été l’objet d’un certain nombre d’épreuves et de
tests de cohérence auquel le jargon informatique confère
le nom de “toilettage” ou de “nettoyage”. L’étudiant
“réel” qui a répondu au questionnaire peut déclarer ses
sommes en anciens francs, confondre travail personnel et
durée des enseignements, déclarer une profession
parentale et des revenus sans aucune mesure, etc. Les
incohérences, les réponses manquantes et les omissions
sont l’apanage de l’étudiant “réel”, mais l’étudiant
“brut” lui perd tous ses droits à ces singularités. Son
système de référence doit être identique à celui de ses
congénères pour pouvoir figurer dans le fichier
d’enquête.
Le toilettage des fichiers implique la mobilisation de
méthodes relativement lourdes telle l’analyse des
correspondances multiples ou la régression logistique
que les progrès de la micro-informatique mettent
aujourd’hui à la portée des chercheurs en sciences
sociales mais qui étaient peu développées voire
inexistantes il y a trente ans. Pour estimer les
réponses manquantes, il existe désormais une panoplie de
méthodes(Grosbras,1987). Il en va ainsi pour la méthode
du Hot-deck qui consiste à dresser pour chaque variable
d’intérêt (montant des bourses, temps de travail
effectif, etc.) une sorte de portrait type du répondant
: sexe, âge, revenu des parents, étape du cursus, etc.
On peut alors situer le non-répondant dans un
environnement sociologique qui permette de prédire au
mieux la réponse manquante en fonction des
caractéristiques connues. La réponse manquante est alors
remplacée par celle d’un autre individu tiré
aléatoirement dans cette population sociologiquement
voisine.
L’étudiant
pondéré
L’étudiant “pondéré” est un étudiant “brut” qui a été
redressé. C’est le cas de l’étudiant OVE qui se
distingue en cela de l’étudiant de 1964 qui est un
« héritier » à l’état “brut”. Pondérer, c’est une des
manières de prendre en compte les non-répondants.
L’analyse des non-réponses même si elle constitue un
préalable épistémologique à toute production d’un
discours sur les enquêtés laisse subsister entièrement
la question de leur traitement ultérieur dans les
tableaux croisés. L’exclusion des non-réponses n’a pas
pour seul effet de produire l’illusion du consensus que
dénonce Bourdieu, elle fausse également l’interprétation
que l’on peut avoir des résultats de l’enquête. A cet
égard, les biais liés à l’exclusion des non-répondants
dans les différents calculs est d’autant plus important
que l’on agrège les répondants en classes ou en
catégories.
Un exemple permettra d’illustrer le biais introduit
dans un résultat lorsqu’on ne prend pas en compte le
taux de non-répondants. Supposons que l’on veuille
comparer les étudiants d’origine populaire aux étudiants
d’origine bourgeoise sous le rapport du travail salarié
à temps plein. Il est évident que pour produire cette
comparaison, il faut agréger des sous-populations dont
les taux de réponse sont extrêmement variables. Pour
simplifier volontairement les calculs, on ne retiendra
comme sous-populations que les garçons et les filles. La
proportion d’étudiants déclarant un travail salarié à
plein temps calculée sans pondération est la suivante :
Tableau 1
Catégories
|
Population
|
répondants
|
Salariés
|
% salariés
|
Filles père ouvrier
|
5000
|
3000
|
450
|
15,00%
|
Garçons père ouvrier
|
5000
|
1000
|
250
|
25,00%
|
Total origine ouvrière
|
10000
|
4000
|
700
|
17,50%
|
Filles père cadre
|
5000
|
2500
|
375
|
15,00%
|
Garçons père cadre
|
5000
|
2500
|
500
|
20,00%
|
Total origine supérieure
|
10000
|
5000
|
875
|
17,50%
|
Un
commentaire qui ne s’attacherait qu’aux catégories les
plus agrégées de ce tableau ne maquerait sans doute pas
de souligner l’identité du rapport au travail salarié
chez les enfants de cadre supérieur et chez les enfants
d’origine ouvrière. Mais, si l’on examine plus en détail
les cases du tableau, on note que les taux de réponse
varient très fortement au sein des populations composant
la catégorie ouvrière. Alors que les filles d’origine
ouvrière ont mieux répondu que l’ensemble, les garçons a
contrario se sont nettement abstenus. Plutôt que de ne
rien faire, ce qui est déjà appliquer un modèle
particulier, il est souvent préférable de pondérer les
réponses afin de corriger le biais introduit par les
non-répondants. La pondération sera d’autant meilleure
que les sous-populations distinguées au sein de
l’enquête seront pertinentes d’un point de vue
sociologique[2]. Techniquement la pondération consiste à
affecter à chaque individu un “poids” correspondant à
l’inverse du taux de réponse obtenu dans la “strate” à
laquelle il appartient[3]. Dans le tableau précédent, la
pondération des sous-populations conduirait à une
interprétation plus nuancée.
Tableau 2
Strates
|
étudiants bruts
|
pondération
|
étudiants pondérés
|
%
|
Filles père ouvrier
|
450
|
1,67
|
752
|
15,03%
|
Garçons père ouvrier
|
250
|
5
|
1250
|
25,00%
|
Total origine ouvrière
|
700
|
|
2002
|
20,02%
|
Filles père cadre
|
375
|
2
|
750
|
15,00%
|
Garçons père cadres
|
500
|
2
|
1000
|
20,00%
|
Total origine supérieure
|
875
|
|
1750
|
17,50%
|
L’étudiant théorique
L’étudiant “théorique” est en fait un étudiant “modèle”
ou plus exactement construit à l’aide d’un modèle. Il
peut remplacer « avantageusement » l’étudiant “brut” ou
“pondéré” dans tous les cas où l’on cherche à mettre en
évidence les effets de certaines variables sur les
pratiques sociales, et ce indépendamment des effets de
structure(Grignon et Gruel, 1999). En fait, la diffusion
à partir des années quatre-vingts d’outils statistiques
(modèles probit ou logit) permettant de réaliser sur des
variables qualitatives des régressions équivalentes à
celles pratiquées dans le domaine des sciences
expérimentales à contribuer à relancer le débat sur la
nature des sciences sociales (Passeron, 1991). L’une des
principales critiques adressées à ces méthodes concerne
l’artifice qui vise à produire des relations entre
variables hors de la configuration singulière où ces
variables interagissent.
La régression logistique invite en effet à raisonner sur
des relations théoriques qui sont inobservables dans la
réalité empirique où l’on ne peut jamais totalement
séparer les effets sociaux des effets de structure liés
au poids des différentes catégories dans une situation
historique donnée. L’oubli du contexte et
l’autonomisation des variables peut ainsi conduire à de
véritables “absurdités sociologiques” comme le souligne
Passeron. On en trouve maints exemples. Ainsi vouloir
comparer “toutes choses égales par ailleurs” l’insertion
des filles à l’insertion des garçons alors qu’ils ne se
situent pas sur les mêmes marchés du travail amène
inévitablement à produire des schèmes de compréhension
totalement artificiels pour ne pas dire stériles. La
littérature statistique nous a d’ailleurs habitués
depuis quelques années à ces fictions sociologiques à
l’usage des décideurs qui, sous l’apparence de la
scientificité, contribuent à légitimer des politiques
dites de “discrimination positive”.
Cependant les risques liés à l’utilisation sans contrôle
de la régression logistique ne doivent pas amener le
sociologue à se priver d’un outil qui au même titre que
le tableau croisé ou l’analyse des correspondances peut
lui permettre de réaliser ce “va-et-vient” nécessaire
entre la problématique et le terrain. Propulser la
régression logistique dans les cieux éthérés des débats
ultimes sur la nature des sciences sociales, c’est
prendre le risque d’autonomiser un outil hors du
contexte où il fait sens et où il doit être jugé, celui
de la pratique sociologique (Desrosieres,1996). La
modélisation peut être en effet un bon moyen pour se
prémunir contre les artefacts produits par certaines
corrélations empiriques mais aussi contre les intuitions
résultant d’une lecture hâtive des faits sociaux.
Réussissant mieux scolairement, les filles sont
proportionnellement plus « jeunes » que les garçons dans
le premier cycle de l’enseignement supérieur. Cette
réussite des filles est le plus souvent mise en rapport
avec une prime éducation qui leur conférerait en quelque
sorte des manières d’être et de faire scolairement
valorisées. Ces prédispositions expliqueraient à la fois
leur réussite et leur avance.
Toute co-occurrence n’est cependant pas une interaction.
L’âge est une variable ambivalente qui allie le social
et le biologique. Si l’on prend en compte cette dualité,
on peut proposer des interprétations qui isolent l’effet
de l’âge - comme construit social - de l’effet du sexe.
Les plus jeunes quel que soit leur sexe mais aussi les
étudiantes quel que soit leur âge seraient condamnés à
réussir parce que les espaces (classes préparatoires,
médecine, etc.) ou les marchés de l’emploi sur lesquels
ils entrent scolairement en concurrence sont plus
étroits. L’attitude adoptée vis-à-vis des études par les
filles viendrait donc moins de leur éducation que des
conditions extérieures d’une lutte pour la réussite
assimilable à celle que se livrent les plus « jeunes » -
garçons ou filles- pour accéder aux filières les plus
sélectives et s’y maintenir.
Pour tester un tel modèle, on peut prendre comme
indicateur de cette « tension » scolaire la
surconsommation de stimulants par les étudiants de
premier cycle ou des classes préparatoires au moment des
examens. La régression logistique confirme qu’il
n’existe pas d’interaction entre l’âge et le sexe[4] par
rapport à la prise de stimulants mais au contraire un
effet « âge » et un effet « sex-ratio ». D’une part
la prise de stimulant diminue au fur et à mesure que
l’étudiant de première année – quel que soit son sexe-
est plus âgé, d’autre part elle est plus
importante s’agissant des filles, et ce quel que soit
l’âge. Si on prolonge cette analyse en substituant à
l’âge, les conditions d’études (classes préparatoires,
université, cycle court, etc.) dont elles sont
corrélatives on aboutit à des conclusions identiques. Il
y a un effet classe préparatoire qui ne se réduit pas à
un effet sex-ratio.
Pour conclure, l’utilisation par le sociologue de
méthodes statistiques proches de celles utilisées par
les sciences de la nature ne devrait pas avoir pour
objectif de transformer les sciences sociales en
sciences expérimentales. Ceux qui voudraient le croire
ne pourraient qu’être déçus à terme par le peu de
résultats qu’ils obtiendraient en voulant agir sur telle
ou telle variable tout en oubliant le contexte
socio-historique où ces variables font sens. La
complexification des outils qui permettent de traiter
les enquêtes et l’élaboration successive à partir de
l’étudiant enquêté de figures statistiques toujours plus
éloignées de l’étudiant réel doivent à mon sens être
resituées dans le contexte d’une pratique sociologique
visant à rompre avec les prénotions plus que dans une
tentative à jamais vouée à l’échec de transformer la
sociologie en une « vraie » science.
A cet égard il faut se souvenir des mises en garde de
Durkheim sur l’observation des faits sociaux : «
l’homme ne peut vivre au milieu des choses sans s’en
faire des idées d’après lesquelles il règle sa conduite.
Seulement parce que ces notions sont plus près de nous
et plus à notre portée que les réalités auxquelles elles
correspondent, nous tendons naturellement à les
substituer à ces dernières et à en faire la matière même
de nos spéculations (…) S’il en est ainsi dans les
sciences naturelles, à plus forte raison en
devrait-il être de même pour la sociologie »
(Durkheim,1937). En s’éloignant de l’étudiant réel par
des méthodes d’objectivation statistiques empruntées aux
sciences de la nature, le sociologue quantitatif vise
moins à identifier les « bonnes » variables qui lui
permettraient d’agir sur le monde social qu’à s’élever
par l’analyse aux déterminations les plus simples et les
plus contrôlables. Il ne lui restera plus ensuite qu’à
refaire le chemin à rebours jusqu’à l’étudiant réel,
celui-ci n’étant plus une « représentation chaotique
d’un tout mais une riche totalité de déterminations »(K.
Marx,1957).
Pierre Cam
Droits de
reproduction et de diffusion réservés ©
LESTAMP -
2005
Dépôt Légal Bibliothèque Nationale de France
N°20050127-4889
Bibliographie
G.Bachelard, La formation de l’esprit
scientifique, Paris, Librairie Philosophique J.Vrin,
1980.
P.Bourdieu, L’anatomie du goût, Actes de la recherche
en sciences sociales, n°5, octobre 1976.
P.Bourdieu, L’opinion publique n’existe pas, Les
temps modernes, 318, janvier 1973,pp.1292-1309.
P.Bourdieu et J.-C. Passeron, Les Héritiers, Paris, Les
éditions de Minuit, 1964.
P.Cam et J.P. Molinari, Les parcours des étudiants,
Paris, La documentation française, 1998.
A.Desrosières, Les rapports mutuels de la méthodologie
statistique et de la sociologie, Journées de
méthodologie statistique, 11 et 12 décembre 1996, INSEE.
E.Durkheim, Les règles de la méthode sociologique,
Paris, P.U.F, 1937.
C.Grignon et L.Gruel, La vie étudiante, Paris,
P.U.F,1999.
J.-M. Grosbras, Les réponses manquantes, in Les
sondages, Paris, Economica, 1987.
S.Haberman, Analysis of qualitative data, London,
Academic Press, 1976.
K. Marx, Contribution à la critique de l’économie
politique, Paris, Editions sociales, 1957.
J.-P. Molinari, Les étudiants, Paris, les Editions
ouvrières, 1992.
J.-C. Passeron, Le raisonnement sociologique, Paris,
éditions Nathan, 1991.
Annexe
Les déterminants de la surconsommation de stimulants en
fonction de l’âge et du sexe
|
Prise de stimulant
|
Constante (garçon âgé de 19ans et plus)
|
14,5%
|
Effet sexe
|
|
Fille
|
24,1%
|
Garçon
|
ref
|
Effet âge
|
|
17 ans et moins
|
19,8%
|
18 ans
|
16,2%
|
19 ans et plus
|
ref
|
Ce
tableau est issu d’une régression logistique opéré sur
les étudiants du premier cycle et des classes
préparatoires. L’âge de référence est l’âge au moment du
baccalauréat. Pour opérer les calculs et neutraliser les
effets de structure, on choisit un variable de
référence : ici les garçons âgés de 19ans et plus.
|
|