Ma Photo

En exergue :

  • Frank Ramsey, "Truth and Probability" (1926)
    The highest ideal would be always to have a true opinion and be certain of it; but this ideal is more suited to God than to man.
  • Jules Bertaut, "1848 et la Seconde République" (1937)
    L'enthousiasme est pour rien chez nous : aussi les Français, peuple avare par excellence, le répandent-ils avec une générosité qui n'a d''egale que leur versatilité.
  • Turgot, lettre à Du Pont (1773)
    C’est au public lisant et réfléchissant qu’il faut parler, c’est à lui qu’il faut plaire, lui et lui seul qu’il faut persuader ; toutes les flagorneries aux gens en place, tous les petits détours dont en s’enveloppe pour ne pas les choquer sont une perte de temps écartant du vrai but et ne réussissant même pas à faire sur eux l’impression qu’on s’est proposée.

Recherche Google


Inscrivez-vous à ma newsletter

Powered by
FeedBurner

Blogs recommandés

Blog powered by Typepad

Merci à StatCounter


« Je suis horrifié ! | Accueil | Pour servir »

Commentaires

luc

je doute que beaucoup de bacheliers puissent suivre cette brillante demonstration...!
plus serieusement, il serait interessant de mentionner les marches de predictions, qui n'attirent que peu d'interet dans les medias francais bizarrement.
cf. www.tradesports.com (ou les volumes ne sont pas tres important helas)
et http://www.easyodds.com/compareodds/specials/politics/
Justin Wolfers a recemment ecrit plusieurs articles suggerant que ces marches fournissent des bonnes predictions.

Jacques Cremer

Bernard, la traduction de "for dummies" est "pour les nuls". Si tu ne sais même pas ça, c'est que tu as vraiment passé trop de temps à l'étranger et que tu devrais vraiment revenir au pays; pourquoi pas à Toulouse?

Kaem

Il existe une collection équivalente des "for Dummies" en France, qui s'appelle "pour les Nuls". Faudrait changer votre titre... Sinon merci pour cet excellent article, moi qui avais toujours cru que si "en niveau" les sondages ne voulaient pas dire grand chose, "en tendance" on pouvait voir le rapport de force.

tommy

Dans votre démonstration mathématique, vous oubliez le rapport à la réalité.
Les instituts ont 2 manières de sonder :
1) le tirage aléatoire de 1000 personnes, qui n'est pas utilisé car on a pas de liste de la population, et si on doit joindre les types jusqu'à ce qu'ils répondent, on est pas sorti de l'auberge.
Sur cette méthode, la loi des grans nombres s'applique.

2) la méthode des quotas. L'institut a des quotas par couche socioprofessionnelles, et ils appellent. Les gens sont interchangeables. C'est la méthode courante.
Il y a des biais dans la conception du quota, le mensonge etc...
Mais on ne peut pas calculer de marge d'erreur au sens strict. Et donc les 3-4 % ne sont pas issus d'un calcul de variance, mais du pifomètre et de l'expérience.

salaniephile

Merci Bernard de ce billet en réponse à mon dernier message.

Ta démonstration est très éclairante, mais permets-moi de te relancer avec quelques interrogations:

Quid des non réponses?
- Les résidents à l'étranger (1 million d'électeurs, désolé je radote un peu, pourtant je crois ne pas encore être sénile) votent très différemment du reste de la population (Le Pen en dessous de 7% en 2002 par exemple). Les sondeurs les ont-ils inclus dans leur plan de sondage? J'en doute. Mais j’avoue pinailler un peu, on parle ici de moins de 3% des électeurs.
- Les enquêtes sont très fréquemment (toujours?) faites par téléphone. Mais certains sont plus souvent absents de leur domicile que d'autres (comme ceux qui voyagent beaucoup et qui me font penser à la catégorie précédente, a contrario les inactifs, travailleurs à domicile, enseignants sont probablement plus fréquemment à leur domicile à l'heure d'appel des enquêteurs), je ne sais pas si les quotas choisis compensent bien ces effets de sélection. 13% des français n'ont pas de téléphone fixe http://www.insee.fr/fr/ffc/chifcle_fiche.asp?ref_id=NATSOS05106P&tab_id=465 et je doute que les français sur liste rouge soient interrogés. De plus, une fraction (que j'ignore) des sondés va décliner la demande au téléphone.
Ipsos ( http://www.ipsos.fr/CanalIpsos/cnl_static_content.asp?rubId=35#02 ) avoue ne pas faire d'effort auprès des non-répondants en présentant la méthode des quotas comme la solution miracle, est-ce satisfaisant? Je présume qu'il s'agit d'un sondeur représentatif :=) , qu'il ne soit pas vu ici une attaque contre un institut en particulier.
Supposer que tous ces non-répondants auraient une réponse analogue aux répondants me parait contestable. Et corriger du biais de sélection est ardu, car il faudrait des informations sur le comportement de vote des non-répondants (on peut penser à des informations sur une précédente élection analogue), à moins que tu n'aies une idée de méthode plus astucieuse.

Pire, il est notoire que des sondés mentent (pour ne pas avouer qu'ils comptent s'abstenir, voter Le Pen...).
Les paramètres utilisés pour le redressement sont eux-mêmes des variables aléatoires entachées d'erreur, comment le prendre en compte? Par-dessus le marché, ces paramètres fluctuent vraisemblablement au cours du temps, et on ne peut les caler que lors d'une élection analogue. Est-il moins ou plus honteux d’avouer qu’on vote Le Pen sachant 2002 ? Difficile à dire.

Ton écart-type est celui d'un sondage aléatoire simple (SAS). La méthode des quotas n'aurait-elle donc rien apporté? Je sais bien qu'on ne connaît pas l'écart-type dans le cas de la méthode des quotas, mais ne serait-elle pas plus proche d'un sondage stratifié que d'un SAS?

A partir du résultat 27,5/23,5, au lieu de te ramener à 54/46, je te propose le raisonnement suivant pour discuter de marge de 4% annoncée par TV5. On peut s’intéresser à la précision du résultat de Sarkozy pris isolément (comme si on demandait: votez-vous Sarkozy ou votez-vous pour un autre candidat?), alors la variance devient p(1-p)/n=0.275*(1-0.275)/1000=0.0002, soit un intervalle de confiance (au seuil que tu utilises dans ton billet) de plus ou moins 2,8%. Si on ajoute les risques de biais (ne devrait-on pas d'ailleurs parler ici d'erreur quadratique?), les erreurs liées au redressement, les 4% annoncés par TV5 (je comprends plus ou moins 4%) ne me paraissent pas invraisemblables.

Tout ceci sans compter que les commentateurs mettent souvent l'accent un ou deux résultats du dernier sondage, en en omettant d'autres (que penser du Figaro qui a fait une une sur les bons sondages de Sarkozy et qui n'a pas fait l'équivalent lors de la montée plutôt rapide de Bayrou...)

On peut également s'interroger sur l'effet autoréalisateur (on ne va pas voter pour tel candidat car on sait qu'il n'a que très peu de chance de victoire) des sondages. La théorie des jeux nous éclairent-elles sur le lien entre nos choix de votes et nos croyances sur les résultats? Si l'effet autoréalisateur est important, un résultat sorti par hasard "en haut de fourchette" peut alimenter une hausse qui peut s'auto-entretenir. Phénomène qui me rappelle Napoléon: "Dans tout ce qu'on entreprend, il faut donner les deux tiers à la raison et l'autre tiers au hasard. Augmentez la première fraction, et vous serez pusillanime. Augmentez la seconde, vous serez téméraire."

Bernard Salanie

* titre corrigé plus haut...
* tommy : l'experience et le pifometre, c'est aussi une methode (peut-etre aleatoire). Le pifometre tient de "que puis-je annoncer tout en restant credible et sans decourager les clients"? L'experience, c'est apprendre du passe, un probleme statistique typique. Il vaut mieux le faire de maniere methodique. Si vous voulez dire que les sondeurs annoncent n'importe quelle marge d'erreur, 1) je ne crois pas que ce soit vrai 2) peu me chaut : je voudrais expliquer ce qu'ils devraient faire, pas ce qu'ils font, qui a beaucoup moins d'interet !
* salaniephile : j'ai effectivement mes doutes sur la couverture/representativite de ces echantillons. Et bien sur, la marge d'erreur sur le vote sur Sarkozy est plus faible que celle sur la difference de votes entre Sarkozy et Royal, et cette derniere depend de l'existence ou no d'autres candidats. Sauf erreur, si p est la proportion de sarkozystes et q celle de royalistes, avec p+q<=1 bien sur, les variances sont

Pour le vote sarkozyste : p(1-p)

Pour le "spread" S-R : p(1-p)+q(1-q)+2pq.

(Remarquons au passage que si le spread est positif, alors la marge d'erreur est maximale quand il s'agit d'un duel, p+q=1.)

* les marches de prediction m'interessent beaucoup, professionnellement. Voir les cotes actuelles sur Betfair :

http://lite.betfair.com/Market.do?s=0000095864458x1z#marketinfo

tommy

Point du tout, je ne voulait pas dire que ce que vous supposez sur la marge d'erreur.

Simplement que la méthode aléatoire pour laquelle s'applique la loi des grands nombre n'est jamais utilisée, et que par conséquent on ne SAIT pas calculer la marge d'erreur des sondages.
Certains sondeurs dénie même le concept de marge d'erreur pour les sondages, vu qu'ils sont fait par quota.

Quand je disait pifomètre, j'entendais "expérience", bien sûr. Je ne suis pas de ceux qui jettent la pierre aux sondeurs.
Je voulait juste exprimer que les théories mathématiques de l'aléatoires sont interessantes à connaïtre, mais ne s'appliquent pas à ce cas précis :)

FrédéricLN

@ tommy sur les quotas (qui empêcheraient de calculer des marges d'erreur) : ce que vous écrivez là est souvent écrit mais faux. Cf. la discussion sur le blog de Thierry Vedel :
http://vedel.blogspot.com/2007/03/les-sondages-politiques-ct-cuisine-la.html

@ Bernard Salanié : la formule sur la variance de (p-q) me semble juste mais je ne comprends pas comment elle peut donner, *au 1er tour*, le double de la marge d'erreur sur chacun des scores. Il s'agit ici, non de questions différentes sur un même échantillon (plus ou moins corrélées, éventuellement r=0) mais de réponses alternatives à une QCM (r<0). Pas le temps de refaire le calcul tout de suite, désolé.

L'utilisation des commentaires est désactivée pour cette note.