|
Vous pouvez trouver sur la page de statistique mondiale du site Pense Malin, que 720 personnes par heure meurent à cause du cancer pour l’année 2007 dans la monde (donnée recueilli le 24 Juillet 2007). La question est comment est ce que les éditeurs de ce sites ont pu savoir, est ce qu’ils ont parcourus la terre entière pour récolter ces données ? Au fait les mathématiques ont une branche qui s’occupe de ce genre d’information, c’est les statistiques, et toutes les sciences qui vont de pair avec elles. Dans ce genre de cas on parle plutôt d’inférence statistique, qui consiste à induire les caractéristiques inconnues d'une population à partir d'un échantillon issu de cette population. L'inférence statistique est donc un ensemble de méthodes permettant de tirer des conclusions fiables à partir de données d'échantillons statistiques. Les caractéristiques de l'échantillon, une fois connues, reflètent avec une certaine marge d'erreur possible celles de la population. L'analyse des propriétés de l'échantillon permet d'estimer certaines caractéristiques de la population, de déterminer la validité de ces estimations ou de certaines hypothèses. Trois éléments sont ainsi importants : l’échantillon, la population et la marge d’erreur.
L’échantillon est un ensemble d'individus extraits d'une population initiale. Pour être représentatif de la population initiale, l’échantillon doit d’abord être un ensemble de variables aléatoires dont on possède une réalisation supposée issue de tirages indépendants, ceci dans l’hypothèse qu’on fera une projection des informations recueillis sur la population. Le problème est alors de s’assurer que l’échantillon est réellement représentatif de la population globale, c’est ainsi qu’on fait entrer une autre notion, la marge d’erreur.
En statistiques, la marge d'erreur est une estimation de l'étendue que les résultats d'un sondage peuvent avoir si l'on recommence l'enquête. Par exemple, si pour une échantillon donnée vous avez posé une question qui va donner le résultat oui ou non et que cette fois 651 sur 1000 ont donné la réponse oui. Vous allez refaire le même sondage avec un autre échantillon constitué de 1000 autres individus, et vous avez obtenu une réponse de 634, le quel de ces deux enquêtes représentent vraiment la population globale ? C’est là qu’intervient la marge d’erreur, on pouvait peut être énoncer depuis le début que la marge d’erreur est de l’ordre de plus ou moins 50, ce qui donnerai 5%. Supposons que vous avez alors une population constituée au total de 10 000 individus, si vous vous basez sur le premier résultat, vous pouvez annoncer que 6510 individus sont pour le « oui » avec une marge d’erreur de plus ou moins 50, ce qui donnera entre 6460 et 6560. Plus la marge d'erreur est importante, moins on peut avoir confiance que les résultats du sondage sont proches des vrais résultats, et ainsi, de la réalité. Il est à noter que la marge d'erreur prend uniquement en compte l'erreur de l'échantillon. Pour un niveau de confiance de 99%, on est sûr à 99% que la vraie valeur se trouve dans la marge d'erreur de la valeur issue du sondage.
Vous pouvez trouver sur la page de statistiques mondiale du site Pense Malin, que 720 personnes par heure meurent à cause du cancer pour l’année 2007 dans la monde (donnée recueilli le 24 Juillet 2007). La question est comment est ce que les éditeurs de ce sites ont pu savoir, est ce qu’ils ont parcourus la terre entière pour récolter ces données ? Au fait les mathématiques ont une branche qui s’occupe de ce genre d’information, c’est les statistiques, et toutes les sciences qui vont de pair avec elles. Dans ce genre de cas on parle plutôt d’inférence statistique, qui consiste à induire les caractéristiques inconnues d'une population à partir d'un échantillon issu de cette population. L'inférence statistique est donc un ensemble de méthodes permettant de tirer des conclusions fiables à partir de données d'échantillons statistiques. Les caractéristiques de l'échantillon, une fois connues, reflètent avec une certaine marge d'erreur possible celles de la population. L'analyse des propriétés de l'échantillon permet d'estimer certaines caractéristiques de la population, de déterminer la validité de ces estimations ou de certaines hypothèses. Trois éléments sont ainsi importants : l’échantillon, la population et la marge d’erreur.
L’échantillon est un ensemble d'individus extraits d'une population initiale. Pour être représentatif de la population initiale, l’échantillon doit d’abord être un ensemble de variables aléatoires dont on possède une réalisation supposée issue de tirages indépendants, ceci dans l’hypothèse qu’on fera une projection des informations recueillis sur la population. Le problème est alors de s’assurer que l’échantillon est réellement représentatif de la population globale, c’est ainsi qu’on fait entrer une autre notion, la marge d’erreur.
En statistiques, la marge d'erreur est une estimation de l'étendue que les résultats d'un sondage peuvent avoir si l'on recommence l'enquête. Par exemple, si pour une échantillon donnée vous avez posé une question qui va donner le résultat oui ou non et que cette fois 651 sur 1000 ont donné la réponse oui. Vous allez refaire le même sondage avec un autre échantillon constitué de 1000 autres individus, et vous avez obtenu une réponse de 634, le quel de ces deux enquêtes représentent vraiment la population globale ? C’est là qu’intervient la marge d’erreur, on pouvait peut être énoncer depuis le début que la marge d’erreur est de l’ordre de plus ou moins 50, ce qui donnerai 5%. Supposons que vous avez alors une population constituée au total de 10 000 individus, si vous vous basez sur le premier résultat, vous pouvez annoncer que 6510 individus sont pour le « oui » avec une marge d’erreur de plus ou moins 50, ce qui donnera entre 6460 et 6560. Plus la marge d'erreur est importante, moins on peut avoir confiance que les résultats du sondage sont proches des vrais résultats, et ainsi, de la réalité. Il est à noter que la marge d'erreur prend uniquement en compte l'erreur de l'échantillon. Pour un niveau de confiance de 99%, on est sûr à 99% que la vraie valeur se trouve dans la marge d'erreur de la valeur issue du sondage.
Vous pouvez trouver sur la page de statistiques mondiales du site Pense Malin, que 720 personnes par heure meurent à cause du cancer pour l’année 2007 dans la monde (donnée recueilli le 24 Juillet 2007). La question est comment est ce que les éditeurs de ce sites ont pu savoir, est ce qu’ils ont parcourus la terre entière pour récolter ces données ? Au fait les mathématiques ont une branche qui s’occupe de ce genre d’information, c’est les statistiques, et toutes les sciences qui vont de pair avec elles. Dans ce genre de cas on parle plutôt d’inférence statistique, qui consiste à induire les caractéristiques inconnues d'une population à partir d'un échantillon issu de cette population. L'inférence statistique est donc un ensemble de méthodes permettant de tirer des conclusions fiables à partir de données d'échantillons statistiques. Les caractéristiques de l'échantillon, une fois connues, reflètent avec une certaine marge d'erreur possible celles de la population. L'analyse des propriétés de l'échantillon permet d'estimer certaines caractéristiques de la population, de déterminer la validité de ces estimations ou de certaines hypothèses. Trois éléments sont ainsi importants : l’échantillon, la population et la marge d’erreur.
L’échantillon est un ensemble d'individus extraits d'une population initiale. Pour être représentatif de la population initiale, l’échantillon doit d’abord être un ensemble de variables aléatoires dont on possède une réalisation supposée issue de tirages indépendants, ceci dans l’hypothèse qu’on fera une projection des informations recueillis sur la population. Le problème est alors de s’assurer que l’échantillon est réellement représentatif de la population globale, c’est ainsi qu’on fait entrer une autre notion, la marge d’erreur.
En statistiques, la marge d'erreur est une estimation de l'étendue que les résultats d'un sondage peuvent avoir si l'on recommence l'enquête. Par exemple, si pour une échantillon donnée vous avez posé une question qui va donner le résultat oui ou non et que cette fois 651 sur 1000 ont donné la réponse oui. Vous allez refaire le même sondage avec un autre échantillon constitué de 1000 autres individus, et vous avez obtenu une réponse de 634, le quel de ces deux enquêtes représentent vraiment la population globale ? C’est là qu’intervient la marge d’erreur, on pouvait peut être énoncer depuis le début que la marge d’erreur est de l’ordre de plus ou moins 50, ce qui donnerai 5%. Supposons que vous avez alors une population constituée au total de 10 000 individus, si vous vous basez sur le premier résultat, vous pouvez annoncer que 6510 individus sont pour le « oui » avec une marge d’erreur de plus ou moins 50, ce qui donnera entre 6460 et 6560. Plus la marge d'erreur est importante, moins on peut avoir confiance que les résultats du sondage sont proches des vrais résultats, et ainsi, de la réalité. Il est à noter que la marge d'erreur prend uniquement en compte l'erreur de l'échantillon. Pour un niveau de confiance de 99%, on est sûr à 99% que la vraie valeur se trouve dans la marge d'erreur de la valeur issue du sondage.
|