Saltar al contenido

Población, muestra y muestreo

Las estadísticas giran en torno al estudio de los conjuntos de datos y, en esta lección, aprenderemos algunas de las principales diferencias entre los conceptos más concurrentes en dicha materia: población, muestra y muestreo. Además de obtener una información detallada sobre cada uno de ellos, encontrará un cuadro comparativo para que pueda lograr una mejor comprensión.

Población

Muestra

Muestreo

Definición La población se refiere a la colección de todos los elementos que poseen características comunes, que comprende el universo. Muestra significa un subgrupo de los miembros de la población elegidos para participar en el estudio. Proceso utilizado en el análisis estadístico para seleccionar elementos de muestra de una población
Incluye Todas y cada una de las unidades del grupo. Solo un puñado de unidades de la población. Es el proceso mismo para pasar de toda la población a solo un puñado de unidades.
Característica Parámetro Estadística Estadística.
Recopilación de datos Enumeración completa o censo Encuesta de muestra o muestreo A través de un muestreo aleatorio simple, o un muestreo sistemático.
Se centra en Identificar las características. Hacer inferencias sobre la población. Seleccionar elementos de una población para ser analizados.
Ejemplos Un profesor decide analizar el rendimiento de sus alumnos en el examen final de la materia. La población sería la totalidad de las notas de todos los alumnos (300). Siguiendo el mismo ejemplo, la muestra consistiría en tomar las notas de 100 de ellos y analizarlas (es decir, una fracción de la población). Los investigadores pueden usar métodos estadísticos para definir un intervalo de confianza alrededor de una media muestral

Qué es el muestreo

El muestreo es un proceso utilizado en el análisis estadístico en el que se toma un número predeterminado de observaciones de una población más grande. La metodología utilizada para tomar muestras de una población más grande depende del tipo de análisis que se realice, pero puede incluir un muestreo aleatorio simple o un muestreo sistemático.

Un método de muestreo es un procedimiento para seleccionar elementos de muestra de una población. El muestreo aleatorio simple se refiere a un método de muestreo que tiene las siguientes propiedades.

  • La población consta de N objetos.
  • La muestra consta de n objetos.
  • Todas las muestras posibles de n objetos tienen la misma probabilidad de ocurrir.

Un beneficio importante del muestreo aleatorio simple es que permite a los investigadores utilizar métodos estadísticos para analizar los resultados de la muestra. Por ejemplo, dada una muestra aleatoria simple, los investigadores pueden usar métodos estadísticos para definir un intervalo de confianza alrededor de una media muestral. El análisis estadístico no es apropiado cuando se utilizan métodos de muestreo no aleatorio.

Qué es una población

En estadística, el término «población» tiene un significado ligeramente diferente del que se le da en el habla ordinaria. No es necesario que se refiera solo a personas o a criaturas animadas: la población de Gran Bretaña, por ejemplo, o la población de perros de Londres. Los estadísticos también hablan de una población de objetos, eventos, procedimientos u observaciones, que incluyen cosas como la cantidad de plomo en la orina, visitas al médico u operaciones quirúrgicas. Una población es, por lo tanto, un conjunto de criaturas, cosas, casos, etc.

Aunque un estadístico debe definir claramente la población con la que está tratando, es posible que no pueda enumerarla exactamente. Por ejemplo, en el uso ordinario, la población de Inglaterra denota el número de personas dentro de los límites de Inglaterra, tal vez como se enumera en un censo. Pero un médico podría embarcarse en un estudio para tratar de responder la pregunta «¿Cuál es la presión arterial sistólica promedio de los ingleses de 40 a 59 años?» ¿Pero quiénes son los «ingleses» mencionados aquí? No todos los ingleses viven en Inglaterra, y los antecedentes sociales y genéticos de los que sí pueden variar. Un cirujano puede estudiar los efectos de dos operaciones alternativas para la úlcera gástrica. ¿Pero cuántos años tienen los pacientes? ¿De qué sexo son? ¿Qué tan grave es su enfermedad? ¿Dónde viven? Y así. El lector necesita información precisa sobre estos asuntos para extraer inferencias válidas de la muestra que se estudió a la población que se está considerando. Las estadísticas como los promedios y las desviaciones estándar, cuando se toman de las poblaciones, se denominan parámetros poblacionales. A menudo se denotan con letras griegas: la media de la población se denota por μ (mu) y la desviación estándar denotada por ς (sigma en minúsculas)

Qué es una muestra

Una población comúnmente contiene demasiados individuos para estudiar convenientemente, por lo que una investigación a menudo se limita a una o más muestras extraídas de ella. Una muestra bien elegida contendrá la mayor parte de la información sobre un parámetro de población en particular, pero la relación entre la muestra y la población debe ser tal que permita hacer inferencias verdaderas sobre la misma.

En consecuencia, el primer atributo importante de una muestra es que cada individuo de la población de la que se extrae debe tener una probabilidad no nula de ser incluido en ella; Una sugerencia natural es que estas posibilidades deben ser iguales. Nos gustaría que las elecciones se hicieran de forma independiente; en otras palabras, la elección de un tema no afectará la posibilidad de que se elijan otros temas. Para asegurar esto, hacemos la elección por medio de un proceso en el que solo el azar opera, como girar una moneda o, más generalmente, el uso de una tabla de números aleatorios. Una muestra así elegida se llama muestra aleatoria. La palabra «aleatorio» no describe la muestra como tal, sino la forma en que se selecciona.

Tomar una muestra satisfactoria a veces presenta mayores problemas que analizar estadísticamente las observaciones hechas en ella. Una discusión completa del tema está más allá del alcance de este artículo.

Antes de extraer una muestra, el investigador debe definir la población de la que procede. A veces, él o ella pueden enumerar por completo a sus miembros antes de comenzar el análisis; por ejemplo, todos los hígados estudiados en la necropsia durante el año anterior, todos los pacientes de 20 a 44 años ingresaron en el hospital con úlcera péptica perforada en los 20 meses anteriores. En estudios retrospectivos de este tipo, los números se pueden asignar en serie desde cualquier punto de la tabla a cada paciente o muestra. Supongamos que tenemos una población de tamaño 150 y deseamos tomar una muestra de tamaño cinco. contiene un conjunto de dígitos aleatorios generados por computadora dispuestos en grupos de cinco. Elija cualquier fila y columna, diga la última columna de cinco dígitos. Lea solo los primeros tres dígitos y baje la columna que comienza con la primera fila. Por lo tanto, tenemos 265, 881, 722, etc. Si aparece un número entre 001 y 150, lo incluimos en nuestra muestra. Por lo tanto, en orden, en la muestra habrá sujetos numerados 24, 59, 107, 73 y 65. Si es necesario, podemos continuar en la siguiente columna a la izquierda hasta que se elija la muestra completa.

El uso de números aleatorios de esta manera es generalmente preferible a tomar cada paciente alternativo o cada quinto espécimen, o actuar en algún otro plan regular. La regularidad del plan puede coincidir ocasionalmente por casualidad con alguna regularidad imprevista en la presentación del material para el estudio, por ejemplo, mediante citas en el hospital de pacientes de ciertas prácticas en ciertos días de la semana, o muestras preparadas en lotes en de acuerdo con algún horario.

Como la susceptibilidad a la enfermedad generalmente varía en relación con la edad, el sexo, la ocupación, los antecedentes familiares, la exposición al riesgo, el estado de inoculación, el país en el que vivió o visitó, y muchos otros factores genéticos o ambientales, es recomendable examinar las muestras cuando se extraen para ver si son, en promedio, comparables en estos aspectos. El proceso de selección aleatorio tiene la intención de hacerlo, pero a veces puede ocasionar disparidades. Para evitar esta posibilidad, el muestreo puede estratificarse. Esto significa que inicialmente se establece un marco y los pacientes u objetos del estudio en una muestra aleatoria se asignan a los compartimentos del marco. Por ejemplo, el marco podría tener una división primaria en hombres y mujeres y luego una división secundaria de cada una de esas categorías en cinco grupos de edad, siendo el resultado un marco con diez compartimentos.

Es importante tener en cuenta que las distribuciones de las categorías en dos muestras formadas en dicho marco pueden ser realmente comparables, pero no reflejarán la distribución de estas categorías en la población de la que se extrae la muestra a menos que los compartimentos en el marco han sido diseñados con eso en mente. Por ejemplo, podrían admitirse números iguales en las categorías masculina y femenina, pero los hombres y las mujeres no son igualmente numerosos en la población general, y sus proporciones relativas varían con la edad. Esto se conoce como muestreo aleatorio estratificado. Para tomar una muestra de una larga lista, un compromiso entre la teoría estricta y los aspectos prácticos se conoce como una muestra aleatoria sistemática. En este caso, elegimos sujetos separados por intervalos en la lista, digamos cada décima asignatura, pero elegimos el punto de partida dentro del primer intervalo al azar.