miércoles, 5 de diciembre de 2018
martes, 27 de noviembre de 2018
prueba de hipotesis para la media varianza y proporcion
RUEBAS DE HIPOTESIS PARA UNA PROPORCION Y DIFERENCIA DE PROPORCIONES.
En el subtema anterior se utilizaron procedimientos de pruebas de la hipótesis para medias. El concepto de la prueba de hipótesis también se puede utilizar para probar hipótesis en relación con datos cualitativos. Por ejemplo, en el ejemplo de las llantas (otra vez), el gerente de la fábrica de llantas quería determinar la proporción de llantas que se reventaban antes de 10 000 kilómetros.
En nuestro ejemplo, el gerente quiere que la calidad de las llantas producidas sea lo bastante alta para que muy pocas se revienten antes de los 10 000 kilómetros. Si más de un 8% de las llantas se revientan antes de los 10 000 kilómetros, se llegaría a concluir que el proceso no funciona correctamente. La hipóteis nula y alternativa para este problema se pueden expresar como sigue:
Ho: p .08 (funciona correctamente H1: p > .08 (no funciona correctamente).
El número de éxitos sigue un proceso binomial. No obstante, como ya se vio al esarrollar intervalos de confianza, si el tamaño de la muestra es lo bastante grande [np y n (1-p) 5], la distribución normal da una buena aproximación a la distribución binomial. La prueba estadística se puede expresar en dos formas, ya sea en términos de la proproción de éxitos en donde p = proporción de éxitos de la hipótesis nula o el número de éxitos Ambas formulas darán como resultado la misma respuesta exacta al problema. Ahora se determinará si el proceso funciona correctamente para las llantas producidas en el turno de día. Los resultados del turno de día indican que cinco llantas en una muestra de 100 se reventaron antes de 10 000 kilómetros. Para este problema, si se selecciona un nivel de significaión de .05, las regiones de rechazo y no rechazo se establecerían como se muetra en la figura Prueba de hipótesis de una cola para una proporción con nivel de significación de 5% y la regla de decisión sería Rechazar Ho si Z > + 1.654: de lo contrario no rechazar Ho. Con los datos que se tienen y entonces, -1.107 < + 1.645; por tanto, no rechazar Ho. La hipótesis nula no se rechazaría porque la prueba estadística no ha caído en la región de rechazo. Se llegaría a la conclusión de que no hay pruebas de que más del 8% de las lantas producidas en el turno de día se revienten antes de los 10 000 kilómetros.
En el subtema anterior se utilizaron procedimientos de pruebas de la hipótesis para medias. El concepto de la prueba de hipótesis también se puede utilizar para probar hipótesis en relación con datos cualitativos. Por ejemplo, en el ejemplo de las llantas (otra vez), el gerente de la fábrica de llantas quería determinar la proporción de llantas que se reventaban antes de 10 000 kilómetros.
En nuestro ejemplo, el gerente quiere que la calidad de las llantas producidas sea lo bastante alta para que muy pocas se revienten antes de los 10 000 kilómetros. Si más de un 8% de las llantas se revientan antes de los 10 000 kilómetros, se llegaría a concluir que el proceso no funciona correctamente. La hipóteis nula y alternativa para este problema se pueden expresar como sigue:
Ho: p .08 (funciona correctamente H1: p > .08 (no funciona correctamente).
El número de éxitos sigue un proceso binomial. No obstante, como ya se vio al esarrollar intervalos de confianza, si el tamaño de la muestra es lo bastante grande [np y n (1-p) 5], la distribución normal da una buena aproximación a la distribución binomial. La prueba estadística se puede expresar en dos formas, ya sea en términos de la proproción de éxitos en donde p = proporción de éxitos de la hipótesis nula o el número de éxitos Ambas formulas darán como resultado la misma respuesta exacta al problema. Ahora se determinará si el proceso funciona correctamente para las llantas producidas en el turno de día. Los resultados del turno de día indican que cinco llantas en una muestra de 100 se reventaron antes de 10 000 kilómetros. Para este problema, si se selecciona un nivel de significaión de .05, las regiones de rechazo y no rechazo se establecerían como se muetra en la figura Prueba de hipótesis de una cola para una proporción con nivel de significación de 5% y la regla de decisión sería Rechazar Ho si Z > + 1.654: de lo contrario no rechazar Ho. Con los datos que se tienen y entonces, -1.107 < + 1.645; por tanto, no rechazar Ho. La hipótesis nula no se rechazaría porque la prueba estadística no ha caído en la región de rechazo. Se llegaría a la conclusión de que no hay pruebas de que más del 8% de las lantas producidas en el turno de día se revienten antes de los 10 000 kilómetros.
miércoles, 10 de octubre de 2018
estimadores
Un estimador es un estadístico (una función de la muestra) utilizado para estimar un
parámetro desconocido de la población.
Por ejemplo, si se desea conocer el precio medio poblacional de un artículo (parámetro
desconocido) se recogen observaciones del precio de dicho artículo en diversos
establecimientos (muestra) pudiendo utilizarse la media aritmética de las observaciones
para estimar el precio medio poblacional.
Para cada parámetro pueden existir varios estimadores diferentes. En general, se elige
el estimador que posea mejores propiedades que los restantes, como insesgadez,
eficiencia, convergencia y robustez (consistencia).
El valor de un estimador proporciona una estimación puntual del valor del parámetro en
estudio. En general, se realiza la estimación mediante un intervalo, es decir, se obtiene
un intervalo parámetro muestral error muestral dentro del cual se espera se
encuentre el valor poblacional dentro de un cierto nivel de confianza. El nivel de
confianza es la probabilidad de que a priori el valor poblacional se encuentre contenido
en el intervalo.
SESGO:
Se denomina sesgo de un estimador a la diferencia entre la esperanza (valor esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un estimador sea insesgado o centrado, esto es, que el sesgo sea nulo para que la esperanza del estimador sea igual al valor del parámetro que se desea estimar. Por ejemplo, si se desea estimar la media de una población, la media aritmética de la muestra es un estimador insesgado de la misma, ya que la esperanza (valor esperado) es igual a la media poblacional.
Se denomina sesgo de un estimador a la diferencia entre la esperanza (valor esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un estimador sea insesgado o centrado, esto es, que el sesgo sea nulo para que la esperanza del estimador sea igual al valor del parámetro que se desea estimar. Por ejemplo, si se desea estimar la media de una población, la media aritmética de la muestra es un estimador insesgado de la misma, ya que la esperanza (valor esperado) es igual a la media poblacional.
chi-cuadrada
Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente especificada como el modelo matemático de la población que ha generado la muestra.
Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada (Ei=n·pi , donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o intervalo de valores según la hipótesis nula). El estadístico de prueba se basa en las diferencias entre la Oi y Ei y se define como:
Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la práctica se tolera un máximo del 20% de frecuencias inferiores a 5.
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadístico tomará un valor igual a 0; por el contrario, si existe una gran discrepancias entre estas frecuencias el estadístico tomará un valor grande y, en consecuencia, se rechazará la hipótesis nula. Así pues, la región crítica estará situada en el extremo superior de la distribución Chi-cuadrado con k-1 grados de libertad.
miércoles, 26 de septiembre de 2018
T-STUDENT
Con el seudónimo de estudiante (Student), William Sealy Gosset desarrolló la prueba t y la distribución t.1 Esta prueba se usa con frecuencia en las publicaciones médicas indexadas nacionales e internacionales y se han observado errores consistentes (The New England Journal of Medicine, Lancet y British Medical Journal).2
El objetivo de esta comunicación es plantear correctamente la prueba y distribución t. La distribución t es un conjunto de curvas estructurada por un grupo de datos de unas muestras en particular. La contribución de esta prueba, específicamente, es para comparar dos muestras de tamaño ≤ 30. La primera presunción es formular la hipótesis nula y la hipótesis alterna, que establece que no hay diferencias en la media de las dos muestras independientes y que de existir esta diferencia, sólo se debe al azar.3 Si la t calculada que se origina de las dos muestras es desmesurada (valor de p que se encuentra en las tablas respectivas), entonces se rechazaría la hipótesis nula (error tipo I). Es importante mencionar que este valor depende del valor de significancia establecido con anterioridad de lo que se quiere probar,4 para la diferencia entre las medias de las dos muestras. Este valor de significancia es la probabilidad de rechazar erróneamente la hipótesis nula.
jueves, 6 de septiembre de 2018
distribución muestral de la diferencia de medias de medias
Suponga que se tienen dos poblaciones distintas, la primera con media m1 y
desviación estándar s1, y la segunda con media m2 y desviación estándar s2. Más
aún, se elige una muestra aleatoria de tamaño n1 de la primera población y una
muestra independiente aleatoria de tamaño n2 de la segunda población; se
calcula la media muestral para cada muestra y la diferencia entre dichas medias.
La colección de todas esas diferencias se llama distribución muestral de las
diferencias entre medias o la distribución muestral del estadístico x1-x2.
La distribución es aproximadamente normal para n1³30 y n2³30. Si las
poblaciones son normales, entonces la distribución muestral de medias es
normal sin importar los tamaños de las muestras.
jueves, 30 de agosto de 2018
teorema de limite central
El teorema del límite central es un teorema fundamental de probabilidad y estadística. El teorema describe la distribución de la media de una muestra aleatoria proveniente de una población con varianza finita. Cuando el tamaño de la muestra es lo suficientemente grande, la distribución de las medias sigue aproximadamente una distribución normal. El teorema se aplica independientemente de la forma de la distribución de la población. Muchos procedimientos estadísticos comunes requieren que los datos sean aproximadamente normales. El teorema de límite central le permite aplicar estos procedimientos útiles a poblaciones que son considerablemente no normales. El tamaño que debe tener la muestra depende de la forma de la distribución original. Si la distribución de la población es simétrica, un tamaño de muestra de 5 podría producir una aproximación adecuada. Si la distribución de la población es considerablemente asimétrica, es necesario un tamaño de muestra más grande. Por ejemplo, la distribución de la media puede ser aproximadamente normal si el tamaño de la muestra es mayor que 50. Las siguientes gráficas muestran ejemplos de cómo la distribución afecta el tamaño de la muestra que se necesita.
Una población que sigue una distribución uniforme es simétrica, pero marcadamente no normal, como lo demuestra el primer histograma. Sin embargo, la distribución de las medias de 1000 muestras de tamaño 5 de esta población es aproximadamente normal debido al teorema del límite central, como lo demuestra el segundo histograma. Este histograma de las medias de las muestras incluye una curva normal superpuesta para ilustrar esta normalidad.
Una población que sigue una distribución exponencial es asimétrica y no normal, como lo demuestra el primer histograma. Sin embargo, la distribución de las medias de 1000 muestras de tamaño 50 de esta población es aproximadamente normal debido al teorema del límite central, como lo demuestra el segundo histograma. Este histograma de las medias de las muestras incluye una curva normal superpuesta para ilustrar esta normalidad
miércoles, 29 de agosto de 2018
DESVIACIÓN ESTÁNDAR
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.
El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido.
La desviación estándar se puede utilizar para establecer un valor de referencia para estimar la variación general de un proceso.
Suscribirse a:
Entradas (Atom)
Pruebas Pruebas de hipótesis para una muestra muestra
http://www.geociencias.unam.mx/~ramon/EstInf/Clase13.pdf
-
RUEBAS DE HIPOTESIS PARA UNA PROPORCION Y DIFERENCIA DE PROPORCIONES. En el subtema anterior se utilizaron procedimientos de pruebas de la ...
-
Un estimador es un estadístico (una función de la muestra) utilizado para estimar un parámetro desconocido de la población. Por ejemplo, si ...
-
http://www.geociencias.unam.mx/~ramon/EstInf/Clase13.pdf