Análisis computacional Inferencia Estadística: intervalos de confianza y contrastes de hipótesis

Please download to get full document.

View again

All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
 4
 
  Análisis computacional Inferencia Estadística: intervalos de confianza y contrastes de hipótesis omán Salmerón Gómez 29 de abril de 2014 Inferencia Estimación (computacional) mediante intervalos de confianza
Related documents
Share
Transcript
Análisis computacional Inferencia Estadística: intervalos de confianza y contrastes de hipótesis omán Salmerón Gómez 29 de abril de 2014 Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 1 / 23 Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 2 / 23 Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 3 / 23 En el archivo encuesta.xls (http://www.ugr.es/local/romansg/material/encuesta.xls) se dispone de la información para las siguientes variables de 148 estudiantes: Edad: edad del estudiante medida en años. Género: variable dicotómica que toma los valores Hombre y Mujer. Titulación: titulación a la que pertenece el estudiante (GECO, GADE, GADE+D y GFICO). Grupo: grupo al que pertenece el estudiante (grupos A y B de mañana, el resto de tarde). Peso: peso del estudiante medido en kg. Pareja: variable dicotómica que toma el valor Si si el estudiante tiene pareja y No en caso contrario. Sueño: número de horas de sueño al día del estudiante. Fuma: variable dicotómica que toma el valor Si si el estudiante fuma y No en caso contrario. Estudio: número de horas de estudio al día del estudiante. TV: número de horas que ve la TV al día el estudiante. adio: número de horas que escucha la radio el estudiante. Alcohol: variable cualitativa que toma los valores Nada, Poco y Bastante. Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 4 / 23 1. Calcular la media (mediana, desviación típica, varianza, asimetría y curtosis) de las variables Edad y Peso en función del Género y Titulación. 2. Es la edad media de los estudiantes de GFICO de 22 años? Se puede decir que el peso medio es de 66 kg? 3. Son las medias de las horas de estudio, de TV y radio iguales entre hombres y mujeres? Es el peso medio distinto entre los que tienen y no tienen pareja? Y entre los fumadores y no fumadores? 4. Son las horas medias de sueño iguales en los estudiantes de todas las titulaciones? 5. Son las muestras obtenidas para Edad, Peso, Sueño, Estudio, TV y adio aleatorias? Se distribuyen normalmente? Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 5 / 23 Opciones disponibles en Comparar medias Contraste de normalidad Paquete estadístico Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 6 / 23 Paquete estadístico Opciones disponibles en Comparar medias Contraste de normalidad es uno de los programas estadísticos informáticos más usados debido a su capacidad de trabajo y su sencillo interfaz. Entre las (muchas) opciones que presenta existe un módulo que permite realizar inferencia estadística con una y dos muestras. Dicho módulo se encuentra en la ruta Analizar Comparar medias Las opciones disponibles son: Medias... Prueba T para una muestra... Prueba T para muestras independientes... Prueba T para muestras relacionadas... ANOVA de un factor... Describimos a continuación brevemente cada una de ellas. Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 7 / 23 Opciones disponibles en Comparar medias Opciones disponibles en Comparar medias Contraste de normalidad Medias... calcula medias (y otros muchos estadísticos univariados) en subgrupos (categorías de una o más variables independientes). Prueba T para una muestra... contrasta si la media de una sola variable difiere de una constante especificada. Prueba T para muestras independientes... compara las medias de dos grupos (especificados en la variable de agrupación). En este caso, mediante la prueba de Levene, además se contrasta la igualdad de varianzas. Prueba T para muestras relacionadas... compara las medias de dos variables de un solo grupo: se trata de una única muestra a la cual se le miden variables antes y después de un evento. ANOVA de un factor se utiliza para contrastar la hipótesis de que varias medias son iguales. Esta técnica es una extensión de la prueba t para dos muestras. Adviértase que las pruebas devuelven el p-valor del contraste realizado y el intervalo de confianza asociado. Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 8 / 23 Contraste de normalidad Opciones disponibles en Comparar medias Contraste de normalidad Las pruebas anteriormente realizadas se pueden realizar siempre y cuando las muestras sean aleatorias y se distribuyan según una normal. Estas hipótesis se pueden contrastar en mediante la ruta Analizar Pruebas no paramétricas Una muestra... En Campo se seleccionan las variables a analizar y en Configuración las pruebas a realizar, en este caso, Kolmogorov-Smirnov y achas. Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 9 / 23 Paquete estadístico Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 10 / 23 Paquete estadístico es un una aplicación de software libre para el análisis de datos y un reemplazo libre para el software propietario. Puesto que es un clon de este todo lo expuesto anteriormente es válido para. Más información en la web: Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 11 / 23 Contrastes Hipótesis Software econométrico Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 12 / 23 Software econométrico Contrastes Hipótesis Si bien es un software enfocado al análisis econométrico, también permite realizar inferencia estadística sobre una y dos muestras mediante contrastes de hipótesis. Esta opción se encuentra en la Calculadora de estadísticos de contraste del menú Herramientas, siendo las opciones disponibles las siguientes: Contraste para la media de una población normal. Contraste para la varianza de una población normal. Contraste para la proporción. Contraste para la diferencia de medias procedentes de sendas poblaciones normales. Contraste para el cociente de varianzas procedentes de sendas poblaciones normales. Contraste de hipótesis para la diferencia de proporciones. Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 13 / 23 Calculadora de estadísticos de contraste Contrastes Hipótesis En todos los casos me permite introducir los valores muestrales a usar 1 o bien seleccionar una variable del conjunto de datos de manera que de forma automática calcula toda la información necesaria. Si se desea comparar dos subgrupos de una misma variable, por ejemplo, comparar el peso de alumnos en dos titulaciones distintas se ha de especificar en cada pestaña Peso (Grado=1) y Peso (Grado=3) y pulsar enter para que calcule los valores muestrales correspondientes. Como resultado se obtiene tanto el valor del estadístico experimental (que habría que comparar con el teórico 2 ) como el p-valor asociado al contraste. 1 Estos se pueden obtener seleccionando la variable correspondiente y pulsando el botón derecho del ratón, dentro de las opciones que aparecen seleccionar Estadísticos principales. 2 Este puede ser calculado en la ruta Herramientas Tablas estadísticas. Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 14 / 23 Hipótesis de partida Contrastes Hipótesis Para contrastar la hipótesis de partida de que la variable ha de ser normal, teniendo seleccionada la variable en cuestión, hay que seguir la ruta Variable Contraste de normalidad. Como resultado se obtienen 4 contrastes (en versión ). En función del p-valor se rechazará o no la hipótesis nula de normalidad. En la ruta Herramientas Contrastes no paramétricos se puede contrastar la hipótesis nula de aleatoriedad de la muestra en la pestaña Contraste de rachas. Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 15 / 23 Contrastes Entorno de programación Código Hipótesis Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 16 / 23 Entorno de programación Contrastes Código Hipótesis es un conjunto integrado de programas para manipulación de datos, cálculo y gráficos que está disponible como software libre en Para comparar medias y varianzas se disponen de los comandos t.test y var.test, respectivamente: t.test(var1, var2=null, alternative= two.sided , mu = 0, paired=false, var.equal=false, conf.level=0.95) var.test(var1, var2, ratio=1, alternative = two.sided , conf.level=0.95) Las opciones indicadas son las ofrecidas por defecto. Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 17 / 23 Opciones de de los comandos t.test y var.test Contrastes Código Hipótesis Si para t.test no se especifica el segundo conjunto de datos se trabajará con una única muestra. El argumento alternative indica el tipo de contraste: bilateral si se especifica two.sided, unilateral con hipótesis alternativa del tipo mayor para greater y menor para less. En el argumento mu se especifica el valor de la hipótesis nula en el caso de comparación de medias, mientras que para la comparación de varianzas se hace con el argumento ratio. En el argumento paired se especifica si los datos están relacionados (pareados), True, o no, False. En el argumento var.equal se especifica, en caso de dos muestras, si las varianzas son iguales (True) o no (False). Con el argumento conf.level se indica el nivel de confianza a usar. Para trabajar con proporciones se tiene el comando prop.test (de similar uso). Para resolver algunos de los problemas planteados al inicio del documento se puede usar el siguiente código (se obtienen p-valores e intervalos de confianza asociados). Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 18 / 23 # leo los datos datos = read.table(file= datos.txt , header=tue, dec= , , sep= \t ) attach(datos) algunos descriptivos list(summary(edad), summary(peso), summary(sueno), summary(estudio), summary(tv), summary(radio)) ejercicios t.test(edad, mu=22) t.test(peso, mu=66) var.test(tv~sexo) t.test(tv~sexo) t.test(tv~sexo,var.equal=t)) var.test(peso~pareja) t.test(peso~pareja) t.test(peso~pareja,var.equal=t) var.test(peso~fuma) t.test(peso~fuma) t.test(peso~fuma,var.equal=t) Hipótesis de partida Para contrastar la normalidad de las variables se tiene el comando shapiro.test: shapiro.test(peso) shapiro.test(edad) Contrastes Código Hipótesis Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 20 / 23 Paquete estadístico Contrastes Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 21 / 23 Paquete estadístico Contrastes es un software estadístico que permite una eficiente gestión de datos y de análisis estadísticos. Los datos en se introducen directamente pulsando el botón correspondiente a Data Editor (edit) o importándolos, por ejemplo desde Excel, sin más que copiarlos en la hoja de cálculo y pegándolos en la de (si el nombre de las variables está escrito en la primera fila de la hoja de cálculo aparecerá un mensaje preguntando si dicha fila ha de tratarla como los nombres de las variables o como datos). Adviértase que el delimitador decimal es el punto (al igual que en y ). Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 22 / 23 Comandos ttest, sdtest y swilk Para hacer inferencia en hay que usar el comando ttest para contrastes sobre la media, ya sea para una única muestra o para dos (con varianzas iguales o distintas), o el comando sdtest para la comparación de varianzas: Contrastes ttest peso = 66 ttest peso, by(fuma) ttest TV = adio, unpaired ttest TV = adio, unpaired unequal sdtest TV = adio En todos los casos se obtienen la media y varianzas muestrales, intervalos y p-valores asociados a los contrastes de hipótesis realizados. Para contrastar la normalidad de las variables se dispone del comando swilk: swilk edad peso TV adio Sueno by fuma, sort: swilk edad peso TV adio Sueno Inferencia Estimación (computacional) mediante intervalos de confianza y contrastes de hipótesis 23 / 23
Related Search
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks