Lunes, 02 de Mayo del 2016.
REVISIÓN DE LA ACTIVIDAD 1.
Indicaciones:
- Las preguntas deben ser claras y sencillas. Cortas y breves con un limite mínimo de 25 palabras.
- Las preguntas pueden ser personalizadas de estas se obtienen respuestas mas exactas.
- Evitar utilizar palabras ambiguas que dificulten la interpretación de las preguntas planteadas.
- No cálculos, temas difíciles o complejos, por ejemplo en los cálculos matemáticos el encuestado puede no entender, y la pregunta no sera valido.
- No preguntas neutrales, este tipo de preguntas podrían estar influyendo en las respuestas.
- Evitar preguntas en las cuales el encuestado de vea obligado a dar opinión o preguntas que puedan intimidar al encuestado.
- No memoria no deben ir preguntas en las que haya que recurrir a la memoria.
- No preguntas de negación, estas pueden confundir la idea principal de la pregunta.
- No dos preguntas juntas, podrían confundir las respuestas por ejemplo una podría ser negativa y la otra positiva.
- ORDEN Y EXTENSIÓN
Da el numero de preguntas limite, no pocas ni demasiadas.
El orden de las preguntas debe ir en secuencia lógica, podrían separarse en grupos. Va de lo especifico a lo general.
- PRUEBA PILOTO
Consiste en realizar una prueba de la encuesta con un grupo de personas no elemento de la
muestra con el objetivo de realizar correcciones si fuera necesario para luego aplicarlo a la muestra.
Revisión del tema de la encuesta e indicaciones extras.
CONTENIDO:
- MARCO TEÓRICO: Contiene los conocimientos que previamente se debe conocer para poder manejarse libremente en el tema con las referencias bibliográficas utilizadas.
- DISEÑO DEL CUESTIONARIO: Preguntas y Variables (numero de preguntas, edad, lugar, tiempo, circunstancias).
- ESTABLECER LA MUESTRA
- PRUEBA PILOTO
- APLICAR LA ENCUESTA
- ANÁLISIS DE DATOS
- PRESENTAR EL INFORME.
--------------------------------------------------------------------------------------------------------------------------
Miércoles, 04 de Mayo del 2016.
ESTADÍSTICA DESCRIPTIVA
1.- Recopilación de datos
- Fuentes.
- Criterios para diseñar la encuesta.
-Tema
- Problema (Marco teórico)
- Objetivo ( General y Específicos)
- Justificación
- Referencias (Normas APA)
- Tipos de datos
- Cualitativos o Categóricos:Niveles
ejemplo: Genero, estado civil, etc.
- Cuantitativos o numéricos: Son los números que caracterizan a un dato. Siempre acompañado de su respectiva unidad de medida.
ejemplo: Peso(kg), edad(años), altura(metros), ingresos (dolares), etc.
Discretos: Conteos (1, 2, 3, 4, ...... , etc).
Continuos: Dentro de un intervalo.
[1.50 , 1.80] metros.
[10 , 23] °C.
2.- Simbología
N: Tamaño de la población.
n: Tamaño de la muestra.
X: Característica de la muestra.
X: ( X1, X2, X3, ........... , Xn)
peso. peso individuo 1. peso individuo n.
x: Valor de la característica.
X1 = x1
3.- Descripción del conjunto de datos.
I. Tabular.
II. Gráfica.
III. Numero que caracterizan al conjunto de datos.
4.- Tabla de frecuencias.
Facilita la interpretación de los datos.
I. Identificar la unidad de medida de los datos (datos cuantitativos).
II. Obtener el rango de los datos.
Donde:
R: Rango
Xmáx: Valor máximo.
Xmín: Valor mínimo.
III. Seleccionar el numero de clases o intervalos (K).
Se sugiere lo siguiente:
IV. Longitud de clase (L).
Donde:
L: Longitud de clase.
R: Rango.
K: Número de clases.
V. Realizar el conteo de datos para obtener la frecuencia en cada clase.
n: # de datos
K: # de clases
fi: frecuencia de la clase. i= 1, 2, 3,4, ......, k.
fr: frecuencia relativa de la clase fr= fi/n.
Fi: frecuencia acumulada de la clase i. Fi= f1+ f2+ f3+ ....+fi.
Fr: frecuencia acumulada relativa de la clase i. Fr= Fi/n.
mi: marca de la clase( es el valor central de la clase i ).
VI. Organizar la información en la tabla de frecuencias.
EJERCICIO 1.
Obtenga la tabla de frecuencias para los siguientes 40 datos de una muestra correspondiente al tiempo que se utilizo para atender a las personas en una estación de servicio.
3.1 4.5 2.9 2.7 3.8 5.1 2.5 3.6 4.3 5.1 4.9 3.5 2.1 4.2 2.2 1.8 3.6 6.1 5.7 4.9 2.8 2.8 3.7 3.5 4.4 2.5 5.6 5.1 4.7 4.2 3.6 4.1 4.1 3.7 2.9 6.2 4.8 3.9 4.6 3.1
i) unidad de medida (min)
precisión 1 cifra decimal
ii) Xmax= 6.2 min
Xmin= 1.8 min
R= Xmax - Xmin = (6.2 - 1.8 ) = 4.4 min.
iii) n=40 ; n>50, entonces, K= 6
iv) L= R/K = 4.4/ 6 = 0.73333.....
L=0.7=1.0
DESCRIPCIÓN: la tabla representa una tabla de frecuencias del tiempo que se utilizo para atender a las personas en una estación de servicio.
INTERPRETACIÓN: El 57.5% de las personas han sido atendidas entre 3 a 5 minutos.
El 2.5 % de las personas han sido atendidas de 1 a 2 minutos.
PROCEDIMIENTO:
EJERCICIO 4.
Un fabricante a realizado un conteo de los tipos de defectos de sus productos y a registrado su frecuencia. Se desea analizar su incidencia en la producción con un diagrama de pareto. Los resultados tabulados según el procedimiento anterior son:
INTERPRETACIÓN: El 57.5% de las personas han sido atendidas entre 3 a 5 minutos.
El 2.5 % de las personas han sido atendidas de 1 a 2 minutos.
5.- Representación gráfica.
Histograma de frecuencias.
Representa gráficamente la distribución de frecuencia de los datos.
Se lo construye dibujando rectángulos cuya base corresponde a cada intervalo de clase, y su
altura según el valor de la frecuencia. Puede ser la frecuencia absoluta o la frecuencia relativa.
- En el eje OX ----> Intervalos de clase.
- En el eje OY ----> Frecuencias fi o fr
CARACTERÍSTICAS:
1) Si las alturas de las barras son similares se dice que tiene distribución tipo “uniforme”.
2) Si las alturas son mayores en la zona central se dice que tiene forma tipo “campana” y
ser simétrica o asimétrica, con sesgo hacia el lado positivo o al lado negativo.
3) Si hay barras muy alejadas del grupo, se dice que son datos atípicos. Estos datos se pueden atribuir a errores de medición y se los puede descartar pues no pertenecen al grupo que se desea caracterizar.
EJEMPLO DE UN HISTOGRAMA. (EJERCICIO 1)
DESCRIPCIÓN:
El gráfico N°1 representa el histograma de frecuencias de los tiempos de atención (minutos) en una estación de servicio.
INTERPRETACIÓN:
Entre el intervalo de 3 a 4 minutos se observa una frecuencia de 11, y en el intervalo de 4 a 5 minutos una frecuencia de 12, siendo las mayores frecuencias y en conjunto representan el 57.5%.
Se observa también que un 2.5% de personas es atendida entre 1 a 2 minutos y el 5% de las personas entre 6 a 7 minutos.
--------------------------------------------------------------------------------------------------------------------------
Lunes, 09 de Mayo del 2016.
DATOS CUALITATIVOS O CATEGÓRICOS.
Gráfico de barras
Gráfico circular o tipo pastel
EJERCICIO 2
En una empresa financiera, los empleados disponen de computadoras portátiles de distintas marcas. Un resumen del numero de maquinas de acuerdo a su respectiva marca se presenta en el siguiente cuadro.Realizar:
a) diagrama de barras.
b) diagrama circular.
x: marca del computador portátil.
variable cualitativa.
%: frecuencia relativa.
a) Diagrama de barras
DESCRIPCIÓN:
El gráfico representa la frecuencia absoluta de la marca de computadoras portátiles de los empleados de una empresa financiera.
INTERPRETACIÓN:
El 42% de los empleados de la empresa disponen de computadoras portátiles de la marca Toshiba.
Existe un 6% de empleados que desconocen la marca del computador portátil que disponen.
b)
DESCRIPCIÓN:
El diagrama circular representa los porcentajes de las marca de computadoras portátiles de los empleados de una empresa financiera.
INTERPRETACIÓN:
El 42% de los empleados de la empresa disponen de computadoras portátiles de la marca Toshiba.
El 23% de los empleados de la empresa disponen de computadoras portátiles de la marca Dell.
El 16% de los empleados de la empresa disponen de computadoras portátiles de la marca Hp.
El 13% de los empleados de la empresa disponen de computadoras portátiles de la marca Lenovo.
Existe un 6% de empleados que desconocen la marca del computador portátil que disponen.
Polígono de frecuencias
Representa el perfil de la distribución de los datos. Se obtiene uniendo mediante segmentos de recta los puntos (marca de clase, frecuencia). Para cerrar el polígono se puede agregar un punto a cada lado con frecuencia 0.
--------------------------------------------------------------------------------------------------------------------------
Miércoles, 11 de Mayo del 2016.
Ojiva
Representa la frecuencia acumulada, absoluta o relativa. Se lo obtiene uniendo segmentos de recta que se extienden entre los extremos de las clases y usando los valores de la frecuencia acumulada.
Diagrama de puntos
Para datos cuantitativos individuales y no para datos agrupados en intervalos.
Si la cantidad de datos es pequeña, (alrededor de 20 o menos), se los puede representar mediante puntos directamente sin agruparlos en intervalos.
EJERCICIO 3
Un fabricante de cierto componente electrónico se interesa en determinar el tiempo de vida (en horas) de estos dispositivos para lo cual a tomado una muestra de 12 observaciones.
123 116 120 130 122 110
175 126 125 110 110 120
a) Realice el diagrama de puntos.
b) Realice el diagrama de tallo y hojas.
x: tiempo de vida de un componente electrónico.
variable cuantitativa continua. ( horas ).
Precisión: o cifras decimales.
Xmin= 110
Xmax= 175
R= Xmax - Xmin =175-110 = 65
DIAGRAMA DE PUNTOS DEL TIEMPO DE VIDA.
TIEMPO DE VIDA (horas).
DESCRIPCIÓN:
El presente gráfico representa el diagrama de tiempo vida (en horas) de un componente electrónico.
INTERPRETACIÓN:
Existe una frecuencia de 3 a 110 horas, y una frecuencia de 2 a 120 horas.
Sin la presencia del dato atípico el rango del tiempo de vida de los dispositivos electrónicos estuviera de 110 a 130.
Diagrama de tallo y hojas
Se utiliza cuando la cantidad de datos es pequeña. Permite describir la distribución de frecuencia de los datos agrupados pero sin perder la información individual de los datos.
La longitud de cada fila ayuda a visualizar la frecuencia, en forma parecida a un histograma pero al mismo tiempo se pueden observar individualmente los datos.
Se construye escribiendo verticalmente las primera(s) cifra(s) de los datos (tallo) y escribiendo las restantes cifras horizontalmente (hojas).
EJERCICIO 4
Realice un diagrama de tallo y hojas con los siguientes datos.
8.3 9.5 6.1 5.0 4.5 6.4 8.7 4.6 9.5 2.4 3.1 5.4 1.4 3.5 6.0 9.4
8.6 1.8 1.7 3.4 7.6 4.9 6.2 4.0 4.4 4.0 2.4 7.1 6.2 4.6 5.8 2.8
Xmin= 1.4.
Xmax= 9.5.
Precisión: 1 cifra decimal.
DESCRIPCIÓN:
El siguiente es un diagrama de tallo y hojas que representa los datos de la tabla.
INTERPRETACIÓN:
En el intervalo [4 , 5 ) la frecuencia es 7.
En el intervalo [7 , 8 ) la frecuencia es 2
Diagrama de Pareto.
- Identificar las causas principales que producen cierto resultado.
- La ley de Pareto dice que:
''De cualquier conjunto de eventos que pueden asociarse a un suceso, solamente unos pocos contribuyen en forma significativa, mientras que otros son secundarios.''Generalmente existen solo 2 o 3 causas significativas.
PROCEDIMIENTO:
- Categorize los datos por tipo de problema.
- Determine la frecuencias y ordene de forma decreciente.
- Represente la frecuencia relativa con barras.
- Superponga la ojiva de la frecuencia acumulada.
- Analice las causas mas importantes del problema de estudio.
EJERCICIO 4.
Un fabricante a realizado un conteo de los tipos de defectos de sus productos y a registrado su frecuencia. Se desea analizar su incidencia en la producción con un diagrama de pareto. Los resultados tabulados según el procedimiento anterior son:
ANÁLISIS:
Se puede observar que más del 70% de los defectos de producción corresponden a los tipos A,
B y C. Con esta información, una decisión adecuada sería asignar recursos para solucionar
estos tipos de problemas pues son los que tienen mayor incidencia en la producción.
--------------------------------------------------------------------------------------------------------------------------
Lunes, 16 de Mayo del 2016.
CALCULO DE MEDIDAS.
- DE LOCALIZACIÓN:
- DE POSICIÓN:
- DE FORMA
1.-DE LOCALIZACIÓN:
MEDIA
ii) Datos individuales con frecuencia.
xi: datos individuales.
fi: frecuencia absoluta de cada dato.
MEDIANA
i) Datos individuales.
La mediana de un conjunto de datos x1, x2, ... , xn es el valor que se encuentra en la posición central de todo el conjunto de datos ordenados en forma creciente.
ii) Datos individuales con frecuencia.
iii) Datos agrupados en intervalos.
Donde:
L i-1: Limite inferior de la clase mediana.
N i-1: frecuencia acumulada de la clase inmediatamente anterior a la clase mediana.
fi: Frecuencia absoluta de la clase mediana.
L: Longitud de la clase mediana.
--------------------------------------------------------------------------------------------------------------------------
Miércoles, 18 de Mayo del 2016.
MODA
Es aquel valor de la variable que tiene mayor frecuencia. Un conjunto de datos puede tener mas de una moda.
Cuando la media. mediana y moda son iguales la distribución se datos se considera ''simétrica''.
2.-DE DISPERSIÓN:
ii) Datos individuales con frecuencia.
DESVIACIÓN
iii) Datos agrupados en intervalos.
DESVIACIÓN
mi: marca de clase
COEFICIENTE DE VARIACIÓN.
Cv =< 1 , Datos homogéneos.
Cv > 1.5 , Datos heterogéneos.
3.-DE POSICIÓN:
PERCENTILES (Pk)
Los percentiles son cada una de las 99 divisiones que dividen a la distribución de datos en 100 partes iguales.
Para determinar los percentiles se debe:
1.- Hallar
Donde:
n: Tamaño de la muestra.
k: orden del percentil.
t: parte entera de nk/100
r: fracción de nk/100
2.- Si los datos son individuales.
NOTA: Los datos deben estar ordenados en forma creciente.
Donde:
L k-1: limite inferior de la clase de interés.
N k-1: frecuencia absoluta acumulada del intervalo inmediatamente anterior al intervalo de interés.
fk: frecuencia absoluta del intervalo de interés.
A: Amplitud del intervalo de interés.
OBSERVACION: La mediana (Me) equivale al percentil 50 (P50).
CUARTILES (Qk)
DECILES ( Dk)
Diagrama de caja o bigotes.
Es un dispositivo gráfico que se usa para expresar en forma resumida, algunas medidas
estadísticas de posición:
--------------------------------------------------------------------------------------------------------------------------
MUESTRAS BIVARIADAS
Es común tener que estudiar muestras con datos que miden dos características, siendo de interés determinar si hay alguna relación entre ellas.Para visualizar la relación entre las variables de una muestra bivariada, es útil graficar los datos en una representación que se denomina Diagrama de Dispersión.
CORRELACIÓN
Se usa el término correlación para describir la relación entre los datos de muestras bivariadas. Los siguientes gráficos son casos típicos para observar la correlación entre dos variables:
COVARIANZA MUESTRAL
Esta definición permite cuantificar el nivel de correlación lineal que existe entre dos variables. Primero anotamos algunas definiciones conocidas para muestras univariadas:
Sean
X, Y: Variables muestrales
n: Tamaño de la muestra
X, Y : Medias aritméticas de X, Y, respectivamente
Sx^2 , Sy^2 : Varianzas muestrales de X, Y, respectivamente
Sx , Sy : Desviaciones estándar muestrales de X, Y respectivamente
COEFICIENTE DE CORRELACION LINEAL MUESTRAL
Es una definición para cuantificar el grado de correlación lineal entre dos variables en forma adimensional y normalizada.
MATRIZ DE VARIANZAS Y COVARIANZAS
Es una matriz simétrica con la que se pueden representar ordenadamente las varianzas y las covarianzas entre las variables. Para definirla se puede usar la notación:
MATRIZ DE CORRELACION
Es una representación ordenada de los coeficientes de correlación de cada variable con la otra variable y consigo misma.




















































No hay comentarios:
Publicar un comentario