MAYO


Lunes, 02 de  Mayo del  2016.

REVISIÓN DE LA ACTIVIDAD 1.

Indicaciones:

  • Las preguntas deben ser claras y sencillas. Cortas y breves con un limite mínimo de 25 palabras.

  • Las preguntas pueden ser personalizadas de estas se obtienen respuestas mas exactas.

  • Evitar utilizar palabras ambiguas que dificulten la  interpretación de las preguntas planteadas.


  • No cálculos, temas difíciles o complejos, por ejemplo en los cálculos matemáticos el  encuestado puede no entender, y la pregunta  no sera valido.


  • No preguntas neutrales, este tipo de preguntas podrían estar influyendo en las respuestas.

  • Evitar preguntas en las cuales el encuestado de vea obligado  a dar opinión o preguntas que puedan intimidar al encuestado.


  • No memoria no deben ir preguntas en las que haya que recurrir a la memoria.


  • No  preguntas de  negación, estas  pueden confundir  la  idea  principal de la pregunta.


  • No dos preguntas juntas, podrían confundir las respuestas por ejemplo una podría ser negativa  y la otra positiva.


  • ORDEN Y EXTENSIÓN
Da el  numero de preguntas limite, no pocas  ni demasiadas.
El orden de las preguntas debe  ir en secuencia lógica, podrían separarse en grupos. Va de lo especifico a lo general.


  • PRUEBA PILOTO
Consiste  en realizar  una prueba de la encuesta  con un  grupo de personas no elemento de la 
muestra con el objetivo de realizar correcciones si fuera necesario para   luego aplicarlo  a la muestra.

Revisión del tema de la encuesta e indicaciones extras.

CONTENIDO:  

  1. MARCO TEÓRICO: Contiene  los  conocimientos que previamente se debe conocer  para poder manejarse libremente en el tema con las  referencias bibliográficas  utilizadas.
  2. DISEÑO DEL CUESTIONARIO: Preguntas  y Variables (numero de preguntas, edad, lugar, tiempo, circunstancias).
  3. ESTABLECER LA  MUESTRA
  4. PRUEBA PILOTO
  5. APLICAR LA ENCUESTA
  6. ANÁLISIS DE DATOS
  7. PRESENTAR EL  INFORME.

--------------------------------------------------------------------------------------------------------------------------

Miércoles, 04 de  Mayo del  2016.

ESTADÍSTICA DESCRIPTIVA

1.- Recopilación de datos

  • Fuentes.
  • Criterios para  diseñar la encuesta.
                         -Tema
                         - Problema (Marco teórico)
                         - Objetivo ( General y Específicos)
                         - Justificación
                         - Referencias (Normas  APA)
  • Tipos de datos
                         - Cualitativos o  Categóricos:Niveles
                                 ejemplo: Genero, estado civil, etc.
                         
                     
                         - Cuantitativos o numéricos: Son los  números que caracterizan a un dato. Siempre                                                                               acompañado de su respectiva unidad de medida.
                               
                                  ejemplo: Peso(kg), edad(años), altura(metros), ingresos (dolares), etc.


                                                  Discretos: Conteos (1, 2, 3, 4, ...... , etc).
                                                
                                                  Continuos: Dentro de un intervalo.
                                                                           [1.50 , 1.80] metros.
                                                                           [10 , 23] °C.
  


2.- Simbología

       N: Tamaño de la  población.
       n: Tamaño de la muestra.
       X: Característica de la  muestra.
                     X:    ( X1, X2, X3, ........... , Xn)
                   
                   peso.     peso individuo 1.      peso individuo n.
   
       x: Valor de la característica.
                     X1 = x1

3.- Descripción del conjunto de datos.

          I. Tabular.
          II. Gráfica.
          III. Numero que caracterizan al  conjunto de datos.

4.- Tabla de frecuencias.

Facilita la interpretación de los  datos.
           I. Identificar la  unidad de medida de  los datos (datos cuantitativos).
           II. Obtener el rango de los  datos.
                                              (1)
                    Donde:
                     R: Rango
                     Xmáx: Valor máximo.
                     Xmín: Valor mínimo.
         
            III. Seleccionar el numero de clases o intervalos (K).
Se sugiere lo siguiente:
               IV. Longitud de clase (L).
Donde:
L: Longitud de clase.
R: Rango.
K: Número de clases.

                 V. Realizar el conteo de datos para obtener la frecuencia en cada clase.
                     n: # de datos
                     K: # de clases
                     fi: frecuencia de la clase.                                                i= 1, 2, 3,4, ......, k.
                     fr: frecuencia  relativa de la clase                                  fr= fi/n.
                     Fi: frecuencia acumulada de la clase i.                          Fi= f1+ f2+ f3+ ....+fi.
                     Fr: frecuencia acumulada relativa de la clase i.             Fr= Fi/n.
                     mi: marca de la clase( es el valor central de la clase i ).
  

                 VI. Organizar la información en la tabla de frecuencias.

EJERCICIO 1.

Obtenga  la tabla de frecuencias para los siguientes 40 datos de una muestra correspondiente al tiempo que se utilizo para atender  a las personas en una estación de servicio.

3.1   4.5   2.9   2.7   3.8   5.1    2.5    3.6   4.3   5.1   4.9   3.5   2.1   4.2   2.2   1.8   3.6   6.1   5.7   4.9   2.8   2.8   3.7   3.5   4.4   2.5    5.6    5.1   4.7   4.2   3.6   4.1   4.1   3.7   2.9   6.2   4.8   3.9   4.6   3.1

i) unidad de medida (min)
    precisión 1 cifra decimal

ii) Xmax= 6.2  min
     Xmin= 1.8   min

R= Xmax - Xmin = (6.2 - 1.8 ) = 4.4  min.

iii)  n=40 ;  n>50, entonces,  K= 6

iv) L= R/K = 4.4/ 6 = 0.73333.....

      L=0.7=1.0



DESCRIPCIÓN: la tabla representa una tabla de frecuencias del tiempo que se utilizo para atender  a las personas en una estación de servicio.

INTERPRETACIÓN: El  57.5% de las personas han sido atendidas entre 3 a 5 minutos.
                                    El 2.5 % de las personas han sido atendidas de 1 a 2 minutos.



5.- Representación gráfica.

      Histograma de frecuencias.  

Representa gráficamente la distribución de frecuencia de los datos.
Se lo construye dibujando rectángulos cuya base corresponde a cada intervalo de clase, y su 
altura según el valor de la frecuencia. Puede ser la frecuencia absoluta o la frecuencia relativa.
  • En el eje OX ---->    Intervalos de clase.
  • En el eje OY ---->    Frecuencias fi o fr
CARACTERÍSTICAS:

1) Si las alturas de las barras son similares se dice que tiene distribución tipo “uniforme”.
2) Si las alturas son mayores en la zona central se dice que tiene forma tipo “campana” y
ser simétrica o asimétrica, con sesgo hacia el lado positivo o al lado negativo.
3) Si hay barras muy alejadas del grupo, se dice que son datos atípicos. Estos datos se pueden atribuir a errores de medición y se los puede descartar pues no pertenecen al grupo que se desea caracterizar.

EJEMPLO DE UN HISTOGRAMA. (EJERCICIO 1)


DESCRIPCIÓN:
El gráfico N°1 representa el histograma de frecuencias de los tiempos de atención (minutos) en una estación de servicio.

INTERPRETACIÓN:
Entre el  intervalo de 3 a 4 minutos se observa una frecuencia de 11, y en el intervalo de 4 a 5 minutos una frecuencia de 12, siendo las mayores frecuencias y en conjunto representan el 57.5%.
Se observa también que un 2.5% de  personas es atendida entre 1 a 2 minutos y el 5% de las personas entre 6 a 7 minutos.


--------------------------------------------------------------------------------------------------------------------------

Lunes, 09 de  Mayo del  2016.

DATOS CUALITATIVOS O CATEGÓRICOS.

Gráfico de barras                                                                              


Gráfico circular o tipo pastel



EJERCICIO 2

En una empresa financiera, los empleados disponen de computadoras portátiles de distintas marcas. Un resumen del numero de maquinas de acuerdo a su respectiva marca se presenta en el siguiente cuadro.Realizar:
a) diagrama de barras.
b) diagrama circular.


x: marca del computador portátil.
    variable cualitativa.
%: frecuencia relativa.
a) Diagrama de barras


DESCRIPCIÓN:
El gráfico representa la frecuencia absoluta de la marca de computadoras portátiles de los empleados de una empresa financiera.

INTERPRETACIÓN:
El 42% de los empleados de la empresa disponen de computadoras portátiles de la marca Toshiba.
Existe un 6% de empleados que desconocen la marca del computador portátil que disponen.
b)



DESCRIPCIÓN:
El diagrama circular representa los porcentajes de las marca de computadoras portátiles de los empleados de una empresa financiera.

INTERPRETACIÓN:
El 42% de los empleados de la empresa disponen de computadoras portátiles de la marca Toshiba.
El 23% de los empleados de la empresa disponen de computadoras portátiles de la marca Dell.
El 16% de los empleados de la empresa disponen de computadoras portátiles de la marca Hp.
El 13% de los empleados de la empresa disponen de computadoras portátiles de la marca Lenovo.
Existe un 6% de empleados que desconocen la marca del computador portátil que disponen.


Polígono de frecuencias

Representa el perfil de la distribución de los datos. Se obtiene uniendo mediante segmentos de recta los puntos (marca de clase, frecuencia). Para cerrar el polígono se puede agregar un punto a cada lado con frecuencia 0.


--------------------------------------------------------------------------------------------------------------------------

Miércoles, 11 de  Mayo del  2016.

Ojiva

Representa la frecuencia acumulada, absoluta o relativa. Se lo obtiene uniendo segmentos de recta que se extienden entre los extremos de las clases y usando los valores de la frecuencia acumulada.



Diagrama de puntos

Para datos cuantitativos individuales y no para datos agrupados en intervalos.
Si la cantidad de datos es pequeña, (alrededor de 20 o menos), se los puede representar mediante puntos directamente sin agruparlos en intervalos.

EJERCICIO 3

Un fabricante de cierto componente electrónico se interesa en determinar el tiempo de vida (en horas) de estos dispositivos para lo cual a tomado una muestra de 12 observaciones.

123      116       120      130      122     110
175      126       125      110      110     120

a) Realice el diagrama de puntos.
b) Realice el diagrama de tallo  y hojas.


x: tiempo de vida de un componente electrónico.
     variable cuantitativa continua. ( horas ).
Precisión: o cifras decimales.

Xmin= 110

Xmax= 175

R= Xmax - Xmin =175-110 = 65
                                

                                  DIAGRAMA DE PUNTOS DEL TIEMPO DE VIDA.

TIEMPO DE VIDA (horas).

DESCRIPCIÓN:
El presente gráfico representa el diagrama de tiempo  vida (en horas) de un componente electrónico.

INTERPRETACIÓN:
Existe una frecuencia de 3 a 110 horas, y una frecuencia de 2 a 120 horas. 
Sin la  presencia del dato atípico el rango del tiempo de vida de los dispositivos electrónicos estuviera de 110 a 130.


Diagrama de tallo  y hojas

Se utiliza cuando la cantidad de datos es pequeña. Permite describir la distribución de frecuencia de los datos agrupados pero sin perder la información individual de los datos.

La longitud de cada fila ayuda a visualizar la frecuencia, en forma parecida a un histograma pero al mismo tiempo se pueden observar individualmente los datos.

Se construye escribiendo verticalmente las primera(s) cifra(s) de los datos (tallo) y escribiendo las restantes cifras horizontalmente (hojas).

EJERCICIO 4

Realice un diagrama de tallo y hojas con los siguientes datos.

8.3     9.5     6.1      5.0       4.5       6.4      8.7      4.6      9.5      2.4    3.1    5.4     1.4       3.5    6.0     9.4   
8.6     1.8     1.7      3.4       7.6       4.9      6.2      4.0      4.4      4.0    2.4    7.1     6.2       4.6    5.8     2.8

Xmin= 1.4.
Xmax= 9.5.
Precisión: 1 cifra decimal.


DESCRIPCIÓN:
El siguiente  es un diagrama de tallo y hojas que representa los datos de la tabla.

INTERPRETACIÓN:
En el intervalo  [4 , 5 ) la frecuencia es 7.
En el intervalo  [7 , 8 ) la frecuencia es 2


Diagrama de Pareto.

  • Identificar las causas principales que producen cierto resultado.
  • La ley de Pareto dice que:

''De cualquier conjunto de eventos que pueden asociarse a un suceso, solamente unos pocos contribuyen en forma significativa, mientras que  otros son secundarios.''
           Generalmente existen solo 2 o  3 causas significativas.

      PROCEDIMIENTO:

  1. Categorize los datos por tipo de problema.
  2. Determine la frecuencias y ordene de forma decreciente.
  3. Represente la frecuencia relativa con barras.
  4. Superponga la ojiva de la frecuencia acumulada.
  5. Analice  las causas mas importantes del problema de estudio. 


EJERCICIO 4. 

Un fabricante a realizado un conteo de los tipos de defectos de sus productos y a registrado su frecuencia. Se desea analizar su incidencia en la producción con un diagrama de pareto. Los resultados tabulados según el procedimiento anterior son:




ANÁLISIS:

Se puede observar que más del 70% de los defectos de producción corresponden a los tipos A,

B y C. Con esta información, una decisión adecuada sería asignar recursos para solucionar

estos tipos de problemas pues son los que tienen mayor incidencia en la producción.

--------------------------------------------------------------------------------------------------------------------------

Lunes, 16 de  Mayo del  2016.

CALCULO DE MEDIDAS.

  • DE LOCALIZACIÓN:
  • DE DISPERSIÓN:
  • DE POSICIÓN:

  • DE FORMA

1.-DE LOCALIZACIÓN:

MEDIA

i) Datos individuales. 
n: Tamaño de la muestra.

ii) Datos individuales con frecuencia.
xi: datos individuales.
fi: frecuencia absoluta de cada dato.

iii) Datos agrupados en intervalos.
mi: marca de clase de cada intervalo.


MEDIANA

i) Datos individuales. 
La mediana de un conjunto de datos x1, x2, ... , xn es el valor que se encuentra en la posición central de todo el conjunto de datos ordenados en forma creciente.

ii) Datos individuales con frecuencia.

iii) Datos agrupados en intervalos.
Donde:
L i-1: Limite inferior de la clase mediana.
N i-1: frecuencia acumulada de la clase inmediatamente anterior a  la clase mediana.
fi: Frecuencia absoluta de la clase mediana.
L: Longitud de la clase mediana.



--------------------------------------------------------------------------------------------------------------------------

Miércoles, 18 de  Mayo del  2016.

MODA

Es aquel valor de la variable que tiene mayor frecuencia. Un conjunto de datos puede tener mas de una moda.


Cuando la  media. mediana y moda son iguales la distribución se datos se considera ''simétrica''.

2.-DE DISPERSIÓN:

i) Datos individuales. 

VARIANZA

DESVIACIÓN


ii) Datos individuales con frecuencia.

VARIANZA

DESVIACIÓN


iii) Datos agrupados en intervalos.

VARIANZA

DESVIACIÓN
mi: marca de clase

COEFICIENTE DE VARIACIÓN.

Cv =< 1 , Datos homogéneos.
  Cv > 1.5 , Datos heterogéneos.

3.-DE POSICIÓN:

PERCENTILES (Pk)

Los percentiles son cada una de las 99 divisiones que dividen a la  distribución de datos en 100 partes iguales.

Para determinar los percentiles se debe:
1.- Hallar 

 Donde:
n: Tamaño de la muestra.
k: orden del percentil.
t: parte entera de nk/100
r: fracción de nk/100

2.- Si los datos son individuales.

NOTA: Los datos deben estar ordenados en forma creciente.

3.- Si los datos  son agrupados

Donde:
L k-1: limite inferior de la clase de interés.
N k-1: frecuencia absoluta acumulada del intervalo inmediatamente anterior al intervalo de interés.
fk: frecuencia absoluta del intervalo de interés.
A: Amplitud del intervalo de interés.

OBSERVACION: La mediana (Me) equivale al percentil 50 (P50).

CUARTILES (Qk)


DECILES ( Dk)
Diagrama de caja o bigotes.

Es un dispositivo gráfico que se usa para expresar en forma resumida, algunas medidas
estadísticas de posición:





--------------------------------------------------------------------------------------------------------------------------

MUESTRAS BIVARIADAS


Es común tener que estudiar muestras con datos que miden dos características, siendo de interés determinar si hay alguna relación entre ellas.Para visualizar la relación entre las variables de una muestra bivariada, es útil graficar los datos en una representación que se denomina Diagrama de Dispersión.

CORRELACIÓN


Se usa el término correlación para describir la relación entre los datos de muestras bivariadas. Los siguientes gráficos son casos típicos para observar la correlación entre dos variables:






COVARIANZA MUESTRAL


Esta definición permite cuantificar el nivel de correlación lineal que existe entre dos variables. Primero anotamos algunas definiciones conocidas para muestras univariadas:

Sean 
X, Y: Variables muestrales
n: Tamaño de la muestra

X, Y : Medias aritméticas de X, Y, respectivamente

Sx^2 , Sy^2 : Varianzas muestrales de X, Y, respectivamente

Sx , Sy : Desviaciones estándar muestrales de X, Y respectivamente



COEFICIENTE DE CORRELACION LINEAL MUESTRAL


Es una definición para cuantificar el grado de correlación lineal entre dos variables en forma adimensional y normalizada.






MATRIZ DE VARIANZAS Y COVARIANZAS


Es una matriz simétrica con la que se pueden representar ordenadamente las varianzas y las covarianzas entre las variables. Para definirla se puede usar la notación:


MATRIZ DE CORRELACION


Es una representación ordenada de los coeficientes de correlación de cada variable con la otra variable y consigo misma.


No hay comentarios:

Publicar un comentario