miércoles, 5 de agosto de 2015

TEMA 1: DEFINICIONES BÁSICAS

¿Qué significa estadística?

Estadística es la ciencia de recolectar,  organizar, presentar, analizar e interpretar datos con el propósito de ayudar a una toma de decisiones más efectiva.

Las técnicas estadísticas se usan ampliamente por personas en áreas de comercialización, contabilidad, control de calidad, estudios de mercado, deportes, administración de hospitales, educación, política, medicina, ingeniería, entre otras disciplinas.

Tipos de estadística

Existen dos tipos de estadística
  • Estadística descriptiva: métodos para organizar, resumir y presentar datos de manera informativa.


EJEMPLO 1: un sondeo de opinión encontró que 49% de las personas en una encuesta sabían el nombre del primer libro en la Biblia. La estadística “49” describe el número de cada 100 personas que saben la respuesta.

EJEMPLO 2: según el Consumer Reports, los dueños de lavadoras de ropa Whirlpool reportaron 9 problemas por cada 100 máquinas durante 1995. La estadística “9” describe el número de problemas por cada 100 máquinas



  •  Estadística inferencial: Se refiere a una decisión, estimación, predicción o generalización sobre el comportamiento de una variable para toda una población, basándose en los datos de una muestra.


EJEMPLO 1: A partir de los datos de una muestra de 100 lavadoras de una determinada marca, se determinó que el promedio de vida útil de estos artefactos para uso doméstico es de 9,6 a 10,7 años con un nivel de confianza del 95%. Esto significa que si se tomó una muestra adecuada para conocer cuánto puede durar una lavadora en funcionamiento de manera regular, se pueden obtener a través de sus datos un intervalo estimado entre los que se podría encontrar la vida útil promedio de cualquier lavadora de la marca estudiada considerando un margen de certeza en que estos valores se pueden encontrar.

EJEMPLO 2: El departamento de contabilidad de una empresa elegirá una muestra de facturas para verificar la exactitud en el monto de todas las facturas de la compañía.

Población y muestra

Una población conjunto de todas las unidades  (personas, objetos, animales, etc.) que posean información sobre la variable que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. Se pueden identificar dos tipos de poblaciones: finitas e infinitas. 

Las poblaciones finitas son aquellas que puenden cuantificarse, como por ejemplo, el número de estudiantes en una escuela en un período específico, el número de trabajadores en una empresa para un determinado mes. En cambio, las poblaciones infinitas son aquellas que por su gran tamaño y variabilidad en el tiempo, son difíciles de cuantificar; por ejemplo, ela población económicamente activa en un país para un período específico, la población de cabezas de ganado en un territorio de más de 250.00 m2 en un mes.

Una muestra es subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de esta (sería una labor muy compleja), sino que se suele seleccionar una muestra que sea  suficientemente representativa de la población

Variables

Las variables son eventos que pueden ser medidos o cuantificados. Los datos de las variables se expresan en valores numéricos o en categorías o atributos. Las variables adquieren valor para la investigación científica cuando forma parte de  una hipótesis o una teoría. Las variables pueden ser de dos tipos: Variables cualitativas y variables cuantitativas.


  •  Variables cualitativas: Se expresan en categorías o atributos. (por ejemplo: nacionalidad, color de la piel, sexo).
  • Variables cuantitativas: Se expresan en valores numéricos y son medibles o cuantificables (edad, precio de un producto, ingresos anuales). Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:


    • Variables Discretas: sólo pueden tomar valores enteros. Por lo general resultan de procesos de conteo. Por ejemplo: número de hermanos (puede ser 1, 2, 3....,n., pero, nunca podrá ser 3,45).
    • Variables Continuas: pueden tomar cualquier valor real dentro de una escala de intervalo o de razón, por lo que pueden expresarse con fraccionamiento o decimales. Por lo general estas variables resultan de procesos de medición.  Por ejemplo, la velocidad de un vehículo puede ser 80,3 Km./h, 94,57 Km./h, etc. Las variables que se expresan en unidades monetarias, también se consideran continuas, como por ejemplo,  los ingresos, los gastos, los sueldos, los impuestos recaudados, entre otros.
 

Niveles de medición

Los niveles de medición es la forma como se representan los datos según los tipos de variables. Las variables cualitativas pueden tener dos tipos de niveles de medición: Nominales y Ordinales. Mientras que las variables cuantitativas pueden ser de Intervalo o de Razón. En el siguiente cuadro se muestran las definiciones y ejemplos de los niveles de medición.

VARIABLE
NIVEL DE MEDICIÓN
DEFINICIÓN
EJEMPLOS
CUALITATIVA
NOMINAL
La variable se expresa en unidades categóricas o atributos. Cuando la variable expresa solo la presencia o ausencia de un atributo, se dice que es de escala dicotómica
        Sexo (masculino, femenino)
        Condición Laboral (Activo, cesante, jubilado)
         Tipo de defecto (Rotura, rayas, abolladuras,consistencia)
 ORDINAL
La variable se expresa en unidades categóricas que pueden jerarquizarse o representan un orden.
         Actitudes (Totalmente de acuerdo, de acuerdo, posición neutra, en desacuerdo, totalmente en desacuerdo)
        Cargo desempeñado: Gerente de departamento, supervisores, jefes, inspectores, operarios)
        Tipo de crudo (Liviano, mediano, pesado, extra pesado)
CUANTITATIVAS
INTERVALO
La variable se expresa en cantidades. No existe un punto inicial,  o no hay un cero natura o lógico
         Nivel PH de las aguas
        Temperatura
        Estado de resultados (Utilidad o pérdida en Bs)
RAZON
La variable se expresa en cantidades. Existe un punto cero natura o lógico
         Peso
         Talla
        Número de empleados





Etapas de la investigación estadística

1. Formulación o definición del problema:  En esta fase debemos identificar plenamente qué ha de ser investigado, se debe formular la pregunta lo más precisamente posible.  Solo de esta forma el investigador puede decidir cuáles son los datos relevantes del problema. Si fracasa en esta formulación los datos compilados pueden ser irrelevantes o inadecuados. 

2. Identificar los factores importantes: En esta fase, debemos al menos de manera tentativa, los factores importantes que afectan el problema o que pueden jugar un papel importante en su solución.

3.  Proponer o refinar el modelo: Proponer un modelo para el problema, utilizando los conocimientos científicos o de la disciplina con la que se esté trabajando del fenómeno bajo estudio.  Consignar todas las limitaciones  y/p supuestos del modelo.

4.  Diseño de investigación: Una vez formulado con precisión el problema, el investigador debe decidir si estudiar toda la población o sólo una muestra extraída de ella. Si extrae una muestra ésta debe representar adecuadamente a la población, esto es fundamental en la teoría estadística, de otro modo puede que no se llegue a alcanzar ninguna conclusión válida. En esta fase se responden preguntas como:

¿Qué tipo de datos deben recogerse?
¿Cómo deben ser compilados los datos?
¿De qué tamaño debe ser la muestra?

5.   Recolección o compilación de datos: En esta fase se recolectan los datos, es la etapa más lenta y costosa de todo el proceso de investigación estadística y fundamental para el éxito de la investigación, puesto que de la calidad de los datos depende el éxito o fracaso de la investigación. No deben intervenir sentimientos ni juicios personales.

6.  Organización y descripción de los datos: Esta cuarta etapa de una investigación estadística incluye la organización, presentación y resumen de datos, mediante tablas o gráficos. Se calculan medidas descriptivas tales como proporciones, promedios o desviaciones estándares.

7.  Decisión o inferencia final: La última etapa consiste en responder basándose en las estadísticas de la muestra, al problema o la pregunta formulada originalmente, que siempre se refiere a los parámetros de la población.