domingo, 16 de marzo de 2008

ESTADISTICA

¿Qué es estadística?
La estadística es una colección de métodos para planificar y realizar experimentos, obtener datos y luego analizar, interpretar, y formular una conclusión basada en esos datos. Es la ciencia encargada de recopilar, organizar, analizar e interpretar información numérica o cualitativa, de manera que pueda llevar a conclusiones válidas.



¿COMENTARIO?


Es una forma que sirve para poder obtener datos por medio del analisis para poder organizar y dar significado una cierta cantidad de informacion es decir datos, para llegar a conclusiciones valederes.







¿QUE ES UNA VARIABLE?


Se refiere a una caracteristica que se mide en el estudio. en terminos estaditicos rigurosos, una variable es la representante de esas mediciones en el analisis. los datos medidos en una escala continuan u ordinal se expresan por medio de una variable. Es al que cambia o varia con diferentes cualidades. las variables pueden ser:



VARIABLES CUALITATIVAS:
Son las vaiables que expresan distintas cualidades, caracteristicas o modalidad. Cada modalidad que se presenta se denomica atributo o categoria y la medicion consiste en una clsificacion de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales.



1. VARIABLE CUALITATIVA ORDINAL: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque non es necesaria que el intervalo entre mediciones sea uniforme.



2. VARIABLE CUALITATIVA NOMINAL: En esta variable los valores no pueden ser sometidos a un criterio de orden.



VARIABLES CUANTITATIVA:
Son las variables que se expresan mediante cantidades numericas cuantitativas ademasn pueden ser discretas y continuas.


1. VARIABLE DISCRETA: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar.


2. VARIABLE CONTINUA: Es la variables que puede adquirir cualquier valor dentro de un intervalo especifico de valores.



¿COMENTARIO?
En este tema es basico para la estadistica por que en esto se basan varias operaciones y problemas numericos.Las variables son representaciones de mediciones o puede cambiar por medio de variables ordinales u continuas, adoptando diferentes valores en cada uno de los casos de un estudio.



Las variables cualitativas son las que se expresan por mediante caracteristicas y modalidades o cualidades. como lo son las variables ordinales y nominal.





Las variables ordinales son las que llevan una escala como: abecedario, leve, calendario.


Las variables nominales son las que no puede ser ordenadas como: los colores , las huellas digitales.





Las variables cuantitativas son las que se expresan medinate cantidades nùmericas.Como lo son las variables discretas y continuas.



Las variables discretas son las que no se pueden contar como un numero entero, el numero de hijos.


Las variables continuas son las que siguen una regla numerica como 1 dividido en 1000.



MEDIDAS DE TENDENCIA CENTRAL
Al analizar la informacionestadistica observamos un significativo comportamiento de los datos en cuanto a la frecuncia con que se presentan los valores y que algunos de estos valores son mas frecuentes que otros. Por lo que la mayor densidad de las frecuencias esta en la parte central de las graficas y ahi se deriva el nombre de MEDIDAS DE TENDENCIA CENTRAL o PROMEDIOS CENTRALES. La media aritmetica se representa por MEDIA, MODA, MEDIANA.



LA MEDIA o media aritmética de “n” datos numéricos es el cuociente entre la suma total de estos, dividida por “n”. La formula se representa asi:









LA MODA de una muestra de datos es aquel que presenta la mayor frecuencia.









LA MEDIANA es un conjunto de datos numéricos ordenados en forma creciente o decreciente, la mediana es el dato que se encuentra en el centro de la ordenación














VARIANZA:
Si elevamos al cuadrado las desviaciones logramos que todas las desviaciones den resultado positivos, luego si sumamos los cuadrados de las desviaciones y las dividimos dentro del nùmero de datos obtendremos la varianza que sirve de base para calcular la desviacion estandart.

DESVIACION TIPICA O ESTANDAR:
Es la media cuadratica de las desviaciones con respecto al promedio aritmetico es la raiz cuadratica de la media aritmetica de los cuadrados de las desviaciones de los datos de las desviaciones de los datos de la serie respecto a su media aritmetica.












DESVIACION MEDIA:
Es la media aritmetica de las desviaciones respecto a la media tomadas en valor absoluto, o sea es la suma de las desviaciones absolutas de todas las observaciones desde su media aritmetica, la cual es dividir entre numeros de observaciones.







MEDIA ARMONICA:
La media armónica , representada por H, de una cantidad finita de números es igual al
recíproco, o inverso, de la media aritmética de los recíprocos de dichos números
Así, dados los números a1,a2, ... , an, la media armónica será igual a:



La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.
La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos.




MEDIA CUADRATICA:
La media cuadrática es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos:
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los
errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema se resuelve, mediante la denominada media cuadrática. Consiste en elevar al cuadrado todas las observaciones (así los signos negativos desaparecen), en obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para volver a la unidad de medida original.
Otras medias
estadísticas son la media aritmética, la media ponderada, media cuadrática, media generalizada, media armónica y la media aritmética geométrica.

MEDIA GEOMETRICA:
La media geométrica de una cantidad finita de números (digamos n números) es la raíz n-ésima del producto de todos los números.
Sólo es relevante la media geométrica si todos los números son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un número negativo (o una cantidad impar de ellos) entonces la media geométrica es, o bien negativa o bien inexistente en los
números reales.
En muchas ocasiones se utiliza su trasformación en el manejo
estadístico de variables con distribución no normal.
La media geométrica es relevante
cuando varias cantidades son sumadas para producir un total.


¿COMENTARIO?

Las medidas de tendencia central le da significado a los datos de la frecuencia y representan los datos mas representativos que otros y siempre se encuentran en el medio de la grafica y se presentan por medio de formulas las cuales son LA MEDIA, LA MODA Y LA MEDIANA.



LA MEDIA: Es el promedio de la frecuencia o el numero de datos asignados.



LA MODA: Es el dato mas representativo de la frecuencia.



LA MEDIANA: Es el dato de la frecuencia que mas se repite.



LA DESVIACION ESTANDAR: Es la raiz cuadrada de los datos de la media aritmetica , la cual es transformar el dato negativo a positivo por medio de la elevacion al cuadrado y de la raiz para que el dato que de sea confiable.



LA DESVIACION MEDIA: Es la suma de todos los datos de la media aritmetica las cuales son divididas entre numerosn de la observacion.



LA MEDIA ARMONICA: Es es la que se representa por medio de una H la cual es una cantidad finita de numeros o la contraria de la media aritmetica y no se extiende anumeros nulos de la operacion.



LA MEDIA CUADRATICA: Esta es la suma de los datos de la raiz cuadrada dividido entre los numeros de la frecuencia.



LA MEDIA GEOMETRICA: Esta es cuando varias cantidads se suman para hacer un total ya que si la cantidad proporcionada hay un 0 el resultado siempre sera 0.



Estas formulas son utilizadas para llevar a cabo un presicion de datos de una frecuencia de n cantidad para poder formular de forma simultania y concreta.

SUMATORIA

La sumatoria es la parte de la estadistica que se ocupa de las suma de grandes cantidades de numeros determinados en la cual se utiliza el signo (SIGMA) que es una letra griega que significasuma ( Σ ) puedesumar cantidades infinitas. Son utilizadas para sumar numeros arbitrarios y naturales y se representa como N numeros. La sumatoria esta compuesta por:

( Σ ) : sigma letra griega que indica que debe realizarce la sumatoria

N: Es el limite superior de la sumatoria.

Xi: La variable con su indice representa el IESIMO elemento de conjunto.

i: Es el limite inderior de la sumatoria.

¡COMENTARIO?

En este tema creo que en la estadistica nos encontramos frecuentemente con la suma de gran número de terminos y para indicar que esos valores van a ser sumados se coloca el signo de suma que es ( Σ ) SIGMA la cual se puede combinar como las variables .

EL DIAGRAMA DE TALLOS Y HOJAS
Es una tecnica estadistica para representar un conjunto de datos. Cada valor numerico se divide en dos partes. EL o los digitos principales forman el tallo y los digitos secundarios las hojas. Los tallos estan colocados a lo largo de del eje vertical, y las hojas de cada observacion a lo largo del eje horizontal.

tallo hoja fa f f%

1 4,5,6,7,9 5 5 21.74

2 5,8,9 8 3 13.04

3 1,7 10 2 8.70

4 2,7,8 (3) 3 13.04

5 1,2,3,3,7 10 5 21.74

6 0,2,5,8 5 4 17.39

7 2 1 1 4.35

23// 100%//


?COMENTARIO?

En el diagrama de tallos y hojas se representa por numeros primarios que son los tallos asi como 15 y los secundarios son las hojas asi como 0 ose se representeria asi TALLOS=15-0=HOJAS esto se se multiplica y todos los datos se combierten a porcentajes y todos deben dar 100% para representa que la operacion es muy comprobable ejemplo:

en el ejercicio anterior F= a la frecuencia se toma el primer numero que en este caso es 5 y se divide por la cantidad de numeros que se tienen en este caso es 23 y se opera 5 /23 y se multiplica por 100 y asi se saca el porcentaje para realizar el diagrama de tallos y hojas.

DIAFRAMA DE CAJAS Y BIGOTES (BOX Y WHISKER PLOT)

Es la representacion visual que representa varias caracteristicas al mismo tiempo de un conjunto de datos importantes, tales como el centro, la dispersion, el alejamiento de la simetria, y la identificacion de valores extremos (puntos atipicos), es decir de, de valores que se alejen de una manera inusual de los demas datos. PResenta los tres cuartiles (y los valores minimos y maximos) alineados sobre una caja vertical u horizontal.

Para el diagrama de cajas y bigotes se requiere
Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras".

La altura (anchura) de la caja no interesa.
La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico

El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H
Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles, la cercainterna inferior menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.
Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas.

COMENTARIO

En el diagrama de cajas y bigotes se calcula sacando la mediana y se puede colocar como sentro y los bigotes se representan como el dato mas pequeno hasta el mas grande y las cercas interiores s multiplican por 1.5(CIi+CIs) y las cercas extermas se multiplican por3(CEi+CEs) con esto podemos calcular una caja ya sea horizontal o vertical pero los datos deben guiarse por los cuartiles y la mediana para que el resultado sea positivo. Y esto se presentan por medio de formulas que se pueden cuantificar por medio de una frecuencia.

AREA BAJO LA CURVA NORMAL.

La altura maxima de la curva esta en la media, que en este caso es el promedio de todos los datos tabulados en una distribucion. Es asintoptica porque las colas de la curva no pueden tocar la línea de base. El rasgo más importante de la curva normal es susimetria, ya que si doblamos la curva en su punto mas alto creariamos dos mitades iguales, es unimodal porque solo tiene un punto máximo de frecunecia contiene el 100% de los datos a calcular.

COMENTARIO

en este tema el area bajocurva representa la altura maxima de la media y se puede hacer por medio de tabulacion de todos los datos de la frecuencia que se puede hacer porcentajey la pormula se calcula primero se toma el numero de frecuencias y se resta por la media y se divide por la desviacion estandart y se puede hacer tambien con la zona de normalidad y posee el 100% de datos a calcualr.