The central objective of the thesis is to show that the significance levels are not altered when the sample sizes are large even though the distributions are not normal, that is, the averages of the non-normal distributions tend to be distributed Normal under the Central Limit Theorem. In this thesis we do not evaluate the power of the test, which consists of the probability of rejecting the null hypothesis H 0 when the alternative hypothesis is true. We will understand as a level of significance the probability of rejecting the hypothesis, when this is true, that is, it is the proportion of times that the hypothesis is rejected being true. In our case, we only consider the null hypothesis H 0, since the samples come from the same distribution and therefore have the same mean and the same variance. The part corresponding to the simulation was made considering two samples with specific sizes as if they were of two distinct populations. 10,000 sample pairs were sampled for each size and the number of times the T statistic was significant for three distributions was normal, uniform and exponential. Finally the conclusions section includes the histograms of 10,000 pairs of samples at 1% and 5%. In this way you can notice the differences that exist in the levels of significance.
El objetivo central de la tesis es demostrar que los niveles de significación no se alteran cuando el tamaño de las muestras son grandes a pesar de que las distribuciones no sean normales, es decir, los promedios de las distribuciones que no son normales tienden a la distribución normal en virtud del Teorema Central del Límite. En esta tesis no se valorar ?a la potencia de la prueba, la cual consiste en la probabilidad de rechazar la hipótesis nula H 0 cuando la hipótesis alternativa es verdadera. Entenderemos como nivel de significancia a la probabilidad de rechazar la hipótesis, cuando esta es cierta, es decir, es la proporción de veces que se rechaza la hipótesis siendo esta cierta. En nuestro caso únicamente consideramos la hipótesis nula H 0 , ya que las muestras provienen de la misma distribución por lo cual tienen la misma media y la misma varianza. La parte correspondiente a la simulación se realizó considerando dos muestras con tamaños específicos como si fueran de dos poblaciones distintas. Se realizaron 10,000 extracciones de parejas de muestras para cada tamaño y se obtuvo el número de veces que la estadística T resulto significativa, para tres distribuciones, normal, uniforme y exponencial. Finalmente en la parte de conclusiones se incluyen los histogramas de 10,000 pares de muestras al 1 % y al 5 %. De esta manera se pueden notar las diferencias que existen en los niveles de significancia.