If we look at a set of numerical data and ask ourselves what is the probability that the number 1 is the first significant digit? Almost immediately we would answer that it is 1/9, because having nine options, {1,. . . , 9}, our intuition would make us think that the nine digits have the same probability. But this is wrong, actually it is log 10 (2). These probabilities are provided by the Benford law, which was initially considered a "curious" mathematical phenomenon, but in the 70's began to be used in applications, mainly in computing, so it was necessary to get a better Understanding of this law. It was not until the 1990s that Hill, using Lebesgue's theory, achieved the mathematical justification of the Benford law, but did not quite understand the nature of this law. The objective of this work is to understand the nature of this phenomenon, for this our work tool is the Fourier analysis, with which we will find sufficient conditions for a random variable to satisfy the Benford law. We then propose a rather simple model in the Z 2 × Z 2 group to understand the behavior of the Benford law in this group. Then, we will generalize the idea of the model to the positive real, fulfilling our objective. We also do some simulations to see how useful the Benford law can be in conjunction with the χ 2 test to detect anomalies in data sets.
Si observamos un conjunto de datos numérico y nos preguntan ¿Cuál es la probabilidad de que el numero 1 sea el primer dígito significativo? de manera casi inmediata contestaríamos que es 1/9, pues teniendo nueve opciones, {1, . . . , 9}, nuestra intuición nos haría pensar que los nueve dígitos tienen la misma probabilidad. Pero esto es erróneo, en realidad es log 10 (2). Estas probabilidades nos la proporciona la ley Benford, que en un principio fue considerada como un fenómeno matemático “curioso”, pero en la década de los 70’s se empezó a utilizar en aplicaciones, principalmente en la computación, por lo que fue necesario obtener un mejor entendimiento de esta ley. No fue hasta los 90’s que Hill, utilizando la teoría de Lebesgue, logro la justificación matemática de la ley Benford, pero no entendió bien la naturaleza de esta ley. El objetivo de este trabajo es entender la naturaleza de este fenómeno, para esto nuestra herramienta de trabajo es el análisis de Fourier, con el que encontraremos condiciones suficientes para que una variable aleatoria satisfaga la ley Benford. Después proponemos un modelo bastante sencillo en el grupo Z 2 × Z 2 para entender el comportamiento de la ley Benford en este grupo. Luego, generalizaremos la idea del modelo a los reales positivos, cumpliendo con nuestro objetivo. También hacemos algunas simulaciones para ver qué tan útil puede ser la ley Benford en conjunto con la prueba χ 2 para detectar anomalías en conjuntos de datos.