Distribución de Fisher: guía completa sobre la distribución de Fisher en estadística direccional

La estadística direccional se ocupa de datos en posiciones de direcciones, ángulos y trayectorias sobre superficies curvas. En este marco, la distribución de Fisher, también conocida en numerosos textos como la distribución de von Mises–Fisher (vMF), es uno de los modelos fundamentales para describir datos que se concentran alrededor de una dirección central en una esfera. En este artículo exploramos qué es la distribución de Fisher, sus parámetros, propiedades, métodos de estimación y aplicación en ciencia de datos, biología, geografía y otras disciplinas. Si buscas entender la distribución de Fisher de manera profunda y práctica, este texto te ofrece una visión clara, con ejemplos y pautas para utilizarla correctamente en tus análisis.

Qué es la distribución de Fisher y por qué es tan importante

La distribución de Fisher pertenece al conjunto de las distribuciones espaciales o direccionales. Su objetivo es modelar datos que son vectores unitarios, es decir, puntos en la esfera de radio uno. En términos simples, dada una dirección mu en el espacio y un nivel de concentración kappa, la densidad de la distribución de Fisher favorece las observaciones que se sitúan cerca de mu y penaliza las que se alejan. Este comportamiento la convierte en una alternativa natural para describir direcciones, orientaciones y direcciones de movimiento en tres dimensiones o en dimensiones superiores.

La idea central es que la densidad toma la forma exponencial de la proyección de cada punto x sobre la dirección media mu. En una esfera S^{p−1} (p es la dimensión del espacio, por ejemplo p=3 para ℝ^3), la fórmula de densidad es intensamente intuitiva: cuanto mayor es kappa, mayor es la concentración alrededor de mu. Cuando kappa se acerca a cero, la distribución se aproxima a una distribución uniforme en la esfera. En resumen, la distribución de Fisher es fundamental para describir datos direccionales con un único modo de concentración alrededor de una dirección central.

Definición formal y parámetros de la distribución de Fisher

Sea x un vector en la esfera S^{p−1} de ℝ^p (es decir, ||x|| = 1) y mu un vector unitario que señala la dirección media. El parámetro de concentración kappa es un número real no negativo. En estas condiciones, la densidad de la distribución de Fisher se escribe como:

f(x; mu, kappa) = C_p(kappa) · exp(kappa · mu^T · x) para x ∈ S^{p−1}

donde C_p(kappa) es la constante de normalización que asegura que la densidad integre a 1 sobre la esfera y depende solo de p y kappa. El término exp(kappa · mu^T · x) favorece puntos x cercanos a mu cuando kappa es grande y concede más libertad para kappa cercana a 0.

Parámetros principales:

mu: dirección media, un vector unitario en ℝ^p que indica la orientación alrededor de la cual se concentra la muestra.
Kappa: concentración, un escalar no negativo que controla cuánto se agrupan las observaciones alrededor de mu. Kappa = 0 implica uniformidad en la esfera; cuanto mayor es kappa, mayor es la concentración.
Dimensión p: dimensión del espacio en el que se definen las direcciones. Para datos en 3D, p = 3; en otras aplicaciones, p puede ser mayor.

La constante de normalización C_p(kappa) se expresa mediante funciones de Bessel modificadas de orden v = p/2 − 1:

C_p(kappa) = kappa^{v} / [(2π)^{p/2} · I_v(kappa)], donde v = p/2 − 1 y I_v es la función de Bessel modificada de primer tipo de orden v.

Esta forma garantiza que la densidad esté correctamente normalizada en la esfera S^{p−1}. En la práctica, calcular I_v(kappa) puede requerir bibliotecas numéricas especializadas, especialmente para valores grandes de kappa o dimensiones altas.

Relación entre la distribución de Fisher y la distribución von Mises–Fisher

En la literatura de estadística direccional, la distribución de Fisher es, en gran medida, un nombre histórico para lo que hoy en día suele llamarse distribuición von Mises–Fisher (vMF). Ambos nombres se refieren al modelo exponencial en el que la densidad depende de la proyección mu^T x. En muchos textos modernos, el término von Mises–Fisher se utiliza para enfatizar su relación con la familia de distribuciones en esferas de dimensión p, mientras que la expresión distribución de Fisher se mantiene en contextos históricos o específicos. En cualquier caso, el modelo comparte la misma estructura fundamental y las mismas propiedades de concentración alrededor de mu cuando kappa crece.

Una ventaja de entender esta conexión es que muchas técnicas de estimación, prueba y simulación desarrolladas para la vMF se aplican directamente a la distribución de Fisher en p dimensiones. Por ejemplo, las estimaciones por máxima verosimilitud, las aproximaciones para kappa a partir del coeficiente de concentración observado y los métodos de muestreo se benefician de este marco unificado.

Propiedades clave de la distribución de Fisher

Dirección media y concentración

La dirección media de la distribución de Fisher es mu, y la variación de los datos alrededor de esa dirección se mide por kappa. A medida que kappa crece, la distribución se concentra cada vez más cerca de mu, y las muestras tienden a alinearse fuertemente con esa orientación. En el límite kappa → ∞, las observaciones casi siempre están en la dirección mu; en el límite kappa → 0, la distribución se aproxima a una distribución uniforme sobre la esfera.

Constante de normalización y funciones de Bessel

La constante de normalización C_p(kappa) depende de p y kappa, y su expresión implica la función de Bessel I_v. Esta dependencia garantiza que la densidad sume a 1 sobre la esfera. El manejo práctico de C_p(kappa) suele requerir el cálculo de I_v(kappa) con bibliotecas numéricas especializadas, especialmente en dimensiones altas o para valores extremos de kappa.

Momento y densidad

La media de la distribución de Fisher apunta en la dirección mu y su magnitud depende de kappa y de la dimensión p. En particular, el primer momento E[x] es proporcional a mu, con una cantidad de concentración que se denota a veces como A_p(kappa). Este término, que involucra las funciones de Bessel, describe cuánto peso tiene la media en la distribución de Fisher y cuánta variabilidad queda en las direcciones ortogonales a mu.

Estimación de parámetros: cómo ajustar la distribución de Fisher a tus datos

Cuando tienes una muestra de vectores unitarios x_1, x_2, …, x_n tomadas de la esfera, el objetivo es estimar la dirección mu y la concentración kappa que mejor describen los datos bajo la distribución de Fisher. A continuación se describen las ideas centrales para estimar cada parámetro.

Estimación de la dirección mu (MLE)

La estimación por máxima verosimilitud de mu es sorprendentemente simple. Sea R = ∑_{i=1}^n x_i la suma vectorial de las observaciones. La estimación de mu es la dirección de este vector suma, normalizada a unidad:

μ̂ = R / ||R||

En palabras simples, la media de los datos en el sentido vectorial define la dirección que mejor resume el conjunto de direcciones observado.

Estimación de la concentración kappa

La estimación de kappa no tiene una solución cerrada en general. Se obtiene a partir de la relación entre la concentración observable y la función A_p(kappa), que describe la magnitud de la media en función de kappa. Sea R = ||∑ x_i|| y R̄ = R / n. Definimos

A_p(kappa) = I_{v+1}(kappa) / I_v(kappa) con v = p/2 − 1

Entonces, la estimación de kappa, kappâ, se obtiene resolviendo A_p(kappâ) = R̄. Dado que I_v(kappa) no se puede invertir de forma explícita, se utilizan métodos numéricos. En la práctica, se emplean aproximaciones iniciales para iniciar el método iterativo. Algunas guías útiles para p = 3 (dimensión espacial habitual) son las siguientes:

Si R̄ < 0.53, kappâ ≈ 2R̄ + R̄^3 + 5R̄^5/6.
Si 0.53 ≤ R̄ < 0.85, kappâ ≈ -0.4 + 1.39R̄ + 0.43/(1 − R̄).
Si R̄ ≥ 0.85, kappâ ≈ 1.39R̄ − 0.4.

Para dimensiones p distintas, existen generalizaciones de estas fórmulas y, a menudo, se recurre a procedimientos numéricos como métodos de Newton-Raphson o búsqueda en rejilla que aseguren la convergencia hacia el valor de kappa que satisface la ecuación A_p(kappa) = R̄.

Una guía práctica para estimar kappa en dimensiones mayores es iniciar con una estimación empírica basada en R̄ y luego refinarla con un algoritmo de optimización que evalúe la verosimilitud de los datos bajo la distribución de Fisher.

Pruebas, simulación y muestreo de la distribución de Fisher

Métodos de muestreo para la distribución de Fisher

La generación de muestras de la distribución de Fisher es un tema práctico para simulaciones y validación de modelos. En la práctica, se puede usar un enfoque basado en la construcción de vectores aleatorios con una componente de proyección en mu y componentes ortogonales. Un esquema típico consiste en:

Elegir mu como dirección deseada (un vector unitario).
Seleccionar un valor de kappa de acuerdo con la concentración pretendida.
Generar una variable aleatoria w en el intervalo [-1,1] con una densidad que depende de kappa y del orden v = p/2 − 1 (la forma exacta se puede obtener a partir de la densidad marginal de la proyección en la dirección mu).
Generar un vector ortogonal u en el subespacio perpendicular a mu de forma uniforme en la esfera S^{p−2} y formar x = w mu + sqrt(1 − w^2) · u. Este x tendrá la distribución de Fisher con los parámetros seleccionados.

Existen algoritmos más directos y eficientes, como los desarrollados para la distribución von Mises–Fisher (vMF), que aprovechan propiedades de las funciones de densidad exponencial en espacios de alta dimensión. En bibliografía y software estadístico, estos métodos están disponibles en paquetes de R, Python y otros entornos de análisis de datos para facilitar la simulación de muestras de la distribución de Fisher.

Pruebas de ajuste y evaluación de modelos

Para evaluar si una muestra de direcciones se ajusta bien a una distribución de Fisher, se pueden usar varias estrategias. Entre ellas se encuentran:

Pruebas de bondad de ajuste basadas en simulación, comparando la estadística observada con la distribución empírica obtenida de simulaciones.
Comparación de modelos: si se tienen varias direcciones candidatas, se comparan verosimilitudes y se elige la que ofrezca mejor ajuste, aplicando criterios como AIC o BIC ajustados a distribuciones direccionales.
Estudios de residualidad en el espacio direccional, inspeccionando la dispersión de residuos tras la estimación de mu y kappa.

Aplicaciones prácticas de la distribución de Fisher

La distribución de Fisher se utiliza en una amplia gama de campos para modelar direcciones y orientaciones. Algunas de sus aplicaciones típicas incluyen:

Biología y ecología: para describir direcciones de movimientos migratorios, orientación de animales o la dirección de polen y semillas transportadas por el viento.
Geografía y navegación: para modelar la orientación de trayectorias de barcos, aeronaves o migraciones de fauna en el planeta.
Neurociencia y biomedicina: para analizar direcciones de fibras en imágenes de difusión o direcciones de crecimiento neuronal en cultivos y tejidos.
Astronomía y geodesia: para estudiar direcciones de vectores estelares o fenómenos direccionales en observaciones astronómicas.
Robótica y visión por computadora: para modelar direcciones de movimientos de robots y flujo direccional de vectores en imágenes.

En todos estos casos, la distribución de Fisher ofrece una forma coherente y computacionalmente manejable de modelar la variabilidad direccional y de estimar tendencias centradas en una dirección dominante, así como de cuantificar la concentración de las observaciones alrededor de esa dirección.

Comparación con otras distribuciones direccionales

Además de la distribución de Fisher, existen otros modelos útiles para datos en la esfera y en espacios direccionales. Entre ellos destacan:

Von Mises en una dirección angular (distribución de Von Mises para variables angulares): útil para datos en un círculo (2D), donde la densidad depende de la diferencia angular respecto a una dirección media.
Distribuciones de Bingham o Fisher–Bingham para direcciones en esferas de mayor dimension, que permiten una estructura de dispersión más compleja al ser no isotrópicas.
Distribuciones cruzadas que combinan componentes direccionales en varias direcciones relevantes para datos en alta dimensión (p > 3).

La elección entre la distribución de Fisher y estas alternativas depende de la forma de la dispersión observada. Si la concentración es aproximadamente isotrópica alrededor de una sola dirección, la distribución de Fisher es una opción robusta y fácil de estimar. En escenarios con dispersión anisotrópica o múltiples modos, puede ser preferible una familia más flexible, como la Fisher–Bingham.

Guía práctica para trabajar con la distribución de Fisher en tus proyectos

Si estás preparando un análisis de datos direccionales, estas pautas pueden ayudarte a aplicar de forma efectiva la distribución de Fisher:

Verifica primero la naturaleza direccional de tus datos: ¿son vectores unitarios o requieren normalización? La distribución de Fisher asume vectores en la esfera.
Elige la dimensión p adecuada: si trabajas con datos en 3D, p = 3; si consideras direcciones en un subespacio de mayor dimensión, ajusta p en consecuencia.
Estima mu como la dirección promedio de tus datos: μ̂ = (∑ x_i) / ||∑ x_i||.
Calcula R̄ = ||∑ x_i|| / n para usar en la estimación de kappa. Emplea las fórmulas de aproximación para kappa o realiza una búsqueda numérica para resolver A_p(kappa) = R̄.
Utiliza bibliotecas estadísticas para calcular I_v(kappa) y la constante de normalización C_p(kappa) cuando necesites la densidad o generar muestras.
Si el tamaño de muestra es pequeño o la concentración es débil (kappa cercano a 0), considera estrategias de bootstrapping para evaluar la estabilidad de las estimaciones.
Interpreta kappa como la fuerza de la dirección: valores pequeños indican dispersión amplia, valores grandes indican fuerte alineación alrededor de mu.
Documenta claramente la definición de mu y kappa para tu conjunto de datos y evita confusiones si trabajas con diferentes convenciones en la literatura.

Conclusión: puntos clave sobre la distribución de Fisher

La distribución de Fisher es una herramienta central en estadística direccional, especialmente en escenarios donde las observaciones son vectores en la esfera y se busca una dirección media junto con una medida de concentración. Su forma funcional, basada en una densidad exponencial dependiente de la proyección mu^T x y normalizada mediante la constante C_p(kappa) que involucra la función de Bessel, la coloca como un modelo natural para describir direcciones y orientaciones en ℝ^p. Aunque en la literatura moderna se habla a menudo de la distribución von Mises–Fisher, la idea subyacente es la misma: un modelo direccional con concentración controlada por kappa y orientación dada por mu.

En la práctica, la estimación de mu es directa: mû es la dirección del vector suma de las observaciones. La estimación de kappa requiere métodos numéricos y, a menudo, aproximaciones iniciales que aceleran la convergencia. La generación de muestras, las pruebas de ajuste y las aplicaciones reales muestran que la distribución de Fisher es una herramienta potente y versátil para analizar datos direccionales en ciencia de datos, biología, geografía y mucho más.

Con esta visión amplia y práctica, tienes una guía sólida para trabajar con la distribución de Fisher en tus análisis. Ya sea que busques entender la teoría subyacente o aplicar métodos de estimación y simulación, este modelo ofrece una base estable para describir direcciones y su dispersión en una variedad de contextos.