Paso a paso aleatorio: explorando el modelo de caminata aleatoria

Tutoriales

Python

En mi primer curso de estadísticas basado en codificación en la universidad, mi profesor planteó una pregunta: ¿cómo podemos modelar el movimiento browniano de una sola partícula de polen en un plato de agua? Después de varios intentos fallidos, mis compañeros de clase y yo finalmente dimos con la respuesta correcta: una caminata aleatoria. Más tarde aprendí que este modelo simple se utiliza para modelar todo tipo de cosas, desde movimientos de animales hasta fluctuaciones de precios de acciones.

En este artículo, exploraremos los fundamentos matemáticos de las caminatas aleatorias, examinaremos diferentes tipos y discutiremos sus aplicaciones. Parte de lo que hace interesante a la caminata aleatoria es que se utiliza en tantas disciplinas diferentes. Además de mi ejemplo, en física, ayuda a describir el movimiento de partículas; en finanzas, modela las fluctuaciones de precios de acciones; y en biología, explica los patrones de movimiento de los animales. Las caminatas aleatorias capturan la aleatoriedad del mundo real, lo cual es clave para simular procesos estocásticos.

Para aquellos que buscan construir una base sólida en las estadísticas que sustentan la teoría de la caminata aleatoria, recomendamos comenzar con el curso Introducción a la Estadística en R o el curso Introducción a la Estadística en Python.

¿Qué son las caminatas aleatorias?

En teoría de la probabilidad, una caminata aleatoria es un modelo que describe una secuencia de pasos aleatorios que forman un camino. O de otra manera, podríamos decir que una caminata aleatoria es un modelo matemático que describe un camino formado por una secuencia de pasos, cada uno determinado de forma independiente y con cierta probabilidad. Esta estocasticidad hace que las caminatas aleatorias sean inherentemente impredecibles.

Imagina a una persona dando un paso en una dirección aleatoria en cada momento. Con el tiempo, su camino forma un sendero impredecible y serpenteante. A pesar de su simplicidad, este concepto tiene una profundidad y versatilidad sorprendentes, modelando varios escenarios del mundo real que involucran la aleatoriedad.

Una explicación conceptual de una caminata aleatoria. Imagen cortesía de napkin.ai.

La idea de las caminatas aleatorias se remonta a los primeros estudios de probabilidad. Uno de los primeros ejemplos, a menudo llamado la caminata del borracho, ilustra cómo una persona que da pasos al azar vagará erráticamente en lugar de moverse predeciblemente hacia un destino. Esta aleatoriedad, combinada con la suposición de que cada paso es independiente de los anteriores, sentó las bases para los modelos modernos de caminatas aleatorias.

Comprendiendo las Matemáticas de las Caminatas Aleatorias

Para entender las caminatas aleatorias, comencemos con un caso simple: una caminata aleatoria unidimensional (1D).Imagina una partícula en una línea numérica. Puede moverse ya sea +1 o -1 a lo largo de la línea numérica con cada paso. Cada movimiento está determinado por una probabilidad igual de moverse a la derecha o a la izquierda. Con el tiempo, la posición de la partícula forma una distribución de probabilidad que se expande, representando la probabilidad de encontrarla en diversas ubicaciones.

Este principio se puede expandir a dos o tres dimensiones. En una caminata aleatoria bidimensional (2D), la partícula se mueve en un plano y puede dar un paso en cualquiera de las cuatro direcciones cardinales (arriba, abajo, izquierda, derecha) con igual probabilidad. De manera similar, en una caminata aleatoria tridimensional (3D), la partícula se mueve en el espacio y puede dar un paso en cualquiera de las seis direcciones posibles (arriba, abajo, izquierda, derecha, adelante, atrás) con igual probabilidad. Estas caminatas aleatorias en dimensiones superiores capturan escenarios aún más complejos y realistas.

Una característica definitoria de las caminatas aleatorias es su naturaleza estocástica, lo que significa que cada paso depende solo de la posición actual y no de los pasos anteriores. Esto las convierte en un tipo de proceso de Markov: un concepto matemático donde el estado futuro depende únicamente del estado presente, no de la secuencia de eventos que lo precedieron. Este movimiento “sin memoria”, combinado con distribuciones de probabilidad que describen posiciones potenciales, proporciona una sólida base matemática para entender las caminatas aleatorias.

Podemos analizar un paseo aleatorio utilizando propiedades estadísticas para entender su comportamiento a lo largo del tiempo. Esto implica examinar aspectos como la distancia esperada desde el punto de partida, la distribución de probabilidad de las posiciones posibles y la probabilidad de regresar al origen. Estos análisis nos ayudan a cuantificar la aleatoriedad y la previsibilidad, proporcionar ideas sobre patrones y hacer predicciones.

Propiedades Clave de los Paseos Aleatorios

Los paseos aleatorios tienen varias propiedades importantes que nos ayudan a entender su comportamiento y aplicaciones. Aquí hay algunos aspectos clave a considerar:

Expectativa y varianza

En un paseo aleatorio unidimensional, podemos calcular la distancia esperada (o posición media) desde el punto de partida a lo largo del tiempo. Si cada paso tiene la misma probabilidad de moverse a la izquierda o a la derecha, la posición esperada después de muchos pasos sigue siendo cero, lo que implica que, en promedio, el caminante se mantiene cerca del punto de partida.

Sin embargo, la varianza de la posición, que mide la dispersión o distribución de posiciones posibles, aumenta con cada paso. Específicamente, en un paseo aleatorio simétrico, la varianza crece linealmente con el número de pasos, lo que lo convierte en un indicador útil de la distancia típica desde el origen a lo largo del tiempo.

Autocorrelación

Aunque los paseos aleatorios simples no tienen correlación entre pasos (cada paso es independiente del anterior), ciertos tipos de paseos aleatorios introducen autocorrelación, donde los pasos pasados pueden influir en los futuros. Por ejemplo, en un paseo aleatorio sesgado, los pasos pueden tener una ligera tendencia en una dirección, lo que hace que las posiciones sean más predecibles.

La autocorrelación en un paseo aleatorio impacta cómo modelamos y predecimos la progresión del paseo. Esto es especialmente relevante en aplicaciones donde el comportamiento pasado influye en los pasos futuros, como ciertos modelos financieros.

Teorema del límite central

El teorema del límite central (TLC) nos dice que la suma de un gran número de variables aleatorias independientes tiende a seguir una distribución normal (o gaussiana), independientemente de la distribución original. En el contexto de caminatas aleatorias, esto significa que a medida que aumenta el número de pasos, la distribución de posiciones tiende a parecerse a una distribución normal. Esta es una propiedad útil porque nos permite aproximar la probabilidad de encontrar al caminante a ciertas distancias del punto de partida.

Ley de los grandes números

La ley de los grandes números (LLN) explica que a medida que aumenta el número de ensayos o pasos, el promedio de los resultados converge hacia el promedio real. Para caminatas aleatorias, esto significa que mientras la posición promedio sigue siendo cero, la varianza y el rango de posiciones posibles crecen de manera predecible con cada paso adicional. Este principio ayuda a cerrar la brecha entre la aleatoriedad pura y los patrones estadísticos predecibles en muestras grandes.

Tipos de Caminatas Aleatorias

Las caminatas aleatorias varían ampliamente dependiendo de las reglas que rigen cada paso. Estos tipos influyen en el comportamiento de la caminata. Algunas están diseñadas para entornos simples o estructurados, mientras que otras están preparadas para fenómenos más complejos del mundo real. Vamos a explorar algunos de los tipos más comunes de caminatas aleatorias.

1D, 2D y 3D caminatas aleatorias

La dimensionalidad de una caminata aleatoria juega un papel fundamental en su comportamiento. En una caminata aleatoria de 1D, cada paso es un avance o un retroceso a lo largo de una línea. Esto hace que la caminata sea relativamente fácil de modelar y predecir.

Sin embargo, al pasar a caminatas aleatorias en 2D (plano) y 3D (espacio), los caminos posibles aumentan significativamente, introduciendo nuevos comportamientos. Por ejemplo, en una caminata aleatoria en 2D, la probabilidad de regresar al punto de partida sigue siendo alta, mientras que en una caminata aleatoria en 3D, esta probabilidad disminuye.

Este cambio es importante en campos como la física y la química, donde las partículas podrían difundirse de manera diferente dependiendo de las restricciones dimensionales.

Camino aleatorio en una red

En un camino aleatorio en una red, el movimiento está restringido a puntos discretos en una cuadrícula o red. Este tipo de camino se usa comúnmente en física y teoría de redes, donde los nodos están dispuestos en una cuadrícula y el movimiento solo puede ocurrir hacia los nodos vecinos.

Un ejemplo común es una red 2D, donde cada paso permite el movimiento a puntos adyacentes en una cuadrícula cartesiana. Esta restricción simplifica la modelización al limitar los caminos de movimiento, lo cual es útil al simular redes complejas o estructuras moleculares.

Camino aleatorio gaussiano

En un paseo aleatorio gaussiano, el tamaño de cada paso está determinado por una distribución gaussiana (o normal). En lugar de moverse por una distancia fija, el tamaño del paso varía de acuerdo con una distribución en forma de campana, con la mayoría de los pasos siendo pequeños y algunos saltos más grandes de forma ocasional. Este tipo de caminata se utiliza con frecuencia en la modelización financiera para tener en cuenta la variabilidad en los cambios de precios de activos.

Caminatas aleatorias heterogéneas y sesgadas

Las caminatas aleatorias heterogéneas y sesgadas permiten la variación en la dirección y tamaño del paso en función de ciertas probabilidades. Esta flexibilidad las hace más adaptables a escenarios del mundo real.

En un paseo aleatorio heterogéneo, la probabilidad de moverse en cualquier dirección puede cambiar según la ubicación o condiciones externas. Por ejemplo, los animales que buscan comida pueden favorecer áreas con recursos conocidos, creando un paseo aleatorio sesgado. Estas caminatas son útiles para estudiar comportamientos que dependen de factores contextuales.

Paseo aleatorio con deriva

En una caminata aleatoria con deriva, hay una tendencia consistente a moverse en una dirección. Por ejemplo, los precios de las acciones pueden mostrar una tendencia general al alza a lo largo del tiempo a pesar de las fluctuaciones diarias. La deriva en estas caminatas representa una fuerza externa o tendencia que influye en el camino. Este tipo se ve a menudo en finanzas, donde los modelos incorporan un término de deriva para representar el crecimiento o la disminución, ofreciendo un enfoque más realista para predecir los precios de los activos y las tendencias del mercado.

Cada uno de estos tipos de caminata aleatoria sirve a un propósito único, ofreciendo diferentes formas de modelar comportamientos aleatorios pero estructurados. Las restricciones dimensionales, la distribución de pasos y la presencia de deriva o sesgo hacen que las caminatas aleatorias sean altamente versátiles para la modelización de datos y simulación en diversos campos.

Aplicaciones del Mundo Real de las Caminatas Aleatorias

Las caminatas aleatorias son más que simples constructos teóricos; desempeñan un papel esencial en muchas aplicaciones prácticas en diversas disciplinas. Veamos cómo las caminatas aleatorias informan la resolución de problemas del mundo real en diferentes sectores.

Aplicaciones en ciencia de datos y aprendizaje automático

Ciencias de la computación

Las caminatas aleatorias sustentan varios algoritmos de informática, como el muestreo aleatorio, la traversía de gráficos web y la segmentación de imágenes. Por ejemplo, el algoritmo PageRank de Google utiliza caminatas aleatorias para clasificar páginas web según su relevancia, simulando cómo un usuario podría navegar aleatoriamente entre enlaces en internet.

Extracción de características

En el aprendizaje automático, las caminatas aleatorias pueden ayudar a extraer características al resaltar las relaciones dentro de los puntos de datos. Por ejemplo, en el análisis de redes, las caminatas aleatorias pueden revelar conglomerados o comunidades, ayudando en tareas como sistemas de recomendación y análisis de redes sociales.

Detección de anomalías

Las caminatas aleatorias también pueden utilizarse para detectar anomalías en conjuntos de datos. Por ejemplo, si los puntos de datos se desvían significativamente de un camino típico en un modelo de caminata aleatoria, estos puntos podrían indicar eventos inusuales o errores en los datos. La detección de anomalías es especialmente valiosa en campos como ciberseguridad y detección de fraudes.

Simulación de procesos estocásticos

Las caminatas aleatorias simulan procesos estocásticos, o determinados aleatoriamente, lo que permite a los científicos de datos modelar fenómenos del mundo real impredecibles. Al simular caminatas aleatorias, podemos obtener información sobre sistemas en los que la predicción precisa es desafiante, como los patrones climáticos o el comportamiento del cliente.

La predicción de series temporales

En el análisis de series temporales, las caminatas aleatorias forman la base de ciertos modelos de predicción, incluida la hipótesis de caminata aleatoria en finanzas. Estos modelos asumen que los valores futuros en una serie temporal dependen únicamente del valor más reciente, sin correlación con las tendencias pasadas.Para obtener más información sobre la predicción de series temporales, consulta ARIMA para la Predicción de Series Temporales: Una Guía Completa. Además, realiza nuestro curso Predicción en R con el Profesor Hyndman, quien conecta los modelos de caminata aleatoria con métodos de predicción ingenuos y estacionalmente ingenuos.

Aplicaciones en otros campos

Finanzas

Uno de los usos más notables de las caminatas aleatorias es en la modelización financiera, especialmente para predecir los precios de las acciones. La hipótesis del mercado eficiente sugiere que los movimientos de los precios de las acciones son esencialmente aleatorios, ya que la nueva información se absorbe instantáneamente, haciendo que los precios futuros sean impredecibles. Las caminatas aleatorias se pueden utilizar para modelar los cambios en los precios de las acciones con el tiempo, ilustrando cómo los precios fluctúan sin un camino predecible.

Matemáticas

En matemáticas puras, las caminatas aleatorias proporcionan soluciones a problemas complejos. Por ejemplo, son útiles para resolver la ecuación de Laplace, analizar redes y explorar combinatoria.

Física y química

En las ciencias físicas, las caminatas aleatorias son cruciales para modelar procesos de difusión, como la forma en que las moléculas se dispersan a través de un medio. El movimiento browniano, donde las partículas suspendidas en un fluido se mueven de manera impredecible debido a colisiones con moléculas circundantes, es un ejemplo clásico que se puede simular con precisión utilizando caminatas aleatorias. De hecho, así fue como aprendí por primera vez sobre las caminatas aleatorias.

Biología

Los paseos aleatorios son valiosos en ecología para estudiar los patrones de movimiento de los animales. Los animales que buscan recursos pueden parecer moverse en un paseo aleatorio, a veces sesgado hacia regiones con recursos conocidos. Otros conceptos biológicos, como la propagación de poblaciones o genes, a menudo pueden ser modelados con principios de paseo aleatorio, lo que facilita la comprensión y predicción de los cambios dentro de los ecosistemas.

Casos Especiales y Variantes de Paseos Aleatorios

Además del paseo aleatorio clásico, varias variantes avanzadas extienden el concepto para adaptarse a aplicaciones especializadas.

Paseos autoevitantes

Un paseo autoevitante es un paseo aleatorio en el que el camino no revisita ninguna posición que ya ha pasado. Esta variante es particularmente útil en campos como la química de polímeros, donde puede modelar cómo se forman las cadenas de polímeros sin cruzarse a sí mismas. Debido a que cada paso evita puntos previamente visitados, los paseos autoevitantes son más restringidos que los paseos aleatorios tradicionales. Esto significa que son computacionalmente desafiantes pero útiles para entender caminos no superpuestos en espacios confinados.

Ramificación

En caminatas aleatorias ramificadas, el camino puede dividirse en múltiples ramas, con cada rama siguiendo una caminata aleatoria. Este tipo de caminata es fundamental para modelar procesos de ramificación como la división celular o la propagación de información a través de redes. Cada “rama” representa un camino aleatorio independiente que se origina desde una fuente común.

Caminatas correlacionadas

Las caminatas correlacionadas llevan este concepto un paso más allá, donde la dirección de cada paso está parcialmente influenciada por el paso anterior. Esta variante es útil para modelar la inercia en sistemas donde los cambios ocurren gradualmente en lugar de aleatoriamente. Las caminatas correlacionadas son a menudo aplicadas en finanzas para simular tendencias de precios o en ecología del movimiento para entender cómo los animales navegan en sus entornos con cierta memoria de su dirección pasada.

Caminatas con eliminación de bucles

Una caminata con eliminación de bucles es una variante donde los bucles, o caminos que se cruzan a sí mismos, son eliminados a medida que se forman. Cada vez que un paso vuelve a visitar una posición, el bucle intermedio es eliminado, dejando un camino simplificado y no repetitivo. Las caminatas con eliminación de bucles son comúnmente aplicadas en análisis de redes y algoritmos de generación de laberintos porque crean caminos que evitan la redundancia.

Implementando Caminatas Aleatorias en Python

Intentemos implementar una caminata aleatoria en Python. Para empezar, asegúrate de tener instalado Python (utilizaremos Python 3.10) y las bibliotecas necesarias disponibles. Puedes instalar cualquier biblioteca faltante usando pip. Aquí es lo que usaremos:

import numpy as np # para operaciones numéricas y generación de pasos aleatorios
import matplotlib.pyplot as plt # para trazar y visualizar las caminatas aleatorias

Caminata aleatoria 1D

Empezaremos con una sencilla caminata aleatoria unidimensional, donde cada paso es o +1 o -1, elegido al azar.

# Parámetros
n_steps = 100  # Número de pasos

# Generar pasos aleatorios: +1 o -1
steps = np.random.choice([-1, 1], size=n_steps)

# Calcular posiciones
positions = np.cumsum(steps)

# Graficar la caminata aleatoria
plt.figure(figsize=(10, 6))
plt.plot(positions, marker='o', linestyle='-', markersize=4)
plt.title("1D Random Walk")
plt.xlabel("Step")
plt.ylabel("Position")
plt.grid(True)
plt.show()

Esto genera un simple paseo aleatorio y visualiza la progresión con el tiempo. Aquí está la salida cuando ejecuto este código:

Recuerda, estamos ejecutando un modelo estocástico. Esto significa que cada vez que lo ejecutemos, la salida se verá un poco diferente.

Paseo aleatorio en 2D

Ahora vamos a extender el paseo aleatorio a dos dimensiones. En cada paso, la dirección será elegida al azar.

# Parámetros
n_steps = 500

# Generar pasos aleatorios en direcciones x e y
x_steps = np.random.choice([-1, 1], size=n_steps)
y_steps = np.random.choice([-1, 1], size=n_steps)

# Calcular posiciones
x_positions = np.cumsum(x_steps)
y_positions = np.cumsum(y_steps)

# Graficar el paseo aleatorio en 2D
plt.figure(figsize=(8, 8))
plt.plot(x_positions, y_positions, marker='o', linestyle='-', markersize=2, label='Random Walk')
plt.plot(x_positions[0], y_positions[0], 'ro', markersize=8, label='Start')  # Punto rojo para inicio
plt.plot(x_positions[-1], y_positions[-1], 'ko', markersize=8, label='End')  # Punto negro para final
plt.title("2D Random Walk")
plt.xlabel("X Position")
plt.ylabel("Y Position")
plt.grid(True)
plt.axis('equal')  # Asegura una escala igual para ambos ejes
plt.legend()
plt.show()

Este código crea un camino visualmente atractivo en dos dimensiones.

Este tipo de caminata aleatoria bidimensional podría modificarse para adaptarse a aplicaciones como el movimiento de partículas o modelado espacial.

Caminata aleatoria sesgada

Por último, veamos un ejemplo ligeramente más complejo: una caminata aleatoria sesgada. Para introducir sesgo, podemos ajustar las probabilidades de cada dirección de paso. Por ejemplo, podríamos hacer que los pasos hacia arriba sean más probables.

# Parámetros
n_steps = 100
bias = 0.7  # Probabilidad de dar un paso +1

# Generar pasos aleatorios sesgados en direcciones x e y
x_steps = np.random.choice([-1, 1], size=n_steps, p=[1-bias, bias])
y_steps = np.random.choice([-1, 1], size=n_steps, p=[1-bias, bias])

# Calcular posiciones
x_positions = np.cumsum(x_steps)
y_positions = np.cumsum(y_steps)

# Graficar la caminata aleatoria 2D sesgada
plt.figure(figsize=(8, 8))
plt.plot(x_positions, y_positions, marker='o', linestyle='-', markersize=2, label='Random Walk')
plt.plot(x_positions[0], y_positions[0], 'ro', markersize=8, label='Start')  # Punto rojo para el inicio
plt.plot(x_positions[-1], y_positions[-1], 'ko', markersize=8, label='End')  # Punto negro para el final
plt.title("Biased 2D Random Walk")
plt.xlabel("X Position")
plt.ylabel("Y Position")
plt.grid(True)
plt.axis('equal')  # Asegura una escala igual para ambos ejes
plt.legend()
plt.show()

Al cambiar el sesgo, puedes observar cómo el recorrido tiende a favorecer una dirección en particular, simulando escenarios del mundo real como el desvío en los precios de las acciones o los patrones de migración de los animales.

Si cambiamos el parámetro de sesgo a 0.55, podemos ver una diferencia drástica en la forma en que se comporta el modelo. Aunque todavía tiene un sesgo hacia arriba, este no es tan fuerte, lo que lleva a más bucles y desvíos.

Conclusión

Los paseos aleatorios son una herramienta de modelado valiosa para los científicos de datos, aplicable en campos que van desde la física hasta las finanzas y más allá. Su capacidad para modelar procesos complejos y estocásticos los convierte en indispensables en muchos escenarios del mundo real.

¿Tienes hambre de más? Echa un vistazo a la suite de cursos de probabilidad y estadística de DataCamp. Encontrarás todo tipo de excelentes cursos tanto en Python como en R. Si estás interesado en contenido más avanzado, echa un vistazo al curso de DataCamp sobre Simulación Estadística en Python y al tutorial de Introducción al Aprendizaje Automático. O si estás listo para poner a prueba tus conocimientos, aborda algunos de estos acertijos de probabilidad.

Source:
https://www.datacamp.com/tutorial/random-walk