Wall Avenue es como una jungla: cientos de criaturas (acciones) moviéndose al mismo tiempo, cada una con su propio ritmo, sus hábitos y sus peligros. Pero… ¿y si pudiéramos agruparlas en tribus? Identificar a los depredadores, a los que se mueven en manada y a los que están al borde de la extinción.
Usando modelos de machine studying no supervisados y los últimos 15 años de datos del S&P 500, un algoritmo de inteligencia synthetic me ayudó a trazar un mapa oculto del mercado: un ecosistema de riesgo y rendimiento que revela patrones invisibles a easy vista.
En este artículo explicaré paso a paso cómo entendí el Commonplace & Poor’s 500 utilizando el algoritmo Okay-Means. El pipeline demuestra cómo transformar collection de precios en características que capturan rendimiento y riesgo (CAGR, volatilidad, máxima caída, desviación a la baja, Sharpe, Sortino, and many others.), cómo normalizar y reducir dimensiones para visualizar relaciones, y cómo segmentar las 500 empresas en grupos interpretables. Los resultados no son sólo etiquetas: son lentes para diseñar hipótesis de inversión — por ejemplo, identificar grupos con alta rentabilidad y alta volatilidad, clusters de baja volatilidad y retorno consistente, y conjuntos de acciones que suelen ser resilientes ante caídas — que el análisis sectorial tradicional tiende a ocultar.
Los detalles de implementación se presentan en Github
Datos, datos y más datos: el oro digital más valioso para cualquier empresa. En la jungla de Wall Avenue, este recurso sigue siendo uno de los activos más codiciados. Para este análisis del S&P 500 recurrí a la API de Yahoo Finance, que me permitió obtener — para cada ticker del índice — sus precios de apertura, cierre, máximos, mínimos y volumen diario en un rango diario que abarca los últimos 15 años.
Sin embargo, estos datos por sí solos no pueden generar conclusiones útiles. Aquí es donde comienza el verdadero trabajo: comprender el caso de uso y transformar datos crudos en información accionable. En lugar de usar únicamente los precios y volúmenes diarios, calculé una serie de métricas financieras que capturan el comportamiento de cada acción desde diferentes ángulos:
- Volatility: mide la variabilidad del rendimiento; alta volatilidad implica movimientos más bruscos y, por lo tanto, mayor riesgo.
- Max Drawdown (MDD): la mayor caída desde un máximo histórico, una métrica clave para entender el peor escenario posible de pérdida.
- Draw back Deviation (DSD): related a la volatilidad, pero enfocada solo en los movimientos negativos, útil para medir el riesgo de pérdidas en vez de la variabilidad complete.
- Sharpe Ratio: relaciona la rentabilidad obtenida con la volatilidad complete asumida; cuanto más alto, mejor el rendimiento ajustado al riesgo.
- Sortino Ratio: variante del Sharpe que penaliza solo la volatilidad negativa, ultimate para inversores que priorizan la protección ante caídas.
- Calmar Ratio: mide el rendimiento ajustado por el riesgo de caídas, calculando la relación entre el CAGR (crecimiento anual compuesto) y el MDD.
Estas métricas convierten una easy serie de precios en un perfil cuantitativo de cada acción, permitiendo que el algoritmo de machine studying identifique patrones de riesgo y rendimiento invisibles en los datos originales.
El nuevo dataframe
Nuestros datos procesados quedan de la siguiente forma:
Nuestros datos procesados quedaron organizados en un formato con múltiples métricas financieras que, aunque muy valiosas, generan un espacio de alta dimensionalidad. Esto dificulta su interpretación y visualización directa. Para abordar esto, aplicamos PCA (Análisis de Componentes Principales), una técnica que scale back la dimensionalidad combinando las variables originales en nuevas variables — llamadas componentes principales — que conservan la mayor parte de la variabilidad del conjunto de datos.
En nuestro caso, con solo 4 componentes principales logramos explicar más del 90 % de la varianza complete, simplificando el análisis sin perder información clave.
Con estos 4 componentes principales como base, y habiendo definido el número de grupos que queremos identificar — en este caso, 4 clusters acordes a necesidades del negocio — procedemos a entrenar el algoritmo Okay-Means para segmentar las acciones. Estos grupos representan distintos perfiles de comportamiento en el mercado, como:
- Los Sólidos (The Core Performers).
Este grupo está compuesto por acciones estables, que combinan un crecimiento constante con bajo riesgo. Son la base sólida de cualquier cartera, atractivas para inversores que buscan un steadiness entre rendimiento y seguridad. - Los Rezagados (The Underperformers).
Estas acciones tienden a mostrar un desempeño pobre, con mayor volatilidad y riesgos que no se ven compensados por los retornos. Son las que, a menudo, un inversor prudente evitaría o mantendría bajo estricta vigilancia. - Los Volátiles de Alto Crecimiento (Increase-or-Bust).
Aquí se agrupan acciones con gran potencial de crecimiento, pero también con alta volatilidad y riesgo significativo. Pueden generar ganancias importantes, aunque también enfrentan caídas pronunciadas. - Las Superestrellas (The Hyper-Development).
Este grupo reúne a las acciones con mayor crecimiento y desempeño destacado, que a pesar de presentar volatilidad elevada, suelen compensar el riesgo con retornos excepcionales. Son las favoritas de quienes buscan oportunidades agresivas y de alto impacto.
Por lo que mediante la libreria Scikit-learn. Podemos obtener esta segmentación de las acciones.
Aunque la visualización nos ofrece una thought common de la agrupación, no siempre revela con detalle las características específicas de cada cluster. Por eso, calculamos métricas clave para cada grupo, asignando a cada acción su cluster correspondiente y obteniendo así un perfil cuantitativo preciso.
A continuación, presentamos una tabla resumen con las principales métricas financieras promedio por cluster:
Al analizar las métricas promedio de cada cluster, podemos identificar perfiles de comportamiento muy distintos en términos de rendimiento y riesgo:
- Cluster 0 muestra un rendimiento sólido y equilibrado, con un crecimiento anual compuesto (CAGR) moderado de aproximadamente 15.8%. Su volatilidad y máxima caída (Max Drawdown) son las más bajas entre todos los grupos, lo que indica estabilidad y menor riesgo. Sus ratios ajustados al riesgo (Sharpe, Sortino y Calmar) también son saludables, lo que lo convierte en una opción atractiva para inversores moderados que buscan un steadiness entre rendimiento y seguridad.
- Cluster 1 representa al grupo con peor desempeño, con un CAGR bajo (8.4%) combinado con una alta volatilidad y una caída máxima significativa. Los ratios ajustados al riesgo son los más bajos, sugiriendo que el retorno no compensa adecuadamente el riesgo asumido. Este grupo puede ser identificado como el de las acciones rezagadas o menos deseables.
- Cluster 2 incluye acciones con un buen rendimiento (CAGR de 23.4%) pero a costa de una volatilidad y caída máxima muy elevadas. Los ratios de Sharpe, Sortino y Calmar son moderados, lo que indica que el alto riesgo scale back la eficiencia del retorno, caracterizando a este grupo como de alto crecimiento pero volátil, con potenciales movimientos bruscos.
- Cluster 3 se destaca claramente por su rendimiento excepcional, con un CAGR anualizado superior al 50%. Aunque la volatilidad y las caídas máximas son altas, este grupo presenta los mejores ratios ajustados al riesgo, lo que significa que, a pesar de la incertidumbre, ha ofrecido recompensas superiores a los inversores. Este cluster podría considerarse como el de las “superestrellas” o acciones de hipercrecimiento.
Este análisis te proporciona una visión simplificada y estructurada del mercado, permitiéndote tomar decisiones de inversión más informadas, estratégicas y alineadas con tu perfil de riesgo. En lugar de evaluar individualmente las 500 acciones del índice, ahora cuentas con 4 “arquetipos” o perfiles de comportamiento que facilitan la comprensión del mercado en conjunto.
Por ejemplo, en un día de alta volatilidad, podrías identificar rápidamente que las acciones del Cúmulo 2 son las que más caen, dándote una visión clara y rápida de la dinámica del mercado sin necesidad de revisar cada acción por separado.
Esta es quizás la mayor ventaja. La diversificación efectiva no se trata solo de poseer muchas acciones diferentes, sino de tener acciones que respondan de manera distinta ante las condiciones del mercado. El clustering te muestra esta diversidad de forma clara.
- Diversificación actual: Un portafolio compuesto únicamente por acciones del Cúmulo 3 podría parecer diversificado a nivel de empresas, pero en realidad todas comparten un perfil related de alto crecimiento y alta volatilidad. Una verdadera diversificación implica combinar acciones de diferentes cúmulos para equilibrar riesgo y rendimiento.
- Núcleo (Core): Construir la base del portafolio con acciones del Cúmulo 0, que ofrecen un equilibrio atractivo entre retorno y riesgo moderado.
- Satélites (Satellite tv for pc): Complementar con acciones del Cúmulo 3, orientadas al crecimiento explosivo y rendimientos excepcionales, conscientes del mayor riesgo que implican.
- Evitar: Acciones del Cúmulo 1, que muestran bajo rendimiento relativo y alto riesgo, generalmente poco atractivas para la mayoría de los perfiles de inversión.
Con este enfoque, podrás diseñar carteras más robustas, adaptadas a tus objetivos y tolerancia al riesgo, aprovechando el conocimiento profundo que aporta el análisis basado en machine studying.
Con tus propios “factores” sintéticos derivados del clustering, ahora puedes diseñar estrategias de inversión más sofisticadas y ajustadas a tus objetivos:
- Estrategia Momentum/Calidad:
Puedes focalizar tus inversiones en las acciones del Cúmulo 3, que representan empresas de alto crecimiento y calidad superior. Este enfoque busca capturar las oportunidades de rendimientos sobresalientes en compañías con desempeño excepcional. - Estrategia de Bajo Riesgo:
Si tu prioridad es la estabilidad, concentrarte en el Cúmulo 0 te permite minimizar las caídas y mantener un crecimiento más constante, ultimate para perfiles conservadores o para el núcleo estable de tu portafolio. - Estrategia de Rotación Dinámica:
Al monitorear cómo las acciones transitan entre cúmulos a lo largo del tiempo, puedes detectar señales valiosas. Por ejemplo, una acción que evoluciona del Cúmulo 1 al Cúmulo 0 podría indicar una mejora elementary y convertirse en una oportunidad de compra. En cambio, una acción que desciende del Cúmulo 3 al Cúmulo 2 podría sugerir que el riesgo ha aumentado y que conviene considerar una venta.
Al identificar el cúmulo al que pertenece cada acción, obtienes una expectativa clara y realista de su comportamiento futuro. Por ejemplo, si decides invertir en una acción del Cúmulo 2, sabes que debes estar preparado mentalmente para soportar caídas pronunciadas, incluso hasta un 70% (según el Max Drawdown promedio). Esta conciencia te ayuda a dimensionar adecuadamente tus posiciones y evitar decisiones impulsivas ante movimientos adversos del mercado.
Hemos viajado desde el caos de los datos crudos hasta un mapa estratégico y claro del S&P 500. Hemos demostrado que, bajo la superficie de las etiquetas sectoriales, existen patrones de comportamiento mucho más profundos.
Este análisis nos da un nuevo lente. Nos permite diseñar portafolios más resilientes, crear estrategias de inversión personalizadas y gestionar el riesgo con una conciencia que antes period imposible.
La próxima vez que mires el S&P 500, no verás solo una lista de 500 empresas. Verás un ecosistema vivo, con sus propias tribus. La verdadera pregunta es: ¿en cuál de ellas quieres invertir tu futuro?