PODCAST · technology
ObservaSistemas Podcast
by Tomás Pardellas
Podcast semanal sobre observabilidad, monitorización y operaciones IT. Cada episodio comenta o resume los artículos de la semana publicados en observasistemas.com con opiniones, anécdotas o historias del sector. Por Tomás Pardellas.
-
34
Dynatrace Intelligence tras Perform 2026 y OpenTelemetry en 2026
Se resume el panorama de la observabilidad tecnológica en 2026, destacando cómo la integración de la inteligencia artificial y los estándares abiertos está transformando la gestión de infraestructuras complejas. Se examina la evolución de la IA hacia modelos deterministas y precisos que evitan errores lógicos, citando casos de éxito en empresas como United Airlines para resolver incidentes en minutos. Asimismo, se resalta el papel fundamental de OpenTelemetry como el protocolo universal que permite a las organizaciones recolectar datos sin quedar cautivas de un solo proveedor. resumen semanal de artículos de observasistemas.com
-
33
El hilo invisible: Uniendo la Observabilidad con la Inteligencia Artificial
Un pequeño resumen de lo publicado en el blog esta semana. Hoy tenemos tres temas que, aunque distintos, tienen un hilo que los conecta: la relación cada vez más estrecha entre la observabilidad y la inteligencia artificial. Vamos a hablar de correlación de logs y trazas, de cómo observar agentes de IA en producción, y de Dynatrace MCP Server.
-
32
Comparativa plataformas APM y la evolución de Prometheus
Observabilidad moderna, la volución de las herramientas APM y las actualizaciones de Prometheus.Resumen breve de los artículos del blog observasistemas.comhttps://observasistemas.com/prometheus-cambios-importantes-de-las-ultimas-versiones-que-todo-administrador-debe-conocer/https://observasistemas.com/pequena-comparativa-de-plataformas-apm-dynatrace-datadog-new-relic-y-elastic/
-
31
Alertas con sentido y el mapa CNCF 2026 para observabilidad
Esta semana hablamos de por qué recibir 47 alertas por un solo problema no es observabilidad, sino ruido. Repasamos qué son las alertas basadas en señales, qué hace falta para implementarlas y cuándo no merece la pena. En la segunda parte, mapa de situación del ecosistema CNCF en 2026: qué proyectos de observabilidad están maduros, cuáles despuntan y cuáles pierden tracción. Todo en observasistemas.com.https://observasistemas.com/alertas-basadas-en-senales-mas-informacion-menos-ruido/https://observasistemas.com/cncf-landscape-en-2026-proyectos-maduros-emergentes-y-en-declive-para-observabilidad/
-
30
Sintéticos, RUM y Alertas: cerrar el ciclo de observabilidad en Dynatrace
Dos artículos, un hilo conductor: esta semana en ObservaSistemas analizamos cómo correlacionar la monitorización sintética con datos reales de usuario en Dynatrace, y cómo configurar el sistema de alertas para que esa detección se convierta en acción. Sintéticos, RUM, Davis AI, Metric Events y Alerting Profiles: todo el ciclo de observabilidad en un episodio.Artículos completos en observasistemas.comhttps://observasistemas.com/correlacion-de-sinteticos-con-datos-reales-de-usuario-mas-alla-de-la-monitorizacion-en-paralelo/https://observasistemas.com/como-se-configuran-alertas-y-notificaciones-en-dynatrace/
-
29
Dynatrace para humanos (y para agentes): API REST, MCP y dtctl
Analizamos la evolución de la automatización en Dynatrace, comparando tres métodos fundamentales para interactuar con la plataforma de observabilidad. La tradicional API REST, destacando su flexibilidad manual, junto a dos innovaciones recientes: el protocolo MCP y la herramienta de línea de comandos dtctl. Mientras que el MCP facilita que los agentes de inteligencia artificial comprendan y ejecuten tareas complejas, dtctl ofrece una experiencia similar a kubectl para gestionar recursos desde la terminal.
-
28
De sysadmin clásico a SRE: cambios de mentalidad que nadie te cuenta
La transformación profesional de un administrador de sistemas tradicional hacia el rol de Site Reliability Engineering (SRE), un cambio más cultural que técnico.
-
27
Instrumentación sin agentes: cuándo tiene sentido en entornos de producción
Revisamos la instrumentación sin agentes como una alternativa estratégica para la monitorización y observabilidad en infraestructuras tecnológicas complejas. Examinemos los beneficios operativos, como la facilidad de despliegue y el cumplimiento de normativas de seguridad, frente a las limitaciones técnicas en cuanto a profundidad y contexto de los datos.
-
26
Tu primera vez rompiendo un servidor en producción (y lo que se aprende de ello)
Hablamos sobre la inevitabilidad de los fallos técnicos en entornos de producción y cómo estos incidentes transforman la madurez de un equipo de sistemas.
-
25
IA para Sysadmins: usos reales y no exageraciones de marketing
El impacto real de la inteligencia artificial en la administración de sistemas, diferenciando las aplicaciones prácticas de las promesas publicitarias vacías.
-
24
Automatización con Dynatrace Workflows: cuándo usarlos y cuándo no
En este apisodio se analiza el uso estratégico de Dynatrace Workflows para automatizar la respuesta operativa en entornos tecnológicos complejos. Se explica cómo esta herramienta permite encadenar tareas mediante triggers inteligentes, diferenciando entre automatizaciones simples para notificaciones y flujos estándar que emplean lógica avanzada.
-
23
eBPF: El motor invisible de la observabilidad y el mapeo de microservicios
¿Cómo entender lo que ocurre en una arquitectura de microservicios sin modificar una sola línea de código? En este episodio, exploramos el potencial de eBPF (extended Berkeley Packet Filter), la tecnología del kernel de Linux que está revolucionando el trabajo de los SREs y arquitectos de sistemas
-
22
Integración de Dynatrace con Prometheus/OpenMetrics: un enfoque estratégico para entornos complejos
Resumen:La integración estratégica de Dynatrace con Prometheus optimiza la observabilidad en entornos complejos. Al combinar la IA automatizada con métricas OpenMetrics, se gana flexibilidad; no obstante, requiere filtrar datos para evitar cardinalidad alta, ruidos y sobrecostos.
-
21
Dynatrace Intelligence: Operaciones Autónomas
Descubre cómo Dynatrace Intelligence permite operaciones autónomas en entornos IT complejos. Exploramos las capacidades de IA que automatizan la detección de problemas, análisis de causa raíz y respuestas proactivas, reduciendo la intervención manual y acelerando la resolución de incidencias.
-
20
El Futuro del SRE: IA y la Era del Troubleshooting Autónomo
En este episodio, exploramos cómo la Inteligencia Artificial (IA) y el Machine Learning (ML) están transformando la gestión de incidentes en infraestructuras modernas de microservicios, donde el volumen de datos ha superado la capacidad de análisis humano.
-
19
Dynatrace Findings: Análisis granular de vulnerabilidades en producción
En este episodio exploramos Findings, la nueva funcionalidad de Dynatrace que revoluciona la gestión de vulnerabilidades al ofrecer un análisis granular a nivel atómico de cada riesgo detectado. Analizamos cómo esta herramienta aborda los desafíos de la fragmentación de datos y la falta de contexto en producción, consolidando información de múltiples fuentes como Snyk o Trivy en una única interfaz unificada. Descubre cómo pasar de simples listas de CVEs a una remediación eficiente y contextualizada gracias a la integración con la plataforma Grail y el uso de métricas avanzadas de seguridad
-
18
Aplicando la IA Generativa al diagnóstico de logs complejos
Aplicando la IA Generativa (LLMs) al diagnóstico de logs complejosEn este podcast se analiza la integración de la IA Generativa (LLMs) para automatizar el diagnóstico de logs complejos en sistemas distribuidos, permitiendo identificar la causa raíz de incidentes de forma contextual,. Destaca cómo esta tecnología normaliza diversos formatos de datos, reduce la fatiga de alertas y mejora la observabilidad al disminuir significativamente el tiempo medio de resolución (MTTR),
-
17
Monitorización Sintética vs. RUM: ¿Cómo asegurar la experiencia de tu usuario?
En este episodio, exploramos los dos pilares fundamentales de la observabilidad moderna: la monitorización sintética y la monitorización de usuario real (RUM). Descubre cómo la monitorización sintética actúa como un "explorador predecible", utilizando scripts automatizados para detectar fallos proactivamente antes de que afecten a tus clientes.Por otro lado, analizamos la "voz del usuario" a través del RUM, una técnica que captura datos auténticos de rendimiento directamente desde los dispositivos y navegadores de quienes usan tu aplicación en el mundo real
-
16
Calcular y optimizar el Costo de Observabilidad (CoO)
En este mini episodio desglosamos el Costo de Observabilidad (CoO), un factor crítico que va más allá de las licencias de software al incluir la ingesta de datos, la infraestructura y el valioso capital humano necesario para gestionar sistemas modernos.
-
15
Métricas de Negocio (Business Metrics) y su integración en Observabilidad
La observabilidad moderna va más allá de CPU y latencia. En este episodio analizamos cómo unir métricas técnicas y de negocio para entender el impacto real de la tecnología en los resultados de la empresa.
-
14
Fatiga por alertas: el camino al burnout
Resumen del articulo Alert fatigue y burnout: cómo evitar el desgaste del SysAdmin moderno en pardellas.es
-
13
SLI y SLO ¿Evolución o burocracia técnica?
SLI, SLO, KPIs… toda la terminología moderna de observabilidad explicada desde la perspectiva de quienes han pasado media vida en sistemas. ¿Son una evolución real para medir fiabilidad o solo nueva burocracia técnica con siglas molonas?
-
12
El Guardián de la Memoria: Cuando los Logs no pueden Fallar
Un vistazo directo a cómo construir un sistema de logging centralizado y resistente, capaz de seguir funcionando incluso cuando todo falla alrededor, con foco operativo y sin complicaciones
-
11
Dashboards anti-ruido: eliminando métricas inútiles para una monitorización limpia y efectiva
Una reflexión práctica sobre cómo limpiar y optimizar dashboards en producción: menos métricas inútiles, más foco operativo. Hablamos de fatiga visual, telemetría excesiva, KPIs, SLOs y señales claras de cuándo es hora de podar paneles. Un enfoque para SREs y equipos de observabilidad que buscan monitorización eficiente y sin ruido.
-
10
La maestría nace de tus propias limitaciones
¿Qué tienen en común Django Reinhardt, Wes Montgomery y un buen SRE? Más de lo que parece. Este audio reflexiona sobre la importancia de aceptar las propias limitaciones, practicar con constancia y construir un estilo técnico propio a lo largo del tiempo.
-
9
Apdex: La Métrica que Cuantifica la Felicidad del Usuario (De 0 a 1)
¿Cómo sabe tu aplicación si tus usuarios están realmente satisfechos? En este episodio, desvelamos el Índice de Rendimiento de Aplicaciones (Apdex), la métrica estándar que transforma el tiempo de respuesta en una puntuación objetiva entre 0 y 1. Aprende a clasificar las interacciones como Satisfechas, Tolerantes o Frustradas, y entiende por qué Apdex es indispensable para identificar cuellos de botella, garantizar los SLAs y elevar tu experiencia digital al nivel "Excelente" (0.94-1.0). Esencial para desarrolladores y gestores de producto.
-
8
El mito o no del profesional IT forjado en crisis
Debate/resumen del artículo de Linkedin : Todo va bien… hasta que cae producciónEl texto reflexiona sobre la diferencia entre la preparación teórica y la experiencia real en el ámbito de la tecnología y la informática (IT). La fuente argumenta que, si bien el estudio y las certificaciones son importantes, nada prepara completamente a un profesional para la primera caída grave de un sistema en producción o un entorno de crisis.
-
7
Monitorización vs Observabilidad : cambio de paradigma
¿Qué diferencia la Monitorización tradicional de la Observabilidad moderna? En este episodio, se habla por qué la complejidad de los microservicios y la nube ha hecho obsoleta la monitorización reactiva. Exploramos la observabilidad como la nueva filosofía para resolver lo desconocido, detallando sus tres pilares (métricas, logs y trazas) y cómo ayuda a los equipos de ingeniería a ser dueños absolutos de su código en producción. Entiende la herramienta esencial para mantener tus sistemas complejos bajo control.
-
6
La Resiliencia en Equipos de Sistemas: Preparándose para la Ausencia de Miembros Clave
¿Qué hace realmente resiliente a un equipo de sistemas?En este episodio reflexionamos sobre dos enfoques habituales en IT, DevOps y SRE:dejar que el equipo se autogestione y comparta el conocimiento de forma natural,o apostar por procesos más estructurados: documentación, comunicación y formación.No hay una respuesta única.Hablamos de equilibrio, experiencia real y de lo que suele fallar cuando una persona clave ya no está.Un pequeño debate para pensar cómo se construyen equipos técnicos que resisten el cambio.
-
5
Mide la experiencia, no solo la disponibilidad
Un episosio sobre como un servicio lento se percibe tan grave como un servicio caído. El impacto de la lentitud es enorme y directo en el negocio (por ejemplo, Amazon reduce ventas un 1% por cada 100 milisegundos extra en la carga, y una demora de medio segundo en Google reduce el tráfico un 20%). También aborda el aumento del toil (trabajo manual, repetitivo y poco escalable) hasta el 30% en 2025, a pesar de la adopción de la IA.
-
4
La IA puede aumentar el toil o trabajo manual en equipos SRE
Hay problemas persistentes en el campo tecnológico de 2025, como el aumento del toil (trabajo manual y repetitivo) a pesar de la adopción de Inteligencia Artificial, y la ineficacia de la dispersión de herramientas de observabilidad si carecen de integración. Los equipos de SRE y SysAdmin deben reorientar sus SLOs (Service Level Objectives) para priorizar la experiencia de usuario.
-
3
Infraestructura inmutable: ventajas, obstáculos y herramientas
¿Qué pasa si te dijéramos que nunca más tienes que aplicar un parche en un servidor en producción?Descubre la Infraestructura Inmutable, el modelo que está redefiniendo la estabilidad en DevOps. En este resumen de 2 minutos, explicamos el cambio de paradigma: en lugar de modificar sistemas (causando "deriva de configuración"), creamos nuevas imágenes y las reemplazamos por completo.Aprende cómo la inmutabilidad te da mayor consistencia, estabilidad y la capacidad de revertir errores de forma instantánea. Es la base de las prácticas modernas con tecnologías como Docker, Kubernetes y IaC. ¡Dale al play y moderniza tu gestión de sistemas!
No matches for "" in this podcast's transcripts.
No topics indexed yet for this podcast.
Loading reviews...
ABOUT THIS SHOW
Podcast semanal sobre observabilidad, monitorización y operaciones IT. Cada episodio comenta o resume los artículos de la semana publicados en observasistemas.com con opiniones, anécdotas o historias del sector. Por Tomás Pardellas.
HOSTED BY
Tomás Pardellas
CATEGORIES
Loading similar podcasts...