Este artículo presenta un modelo flexible basado en Transformer para detectar anomalías en registros de sistema. Mediante la incrustación de plantillas de registro con un modelo BERT pre-entrenado e incorporando codificación posicional y temporal, captura tanto el contexto semántico como secuencial dentro de las secuencias de registro. El enfoque admite longitudes de secuencia variables y características de entrada configurables, permitiendo una experimentación extensiva a través de conjuntos de datos. El modelo realiza una clasificación binaria supervisada para distinguir patrones normales de anómalos, utilizando un token similar a [CLS] para la representación a nivel de secuencia. En general, amplía los límites de la detección de anomalías basada en registros al integrar técnicas modernas de PNL y aprendizaje profundo en el monitoreo de sistemas.Este artículo presenta un modelo flexible basado en Transformer para detectar anomalías en registros de sistema. Mediante la incrustación de plantillas de registro con un modelo BERT pre-entrenado e incorporando codificación posicional y temporal, captura tanto el contexto semántico como secuencial dentro de las secuencias de registro. El enfoque admite longitudes de secuencia variables y características de entrada configurables, permitiendo una experimentación extensiva a través de conjuntos de datos. El modelo realiza una clasificación binaria supervisada para distinguir patrones normales de anómalos, utilizando un token similar a [CLS] para la representación a nivel de secuencia. En general, amplía los límites de la detección de anomalías basada en registros al integrar técnicas modernas de PNL y aprendizaje profundo en el monitoreo de sistemas.

Detección de anomalías basada en Transformer utilizando incrustaciones de secuencias de registros

2025/11/04 01:52

Abstracto

1 Introducción

2 Antecedentes y Trabajos Relacionados

2.1 Diferentes Formulaciones de la Tarea de Detección de Anomalías Basada en Logs

2.2 Supervisado vs. No Supervisado

2.3 Información dentro de los Datos de Log

2.4 Agrupación de Ventana Fija

2.5 Trabajos Relacionados

3 Un Enfoque Configurable de Detección de Anomalías Basado en Transformer

3.1 Formulación del Problema

3.2 Análisis de Logs y Embedding de Logs

3.3 Codificación Posicional y Temporal

3.4 Estructura del Modelo

3.5 Clasificación Binaria Supervisada

4 Configuración Experimental

4.1 Conjuntos de Datos

4.2 Métricas de Evaluación

4.3 Generación de Secuencias de Logs de Longitudes Variables

4.4 Detalles de Implementación y Entorno Experimental

5 Resultados Experimentales

5.1 RQ1: ¿Cómo se comporta nuestro modelo de detección de anomalías propuesto en comparación con las líneas base?

5.2 RQ2: ¿Cuánto afecta la información secuencial y temporal dentro de las secuencias de logs a la detección de anomalías?

5.3 RQ3: ¿Cuánto contribuyen individualmente los diferentes tipos de información a la detección de anomalías?

6 Discusión

7 Amenazas a la validez

8 Conclusiones y Referencias

\

3 Un Enfoque Configurable de Detección de Anomalías Basado en Transformer

En este estudio, presentamos un nuevo método basado en transformer para la detección de anomalías. El modelo toma secuencias de logs como entradas para detectar anomalías. El modelo emplea un modelo BERT preentrenado para incorporar plantillas de logs, permitiendo la representación de información semántica dentro de los mensajes de logs. Estos embeddings, combinados con codificación posicional o temporal, se introducen posteriormente en el modelo transformer. La información combinada se utiliza en la posterior generación de representaciones a nivel de secuencia de logs, facilitando el proceso de detección de anomalías. Diseñamos nuestro modelo para que sea flexible: Las características de entrada son configurables para que podamos usar o realizar experimentos con diferentes combinaciones de características de los datos de logs. Además, el modelo está diseñado y entrenado para manejar secuencias de logs de entrada de longitudes variables. En esta sección, presentamos nuestra formulación del problema y el diseño detallado de nuestro método.

\ 3.1 Formulación del Problema

Seguimos los trabajos anteriores [1] para formular la tarea como una tarea de clasificación binaria, en la que entrenamos nuestro modelo propuesto para clasificar secuencias de logs en anomalías y normales de manera supervisada. Para las muestras utilizadas en el entrenamiento y evaluación del modelo, utilizamos un enfoque de agrupación flexible para generar secuencias de logs de longitudes variables. Los detalles se presentan en la Sección 4

\ 3.2 Análisis de Logs y Embedding de Logs

En nuestro trabajo, transformamos eventos de logs en vectores numéricos mediante la codificación de plantillas de logs con un modelo de lenguaje preentrenado. Para obtener las plantillas de logs, adoptamos el analizador Drain [24], que es ampliamente utilizado y tiene un buen rendimiento de análisis en la mayoría de los conjuntos de datos públicos [4]. Utilizamos un modelo sentence-bert preentrenado [25] (es decir, all-MiniLML6-v2 [26]) para incorporar las plantillas de logs generadas por el proceso de análisis de logs. El modelo preentrenado se entrena con un objetivo de aprendizaje contrastivo y logra un rendimiento de vanguardia en varias tareas de NLP. Utilizamos este modelo preentrenado para crear una representación que capture información semántica de los mensajes de logs e ilustre la similitud entre plantillas de logs para el modelo de detección de anomalías posterior. La dimensión de salida del modelo es 384.

\ 3.3 Codificación Posicional y Temporal

El modelo transformer original [27] adopta una codificación posicional para permitir que el modelo utilice el orden de la secuencia de entrada. Como el modelo no contiene recurrencia ni convolución, los modelos serán agnósticos a la secuencia de logs sin la codificación posicional. Aunque algunos estudios sugieren que los modelos transformer sin codificación posicional explícita siguen siendo competitivos con los modelos estándar cuando se trata de datos secuenciales [28, 29], es importante tener en cuenta que cualquier permutación de la secuencia de entrada producirá el mismo estado interno del modelo. Como la información secuencial o temporal puede ser un indicador importante de anomalías dentro de las secuencias de logs, trabajos anteriores basados en modelos transformer utilizan la codificación posicional estándar para inyectar el orden de eventos de logs o plantillas en la secuencia [11, 12, 21], con el objetivo de detectar anomalías asociadas con un orden de ejecución incorrecto. Sin embargo, notamos que en una implementación de replicación comúnmente utilizada de un método basado en transformer [5], la codificación posicional fue, de hecho, omitida. Hasta donde sabemos, ningún trabajo existente ha codificado la información temporal basada en las marcas de tiempo de los logs para su método de detección de anomalías. La efectividad de utilizar información secuencial o temporal en la tarea de detección de anomalías no está clara.

\ En nuestro método propuesto, intentamos incorporar codificación secuencial y temporal en el modelo transformer y explorar la importancia de la información secuencial y temporal para la detección de anomalías. Específicamente, nuestro método propuesto tiene diferentes variantes que utilizan las siguientes técnicas de codificación secuencial o temporal. La codificación se agrega luego a la representación de logs, que sirve como entrada a la estructura transformer.

\

3.3.1 Codificación de Tiempo Transcurrido Relativo (RTEE)

Proponemos este método de codificación temporal, RTEE, que simplemente sustituye el índice de posición en la codificación posicional con el tiempo de cada evento de log. Primero calculamos el tiempo transcurrido según las marcas de tiempo de los eventos de logs en la secuencia de logs. En lugar de usar el índice de secuencia de eventos de logs como la posición para las ecuaciones sinusoidales y cosinusoidales, usamos el tiempo transcurrido relativo al primer evento de log en la secuencia de logs para sustituir el índice de posición. La Tabla 1 muestra un ejemplo de intervalos de tiempo en una secuencia de logs. En el ejemplo, tenemos una secuencia de logs que contiene 7 eventos con un lapso de tiempo de 7 segundos. El tiempo transcurrido desde el primer evento hasta cada evento en la secuencia se utiliza para calcular la codificación de tiempo para los eventos correspondientes. Similar a la codificación posicional, la codificación se calcula con las ecuaciones 1 mencionadas anteriormente, y la codificación no se actualizará durante el proceso de entrenamiento.

\

3.4 Estructura del Modelo

El transformer es una arquitectura de red neuronal que se basa en el mecanismo de autoatención para capturar la relación entre elementos de entrada en una secuencia. Los modelos y marcos basados en transformer han sido utilizados en la tarea de detección de anomalías por muchos trabajos anteriores [6, 11, 12, 21]. Inspirados por los trabajos anteriores, utilizamos un modelo basado en codificador transformer para la detección de anomalías. Diseñamos nuestro enfoque para aceptar secuencias de logs de longitudes variables y generar representaciones a nivel de secuencia. Para lograr esto, hemos empleado algunos tokens específicos en la secuencia de logs de entrada para que el modelo genere representación de secuencia e identifique los tokens rellenados y el final de la secuencia de logs, inspirándonos en el diseño del modelo BERT [31]. En la secuencia de logs de entrada, utilizamos los siguientes tokens: se coloca al inicio de cada secuencia para permitir que el modelo genere información agregada para toda la secuencia, se agrega al final de la secuencia para indicar su finalización, se utiliza para marcar los tokens enmascarados bajo el paradigma de entrenamiento autosupervisado, y se utiliza para tokens rellenados. Los embeddings para estos tokens especiales se generan aleatoriamente según la dimensión de la representación de logs utilizada. Un ejemplo se muestra en la Figura 1, el tiempo transcurrido para , y se establece en -1. La representación a nivel de evento de log y el embedding posicional o temporal se suman como la característica de entrada de la estructura transformer.

\ 3.5 Clasificación Binaria Supervisada Bajo este objetivo de entrenamiento, utilizamos la salida del primer token del modelo transformer mientras ignoramos las salidas de los otros tokens. Esta salida del primer token está diseñada para agregar la información de toda la secuencia de logs de entrada, similar al token del modelo BERT, que proporciona una representación agregada de la secuencia de tokens. Por lo tanto, consideramos la salida de este token como una representación a nivel de secuencia. Entrenamos el modelo con un objetivo de clasificación binaria (es decir, Pérdida de Entropía Cruzada Binaria) con esta representación.

\

:::info Autores:

  1. Xingfang Wu
  2. Heng Li
  3. Foutse Khomh

:::

:::info Este artículo está disponible en arxiv bajo la licencia CC by 4.0 Deed (Atribución 4.0 Internacional).

:::

\

Aviso legal: Los artículos republicados en este sitio provienen de plataformas públicas y se ofrecen únicamente con fines informativos. No reflejan necesariamente la opinión de MEXC. Todos los derechos pertenecen a los autores originales. Si consideras que algún contenido infringe derechos de terceros, comunícate a la dirección [email protected] para solicitar su eliminación. MEXC no garantiza la exactitud, la integridad ni la actualidad del contenido y no se responsabiliza por acciones tomadas en función de la información proporcionada. El contenido no constituye asesoría financiera, legal ni profesional, ni debe interpretarse como recomendación o respaldo por parte de MEXC.

También te puede interesar

Día Nacional del Oftalmólogo: qué es y por qué se conmemora

Día Nacional del Oftalmólogo: qué es y por qué se conmemora

Jessica Zamora RamirezMirar el mundo con claridad es algo que casi siempre damos por hecho… hasta que empieza a fallar. Por eso el Día Nacional del Médico Oftalmólogo, no solo celebra a quienes cuidan nuestros ojos, sino que nos recuerda una verdad incómoda: muchas enfermedades visuales avanzan sin dolor ni aviso. ¿Por qué se conmemora el día Nacional del oftalmólogo? El Día Nacional del Médico Oftalmólogo es una efeméride dedicada a reconocer el trabajo de las y los especialistas que previenen, diagnostican y tratan enfermedades de los ojos, además de visibilizar la importancia de la salud visual como parte del bienestar general. En México y en varios países de América Latina, la fecha más extendida para esta conmemoración es el 13 de diciembre, asociada a la festividad de Santa Lucía, figura histórica y religiosa identificada desde la Edad Media como protectora de la vista.  Por esa relación cultural, el gremio oftalmológico adoptó el día para rendir homenaje a la especialidad y, de paso, recordar algo esencial: la vista no es un tema menor, es salud. La conmemoración tiene sentido no solo por la tradición, sino por el peso real del problema. La Organización Mundial de la Salud (OMS) advierte que la pérdida visual sigue siendo masiva y, en buena medida, evitable con diagnóstico y tratamiento oportunos.  En su informe sobre visión, la OMS calcula que al menos 2.2 mil millones de personas viven con discapacidad visual o ceguera en el mundo, y más de mil millones de casos pudieron prevenirse o no han sido atendidos.  ¿Qué hace un oftalmólogo?  Un oftalmólogo es un médico especialista que estudia y trata enfermedades del ojo y del sistema visual. A diferencia de otras profesiones relacionadas con la vista, el oftalmólogo puede indicar medicamentos, realizar diagnósticos clínicos complejos y practicar cirugías, por ejemplo, de catarata, retina o glaucoma. Su trabajo es especialmente crucial porque muchas afecciones oculares avanzan sin dar señales claras. Cuando la persona nota que ya ve menos, a veces el daño está avanzado y es difícil revertirlo. El caso más típico es el glaucoma, conocido como el “ladrón silencioso de la vista”, porque puede afectar la visión sin dolor y de forma gradual.  La salud visual en México En México, la Sociedad Mexicana de Oftalmología ha señalado que hasta 80% de los casos de ceguera podrían evitarse con detección temprana y atención accesible, sobre todo en enfermedades como catarata, glaucoma y retinopatía diabética. Este dato se alinea con la tendencia global de la OMS sobre ceguera prevenible. La Secretaría de Salud reconoce que la catarata es la principal causa de ceguera reversible en el país. De hecho, en 2025 lanzó la estrategia nacional “Ver por México”, destinada a realizar cirugías gratuitas en las 32 entidades para personas mayores de 60 años diagnosticadas con catarata. La meta es reducir la pérdida visual que no debería ocurrir si hay acceso a cirugía. El glaucoma, por su parte, representa un reto distinto porque no avisa. Cifras oficiales estiman que alrededor de 4% a 4.2% de la población mexicana lo padece y cerca de la mitad no lo sabe, justo porque al inicio no suele dar síntomas.  Otro frente fuerte es la diabetes. Un estudio publicado en la Gaceta Médica de México analizó pacientes con diabetes tipo 2 en entorno hospitalario y encontró que la retinopatía diabética fue la comorbilidad ocular más frecuente. El mismo trabajo recuerda que en México la prevalencia de retinopatía diabética en personas con diabetes se ha estimado entre 22% y 41%, y la del edema macular diabético —una complicación que afecta la zona central de la visión— entre 4.2% y 17.5%.  Principales enfermedades de los ojos que detecta un oftalmólogo Los oftalmólogos en México enfrentan un panorama bastante claro de padecimientos comunes. De acuerdo con instituciones de salud, los problemas más frecuentes incluyen errores de refracción (miopía, astigmatismo, hipermetropía y presbicia), catarata, glaucoma, degeneración macular y retinopatía diabética. Catarata: es cuando el cristalino (la “lente natural” del ojo) se opaca. La persona ve borroso, se encandila al manejar de noche o nota colores más apagados. La buena noticia es que se trata con cirugía y suele recuperar visión.  Glaucoma: daña el nervio óptico poco a poco. Al inicio no duele ni se siente, pero va cerrando la visión periférica hasta dejar solo un “túnel visual”. Por eso se recomienda revisión anual después de los 40 años o antes si hay antecedentes familiares, diabetes o miopía alta.  Retinopatía diabética: la diabetes afecta los vasos sanguíneos de la retina. Puede causar visión fluctuante, manchas negras, destellos o pérdida súbita de visión. No es inevitable, pero sí exige chequeos regulares, porque detectarla a tiempo evita daños mayores.  Conmemorar el Día Nacional del Oftalmólogo no es solo un gesto simbólico. Es recordar que la vista se pierde en silencio y que cuidarla no debería depender de que algo ya duela o se note grave. También es una oportunidad para valorar a un gremio que, diariamente, evita discapacidades que cambian por completo la vida. Así que este 13 de diciembre vale la pena celebrar a los especialistas… pero también hacer algo concreto: agendar una revisión, sobre todo si tienes más de 40 años, vives con diabetes, o has notado cambios sutiles en tu visión. Ver bien no es lujo: es salud, autonomía y calidad de vida. Contenidos Relacionados: ¡Adiós a la ceguera! Un pequeño implante ocular ayuda a las personas a restaurar su visión y leer de nuevo Arteritis de células gigantes: inflamación silenciosa que puede causar cegueraEl 50 por ciento de pacientes atendidos a tiempo por glaucoma evitan ceguera temprana: IMSS
Compartir
Excelsior2025/12/11 01:48
Retroexcavadora se convierte en trineo de Santa Claus y se vuelve viral

Retroexcavadora se convierte en trineo de Santa Claus y se vuelve viral

Lizeth Diana HernándezEn el municipio de El Naranjo, San Luis Potosí, la creatividad local se robó la atención durante el desfile del 31 aniversario del municipio, cuando una retroexcavadora fue transformada en un auténtico trineo de Santa Claus, completa con “renos” y decoraciones navideñas, para alegría de grandes y chicos. Leer también: ¿Cuántos días faltan para Navidad 2025? Así va la cuenta regresiva  La idea surgió ante la falta de recursos para construir un carro alegórico convencional. Lejos de desanimarse, los organizadores integrantes del Departamento de Obras Públicas decidieron aprovechar la maquinaria disponible y adaptarla para crear un espectáculo único. El brazo mecánico de la retroexcavadora elevaba el trineo, permitiendo que “Santa” saludara a los asistentes desde las alturas, mientras la estructura estaba decorada con luces, figuras festivas y detalles artesanales. El improvisado trineo avanzó lentamente acompañado por trabajadores disfrazados de “renos” humanos, generando aplausos, risas y un ambiente festivo que rápidamente se volvió viral en plataformas como TikTok, Facebook y X. Las familias lo siguieron con entusiasmo, tomando fotos y grabando videos que se compartieron en segundos, celebrando la creatividad mexicana y la capacidad de transformar lo cotidiano en algo extraordinario. Usuarios en redes no tardaron en elogiar la propuesta, destacando el ingenio y la identidad comunitaria de El Naranjo: “Solo aquí se ve este tipo de magia”. “El talento improvisado de México nunca falla”. “Esta joyita navideña solo podía ocurrir en nuestro país”. El evento combinó tradición y humor, mostrando que, con imaginación y espíritu colaborativo, incluso una retroexcavadora puede convertirse en protagonista de la navidad. Lo que comenzó como una solución práctica se convirtió en símbolo del ingenio potosino, dejando a los asistentes y a usuarios de internet con una sonrisa y un ejemplo del ingenio mexicano que hace únicos los festejos locales.   LDH Contenidos Relacionados: ¿Dónde tomarte la foto con Santa Claus en CDMX? Y lugares para vivir la NavidadEstos son los cinco libros ideales para regalar en NavidadSeñoras se pelean por una bolsa de dulces en pleno desfile de Navidad
Compartir
Excelsior2025/12/11 01:59
Rosalía abre nuevas fechas en México: ¿cuándo es la venta de boletos para sus conciertos?

Rosalía abre nuevas fechas en México: ¿cuándo es la venta de boletos para sus conciertos?

Paola Jiménez Rosalía hace poco anunció fechas de nuevo tour y México está incluido. Tras ponerse a la venta los boletos, estos se agotaron rápidamente por lo que se añadieron más shows. Es por eso que si no alcanzaste boleto en las primeras fechas, no te preocupes, que hay más oportunidades de poder asistir a alguno de los conciertos que dará Rosalía. ¿Cuándo son las nuevas fechas para los conciertos de Rosalía en México? Debido a la alta demanda que tuvieron los boletos para los conciertos, Ocesa informó que se abrirán nuevas fechas. A continuación, te dejamos cuándo son las fechas que se añadieron a la visita de Rosalía por México. 16 de agosto en Guadalajara 28 y 29 de agosto en CDMX Por lo tanto, los conciertos que dará Rosalia en México serán: 15 y 16 de agosto: Arena VFG en Guadalajara 19 de agosto: Arena Monterrey en Monterrey 24, 26, 28 y 29 de agosto: Palacio de los Deportes en CDMX ¿Cuándo será la venta de boletos para las nuevas fechas de Rosalía en México? Por el momento, los boletos para las nuevas fechas de Rosalía ya están a la venta en preventa, por lo que si tienes una tarjeta Banamex podrás adquirir tus entradas. Si no cuentas con una tarjeta de ese banco, no te preocupes, ya que puedes comprar tus boletos en la venta general que será este 11 de diciembre a las 11:00 AM en Ticketmaster. Precios de boletos de Rosalía en México Precios de boletos para Rosalía en CDMX PIT: $4,947.50 FLOOR: $3,211.50 NIVEL B: $6,600.50 NIVEL C: $2,715.50 NIVEL D: $1,971.59 NIVEL E: $1,599.50 NIVEL EE: $1,227.50 Precios de boletos para Rosalía en Guadalajara PIT: $4,451.50 GENERAL: $2,467.50 GRADA PREF B: $4,958.75 GRADA PREF C: $2,827.25 PLANTA BAJA: $2,083.25 PLATEA: $1,711.25 PLANTA ALTA: $1,339.25 SC300: $967.25 Precios de boletos para Rosalía en Monterrey Cancha Vip: $4,490 Oro: $4,234 Banco Azteca: $4,234 Coke Studio: $4,234 McCormick: $4,234 Doritos: $4,234 Megacable: $4,234 Osel: $4,234 Plus Ultra: $4,234 Barrera: $3,364 Super Palco: $3,364 Cancha General: $2,498 DISCAP: $2,486 Butaca: $2,486 Preferente: $1,482 Luneta: $1,004 Balcón: $854   PJG Contenidos Relacionados: ¡Qué miedo! Rosalía se asusta de cucaracha voladora en plena entrevistaRosalía en México: precio de los boletos y paquetes VIP de sus conciertos
Compartir
Excelsior2025/12/11 02:19