¿Cuáles son las funciones comunes pero inútiles en el análisis de registros de operación y mantenimiento de TI?
El análisis de registros es una parte muy importante del campo de operación y mantenimiento de TI. Incluso se puede decir que hoy en día, cuando prevalecen la plataforma, la modularización y la orientación a servicios, la importancia de esta parte del trabajo se ha acercado a la del monitoreo de equipos tradicionales. Sin embargo, debido a que las fuentes de registros, los usuarios y los administradores son más complejos que los indicadores de dispositivos, los requisitos funcionales para el análisis de registros también son mucho mayores.
¿Cuáles son las funciones comunes pero inútiles en el análisis de registros de operación y mantenimiento de TI?
Entre estos enormes requisitos funcionales, o "todo en uno", hay algunos que son completamente fuera de discusión, tal vez porque suena bien, o tal vez porque quiero continuar con mis hábitos de uso anteriores. Hoy estoy en un viaje de negocios y rara vez tengo tiempo para relajarme, así que decidí quejarme de algunos de estos aparentemente inofensivos. funciones.
Autor: Brother Xiaoma Fuente: Escuela de Operación y Mantenimiento | 2016-11-22 14:12 Colección Compartir
El análisis de registros es una parte muy importante del campo de operación y mantenimiento de TI. Incluso se puede decir que hoy en día, cuando prevalecen la plataforma, la modularización y la orientación a servicios, la importancia de esta parte del trabajo se ha acercado a la del monitoreo de equipos tradicionales. Sin embargo, debido a que las fuentes de registros, los usuarios y los administradores son más complejos que los indicadores de dispositivos, los requisitos funcionales para el análisis de registros también son mucho mayores. Entre estos enormes requisitos funcionales, o "que lo abarcan todo", hay algunos que no son perfectos, tal vez porque suenan bien o tal vez porque quieren continuar con los hábitos de uso anteriores. Hoy estoy en un viaje de negocios y rara vez lo he hecho. Es hora de relajarme. A continuación, decidí quejarme de algunas de estas funciones aparentemente inútiles.
realtimealert
La primera es la llamada "alerta en tiempo real". En realidad, la construcción de un sistema de alarma se puede dividir en dos propósitos diferentes:
Reparar los problemas cuando ocurren y evitar los problemas que están a punto de ocurrir.
Evitar los problemas que están a punto de ocurrir. que ocurra.
Hablemos de ello por separado:
Si necesita llamar a alguien para arreglarlo, suponiendo que el contenido de su alarma se haya refinado hasta el punto de que no necesita hacerlo solucionar el problema, desde el momento en que se envía la alarma hasta el momento en que inicia sesión. Tomará al menos varios minutos ir al servidor para resolver el problema; de acuerdo con la ley de Murphy, probablemente esté durmiendo, comiendo, viajando en el coche y equipo en este momento, por lo que diez minutos son suficientes para que puedas actuar rápidamente. Entonces, ¿cuál es la diferencia entre la alarma que se envía en el 0,1 segundo y la alarma que se envía en el décimo segundo? Y comprimir la alarma de un intervalo de 10 segundos a tiempo real en 1 segundo requiere muchos ajustes estructurales y El costo aumenta. Medio punto... (¿Dijiste que el filtrado de palabras clave en tiempo real no tiene costo? Entonces primero debes fortalecer el seguimiento, la expansión, la supresión y otras funciones del sistema de alarma. Las alarmas no son tan simples)
Si quiere evitarlo de antemano Sí, generalmente su infraestructura ha evolucionado bien y querrá modificar automáticamente su tráfico, recursos y programación de tareas mediante acciones de activación de alarmas. En realidad, este tipo de demanda cae más en la categoría de planificación de capacidad. Es difícil imaginar por qué este tipo de cosas deben realizarse en tiempo real. ¿De quién es la plataforma que no tiene en cuenta?
Por supuesto, de todos modos. De lo anterior, me quejo. Todos persiguen un tiempo real de 1 segundo o incluso milisegundo. Si su intervalo de monitoreo aún es superior a 5 minutos, no use mis palabras como escudo; si pasan horas desde que se recibe la alarma hasta que se resuelve el problema, 5 minutos puede no ser demasiado, pero la ubicación de su falla El método, o el El nivel de refinamiento del contenido del sistema de alarma debe mejorarse aún más.
Pasa página, pasa página, pasa página
El segundo es showmemoremoney, incorrecto, logline. Los sistemas de análisis de registros generalmente enumeran el texto del registro original en la interfaz para su visualización. Y un grupo de personas "baratas" felizmente harán clic en la página siguiente, página siguiente, página siguiente, página siguiente, página siguiente, página siguiente, y luego el sistema tendrá un problema.
Este requisito funcional es en realidad un legado del hábito pasado catlogfile|grepKEYWORD|less. Cuando aparecí, deseé poder ingresar a vim y comenzar a leer el registro línea por línea. Ctrl F Es divertido pasar páginas, pero todo el tiempo se pierde inconscientemente; piense en el "tiempo real" que aún desea del artículo anterior; la forma más adecuada de solucionar problemas de operación y mantenimiento es intentar cometer errores rápidamente. Se verifica una idea. Si no funciona, verifica rápidamente la siguiente.
Si no puede ver los 20 registros en una página o los 40 registros en dos páginas, debe cambiar rápidamente el período de tiempo y las palabras clave.
Por supuesto, dicho esto, si sigues pensando en volver atrás en la página, es posible que realmente no puedas pensar en qué palabras clave usar en su lugar. El sistema de análisis de registros debe brindar la capacidad de ayudar a los usuarios a encontrar palabras clave adecuadas más rápidamente. Esto es la visualización del tablero. Utilice las habilidades adecuadas para hacer lo correcto, en lugar de seguir utilizando métodos engorrosos cuando el método correcto esté disponible.