Red de conocimiento del abogados - Preguntas y respuestas jurídicas - ¿Por qué las interrupciones del servidor generalmente ocurren temprano en la mañana cuando el uso es menor?

¿Por qué las interrupciones del servidor generalmente ocurren temprano en la mañana cuando el uso es menor?

Jike se ha especializado en el desarrollo de software integrado durante muchos años. Recientemente, debido a que la empresa necesita participar en investigación y desarrollo de back-end, a menudo opta por actualizar temprano en la mañana y procesar datos a gran escala. también se realiza durante este período de tiempo, lo que sucede a menudo. El servidor también estuvo inactivo durante este período. Todos comienzan a lanzarse cuando los usuarios lo usan menos. Si la cantidad de lanzamientos es alta, es fácil que ocurran problemas con el servidor. Dado que estamos trabajando en equipos de Internet de las cosas, el tiempo de inactividad encontrado en el trabajo incluye principalmente las siguientes situaciones: la operación de grandes cantidades de datos hace que la proporción de CPU aumente drásticamente en un período de tiempo, lo que provoca problemas con el módulo de recepción de datos y provoca. Problemas de monitoreo del sistema. Problema, no se puede detectar mucha información del dispositivo.

Las operaciones demasiado frecuentes en la base de datos conducen a una disminución de la eficiencia, que también es una parte importante del rendimiento del sistema. De hecho, el servidor también se compone de una computadora común y corriente. y la memoria No importa dónde estén estos dos factores, todos estos pueden hacer que el sistema falle. Si la CPU está llena, la respuesta del sistema será extremadamente lenta y puede ralentizarse después de mucho tiempo. , provocará que el sistema falle y ya no podrá ejecutarse directamente. De hecho, el punto central del tiempo de inactividad no será causado por estos dos factores.

Ahora hagamos un resumen de los problemas comunes de tiempo de inactividad del servidor:

1. El espacio en disco está lleno. Ahora los programadores están acostumbrados a imprimir registros cuando se ejecuta. no existe un mecanismo de limpieza, los problemas ocurrirán tarde o temprano. Este error ocurre a menudo durante el funcionamiento normal. Si usa un servidor de computación en la nube, generalmente enviará un mensaje de texto antes de que el sistema falle para notificarle que el sistema está al borde. de colapso.

2. Problemas de rendimiento de concurrencia. Si varias personas operan una base de datos o un bloque de datos al mismo tiempo, el sistema se congelará. Este es un problema de competencia por los recursos de la CPU. configuración y optimización de la eficiencia del código de software Para resolver el problema, si la cantidad de datos es lo suficientemente grande, se puede considerar la administración distribuida

3. El daño o la destrucción de los datos provocarán que el sistema falle, por lo que un enfoque común es configurar un disco de respaldo y obtener la copia de seguridad lo antes posible si hay un problema. Para colmo, la empresa ahora utiliza servidores de Alibaba Cloud. La estabilidad es mucho mejor que antes. Nube en el medio. Aunque el precio de Tencent Cloud es más bajo, finalmente no pude soportarlo y cambié a Alibaba Cloud. Después de volver a cambiar, la estabilidad de los datos siempre será lo primero.

4. Algunas operaciones incorrectas innecesarias a menudo son causadas por fallas de los programadores o del personal de operación y mantenimiento, lo que resulta en un tiempo de inactividad del servidor a gran escala. Este tipo de incidente le ha sucedido a muchos proveedores de servicios en la nube, el nivel fundamental es. sigue siendo un problema de gestión. Cualquier detalle de la gestión en segundo plano puede ser posible.

Varias pistas para encontrar el problema cuando el servidor no funciona:

1. Compruebe si hay una pérdida de memoria en el servidor. El problema comienza después de reiniciar la máquina. Después de funcionar normalmente durante un tiempo, se vuelve muy lenta nueve de cada diez veces, es un problema de memoria.

2. ¿Es causado por una intrusión de piratas informáticos? y los datos importantes también son de mayor interés para los piratas informáticos. Sí, en términos generales, esta probabilidad no es muy alta.

3. ¿Se debe a un bloqueo de la base de datos, un acceso excesivo o demasiadas conexiones?

Una vez que se produce un tiempo de inactividad del servidor, provocará innumerables quejas de los usuarios, sin importar cuál sea la situación, la estabilidad es siempre la primera prioridad hoy en día, a menos que la gran actualización de funciones se haya verificado al 100% con éxito. provocar consecuencias impensables.

Espero que esto ayude.

Anteriormente, un dispositivo de nuestra unidad se apagaba por la noche. Este dispositivo se usaba para apilamiento, no como respaldo, y todas las líneas de enlace descendente estaban conectadas al dispositivo principal. Como resultado, en las primeras horas de esa noche, ¡el módulo de alimentación del dispositivo principal resultó dañado! Esto... ¿puedes ver el patrón? ¡También quiero saber por qué se dañó temprano en la mañana!

¡Así que no se puede decir que los eventos accidentales sean la mayoría!

Sin embargo, es normal realizar cortes por la noche. Es de sentido común optar por hacer cosas necesarias que puedan afectar al negocio cuando hay menos usuarios.

Aunque son muy pocos los usuarios que utilizan el sistema a primera hora de la mañana, el trabajo que tiene que hacer el servidor a esta hora puede que no sea menor en absoluto:

Déjame hablar de otro Lo que vi hace mucho tiempo, las experiencias de tiempo de inactividad del servidor compartidas por colegas, algunas de las cuales son muy mágicas, así que trátelas como una broma (por conveniencia, las contaré en primera persona).

El cliente al que atendemos es un hospital y la sala de computadoras está en el edificio del hospital. Recientemente, el servidor de la sala de computadoras ha estado inactivo con frecuencia. Los ingenieros de la compañía fueron allí varias veces y no encontraron nada. problemas; más tarde, la empresa no tuvo más remedio que dejar que un ingeniero se quedara en la sala de computadoras por la noche para ver qué sucedía en la sala de computadoras en medio de la noche, pensé que incluso si no podía encontrar la causa, Podría reiniciar el servidor lo antes posible después de que se cayera.

Más tarde descubrí el motivo. A las tres o cuatro de la madrugada se abrió la puerta de la sala de ordenadores y entró una enfermera del turno de noche. Echó un vistazo y dijo: "No hay nadie". ¿No es un desperdicio de electricidad encender el aire acondicionado?" Luego apagó el aire acondicionado en la sala de computadoras, y luego la temperatura subió...

Continuaré. para compartir mis conocimientos sobre el desarrollo de Java, el diseño de arquitectura, el desarrollo profesional de programadores, etc., con la esperanza de llamar su atención.

Ocasionalmente, es posible que tengas una conciencia superficial, porque este tipo de problema tiene la impresión más profunda, puedes pensar que es más y probarlo tomando notas.

El tiempo de inactividad generalmente se divide en 5 situaciones:

1. Hay un problema con el programa que provoca que el programa se bloquee.

2. La CPU\\Gpu y la memoria están llenas.

3. El espacio en el disco duro está lleno

4. El espacio en la tabla de la base de datos está lleno

5. La temperatura de la sala de ordenadores es demasiado alta

Lo anterior es un resumen personal de las respuestas a los problemas encontrados durante el proceso de operación y mantenimiento.

Aquí debemos explicar qué significa el tiempo de inactividad del servidor. El "down" en el "down" del que hablamos todos los días en realidad se refiere al inglés "down". Down significa que el servidor o servicio actual no responde o está fuera de línea.

El tiempo de inactividad del servidor se puede dividir en tiempo de inactividad controlado por humanos y tiempo de inactividad incontrolable. ¿Cuál es la diferencia entre los dos? Expliquemos en detalle a continuación:

1. Comportamiento de tiempo de inactividad controlable por humanos

El funcionamiento prolongado del servidor puede causar algunos problemas (no fatales). ) sexuales), o cuando necesitamos realizar actualizaciones y mantenimiento de software/hardware en el servidor, es posible que necesitemos apagar o reiniciar el servidor. El tiempo de inactividad en este caso es controlable y está dentro de nuestro plan.

2. Comportamiento de tiempo de inactividad incontrolable

Hay muchos factores, como una pantalla azul repentina en el servidor, una falla anormal del servicio, un corte de energía repentino y un corte de red. Esta vez, el servidor (servidor) no podrá brindar servicios normalmente, todo esto es causado por factores incontrolables.

En nuestro trabajo diario de operación y mantenimiento, el mantenimiento planificado del tiempo de inactividad generalmente se realiza en medio de la noche. ¿Por qué? Las razones principales son las siguientes:

1. Reducir el impacto. usuarios

Temprano en la mañana, básicamente todos descansan y el número de usuarios es mucho menor que durante el día, por lo que elegimos realizar el mantenimiento del sistema y del hardware en este momento. El impacto del tiempo de inactividad en los usuarios. El impacto es pequeño e incluso si lo hiciera, solo afectaría a un pequeño número de usuarios.

2. Disponer de tiempo suficiente para solucionar la avería

Si el mantenimiento se realiza a primera hora de la mañana, aunque haya algún problema, los técnicos tendrán tiempo suficiente (por ejemplo: 00 ~ 05 en punto) para solucionar el problema. Si el mantenimiento se realizara durante el día, todas las quejas llegarían si el servicio (servidor) estuviera caído durante más de una hora, lo que sería muy estresante.

El tiempo de inactividad del servidor significa que el servidor no puede ejecutarse normalmente debido a algunas razones, lo que provoca que la red se desconecte y no se pueda utilizar normalmente. El tiempo de inactividad del servidor suele ocurrir temprano en la mañana. ¿Por qué sucede esto? Por ejemplo, nuestra empresa se dedica a la producción de equipos tecnológicos de Internet para no afectar la producción normal, las actualizaciones del sistema generalmente se realizan temprano en la mañana y también se realiza una gran cantidad de procesamiento de datos en este momento. Es probable que ocurra en este momento. El análisis específico es el siguiente. Hay varias razones:

1. Cuando el sistema está actualizando o procesando datos grandes, el espacio del disco duro está lleno si nadie puede borrarlo. espacio en disco en el tiempo, el servidor sufrirá retrasos y provocará tiempo de inactividad.

2. Si hay varios dispositivos funcionando al mismo tiempo, el uso de esta base de datos provocará que el sistema se congele. Esto se debe a la incautación de recursos de la CPU, lo que provocará que el servidor se sobrecargue y las visitas al sitio web. Cada vez más, muchas aplicaciones sufren envenenamiento de programas y consumen el servidor, hasta que finalmente fallan y no pueden responder.

3. Debido a la reducción del personal de mantenimiento temprano en la mañana, habrá cortes de energía, altas temperaturas y otros factores ambientales que provocarán la caída del servidor, etc. Sin embargo, esta situación es rara, porque ahora la sala de computadoras tiene El generador está en espera para evitar la pérdida de datos causada por cortes de energía, y la temperatura también está controlada por un sistema de temperatura constante.

4. Para ahorrar costos de servidor, algunas empresas alquilan servidores con configuraciones más bajas para realizar una gran cantidad de trabajo, lo que sobrecarga los servidores. Los resultados son predecibles y, a menudo, se producirá tiempo de inactividad.

5. El tiempo de inactividad del servidor generalmente está estrechamente relacionado con la memoria. Algunos servidores se ralentizan después de funcionar durante un período de tiempo. Básicamente, hay un problema con la memoria.

Cuando el servidor no funciona, se producirán una serie de problemas y las pérdidas causadas son inconmensurables. Solo realizando un mantenimiento regular y prestando atención al estado de uso temprano en la mañana podemos evitar el tiempo de inactividad, sin importar la hora. En cualquier momento, el funcionamiento estable del servidor es lo más importante.

El software de la aplicación del servidor es muy estable durante el funcionamiento y, en general, no se producirán problemas. Las razones de la alta probabilidad de que se produzca un tiempo de inactividad temprano en la mañana son: primero, las actualizaciones de funciones y los reemplazos de hardware se realizan principalmente temprano en la mañana, lo que genera una alta probabilidad de problemas; segundo, la ejecución por lotes a menudo se realiza temprano en la mañana; Esto consume muchos recursos en un instante, lo que provoca problemas de datos, problemas de recursos de hardware e incluso lidiar con problemas lógicos puede provocar fácilmente un tiempo de inactividad. Además, si hay un problema con las transacciones en línea, se puede descubrir fácilmente y el sistema no se cerrará.

El principio es realmente muy simple: es como si estuviéramos ocupados con muchas cosas durante el día, como los porteadores, moviendo constantemente artículos al almacén. Solo cuando todos los artículos se hayan movido, podremos hacerlo. Empiece a organizar estos artículos y organice el almacén.

En segundo lugar, durante el día, el servidor está realmente en el estado "portador" de procesamiento de datos en tiempo real. Solo después de que se completa el trabajo de procesamiento de datos en tiempo real (trabajo de transporte), puede tener el oportunidad o poder tener las manos libres para resumir y organizar los datos. Por lo tanto, el tiempo de inactividad del servidor suele producirse durante el período de menor uso. Eso es todo.

Para una empresa que funciona de forma normal y estable, generalmente es difícil que el servidor se caiga debido a las operaciones comerciales normales. Los problemas de recursos del servidor son predecibles y controlables en la mayoría de los casos.

Las cosas que tienen más probabilidades de causar tiempo de inactividad son causadas por operaciones de desarrollo/operación y mantenimiento inadecuados. Por ejemplo, reemplazar el hardware del servidor, actualizar/instalar paquetes del sistema operativo, publicar código nuevo, actualizar datos en lotes, etc. Estas cosas generalmente se hacen en medio de la noche, cuando el volumen de negocios es bajo.

Debido a que temprano en la mañana es el momento en el que más sueño hay, el servidor se cae tan pronto como toma una siesta.