Sucedido a Nigel Adams, especialista de producto de Aeroflex Ltd (Stevenage, Reino Unido).
Un número de años, he trabajado como ingeniero de soporte de alto nivel para un fabricante de grandes sistemas ATE (automatización de prueba de equipos). Nos suministran un gran número de sistemas de prueba para los clientes en todo el mundo, todos con resultados exitosos. Una empresa con cinco máquinas similares en su proceso de producción, y que inicialmente parecían estar funcionando bien, con una buena fiabilidad y rendimiento. Después de unos meses, sin embargo, los problemas comenzaron a surgir. Nuestros ingenieros de servicio comenzaron a recibir llamadas para investigar los fallos del sistema. La fábrica no era local, y llegar allí requiere un largo viaje. En el momento en que el ingeniero llegó al lugar, los problemas habían desaparecido y los sistemas funcionaban normalmente.
Hemos intercambiado varias placas electrónicas, cambio de las fuentes de alimentación, y volver a cargar el software, todo fue en vano. Este problema continuó de forma intermitente durante semanas. En el momento que el cliente estaba poniendo a prueba las juntas, el sistema de repente e inexplicablemente se congeló. Nada más que un reinicio servía para solucionar el problema. No parece haber ningún patrón de los fracasos. No depende del operador, y se produjo cuando las diferentes pruebas e incluso programas se estaban ejecutando.
El cliente estaba preocupado por el tiempo de inactividad del sistema, culpando a nuestro hardware, y que se estaban quedando sin ideas. Se tomaron medidas drásticas, se decidió sustituir la ATE. Hemos seleccionado un sistema de demostración, totalmente rediseñado que estaba en condiciones óptimas, y calibrado a la perfección. Cargamos los programas del cliente, y funciona perfectamente bajo prueba. A la entrega del sistema, todo parecía bien.
A la mañana siguiente, sin embargo, tuvimos la temida llamada telefónica: El nuevo sistema se comporta exactamente igual que el anterior. Mientras tanto, había vuelto uno de los sistemas del cliente para el taller y no se pudo encontrar nada malo en él. Revisar las hojas de servicio y registros de trabajos revelaron poco en el camino de soluciones que no se han tratado en circunstancias similares. Ya era hora de una hoja de papel en blanco.
Por lo tanto, se cargó el coche con todo tipo de equipos de prueba y se dirigió hacia el sitio del cliente, sin saber qué esperar o con una idea de que tratar de solucionar con el problema. Decidí que lo mejor sería el primer ataque para simplemente sentarse y ver qué pasa. El primer día no revelaron nada fuera de lo común. En el segundo día, me ofrecí para actuar como operador para aliviar el tedio y para ganar experiencia de primera mano de la falla, cuando y si alguna vez se presentaba.
En el tercer día, a media mañana, el sistema simplemente se «congeló». Nada de lo obvio era diferente, pero ahora tenía la menor idea, porque el fallo se repitió unos 20 minutos más tarde. La fábrica tenía una gran fuerza de trabajo que tomó descanso para el café en grupos, y un gran número de máquinas de té y de café o menús, al mismo tiempo en un área adyacente a la planta de producción.
Me puse en el analizador de red a la fuente de entrada y descubrí el problema. Un par de formas de onda capturadas del evento mostraron que, cuando todas las máquinas expendedoras de bebidas estaban operando a la vez, produjeron patrones acumulativos de ruido, llegando a superar las calificaciones de nuestros filtros estándares industrial. Nuestras computadoras simplemente no podían hacer frente a la excesiva interferencia.
Resultó que el proveedor de bebidas había instalado sus máquinas poco después de que se habían instalado nuestros sistemas, lo que explica sin problemas el período inicial. Las máquinas de bebidas también tenían poco más de un circuito de supresión de lo más básico, y todos ellos fueron transferidos a la misma fase de la red eléctrica como nuestros sistemas. Cambiar el cableado en nuestros sistemas a otra fase inmediatamente solucionó el problema.
Fuente: EDN