23 research outputs found

    Contributions to the detection and diagnosis of soft errors in radiation environments

    Get PDF
    Texto completo descargado desde Teseo1. Introducci贸n Los efectos de la radiaci贸n ionizante sobre dispositivos semiconductores es objeto de estudio desde la invenci贸n del transistor bipolar en 1947. El espacio es un entorno de alta radiaci贸n, como pusieron de manifiesto los primeros sat茅lites puestos en 贸rbita, y fue durante la carrera espacial de los a帽os 50 cuando se impuls贸 el estudio de errores generados en componentes electr贸nicos cr铆ticos a bordo de las primeras misiones espaciales. La necesidad de robustecer la electr贸nica frente a la radiaci贸n ha estado siempre presente en el sector aeroespacial, adem谩s, el progresivo escalado de las tecnolog铆as microelectr贸nicas, hace que el problema sea cada vez m谩s acuciante, afectando incluso a dispositivos que operan a nivel del mar. El advenimiento de tecnolog铆as nanom茅tricas augura que ser谩n necesarias nuevas y m谩s eficaces t茅cnicas de robustecimiento que garanticen la fiabilidad de equipos electr贸nicos cr铆ticos en sectores tan importantes como la aviaci贸n, automoci贸n o energ铆a nuclear. Existen dos m茅todos de robustecimiento para los dispositivos electr贸nicos, por proceso y por dise帽o. En el primer caso, el circuito integrado es fabricado en una tecnolog铆a que presenta baja sensibilidad a los efectos de la radiaci贸n, como la ampliamente utilizada SOI (Silicon On Insulator). En el segundo caso, el circuito presenta topolog铆as en su dise帽o que mitigan en mayor o menor grado el da帽o por radiaci贸n. La efectividad de cualquier medida de protecci贸n debe ser validada en el correspondiente ensayo de radiaci贸n de acuerdo a los est谩ndares vigentes (ESA, NASA, JEDEC, AEC,...). Existen varios tipos de da帽o por radiaci贸n, asociados a dosis acumulada (TID) y a eventos 煤nicos (SEE), fundamentalmente. Estos 煤ltimos est谩n asociados al paso de una 煤nica part铆cula energ茅tica a trav茅s del dispositivo, que genera una estela de carga y puede dar lugar a respuestas el茅ctricas no deseadas, como conmutaci贸n 2 2 Antecedentes de biestables, enclavamiento de un bit o excursiones de voltaje transitorias. A su vez, dentro de los errores asociados a eventos 煤nicos se puede distinguir entre da帽os f铆sicos, que pueden destruir el dispositivo de manera irreversible, y errores l贸gicos o soft errors que conllevan la corrupci贸n del estado de un circuito digital, por ejemplo por la conmutaci贸n del valor l贸gico de un biestable. Los tests en aceleradores de part铆culas o con fuentes radiactivas, se consideran los ensayos m谩s representativos para conocer la inmunidad de un componente frente al da帽o de tipo SEE. Sin embargo, la complejidad de estos ensayos dificulta la observabilidad experimental y la interpretaci贸n de los resultados obtenidos. En particular los tests din谩micos, que implican que el chip est茅 operando durante la irradiac贸n, comportan una dificultad a帽adida a la hora de interpretar los errores observados en las salidas del circuito. El test din谩mico de radiaci贸n es el m谩s realista, ya que introduce la variable temporal en el experimento y da lugar a efectos reales que no son reproducibles en condiciones est谩ticas, como el evento 煤nico transitorio (SET). El trabajo a realizar durante esta tesis pretende aportar una metodolog铆a de test que mejore la observabilidad de errores l贸gicos en un test din谩mico de radiaci贸n de circuitos digitales mediante detecci贸n y diagn贸stico en tiempo real. 2. Antecedentes La experiencia investigadora del grupo al que pertenece el autor de esta tesis en el campo de los efectos de la radiaci贸n sobre dispositivos electr贸nicos, ha puesto de manifiesto la necesidad de establecer una metodolog铆a que permita el diagn贸stico de los errores observados en un componente electr贸nico sometido a radiaci贸n ionizante. Generalmente, no es posible correlacionar con certeza el efecto (anomal铆a detectada en los puertos de salida) con la causa del mismo. La complejidad inherente a la instrumentaci贸n de un ensayo de radiaci贸n en un acelerador 3 3 Hip贸tesis y Objetivos de part铆culas, as铆 como la propia comlejidad del circuito bajo estudio, requieren alg煤n criterio de clasificaci贸n de los errores observados que pueden ser de muy diversa naturaleza. Algunos autores han aportado t茅cnicas que combinan inyecci贸n de fallos din谩mica con test en acelerador est谩ticos para estimar la probabilidad de fallo real del circuito, salvando la complejidad del test de radiaci贸n din谩mico. La protecci贸n selectiva, consistente en adoptar topolog铆as de dise帽o robustas en 驴puntos calientes驴 o cr铆ticos del circuito, requiere t茅cnicas de ensayo que permita el diagn贸stico y localizaci贸n del da帽o por radiaci贸n. El uso de microsondas nucleares permite la focalizaci贸n de un haz de iones en una regi贸n relativamente peque帽a, facilitando el diagn贸stico. La disponibilidad de uso de la microsonda nuclear en el Centro Nacional de Aceleradores puede contribuir al desarrollo de la t茅cnica de detecci贸n y diagn贸stico que es objeto de esta tesis. La curva de secci贸n eficaz de fallo SEE es la forma m谩s extendida de representaci贸n de resultados de experimentaci贸n. Estas curvas representan una colecci贸n de datos experimentales que deben ser minuciosamente clasificados. Lo mismo ocurre en los tests destinados a evaluar la tasa de errores l贸gicos en tiempo real (RTSER). En este sentido, la norma JEDEC JESD89-1A recomienda que se sigan 驴criterios de fallo驴 para la correcta identificaci贸n de los errores detectados a la salida de un circuito en tests de radiaci贸n. 3. Hip贸tesis y Objetivos El grupo de investigaci贸n al que pertenece el doctorando, posee una contrastada experiencia en el uso de emuladores hardware para la evaluaci贸n temprana de la robustez de dise帽os digitales ante errores l贸gicos. Estos emuladores inyectan fallos en la netlist de un dise帽o digital y estudian la evoluci贸n del estado del circuito durante la ejecuci贸n de un conjunto de est铆mulos. La principal ventaja de estas herramientas frente a la simulaci贸n, radica en la aceleraci贸n hardware de los 4 3 Hip贸tesis y Objetivos tests que permite la finalizaci贸n de campa帽as de inyecci贸n masivas en un tiempo relativamente corto. Las campa帽as masivas o sistem谩ticas de inyecci贸n de fallos permiten comprobar de forma exhaustiva la respuesta de un dise帽o digital a un entorno de alta radiaci贸n. Estas campa帽as arrojan una ingente cantidad de informaci贸n acerca de las vulnerabilidades del dise帽o que debe ser procesada generalmente de forma estad铆stica. La correlaci贸n entre el instante y lugar de inyecci贸n del fallo emulado y la respuesta del mismo, ser铆a una informaci贸n que permitir铆a establecer la causa de un error (comportamiento an贸malo) observado durante un test de radiaci贸n, donde generalmente s贸lo est谩n accesibles las salidas del dispositivo. Los resultados de una campa帽a de inyecci贸n dependen, adem谩s del dise帽o bajo test, del conjunto de est铆mulos aplicado (workload). A partir de los resultados de la campa帽a de inyecci贸n masiva, se puede realizar un estudio estad铆stico que determine la calidad de los vectores de test desde el punto de vista del diagn贸stico. Es de esperar que diferentes fallos inyectados compartan la misma firma, de manera que en caso de obtener dicha firma en un test de radiaci贸n, sea imposible determinar exactamente el punto de inyecci贸n del fallo. A la hora de preparar un test de radiaci贸n, es recomendable emplear vectores de test que garanticen que la certidumbre del diagn贸stico sea m谩xima, lo cual es un aporte adicional de la tesis. Esta tesis pretende establecer un procedimiento que permita obtener 驴diccionarios de fallos驴 en los que se establece una correlaci贸n entre el punto de inyecci贸n y la respuesta del circuito codificada en una firma de pocos bytes. Durante un test de radiaci贸n se pueden obtener en tiempo real las firmas generadas por el circuito, que servir谩n para diagnosticar en cada caso el origen del da帽o empleando los diccionarios de fallos previamente generados en un emulador hardware. En el supuesto de que la firma generada durante la irradiaci贸n no estuviera contenida en un diccionario exhaustivo, se puede decir que el error no ha sido originado por el 5 4 Metodolog铆a y Trabajo Realizado modelo de fallo empleado en la generaci贸n del diccionario, debi茅ndose por tanto a un tipo de da帽o no contemplado (por ejemplo da帽o f铆sico). La culminaci贸n de la tesis es el test de radiaci贸n en un acelerador de part铆culas. La Universidad de Sevilla cuenta con las instalaciones del Centro Nacional de Aceleradores, que puede ser un banco de pruebas id贸neo para comprobar la validez de la metodolog铆a y comprobar las ventajas e inconvenientes de la misma. 4. Metodolog铆a y Trabajo Realizado El plan de trabajo incluy贸 los siguientes hitos en el orden expuesto: Estudio de la base de conocimiento gen茅rica relacionada con los efectos de la radiaci贸n en circuitos electr贸nicos An谩lisis del Estado del Arte en t茅cnicas de inyecci贸n de fallos en circuitos digitales. Recopilaci贸n de normas y est谩ndares relacionados con los test radiaci贸n de componentes electr贸nicos. Estudio simulado de bajo nivel de los efectos de la radiaci贸n en tecnolog铆as submicrom茅tricas. Selecci贸n de un m贸dulo adecuado para creaci贸n de firmas a partir de las salidas de un circuito digital. Adecuaci贸n del emulador hardware FT-UNSHADES para la generaci贸n de firmas durante las campa帽as de inyecci贸n. Selecci贸n de un veh铆culo de test para el experimento en la microsonda nuclear del CNA. 6 4 Metodolog铆a y Trabajo Realizado Realizaci贸n de campa帽as de inyecci贸n masivas para la generaci贸n de diccionarios de fallos sobre dise帽os digitales y an谩lisis de resultados. Preparaci贸n del setup experimental para el acelerador de part铆culas. Experimento en la microsonda nuclear del CNA y an谩lisis de resultados. El estudio bibliogr谩fico de la base de conocimiento en el campo de los efectos de la radiaci贸n sobre circuitos electr贸nicos ha sido fundamental para poder establecer el 谩mbito de aplicaci贸n de la tesis. El papel de la emulaci贸n hardware para inyecci贸n de fallos en esta investigaci贸n fue cr铆tica y ha sido necesario un estudio de las plataformas existentes para entender qu茅 puede aportar cada herramienta. Para acabar con la documentaci贸n, es necesario adem谩s recopilar las normas y est谩ndares relacionados con test de radiaci贸n de circuitos electr贸nicos. La simulaci贸n de bajo nivel de los efectos de la radiaci贸n sobre una determinada tecnolog铆a engloba herramientas como SPICE, SRIM y TCAD. Estas simulaciones permiten estimar cuales deben ser las caracter铆sticas del haz de iones empleado en un futuro ensayo en el acelerador de part铆culas. Los resultados de estas simulaciones fueron discutidos con los t茅cnicos del acelerador para estudiar la viabilidad de los par谩metros deseados. Un elemento clave en la metodolog铆a fue el bloque que debe generar las firmas a partir de las salidas del circuito digital. Es deseable que se trate de un m贸dulo sencillo y que pueda ser implementado en un dispositivo programable sin suponer un consumo excesivo de recursos. El emulador FT-UNSHADES fue adaptado par incorporar el m贸dulo de firmas. Se dispuso de un circuito integrado que servi贸 veh铆culo de test para un experimento en el CNA. Es necesaria adem谩s la descripci贸n VHDL del mismo para su emulaci贸n en FT-UNSHADES. No es objeto de esta tesis el desarrollo de este componente, su dise帽o y fabricaci贸n est谩 fuera del alcance de esta tesis. Se gener- 7 4 Metodolog铆a y Trabajo Realizado aron diccionarios de fallos del veh铆culo de tests y de otros dise帽os digitales y, a partir de estos diccionarios, se han confeccionado estudios estad铆sticos de diagn贸stico. En una fase ulterior, se desarroll贸 el hardware necesario para el setup experimental. Todo el hardware se prob贸 en el laboratorio, antes de acudir al CNA. El resultado de esta etapa es la configuraci贸n del equipamiento de test autom谩tico (ATE) que se encarg贸 de introducir est铆mulos en el chip y monitorizarlo durante el experimento en el acelerador de part铆culas. Finalmente, se llev贸 a cabo un experimento en el Centro Nacional de Aceleradores sobre el veh铆culo de test elegido para completar una prueba de concepto de la metodolog铆a propuesta.

    Speeding-up model-based fault injection of deep-submicron CMOS fault models through dynamic and partially reconfigurable FPGAS

    Full text link
    Actualmente, las tecnolog铆as CMOS submicr贸nicas son b谩sicas para el desarrollo de los modernos sistemas basados en computadores, cuyo uso simplifica enormemente nuestra vida diaria en una gran variedad de entornos, como el gobierno, comercio y banca electr贸nicos, y el transporte terrestre y aeroespacial. La continua reducci贸n del tama帽o de los transistores ha permitido reducir su consumo y aumentar su frecuencia de funcionamiento, obteniendo por ello un mayor rendimiento global. Sin embargo, estas mismas caracter铆sticas que mejoran el rendimiento del sistema, afectan negativamente a su confiabilidad. El uso de transistores de tama帽o reducido, bajo consumo y alta velocidad, est谩 incrementando la diversidad de fallos que pueden afectar al sistema y su probabilidad de aparici贸n. Por lo tanto, existe un gran inter茅s en desarrollar nuevas y eficientes t茅cnicas para evaluar la confiabilidad, en presencia de fallos, de sistemas fabricados mediante tecnolog铆as submicr贸nicas. Este problema puede abordarse por medio de la introducci贸n deliberada de fallos en el sistema, t茅cnica conocida como inyecci贸n de fallos. En este contexto, la inyecci贸n basada en modelos resulta muy interesante, ya que permite evaluar la confiabilidad del sistema en las primeras etapas de su ciclo de desarrollo, reduciendo por tanto el coste asociado a la correcci贸n de errores. Sin embargo, el tiempo de simulaci贸n de modelos grandes y complejos imposibilita su aplicaci贸n en un gran n煤mero de ocasiones. Esta tesis se centra en el uso de dispositivos l贸gicos programables de tipo FPGA (Field-Programmable Gate Arrays) para acelerar los experimentos de inyecci贸n de fallos basados en simulaci贸n por medio de su implementaci贸n en hardware reconfigurable. Para ello, se extiende la investigaci贸n existente en inyecci贸n de fallos basada en FPGA en dos direcciones distintas: i) se realiza un estudio de las tecnolog铆as submicr贸nicas existentes para obtener un conjunto representativo de modelos de fallos transitoriosAndr茅s Mart铆nez, DD. (2007). Speeding-up model-based fault injection of deep-submicron CMOS fault models through dynamic and partially reconfigurable FPGAS [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/1943Palanci

    Test set generation almost for free using a Run-Time FPGA reconfiguration technique

    Get PDF
    The most important step in the final testing of fabricated ASICs or the functional testing of ASIC and FPGA designs is the generation of a complete test set that is able to find the possible errors in the design. Automatic Test Pattern Generation (ATPG) is often done by fault simulation which is very time-consuming. Speed-ups in this process can be achieved by emulating the design on an FPGA and using the actual speed of the hardware implementation to run proposed tests. However, faults then have to be actually built in into the design, which induces area overhead as (part of) the design has to be duplicated to introduce both a faulty and a correct design. The area overhead can be mitigated by run-time reconfiguring the design, at the expense of large reconfiguration time overheads. In this paper, we leverage the parameterised reconfiguration of FPGAs to create an efficient Automatic Test Pattern Generator with very low overhead in both area and time. Experimental results demonstrate the practicality of the new technique as, compared to conventional tools, we obtain speedups of up to 3 orders of magnitude, 8X area reduction, and no increase in critical path delay
    corecore