6 research outputs found

    Tolerancia a fallos en sistemas de memoria compartida distribuida

    Get PDF
    A medida que es necesario m谩s poder de c谩lculo, aumenta la demanda de sistemas con m煤ltiples procesadores, pero su desventaja es la programaci贸n que requiere gran esfuerzo y habilidad. Debido a esto, gran parte de su 茅xito depende del paradigma de programaci贸n que ofrezcan estos sistemas. Hay distintos m茅todos para mejorar la eficiencia y facilitar el uso de los sistemas paralelos, uno de estos es la memoria compartida distribuida (MCD). Una memoria distribuida compartida es una abstracci贸n que presenta un solo espacio de direcciones compartidos por un n煤mero de procesadores. Cualquier procesador puede acceder a los espacios de memoria directamente. Los administradores de mapeo de memoria implementan el mapeo entre las memorias locales y el espacio de direcciones compartido. Adem谩s de mapear, una de las principales responsabilidades de los administradores es mantener la coherencia todo el tiempo. Un sistema de memoria compartida distribuida es atractivo desde el punto de vista del programador, debido a que simplifica varios aspectos en los desarrollos de aplicaciones. Sin embargo. a medida que el n煤mero de componentes crece, la probabilidad de fallas del sistema se incrementa en la misma medida. Un sistema de MCD es robusto o tolerante a fallas si soporta la supervivencia a fallos de la aplicaci贸n de usuario. El mecanismo puede ser transparente a la aplicaci贸n o puede proveer un conjunto de primitivas para que la aplicaci贸n los utilice. Para implementar un sistema de MCD completamente confiable 茅ste debe preservar una imagen consistente de la memoria compartida (los datos globales) y proveer mecanismos para que cada aplicaci贸n sea recuperada de forma consistente (estados de los procesos y datos privados). Distinguiremos entre: recuperables; que son los sistemas que aunque sobrevivan a fallos pueden tener inconsistencias; y confiables; que son los que garantizan consistencia e integridad.Eje: Procesamiento Concurrente, paralelo y distribuido. RedesRed de Universidades con Carreras en Inform谩tica (RedUNCI

    Tolerancia a fallos en sistemas de memoria compartida distribuida

    Get PDF
    A medida que es necesario m谩s poder de c谩lculo, aumenta la demanda de sistemas con m煤ltiples procesadores, pero su desventaja es la programaci贸n que requiere gran esfuerzo y habilidad. Debido a esto, gran parte de su 茅xito depende del paradigma de programaci贸n que ofrezcan estos sistemas. Hay distintos m茅todos para mejorar la eficiencia y facilitar el uso de los sistemas paralelos, uno de estos es la memoria compartida distribuida (MCD). Una memoria distribuida compartida es una abstracci贸n que presenta un solo espacio de direcciones compartidos por un n煤mero de procesadores. Cualquier procesador puede acceder a los espacios de memoria directamente. Los administradores de mapeo de memoria implementan el mapeo entre las memorias locales y el espacio de direcciones compartido. Adem谩s de mapear, una de las principales responsabilidades de los administradores es mantener la coherencia todo el tiempo. Un sistema de memoria compartida distribuida es atractivo desde el punto de vista del programador, debido a que simplifica varios aspectos en los desarrollos de aplicaciones. Sin embargo. a medida que el n煤mero de componentes crece, la probabilidad de fallas del sistema se incrementa en la misma medida. Un sistema de MCD es robusto o tolerante a fallas si soporta la supervivencia a fallos de la aplicaci贸n de usuario. El mecanismo puede ser transparente a la aplicaci贸n o puede proveer un conjunto de primitivas para que la aplicaci贸n los utilice. Para implementar un sistema de MCD completamente confiable 茅ste debe preservar una imagen consistente de la memoria compartida (los datos globales) y proveer mecanismos para que cada aplicaci贸n sea recuperada de forma consistente (estados de los procesos y datos privados). Distinguiremos entre: recuperables; que son los sistemas que aunque sobrevivan a fallos pueden tener inconsistencias; y confiables; que son los que garantizan consistencia e integridad.Eje: Procesamiento Concurrente, paralelo y distribuido. RedesRed de Universidades con Carreras en Inform谩tica (RedUNCI

    Recoverable Distributed Shared Memory Under Sequential and Relaxed Consistency

    Get PDF
    Coordinated Science Laboratory was formerly known as Control Systems LaboratoryOffice of Naval Research / N00014-90-J-1270 and N00014-91-J-1283National Aeronautics and Space Administration / NASA NAG 1-61

    Relaxing Consistency in Recoverable Distributed Shared Memory

    No full text
    Relaxed memory consistency models tolerate increased memory access latency in both hardware and software distributed shared memory systems. In recoverable systems, relaxing consistency has the added benefit of reducing the number of checkpoints needed to avoid rollback propagation. In this paper, we introduce new checkpointing algorithms that take advantage of relaxed consistency to reduce the performance overhead of checkpointing. We also introduce a scheme based on lazy relaxed consistency, that reduces both checkpointing overhead and the overhead of avoiding error propagation in systems with error latency. We use multiprocessor address traces to evaluate the relaxed consistency approach to checkpointing with distributed shared memory. 1 Introduction Several parallel architectures use distributed shared memory to avoid the programming complexities of message passing. A distinguishing feature of these architectures is the distribution of memory across many processing nodes connected ..

    Relaxing Consistency in Recoverable Distributed Shared Memory

    No full text
    corecore