3 research outputs found

    Hermes: DSM por software con granularidad fina

    Get PDF
    Los sistemas de DSM por software sobre clusters de workstations constituyen una alternativa interesante para el procesamiento paralelo, gracias a su gran potencial para la escalabilidad y excelente relaci on costo/performance. Al encarar el diseño de un sistema de este tipo, los aspectos fundamentales a considerar son: que sea simple y eficiente, que pueda utilizarse sobre una plataforma est andar sin requerimientos onerosos de hardware, que minimice el efecto negativo de false sharing proveniente de la gruesa granularidad de consistencia que acarrea el uso del mecanismo de protecci on de memoria virtual, y que evite las latencias prohibitivas asociadas al tr afico de mensajes sobre protocolos de red est andares durante las etapas de sincronizaci on. En este trabajo presentamos Hermes, un sistema de DSM por software que resuelve la problem atica citada con un enfoque simple y totalmente novedoso, al evitar el costo de mantener un orden parcial de las referencias {con ciertos modelos de consistencia relajados{. Hermes provee adem as control de granularidad fina de complejidad y sobrecarga m nima, que potencia su escalabilidad y brinda a su vez una alta flexibilidad para utilizar el modelo de consistencia que resulte m as apropiado. En lo que respecta a la comunicaci on, proponemos recurrir al uso de interfaces de red mapeadas a memoria virtual.Eje: Procesamiento distribuido y paralelo (PDP)Red de Universidades con Carreras en Informática (RedUNCI

    Evaluation of Architectural Support for Global Address-Based Communication in Large-Scale Parallel Machines

    No full text
    Large-scale parallel machines are incorporating increasingly sophisticated architectural support for user-level messaging and global memory access. We provide a systematic evaluation of a broad spectrum of current design alternatives based on our implementations of a global address language on the Thinking Machines CM-5, Intel Paragon, Meiko CS-2, Cray T3D, and Berkeley NOW. This evaluation includes a range of compilation strategies that make varying use of the network processor; each is optimized for the target architecture and the particular strategy. We analyze a family of interacting issues that determine the performance tradeo s in each implementation, quantify the resulting latency, overhead, and bandwidth of the global access operations, and demonstrate the e ects on application performance
    corecore