Repository logo
  • English
  • Čeština
  • Deutsch
  • Español
  • Français
  • Gàidhlig
  • Latviešu
  • Magyar
  • Nederlands
  • Português
  • Português do Brasil
  • Suomi
  • Svenska
  • Türkçe
  • Қазақ
  • বাংলা
  • हिंदी
  • Ελληνικά
  • Log In
    or
    New user? Click here to register.
Repository logo

Repositorio Institucional de la Universidad de Murcia

Repository logoRepository logo
  • Communities & Collections
  • All of DSpace
  • menu.section.collectors
  • menu.section.acerca
  • English
  • Čeština
  • Deutsch
  • Español
  • Français
  • Gàidhlig
  • Latviešu
  • Magyar
  • Nederlands
  • Português
  • Português do Brasil
  • Suomi
  • Svenska
  • Türkçe
  • Қазақ
  • বাংলা
  • हिंदी
  • Ελληνικά
  • Log In
    or
    New user? Click here to register.
  1. Home
  2. Browse by Subject

Browsing by Subject "Manycore"

Now showing 1 - 2 of 2
Results Per Page
Sort Options
  • Repository logo
    Publication
    Open Access
    HATLib. Software para la instalacion y optimizacion jerarquica de rutinas de algebra lineal en sistemas heterogenos
    (2025) Cámara, Jesús; Cuenca Muñoz, Antonio Javier; Giménez, Domingo; Ingeniería y Tecnología de Computadores
    Este software permite realizar la instalacion jerarquica de rutinas de algebra lineal, auto-optimizando su ejecucion conforme se avanza en los diferentes niveles hardware (agrupacion de unidades de computo) y software (jerarqua de rutinas). Durante el proceso de instalacion, por un lado, se determinan los valores de los parametros algormicos en el nivel actual y, por otro, se aplica una metodologa de optimizacion que permite, mediante el uso de la informacion de instalacion almacenada en niveles inferiores de la jerarqua, ejecutar de forma e ciente la rutina que esta siendo instalada. De esta forma se consigue, a su vez, reducir el tiempo de instalacion. El proceso de instalacion se ha de llevar a cabo comenzando siempre desde el nivel mas bajo de la jerarqua. En la dimension hardware, este nivel corresponde a las unidades basicas de procesamiento (CPU, GPUs y/o MICs) presentes en los nodos de computo. El siguiente nivel (nivel 1) correspondera al nodo de computo en su totalidad o cualquier subconjunto de unidades de computo del mismo (nodos virtuales). El ultimo nivel (nivel 2), equivaldra a usar la plataforma completa o un subconjunto de nodos (virtuales o no) de la misma, es decir, cualquier agrupacion de unidades de computo de la plataforma, donde cada una puede estar formada, a su vez, por un subconjunto de unidades de computo. En la dimension software, en cambio, esta version inicial solo permite la instalacion de la rutina de multiplicacion de matrices en los niveles hardware mencionados. Se ha considerado inicialmente esta rutina porque constituye el kernel computacional basico de la gran mayora de rutinas de algebra lineal numerica. Una vez instalada la rutina, la aplicacion ofrece otras rutinas de nivel superior, como la multiplicacion de Strassen o la factorizacion LU, que se pueden ejecutar en diferentes niveles usando internamente la rutina auto-optimizada de multiplicacion de matrices. En siguientes versiones se extendera su funcionalidad para permitir instalar rutinas de forma optimizada en cualquier nivel hardware de la plataforma, haciendo uso de una jerarqua de niveles de rutinas similar a la establecida en libreras de algebra lineal como BLAS y LAPACK.
  • Loading...
    Thumbnail Image
    Publication
    Restricted
    Integrating software and hardware hierarchies in an autotuning method for parallel routines in heterogeneous clusters
    (Springer , 2020-03-07) Cámara, Jesús; Cuenca Muñoz, Antonio Javier; Giménez, Domingo; Ingeniería y Tecnología de Computadores
    A hierarchical approach for autotuning linear algebra routines on heterogeneous platforms is presented. Hierarchy helps to alleviate the difficulties of tuning parallel routines for high-performance computing systems. This paper analyzes the application of the hierarchical approach at both the hardware and software levels, using the basic matrix multiplication and the Strassen multiplication as proof of concept on multicore+coprocessor nodes. In this way, the hierarchical approach allows partial delegation of the efficient exploitation of the computing units in the node to the underlying direct autotuned matrix multiplication used in the base case.

DSpace software copyright © 2002-2026 LYRASIS

  • Cookie settings
  • Accessibility
  • Send Feedback