GRID COLOMBIA: SOPORTE PARA INVESTIGACIONES DE AVANZADA

Share Embed


Descripción

See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/228680788

GRID COLOMBIA: SOPORTE PARA INVESTIGACIONES DE AVANZADA ARTICLE

READS

54

5 AUTHORS, INCLUDING: Cesar Diaz

Enrique González

Jorge Tadeo Lozano University

Pontifical Xavierian University (Bogota)

13 PUBLICATIONS 40 CITATIONS

39 PUBLICATIONS 103 CITATIONS

SEE PROFILE

SEE PROFILE

Jorge Zuluaga Universidad del Valle (Colombia) 2 PUBLICATIONS 0 CITATIONS SEE PROFILE

Available from: Jorge Zuluaga Retrieved on: 26 February 2016

Volumen 1 N. 1 Enero – Junio 2011 ISSN: 2027 - 7415 Pág. 48 ___________________________________________________________________________________________________

GRID COLOMBIA: SOPORTE PARA INVESTIGACIONES DE AVANZADA 1

2

3

4

5

Harold Castro , Jorge Chacón , César Díaz , Enrique González , Jorge Zuluaga 2 3 Universidad de los Andes-Bogotá, Universidad Industrial de Santander-Bucaramanga, Universidad 4 5 Católica-Bogotá, Pontificia Universidad Javeriana-Bogotá, Universidad de Antioquia-Medellín [email protected], [email protected], [email protected], [email protected], [email protected] 1

Resumen La investigación científica y tecnológica se apoya cada vez más en sistemas de cómputo de alto desempeño para incrementar su calidad y alcances. Para lograr sistemas de este tipo en el contexto colombiano, se requiere lograr la integración los recursos limitados existentes en un grid o una grilla de alcance nacional conectada a través de la red RENATA. Con el propósito de aunar los esfuerzos de las universidades colombianas que trabajan en computación de alto desempeño ha surgido la iniciativa nacional Grid Colombia. Este artículo presenta la justificación de las necesidades de adelantar una iniciativa de este estilo y el trabajo adelantado con el objetivo de establecer una iniciativa nacional de computación en malla que sirva para potencia la capacidad investigativa de las instituciones colombianas. Palabras claves: Computación en Grilla, Grid Colombia, Computación de Alto Desempeño. Abstract Scientific and technological research is increasingly supported by high performance computing systems to enhance their quality and scope. In order to build such systems in the Colombian context, we need to gather the few and scattered resources in a country wide computational grid connected through RENATA. Grid Colombia is a National Grid Initiative (NGI) aimed for the integration of scattered efforts for developing high performance computing platforms within Colombian universities. This paper presents the motivation to develop such an initiative and the advances on achieving this goal. Keywords: Grid computing, Grid Colombia, High Performance Computing.

INTRODUCCIÓN Los retos planteados por la ciencia han crecido a un ritmo para el cual la tecnología no estaba preparada. De un trabajo empírico y teórico la ciencia ha pasado hoy a un proceso de simulaciones y de manipulación de datos para los cuales los centros de cómputo, aun los más potentes, no ofrecen una respuesta satisfactoria.

________________________________________________________________________________________ e-colabora “Revista de ciencia, educación, innovación y cultura apoyadas por Redes de Tecnología Avanzada” http://publicaciones.renata.edu.co

Volumen 1 N. 1 Enero – Junio 2011 ISSN: 2027 - 7415 Pág. 49 ___________________________________________________________________________________________________

Para los retos actuales es común hablar de experimentos que requieren miles de horas de CPU, terabytes y hasta petabytes de almacenamiento y gigabytes por segundo en capacidades de comunicación (Foster & Kesselman, 2003). Este crecimiento ha comenzado a restar importancia a la capacidad computacional individual de los grupos de investigación. Los problemas de hoy son es tan grandes que no vale la pena intentar resolverlo solo con recursos propios. Lo que importa no es lo que un grupo tiene sino a lo que puede acceder y bajo esa premisa, el compartir recursos computacionales entre distintos grupos de investigación (aún en competencia) resulta de altísimo interés en la ciencia moderna. Es sobre esta premisa que se fundamenta la e-ciencia (e-Science), que se apoya de manera intensiva en recursos computacionales, pero donde dicho apoyo se realiza en entornos altamente distribuidos. Grid computing (computación en malla) es la respuesta de la tecnología a las necesidades de la e-ciencia. Para poder compartir recursos entre grupos que no pertenecen a una misma organización, y poder hacerlo de manera que todos los participantes obtengan una experiencia satisfactoria (en términos de rendimiento, seguridad, usabilidad, etc.), muchas capas de software, pero también de política, son necesarias (Foster & Kesselman, 2003). Grid nos permite abrir entonces una ventana de oportunidad para hacer ciencia sin tener que poseer todos los recursos y sin sufrir las consecuencias de una baja capacidad computacional propia. Sin embargo, a la vez se convierte un inmenso riesgo: si nuestros grupos de investigación no logran acceder de manera eficaz a esta tecnología, el riesgo de pasar a ser irrelevantes en el contexto científico mundial es muy grande. Este artículo presenta en la sección 2 las aplicaciones que han motivado o sustentado el desarrollo y la existencia de proyectos de computación en malla a nivel nacional, regional y/o mundial. La sección 3 introduce algunos ejemplos de esfuerzos grid en diferentes contextos para dar paso en la sección 4 a una introducción del esfuerzo de algunas universidades nacionales por desarrollar una iniciativa grid a nivel Colombia. Por último la sección 5 concluye con una idea de los pasos a seguir.

APLICACIONES HPC Aunque Grid nace de la necesidad de proyectos científicos, poco a poco se ha ido mostrando como una solución adecuada para distintos entornos. Desde soluciones enfocadas a física teórica hasta modelos de negocio basados en computación por demanda, grid aparece en el centro de la estrategia tecnológica, habilitando nuevas posibilidades y rompiendo los esquemas tradicionales sobre la posesión absoluta y exclusiva de los recursos de una organización.

E-SCIENCE Como dijimos anteriormente, e-ciencia y grid van de la mano, pero es de esperar que el nuevo término eciencia simplemente desaparezca pues grid será la manera natural de hacer ciencia en muy poco tiempo. Para hacer un mejor análisis de las aplicaciones científicas que aprovechan la tecnología Grid, la tabla 1

________________________________________________________________________________________ e-colabora “Revista de ciencia, educación, innovación y cultura apoyadas por Redes de Tecnología Avanzada” http://publicaciones.renata.edu.co

Volumen 1 N. 1 Enero – Junio 2011 ISSN: 2027 - 7415 Pág. 50 ___________________________________________________________________________________________________

resume proyectos de ciencia que actualmente se están resolviendo con la ayuda de estas infraestructuras, clasificados por área de conocimiento. Esta clasificación se hizo a partir de las aplicaciones reportadas por diferentes proyectos de grid a lo largo y ancho del planeta y será muy importante al momento de investigar los grupos de investigación y los proyectos de ciencia que se están llevando a cabo en Colombia ya que se podrán buscar similitudes en proyectos y grupos de investigación para ver su viabilidad de despliegue sobre una infraestructura Grid (Martínez, 2008). Área del conocimiento Física

Aplicaciones

Área del conocimiento Meteorología

Física de alta energía Aplicaciones de partículas físicas Astrofísica Física Experimental de Partículas

Observaciones de la tierra Modelos atmosféricos Ciencias atmosféricas Observatorios Aplicaciones climáticas Erupciones volcánicas

Medicina Procesamiento de imágenes médicas Problemas médicos en Latinoamérica Área Temática de Salud Biología

Aplicaciones

Química Procesos bioquímicos computacionales Modelos bioquímicos Química Computacional

Procesamiento de imágenes biológicas Aplicaciones biológicas Electrónica Biología computacional Aplicaciones e-Learning Bioinformática Matemáticas Biomedicina Sistemas Complejos Tabla 1. Disciplinas científicas usando grid actualmente

E MPRESARIALES Para que un producto tecnológico perdure en el tiempo, es necesario que muestre su efectividad en el mundo empresarial; de lo contrario, está condenado a un alcance e impacto muy limitados. Grid ha incursionado exitosamente en el mundo empresarial y las grandes multinacionales de la informática ya incluyen productos o soluciones basadas en esta tecnología. IBM es uno de los principales participantes en la alianza Globus (estándar de facto de esta tecnología: www.globus.org) e incluye componentes de este producto en sus soluciones WebSphere, SUN integró su motor de grid en su plataforma N1 y ofrece el producto SUN N1 Grid Engine, Hewlett Packard habla de empresas adaptativas y ofrece soporte para el kit de globos en su plataforma, Oracle presenta al motor de Oracle 10g como “habilitado” para grid e incluso

________________________________________________________________________________________ e-colabora “Revista de ciencia, educación, innovación y cultura apoyadas por Redes de Tecnología Avanzada” http://publicaciones.renata.edu.co

Volumen 1 N. 1 Enero – Junio 2011 ISSN: 2027 - 7415 Pág. 51 ___________________________________________________________________________________________________

Microsoft tiene a grid de fondo cuando presenta su estrategia de Computación Autónoma. Otros fabricantes y vendedores como Apple y SAP no se quedan atrás en esta tendencia y de alguna manera incluyen pasarelas que habiliten la integración de sus productos con otros del mundo de la computación en malla (Plaszczak & Wellner, 2006). Todas las anteriores soluciones están orientadas a habilitar nuevas posibilidades de integración y particularmente a lograr un uso más eficiente de los recursos computacionales de las organizaciones. Ya se están presentando casos de negocio que extienden esta idea a un mundo en donde las organizaciones resuelven sus necesidades computacionales gracias a la agrupación de recursos que aunque pertenecen a distintas empresas, se unen para atender de manera más eficiente requisitos puntuales de alguna de ellas.

ANTECEDENTES DE DESARROLLO DE GRIDS COMPUTACIONALES En esta sección se presentarán, en primera instancia, algunos de los ejemplos más sobresalientes de desarrollos de grids computacionales. Se incluyen los principales proyectos de grid a nivel mundial así como un ejemplo de iniciativa grid nacional que por corresponder a un país latinoamericano lo consideramos muy pertinente para el caso colombiano. •





EGEE (Enabling Grids for E-SciencE): es el proyecto mundial de grid por excelencia. Sus principales objetivos son crear una infraestructura confiable, robusta y segura para implementar un Grid. Una de las prioridades de EGEE es facilitar la participación de un gran número de centros de cómputo y de grupos de investigación y para ello concentra muchos de sus esfuerzos en entrenamientos y ayudas a los usuarios de dicha infraestructura. Este proyecto se inicia a partir de la infraestructura de LHC Computing Grid (www.cern.ch/lcg), con la urgencia de procesar los más de 15 Petabytes de información por año que se espera produzcan cada uno de los experimentos del LHC del Cern. Una vez consolidado un núcleo robusto de centros, se ha venido trabajando en la incorporación de nuevos recursos de todo el mundo para así poder lograr crear una gran infraestructura mundial (www.eu-egee.org). Teragrid: es la respuesta americana a EGEE. Teragrid basa su fortaleza en la unión de los más grandes centros de cómputo de Estados Unidos y de esta forma con un número mucho menor de sitios, Teragrid sobrepasa a EGEE en capacidad de cómputo y almacenamiento. Para consolidar esta agrupación de super centros de cómputo, Teragrid aprovecha el desarrollo de Internet2 que ofrece un backbone de comunicación a decenas de gigabits por segundo. En Teragrid se ejecuta un conjunto amplio de aplicaciones de las áreas de ciencias moleculares, física, astronomía, química, materiales, sistemas térmicos, ciencias atmosféricas y en general aplicaciones científicas de computación avanzada (www.teragrid.org). EELA (E-Infraestructure shared between Europe and Latin America): es un proyecto que nació con el objetivo de crear un puente entre la infraestructura Grid europea y la infraestructura Grid de algunos países Latinoamericanos. Esta conexión se hizo a través de las redes de alta velocidad RedClara y Geant2, en Latinoamérica y Europa respectivamente. Con este proyecto se buscaba desarrollar y

________________________________________________________________________________________ e-colabora “Revista de ciencia, educación, innovación y cultura apoyadas por Redes de Tecnología Avanzada” http://publicaciones.renata.edu.co

Volumen 1 N. 1 Enero – Junio 2011 ISSN: 2027 - 7415 Pág. 52 ___________________________________________________________________________________________________



desplegar aplicaciones Grid para usos biológicos, climáticos, e-learning y de física de altas energías. Aparte de los anteriores objetivos, el proyecto EELA también pretendía iniciar una infraestructura piloto en Latinoamérica, la cual se pudiera conectar con la Infraestructura EGEE europea y de esta forma poder incrementar el uso de estas plataformas en las diferentes áreas del conocimiento. Por otra parte al unir estas infraestructuras también estaría logrando unir proyectos europeos y latinoamericanos encaminados a la ciencia. En abril de este año se dio inicio a la segunda fase de este proyecto, ahora llamado E-science grid facility between Europe and Latinamerica, con la participación de la Universidad de los Andes y la Universidad Industrial del Santander como representantes colombianos (www.eueela.eu). CLCGRID: La idea de CLGRID es que las universidades o las organizaciones que se incorporaran al proyecto inviertan en personal investigador, en tiempo y en recursos computacionales para estructurar un Grid de alcance nacional. Una vez creados los convenios entre universidades y grupos de investigación, se creó una versión preliminar (piloto) para desplegar entre las universidades usando los enlaces de Reuna. De esta forma, una vez interconectadas las universidades y lista la infraestructura se comenzó a abordar problemas de ciencia de las universidades participantes dando lugar a una comunidad científica con temas científicos en común. Uno de los logros más importantes de CLCGRID es haber logrado canalizar el aprovechamiento de esta infraestructura en temas de interés nacional: vacunas para los salmones, mejoramiento genético de cepas de viñedos, análisis geotécnicos de las minas de carbón son algunos de los ejemplos en donde la disponibilidad de un grid ha posibilitados avances muy importantes (www.clgrid.cl).

GRID COLOMBIA La iniciativa Grid Colombia ha logrado generar la articulación y compromiso de varias universidades con un fin común: la conformación del grid nacional. Para alcanzar esta meta se generó una organización con las siguientes características: •

• •



Visión: lograr que en un año Grid Colombia se constituya en la primera alternativa en computación distribuida en el país, que en dos años todas las universidades conectadas a RENATA que estén desarrollando proyectos de computación distribuida hagan parte de Grid Colombia y que en cuatro años Grid Colombia sea visible, reconocida y certificada como una alternativa de Grid a nivel internacional. Objetivo general: constituir un Grid de escala nacional en Colombia que reúna clusters y Grids de universidades e instituciones de investigación, haciendo uso de las redes de tecnología avanzada Objetivos específicos: fomentar el uso de mallas computacionales como herramientas para solucionar problemas que necesiten alto nivel de cómputo; ofrecer servicios de grilla y participar en proyectos a nivel nacional e internacional; promover la colaboración de grupos de interés, estudiantes y docentes; desarrollar aplicaciones de alta carga computacional para resolver problemas de alto impacto para el país. Membresía: pueden ser actores de Grid Colombia los grupos y centros de investigación, no sólo los que se centran en las áreas de la computación de alto desempeño sino también los que requieran usar este

________________________________________________________________________________________ e-colabora “Revista de ciencia, educación, innovación y cultura apoyadas por Redes de Tecnología Avanzada” http://publicaciones.renata.edu.co

Volumen 1 N. 1 Enero – Junio 2011 ISSN: 2027 - 7415 Pág. 53 ___________________________________________________________________________________________________

tipo de tecnología; también se espera poder contar con la participación de entidades gubernamentales como RENATA y Colciencias y asociaciones como ACOFI. Los miembros deben estar en disposición de aportar recursos para la conformación del grid nacional. Con el fin de coordinar y aunar las contribuciones y esfuerzos de la comunidad Grid Colombia se ha planteado una organización en cuatro frentes de trabajo: •







Frente de infraestructura: encargado de preparar, diseñar, implementar y configurar un Grid de Cómputo Nacional que permita agrupar recursos computacionales de las instituciones participantes en el proyecto. La interconexión de los nodos se realizará a través de la Red Nacional de Tecnología Avanzada RENATA. Frente de formación y capacitación: propende por el desarrollo de la formación de estudiantes, docentes y especialistas en computación de alto desempeño, además por la integración de un servicio de cómputo avanzado interdisciplinario en Grid Colombia. Esta formación incluye capacitación en las tecnologías de clusters y grillas, programación concurrente y paralela, y desarrollo de aplicaciones. Frente de promoción y divulgación: el objetivo es plantear y realizar estrategias de promoción y divulgación del proyecto Grid Colombia para difundir y ampliar el uso de las tecnologías de grilla y obtener un reconocimiento nacional e internacional. Frente de seguridad: su función es proponer y analizar los aspectos concernientes a la seguridad informática para la implantación de una infraestructura de computación en malla a nivel nacional, garantizando el cumplimiento de estándares para esta tecnología.

Actualmente, Grid Colombia se encuentra en proceso de consolidación; en esta etapa se busca desarrollar las siguientes actividades: • • •

• •

Levantar un censo nacional de plataformas de computación intensiva e identificar las aplicaciones de computación en grilla de mayor relevancia en el contexto colombiano. Probar, configurar y evaluar un middleware operativo para la administración de recursos y la programación de trabajos en la primera grilla de alcance nacional. Realizar pruebas sistemáticas de rendimiento y estabilidad de la red apuntando especialmente a la determinación de sus propiedades en relación con los retos que ofrece la computación en grilla en Colombia. Desarrollar las primeras aplicaciones que permita, simular, evaluar y validar la utilidad de la tecnología grid para la solución de problemas científicos y tecnológicos de interés para el país. Establecer relaciones institucionales formales propicias para la colaboración en el establecimiento del grid nacional, generando las bases y recomendaciones para la operación del mismo en el marco de la organización académica Grid Colombia.

________________________________________________________________________________________ e-colabora “Revista de ciencia, educación, innovación y cultura apoyadas por Redes de Tecnología Avanzada” http://publicaciones.renata.edu.co

Volumen 1 N. 1 Enero – Junio 2011 ISSN: 2027 - 7415 Pág. 54 ___________________________________________________________________________________________________

DISCUSIÓN Y CONCLUSIONES Como se mencionó anteriormente, cada frente de trabajo tiene unas metas bien definidas, las cuales se plantea alcanzar a través de proyectos específicos que involucren a los miembros de Grid Colombia. Estos proyectos semilla aportarían desde los diferentes frentes a la formación de la infraestructura y operación del grid nacional. En el mediano plazo se planea llegar hacer que la organización se constituya en un centro de excelencia, generando sus propios recursos a través de la realización de proyectos de gran envergadura e impacto y buscando convertirse en nodo de las grandes redes internacionales. Sin embargo, para poder desarrollar las diferentes iniciativas propuestas se requiere de la voluntad política de la triple Hélice Universidad-Empresa-Estado para poder realizar iniciativas de impacto académico, económico y social en el país. Hasta el momento, se cuenta con apoyos de algunas instituciones participantes, pero no se ha logrado el apoyo requerido del estado. Ante esta situación, la estrategia adoptada es la de trabajar para lograr formar grillas a nivel regional y una incipiente grilla nacional; este logro dará mayor credibilidad a la organización, y gracias a este reconocimiento obtener captación de recursos que permitan la formación de una grilla nacional acorde con los requerimientos del país. Adicionalmente, se ha iniciado un trabajo interdisciplinario de búsqueda e interacción con usuarios potenciales de aplicaciones de alto desempeño; este trabajo conjunto busca atacar problemas concretos de interés en nuestro contexto. Finalmente, la incipiente comunidad Grid Colombia quiere reiterar la invitación a las universidades e instituciones para que se unan a esta iniciativa. La computación de alto desempeño es indispensable para el desarrollo de la ciencia moderna, por fortuna es una tecnología que está a nuestro alcance.

REFERENCIAS nd

Foster, I. & Kesselman, C. (Ed.). (2003). The Grid 2: blueprint for a new computing. (2 . Ed.). Morgan Kaufmann. Martínez, J.C. (2008). Hacia una iniciativa grid nacional en Colombia: infraestructura y aplicaciones. Tesis de Maestría. Departamento de Ingeniería de Sistemas y Computación. Universidad de los Andes. Plaszczak, P. & Wellner. R. Jr. (2006). Grid Computing, The Savvy Manager's Guide. Morgan Kaufmann.

________________________________________________________________________________________ e-colabora “Revista de ciencia, educación, innovación y cultura apoyadas por Redes de Tecnología Avanzada” http://publicaciones.renata.edu.co

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.