Cómo llevar a la Inteligencia Artificial al centro de datos
12 de junio 2019
Por Dr. Bhushan Desam, Director, Global AI Business Lenovo Data Center Group
Cómo llevar a la Inteligencia Artificial al centro de datos

Por Dr. Bhushan Desam, Director, Global AI Business Lenovo Data Center Group

La inteligencia artificial (IA) es un elemento muy presente para muchas empresas por su potencial para ofrecer ventajas significativas, tanto a nivel de ingresos como de beneficios. Las soluciones de IA ayudan a las empresas a tomar decisiones más provechosas al permitirles utilizar sus datos para reducir gastos aumentando la eficiencia de sus procesos; incrementar sus ingresos y ganar en competitividad al acelerar la comercialización de nuevos productos.

De hecho, la IA tiene un gran potencial para influir en nuestras vidas. Estas tecnologías pueden hacer posible una sanidad mejor al reducir los errores humanos en la fase de diagnóstico; nos permiten mejorar nuestro conocimiento sobre las enfermedades y sus tratamientos y nos brindan herramientas con las que acelerar drásticamente el ciclo de descubrimiento de nuevos medicamentos. También pueden utilizarse con otros fines, como mejorar la seguridad personal mediante la identificación de posibles amenazas humanas o naturales antes de que se conviertan en un problema, como puedan ser pronósticos meteorológicos más precisos o sistemas de monitorización del tráfico para vehículos. 

Muchas de las aplicaciones inteligentes que ofrecen estas ventajas revolucionarias para las empresas requieren enormes volúmenes de datos, especialmente utilizando nuevos métodos como el llamado deep learning, que hace posible la IA de hoy en día. Buena parte de estos datos aún se almacena en centros de datos físicos controlados directamente por las organizaciones por razones de seguridad, por adecuación a normativas de privacidad o simplemente por el elevado coste que representa el trasladar tal cantidad de datos. Este tipo de problemas son mucho más patentes en organizaciones de ciertos sectores, como el sanitario, el industrial, el financiero o el de la investigación y desarrollo. Al desarrollar y desplegar aplicaciones de IA en estos ámbitos suele tener más sentido llevar la capacidad de procesamiento a los datos, en lugar de hacerlo a la inversa, que es lo habitual.

Para poder alcanzar el éxito en sus proyectos de IA, las empresas necesitan algo más que un simple proveedor de hardware que cubra sus necesidades en materia de procesamiento. Necesitan un partner que trabaje en estrecha colaboración con ellos y les ayude a reducir las incertidumbres y las complejidades técnicas que traen consigo estas tecnologías emergentes. Por ello, Lenovo ha adoptado un planteamiento único con el que responder a las necesidades de sus clientes mediante varias propuestas que van más allá de las infraestructuras. Lenovo no solo ofrece los talleres Launch: AI Workshops, sino que sus centros globales de innovación AI Innovation Centers ayudan a los clientes a identificar casos de uso en los que la IA pueda ofrecer valor y a ejecutar proyectos piloto ofreciendo información e infraestructuras optimizadas, reduciendo así el riesgo para el negocio y demostrando la viabilidad técnica de la IA.

La siguiente fase al ejecutar proyectos de IA puede traer consigo muchos más retos, especialmente a la hora de obtener las soluciones de hardware y software que necesitan los desarrolladores y analistas de datos, al tiempo que se optimizan los costes totales de propiedad. Actualmente, buena parte del desarrollo de IA mediante deep learning se realiza mediante entornos de desarrollo open source como TensorFlow, Caffe, MxNet, etc., mientras que la experiencia en el ámbito de la informática empresarial suele girar en torno a suites de aplicaciones profesionales de fácil utilización. A esto se añade la complejidad de tener que brindar herramientas a múltiples desarrolladores que empleen diferentes entornos y versiones para realizar una misma tarea. En este contexto, las empresas necesitan contar con herramientas de desarrollo que permitan hacer un uso más eficaz de los recursos open source ya existentes. Nuestra solución  Lenovo intelligent Computing Orchestration (LiCO), acreedora de múltiples galardones, simplifica el desarrollo de soluciones de IA al gestionar más eficientemente los flujos de trabajo característicos de las IA, sus entornos de open source y los recursos de clúster necesarios para el proyecto.

Para muchos administradores informáticos de centros de datos, obtener recursos de infraestructura para IA suele ser un equilibrio complejo, ya que hay que satisfacer múltiples requisitos. Entre ellos está cubrir las necesidades en materia de rendimiento de los analistas de datos, ingenieros de IA e ingenieros de software, al tiempo que se optimizan los costes totales de propiedad. Ciertamente un equilibrio complicado de alcanzar. Una solución óptima ofrecería el rendimiento de un sistema específicamente diseñado para el proyecto, manteniendo al mismo tiempo la flexibilidad para ejecutar múltiples tareas, ya sean de IA o de otro tipo. Con estas necesidades en mente, Lenovo ha diseñado su ThinkSystem SR670 pensando principalmente en cargas de trabajo de IA que no solo requieran gran escalabilidad, sino la flexibilidad para abordar tareas de procesamiento de alto rendimiento (HPC) tradicionales, de infraestructura de escritorios virtualizados (VDI), de procesamiento de vídeo, etc. Además, este sistema permite ampliar la escala del proyecto, pasando de un par de nodos en las fases de experimentación a despliegues a gran escala para entornos de aprendizaje distribuidos, con los que LiCO también es compatible.

Los ThinkSystem SR670 se ofrecen en dos modelos, cada uno pensado para diferentes cargas de trabajo de IA para centros de datos y compatible con las GPU de núcleos tensores NVIDIA T4 o NVIDIA V100. Los nuevos modelos ThinkSystem SR670 (que Lenovo ha anunciado recientemente en el evento NVIDIA GTC’19) permiten integrar hasta ocho GPU del modelo T4 en un espacio de rack de 2U. Gracias a su calificación NVIDIA NGC-Ready, los servidores equipados con GPU T4 ofrecen un rendimiento excepcional en todo tipo de cargas aceleradas por hardware, como el machine learning, el deep learning, la virtualización de escritorios y el procesamiento de alto rendimiento (HPC). Y al ofrecer un consumo de tan solo 70 watios por unidad, las GPU T4 aliviarán las necesidades en materia de consumo eléctrico y refrigeración, lo que facilita su despliegue a gran escala en centros de datos ya existentes.

Para quienes busquen abordar cargas de trabajo exclusivamente centradas en el aprendizaje de IA mediante deep learning o tareas HPC, los SR670 permiten integrar hasta cuatro GPU NVIDIA V100, lo que resulta en una potencia de procesamiento de 448 teraFLOPS para tareas de deep learning o de 28 teraFLOPS en tareas de doble precisión. Además, sus 32 GB de memoria integrada HBM2 son idóneos para el desarrollo de redes neurales de gran escala y para modelos HPC que se procesen en memoria. La configuración de los ThinkSystem SR670, en la que CPU y GPU se comunican mediante canales PCIe dedicados, representa la opción idónea para que los departamentos informáticos cuenten el mejor rendimiento del mercado para este tipo de cargas de trabajo.

Gracias a los SR670 y LiCO, los administradores informáticos serán capaces de dar con un equilibrio satisfactorio entre las necesidades de rendimiento y los costes totales de propiedad, ya que estarán configurando su infraestructura para obtener un mayor retorno a la inversión realizada. Ha llegado el momento de llevar a la IA al centro de datos y así crear aplicaciones inteligentes listas para la producción.