En Microsoft, diseñamos, construimos y operamos una infraestructura de computación en la nube que abarca toda la pila, desde centros de datos hasta servidores y silicio personalizado. Esto crea oportunidades únicas para orquestar cómo funcionan los elementos juntos para mejorar tanto el rendimiento como la eficiencia. Consideramos que el trabajo para optimizar la energía y la eficiencia energética es un camino crítico para cumplir nuestra promesa de ser carbono negativo para 2030, junto con nuestro trabajo para avanzar en la electricidad libre de carbono y la eliminación de carbono.
El rápido crecimiento de la demanda de innovación en IA para impulsar las próximas fronteras del descubrimiento nos ha brindado la oportunidad de rediseñar nuestros sistemas de infraestructura, desde los centros de datos hasta los servidores y el silicio, con la eficiencia y la sostenibilidad a la vanguardia. Además de abastecernos de electricidad libre de carbono, innovamos en todos los niveles de la pila para reducir la intensidad energética y los requisitos de energía de las cargas de trabajo en la nube y de IA. Incluso antes de que los electrones ingresen a nuestros centros de datos, nuestros equipos se centran en cómo podemos maximizar la potencia de cómputo que podemos generar a partir de cada kilovatio-hora (kWh) de energía eléctrica.
En este blog, me gustaría compartir algunos ejemplos de cómo avanzamos en el poder y la eficiencia energética de la IA. Esto incluye un enfoque de sistemas completos para la eficiencia y la aplicación de la IA, en específico el aprendizaje automático, a la gestión de las cargas de trabajo en la nube y la IA. Obtengan más información sobre cómo llevamos la investigación de eficiencia del laboratorio a las operaciones comerciales en Sostenible por diseño: innovación para la eficiencia energética en IA, parte 2.
Impulsar la eficiencia de los centros de datos a los servidores y al silicio
Maximización de la utilización del hardware a través de la gestión inteligente de la carga de trabajo
Fiel a nuestras raíces como empresa de software, una de las formas en que impulsamos la eficiencia energética dentro de nuestros centros de datos es a través de software que permite la programación de cargas de trabajo en tiempo real, de modo que podamos maximizar la utilización del hardware existente para satisfacer la demanda de servicios en la nube. Por ejemplo, podríamos ver una mayor demanda cuando las personas comienzan su jornada laboral en una parte del mundo, y una menor demanda en todo el mundo donde otras se relajan por la noche. En muchos casos, podemos alinear la disponibilidad para las necesidades de recursos internos, como la ejecución de cargas de trabajo de entrenamiento de IA durante las horas de menor actividad, a través de la utilización del hardware existente que, de otro modo, estaría inactivo durante ese período de tiempo. Esto también nos ayuda a mejorar la utilización de la energía.
«Utilizamos el poder del software para impulsar la eficiencia energética en todos los niveles de la pila de infraestructura, desde centros de datos hasta servidores y silicio.»
A nivel histórico, en todo el sector, la ejecución de cargas de trabajo de IA y computación en la nube se ha basado en la asignación de unidades centrales de procesamiento (CPU, por sus siglas en inglés), unidades de procesamiento gráfico (GPU, por sus siglas en inglés) y potencia de procesamiento a cada equipo o carga de trabajo, lo que ofrece una tasa de utilización de CPU y GPU de alrededor del 50% al 60%. Esto deja a algunas CPU y GPU con capacidad infrautilizada, capacidad potencial que, de manera ideal, podría aprovecharse para otras cargas de trabajo. Para abordar el desafío de la utilización y mejorar la administración de la carga de trabajo, hemos realizado la transición de las cargas de trabajo de entrenamiento de IA de Microsoft a un único grupo administrado por una tecnología de aprendizaje automático llamada Project Forge.