Argumentando la informática descentralizada en la IA

The case for decentralized compute in AI

La siguiente es una publicación invitada de Jiahao Sun: CEO y fundador de FLock.io.

En el panorama siempre cambiante de la inteligencia artificial (IA), el debate entre informática centralizada y descentralizada se está intensificando. Los proveedores centralizados como Amazon Web Services (AWS) dominan el mercado y ofrecen soluciones sólidas y escalables para entrenar e implementar modelos de IA. Sin embargo, la informática descentralizada está surgiendo como un competidor formidable, que presenta beneficios y desafíos únicos que podrían redefinir cómo se entrenan e implementan los modelos de IA a escala global.

Rentabilidad gracias a los recursos no utilizados

Una de las principales ventajas de la informática descentralizada en el campo de la IA es la rentabilidad. Los proveedores centralizados están invirtiendo mucho en infraestructura y manteniendo grandes centros de datos con GPU dedicadas a cálculos de IA. Este modelo, aunque potente, es caro. La informática descentralizada, por otro lado, aprovecha las GPU «no utilizadas» de diversas fuentes en todo el mundo.

Podrían ser computadoras personales, servidores no utilizados o incluso consolas de juegos. Al aprovechar este conjunto de recursos subutilizados, las plataformas descentralizadas pueden ofrecer potencia informática a una fracción del costo de los proveedores centralizados. Esta democratización de los recursos informáticos hace que el desarrollo de la IA sea más accesible para las pequeñas empresas y las nuevas empresas, fomentando así la innovación y la competencia en el espacio de la IA.

Accesibilidad de GPU mejorada

La escasez mundial de GPU ha reducido significativamente la capacidad de las pequeñas empresas para obtener la potencia informática necesaria de proveedores centralizados. Las grandes empresas suelen celebrar contratos a largo plazo, monopolizando el acceso a estos recursos esenciales.

Las redes informáticas descentralizadas alivian este problema al obtener GPU de una amplia gama de contribuyentes, incluidos jugadores de PC individuales y proveedores de pequeña escala. Esta mayor accesibilidad garantiza que incluso las entidades pequeñas puedan obtener la potencia informática que necesitan sin verse eclipsadas por los gigantes de la industria.

Privacidad de datos y control de usuarios

La privacidad de los datos sigue siendo una preocupación importante en el desarrollo de la IA. Los sistemas centralizados requieren que los datos se transfieran y almacenen dentro de sus infraestructuras, lo que deja al usuario fuera de control. Esta centralización presenta riesgos importantes en términos de confidencialidad. La informática descentralizada ofrece una alternativa interesante al mantener los cálculos cerca del usuario. Esto se puede lograr mediante el aprendizaje federado, donde los datos permanecen en el dispositivo del usuario, o mediante el uso de proveedores informáticos descentralizados seguros.

Private Cloud Compute de Apple ejemplifica este enfoque al integrar múltiples nodos de computación de iCloud alrededor de un usuario específico, preservando así la privacidad de los datos y aprovechando al mismo tiempo la potencia informática de la nube. Si bien este método todavía implica cierto grado de centralización, destaca un movimiento hacia un mayor control del usuario sobre los datos.

Protocolos de verificación y seguridad

A pesar de sus ventajas, la informática descentralizada enfrenta varios desafíos. Una de las cuestiones cruciales es verificar la integridad y seguridad de los nodos informáticos descentralizados. Garantizar que estos nodos no se vean comprometidos y que proporcionen potencia informática real es un problema complejo.

Los avances en la tecnología blockchain ofrecen soluciones potenciales, permitiendo mecanismos de autoverificación que verifican la legitimidad de los nodos informáticos sin comprometer la seguridad.

Preservar la privacidad de los datos en sistemas descentralizados

Otro desafío importante es la posible exposición de datos personales durante los cálculos descentralizados. Los modelos de IA se basan en grandes conjuntos de datos, pero sin tecnologías que preserven la privacidad, la capacitación descentralizada podría provocar violaciones de datos. Técnicas como el aprendizaje federado, las pruebas de conocimiento cero y el cifrado totalmente homomórfico pueden mitigar estos riesgos.

El aprendizaje federado, ampliamente adoptado por las grandes empresas desde 2017, permite que los datos sigan siendo locales y al mismo tiempo contribuye a la formación del modelo. Al integrar estas tecnologías de cifrado y preservación de la privacidad en redes informáticas descentralizadas, podemos mejorar la seguridad de los datos y la privacidad del usuario, ampliando los límites de lo que la IA descentralizada puede lograr.

Problemas de ancho de banda y eficiencia

La eficiencia de las redes informáticas descentralizadas es otra área de preocupación. La eficiencia de transmisión en un sistema descentralizado será inevitablemente menor que en los clústeres centralizados debido a la naturaleza distribuida de la red. Anécdotas históricas, como el traslado de datos de AWS de Toronto a Vancouver durante una tormenta de nieve, resaltan los desafíos logísticos de la transmisión de datos.

Sin embargo, los avances en las técnicas de IA, como el ajuste fino de LoRA y la compresión de modelos, pueden ayudar a aliviar estos cuellos de botella en el ancho de banda. Al optimizar los procesos de transferencia de datos y perfeccionar las técnicas de capacitación de modelos, las redes informáticas descentralizadas pueden alcanzar niveles de rendimiento competitivos con sus contrapartes centralizadas.

Cerrar la brecha con las tecnologías emergentes

La integración de la tecnología blockchain con la IA ofrece un camino prometedor para abordar muchos de los desafíos que enfrenta la informática descentralizada. Blockchain proporciona un libro de contabilidad transparente e inmutable para rastrear la procedencia de los datos y la integridad de los nodos informáticos. Esto garantiza que todos los participantes de la red puedan confiar en los datos y cálculos realizados.

Además, los mecanismos de consenso de blockchain pueden facilitar la gobernanza descentralizada, permitiendo a las comunidades gestionar y mejorar colectivamente la red.

Además, los avances en el aprendizaje federado y el cifrado homomórfico son fundamentales para garantizar la privacidad de los datos y al mismo tiempo explotar la naturaleza distribuida de las redes informáticas descentralizadas. Estas tecnologías permiten que los modelos de IA aprendan de conjuntos de datos distribuidos sin exponer información confidencial, equilibrando la necesidad de grandes cantidades de datos con estrictos requisitos de privacidad.

El futuro de la informática descentralizada en IA

El potencial de las redes informáticas descentralizadas para revolucionar el desarrollo de la IA es inmenso. Al democratizar el acceso a los recursos informáticos, mejorar la privacidad de los datos y aprovechar las tecnologías emergentes, la IA descentralizada puede ofrecer una alternativa sólida a los sistemas centralizados. Sin embargo, el camino está plagado de desafíos que requieren soluciones innovadoras y esfuerzos de colaboración por parte de las comunidades de IA y blockchain.

A medida que avanzamos, debemos continuar explorando y desarrollando soluciones informáticas descentralizadas que aborden estos desafíos. Al fomentar un ecosistema colaborativo, podemos garantizar que los beneficios de la IA sean accesibles para todos, fomentando un futuro más equitativo e innovador para el desarrollo de la IA.