OpenAI serait proche des dernières étapes de la conception de sa première puce IA interne, dans le but de réduire sa dépendance à Nvidia et d’étendre ses centres de données. La société prévoit d’envoyer la conception à Taiwan Semiconductor Manufacturing Co. (TSMC) pour fabrication dans les prochains mois. La production de masse devrait commencer d’ici 2026.
Raisons de développer une puce interne
- Réduire la dépendance à Nvidia : OpenAI cherche à réduire sa dépendance aux GPU de Nvidia, qui sont essentiels pour la formation et le fonctionnement des modèles IA.
- Levier de négociation : La puce interne est considérée comme un outil stratégique pour renforcer le pouvoir de négociation d’OpenAI avec d’autres fournisseurs de puces.
- Efficacité : la puce personnalisée devrait rendre la formation et l’inférence des modèles IA plus efficaces.
Détails techniques et production
- Conception et fabrication de puces : OpenAI finalise sa première conception de puces en interne et prévoit de l’envoyer à TSMC pour la fabrication. Le processus d’envoi d’une conception à une usine de puces est connu sous le nom de “taping out”. TSMC fabriquera la puce en utilisant une technologie avancée de 3 nanomètres.
- Calendrier et production : OpenAI vise à commencer la production de masse chez TSMC d’ici 2026. Le processus de coûte généralement des dizaines de millions de dollars et prend environ six mois pour produire une puce finie.
- Caractéristiques de la puce : La puce comportera une mémoire à bande passante élevée et des capacités de mise en réseau robustes. Elle utilisera une architecture de matrice systolique, similaire aux puces de Nvidia.
- Motivation stratégique : OpenAI considère la puce comme un outil stratégique pour renforcer son levier de négociation avec d’autres fournisseurs de puces. La société prévoit de développer des processeurs de plus en plus avancés à chaque nouvelle itération.
- Équipe et collaboration : L’équipe de conception de puces d’OpenAI est dirigée par Richard Ho, un ancien ingénieur TPU de Google, et compte désormais 40 membres. OpenAI collabore avec Broadcom sur la conception de puces.
- Déploiement initial : La puce IA interne sera initialement déployée à une échelle limitée et principalement pour exécuter des modèles IA.
Déploiement et plans futurs
- Déploiement initial : la puce sera initialement déployée à une échelle limitée, principalement pour exécuter des modèles IA.
- Itérations futures : OpenAI prévoit de développer des processeurs plus avancés avec des capacités plus larges dans les versions futures.
Défis et considérations
- Objectif ambitieux : produire en masse une puce IA interne dans un court laps de temps est un objectif ambitieux et coûteux.
- Risque d’échec : il est possible que la déconnexion initiale échoue, nécessitant des tests de défaillance et la répétition du processus.
- Scepticisme du marché : des questions se sont posées quant à savoir si autant de puces seront nécessaires pour développer des modèles puissants à l’avenir.
lire la suite : OpenAI présente une Deep Research