Apertus, « ouvert » en latin, est un nouveau modèle de langage (LLM) développé par trois institutions publiques suisses. Le Centre national suisse de calcul scientifique (CSCS), l’École polytechnique fédérale de Lausanne (EPFL) et l’École polytechnique fédérale de Zurich (ETH) se sont penché sur le berceau de ce LLM complètement ouvert.
L’IA comme infrastructure publique
Les données d’entraînement, la méthodologie, les paramètres et l’architecture d’Apertus sont ainsi documentés et librement accessibles, contrairement à la majorité des autres modèles. Apertus a été entraîné sur 15 000 milliards de mots ou de parties de mots (tokens) issus de plus de 1 000 langues. 40 % de ses sources, toutes publiques, est non anglophone — on y trouve des langues habituellement peu représentées comme le romanche ou le suisse allemand.
Le modèle peut être utilisé par des chercheurs en IA, des professionnels, des entreprises, et même des particuliers, le tout gratuitement sur Hugging Face. Deux versions sont proposées : 8 milliards et 70 milliards de paramètres, le plus petit étant plus adapté à une utilisation individuelle.
Le LLM étant sous licence Apache 2.0, il est possible de s’en servir aussi bien pour la recherche et l’enseignement, que dans pour des applications commerciales. « Avec cette publication, nous voulons offrir un modèle de référence pour le développement d’une IA de confiance, souveraine et inclusive », déclare Martin Jaggi, professeur en apprentissage automatique à l’EPFL. Apertus sera mis à jour régulièrement, même s’il n’a pas vocation à rivaliser avec le flot incessant de nouveautés des modèles commerciaux à la GPT-5.
Les prochaines versions étendront la famille de modèles et à améliorer leur efficacité. Un des objectifs est aussi de développer des variantes spécifiques pour certains domaines d’activité comme le droit, la santé ou l’éducation.
Un des avantages de ce LLM pour les entreprises et les organisations qui voudront l’exploiter est qu’il prend en compte les lois suisses sur la protection des données, des droits d’auteur, ainsi que des obligations de transparence du règlement européen sur l’IA (l’AI Act). Pour la Public AI Inference Utility, une initiative qui veut faciliter l’accès public à des modèles IA, Apertus est « le modèle d’IA publique de référence: un modèle construit par des institutions publiques, pour l’intérêt général. C’est la meilleure preuve à ce jour qu’une IA peut devenir une véritable infrastructure publique, au même titre que les routes, l’eau ou l’électricité ».
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.
Source : Apertus