Les institutions de recherche en Suisse s'associent pour relever le défi du « black box » des grands modèles linguistiques. Le École polytechnique fédérale de Lausanne (EPFL), l'École polytechnique fédérale de Zurich (ETH Zurich) et le Centre suisse de calcul scientifique (CSCS) ont récemment lancé un grand modèle linguistique open source nommé Apertus. Ce modèle ne se distingue pas seulement par son nom, qui signifie « ouvert » en latin, mais aussi par sa transparence totale dans la pratique.

Robot AI Intelligence artificielle (3) interface cerveau-machine

Au contraire des modèles américains tels que les séries GPT d'OpenAI, Llama de Meta ou Claude d'Anthropic, Apertus se distingue par une transparence sans précédent. Il met à disposition publiquement toutes les informations clés, allant des poids du modèle, de l'architecture, du code d'entraînement, de la recette des données, jusqu'aux documents complets sur le processus d'entraînement, sans aucune réserve. Cette approche totalement transparente vise à favoriser la collaboration et l'innovation à l'échelle mondiale, permettant aux chercheurs et développeurs de comprendre en profondeur le fonctionnement du modèle et d'améliorer et optimiser ce dernier.