Depuis les fondements posés par Ada Lovelace et Charles Babbage jusqu'aux recherches informatiques révolutionnaires d'Alan Turing, le monde a été captivé par la promesse de l'IA - le rêve de créer des entités basées sur des machines et dotées de capacités cognitives semblables à celles de l'homme.
Cependant, la trajectoire du développement de l'IA s'est ensuite détournée de ses racines biologiques en faveur de la puissance de calcul brute et de la complexité algorithmique.
Ainsi, les rêves de robots réalistes inspirés de la science-fiction se sont quelque peu estompés pour laisser place à une réalité plus superficiellement banale, celle des grands modèles de langage (LLM) tels que ChatGPT.
Certes, les modèles d'IA actuels restent captivants, mais ils agissent comme un outil plutôt que comme un être.
Il est encore tôt, mais malgré des progrès phénoménaux, la course à l'armement informatique de l'IA a révélé des lacunes dans notre quête de machines véritablement intelligentes.
Quelle que soit la puissance de nos algorithmes, ils manquent d'élégance, d'adaptabilité et d'efficacité énergétique, qui sont les caractéristiques des systèmes biologiques.
Les chercheurs le savent - et cela les frustre.
Le professeur Tony Prescott et le docteur Stuart Wilson de l'université de Sheffield, récemment mis en évidence que la plupart des modèles d'IA, comme ChatGPT, sont "désincarnés", c'est-à-dire qu'ils n'ont pas de lien direct avec l'environnement physique.
En revanche, le cerveau humain a évolué au sein d'un système physique - notre corps - qui nous permet de percevoir directement le monde et d'interagir avec lui.
Les chercheurs sont impatients de libérer les IA de leur architecture monolithique, ce qui a conduit à une résurgence de l'IA bio-inspirée, parfois appelée IA neuromorphique, une sous-discipline qui cherche à émuler les processus complexes présents dans la nature pour créer des systèmes plus intelligents et plus efficaces.
Ces efforts s'appuient sur différents cadres biologiques, depuis les structures qui constituent notre cerveau jusqu'à l'intelligence en essaim observée chez les fourmis ou les oiseaux.
Dans sa quête d'autonomie et d'efficacité, l'IA bio-inspirée nous oblige à examiner des problèmes de calcul de longue date, tels que l'abandon des architectures lourdes en ressources construites à partir de milliers de GPU gourmands en énergie au profit de systèmes analogiques plus légers et plus complexes.
Prescott, qui a co-rédigé un article récent intitulé "Comprendre l'architecture fonctionnelle du cerveau grâce à la robotiqueIl est beaucoup plus probable que les systèmes d'IA développent une cognition de type humain s'ils sont construits avec des architectures qui apprennent et s'améliorent de la même manière que le cerveau humain, en utilisant ses connexions avec le monde réel.
Le cerveau humain en est un bon exemple : chaque pensée et chaque action qu'il évoque ne nécessite que la puissance d'une faible ampoule électrique, soit environ 20 watts.
Et cela ne s'arrête pas là. Même lorsque l'homme ne reçoit aucune énergie extérieure provenant de la nourriture, il peut survivre pendant plus d'un mois. Les extrêmophiles ont trouvé des méthodes pour prospérer dans certains des environnements les plus inhospitaliers de la planète.
Comparez cela à l'infrastructure nécessaire pour alimenter des modèles d'IA tels que ChatGPT, qui nécessite une puissance équivalente à celle d'une petite ville et ne peut pas se reproduire, guérir ou s'adapter à son environnement.
Pour que l'IA soit entendue équitablement, on peut dire que la comparaison entre l'IA et les systèmes biologiquement intelligents est un exercice erroné.
Après tout, les ordinateurs et les cerveaux excellent tout simplement dans des tâches différentes - c'est peut-être la nature humaine que de les fusionner dans des visions anthropomorphiques d'IA autonomes qui interagissent avec l'environnement comme les êtres biologiques à côté desquels nous avons évolué.
Cependant, les chercheurs en IA et les neuroscientifiques sont prêts à tomber dans cette impasse intellectuelle, et beaucoup décrivent le cerveau "comme un ordinateur" qui peut être modélisé et reproduit artificiellement.
Les Projet européen sur le cerveau humain (HBP)une expérience multinationale de Big Science d'une valeur de près de $1 milliard d'euros, a montré comment la complexité du cerveau échappe à la modélisation artificielle.
Le HBP avait pour objectif de modéliser le cerveau humain dans son intégralité, mais n'a réussi qu'à modéliser des bribes de sa fonctionnalité.
Notre cerveau - en tant qu'entité unique - a vaincu le cerveau collectif de milliers de chercheurs disposant d'un financement important et d'une grande puissance de calcul à portée de main - l'appeler justice poétique.
Il se trouve que la conscience et l'essence de la formation de la pensée constituent une frontière tout aussi lointaine dans les profondeurs de l'espace - wNous n'en sommes pas encore là.
La déconnexion entre la biologie et les machines est au cœur de cette question.
Si les réseaux neuronaux et d'autres formes d'architecture d'apprentissage automatique sont modélisés par analogie avec les cerveaux biologiques, la méthode de calcul est fondamentalement différente.
Rodney Brooks, professeur émérite de robotique au MIT, a réfléchi à cette impasse, déclarantIl est à craindre que sa version du calcul, basée sur des fonctions d'entiers, soit limitée. Les systèmes biologiques sont clairement différents. Ils doivent répondre à des stimuli variés sur de longues périodes ; ces réponses modifient à leur tour leur environnement et les stimuli ultérieurs. Les comportements individuels des insectes sociaux, par exemple, sont influencés par la structure de la maison qu'ils construisent et par le comportement de leurs frères et sœurs à l'intérieur de celle-ci".
Brooks résume ce paradoxe en posant la question suivante : "Ces machines devraient-elles être modélisées sur le cerveau, étant donné que nos modèles du cerveau sont réalisés sur de telles machines ?
Le parcours de l'IA bio-inspirée
La nature a eu des millions d'années de "R&D" pour perfectionner ses mécanismes incroyablement résistants.
La tendance à l'IA bio-inspirée peut être considérée comme une correction de trajectoire, une humble reconnaissance du fait que notre quête d'une IA avancée nous a peut-être conduits sur une voie qui, bien que toujours éblouissante par sa complexité, n'est peut-être pas viable à long terme.
Ou du moins, la trajectoire actuelle pourrait ne pas répondre à ce que l'humanité attend en fin de compte de l'IA. Si nous voulons vivre dans un "futur" où les humains et les robots marchent côte à côte (même si, bien sûr, tout le monde ne le souhaite pas), nous devons faire mieux que d'accumuler plus de GPU et d'entraîner des modèles plus grands.
Cela dit, il y a de l'espoir pour les futuristes les plus ardents d'entre nous, car les chercheurs ont réfléchi à l'informatique bio-inspirée pendant des décennies, et certaines idées spéculatives commencent à trouver leur place.
À la fin des années 50 et au début des années 60, les travaux de Frank Rosenblatt sur les Perceptron a proposé le premier modèle simplifié de neurone biologique.
Cependant, l'article de 1986 "Apprentissage des représentations par rétropropagation des erreurs"Les travaux de David Rumelhart, Geoffrey Hinton et Ronald Williams ont changé la donne.
Souvent considérés comme le "parrain des réseaux neuronaux (ou de l'IA en général)", Hinton et son équipe ont introduit l'algorithme de rétropropagation, qui fournit un mécanisme robuste pour l'entraînement des réseaux neuronaux multicouches, ce qui a propulsé le domaine dans des applications allant du traitement du langage naturel (NLP) à la vision par ordinateur (CV) - deux branches fondamentales de l'IA moderne.
Peu après, la bio-inspiration a pris un chemin différent, empruntant les principes darwiniens. Le livre de John Holland "Adaptation dans les systèmes naturels et artificiels"a jeté les bases des algorithmes génétiques.
En simulant des mécanismes tels que la mutation et la sélection naturelle, cette approche a débloqué un outil puissant pour les problèmes d'optimisation, utilisé dans des secteurs tels que l'aérospatiale et la finance.
Des concepts tels que l'"intelligence en essaim", observée dans les essaims d'insectes et les mouvements synchronisés des oiseaux et des poissons, ont été introduits pour la première fois dans l'informatique dans les années 80 et 90 et ont connu des avancées notables en 2023.
En août 2023, d'anciens employés de Google a fondé Sakanaune startup qui propose de développer un ensemble de petits modèles d'IA fonctionnant de concert.
L'approche de Sakana s'inspire des systèmes biologiques tels que les bancs de poissons ou les réseaux neuronaux, où de petites unités travaillent ensemble pour atteindre un objectif plus complexe.
Reconnaissant les architectures monolithiques des modèles d'IA modernes tels que ChatGPT, cette approche d'assemblage promet de réduire la consommation d'énergie et d'offrir une adaptabilité et une résilience accrues - des qualités intrinsèques aux organismes biologiques.
Même l'apprentissage par renforcement (RL), une branche de l'apprentissage automatique qui consiste à enseigner aux algorithmes à prendre des décisions en vue d'obtenir une récompense, était largement bio-inspiré.
Le livre fondateur de Richard Sutton et Andrew Barto "Apprentissage par renforcement : Une introduction"Il s'appuie sur de nombreux exemples de la manière dont les animaux apprennent de leur environnement, inspirant des algorithmes capables de s'adapter en fonction des récompenses et des pénalités.
Le livre fait des centaines de comparaisons avec le comportement animal, citant "De toutes les formes d'apprentissage automatique, l'apprentissage par renforcement est celui qui se rapproche le plus du type d'apprentissage que font les humains et les autres animaux".
Vers une IA bio-inspirée
Chez les êtres biologiques complexes comme l'homme et les autres vertébrés, différents composants du système nerveux travaillent de concert pour gérer un large éventail de fonctions.
Le système nerveux central (SNC) sert de centre de contrôle, traitant les informations et orchestrant les réponses.
Le système nerveux périphérique (SNP) agit quant à lui comme un réseau de communication, transmettant des signaux entre le SNC et d'autres parties du corps.
Au sein du SNP se trouve le système nerveux autonome (SNA), qui fonctionne de manière involontaire pour gérer des fonctions vitales telles que le rythme cardiaque et la digestion. Chaque système a des rôles distincts, mais ils sont interconnectés et collaborent de manière transparente pour nous aider à naviguer dans l'environnement.
Les organismes plus simples, comme les insectes, ont un système nerveux plus fin et plus économique, même s'il reste incroyablement complexe. Une mouche à fruits possède quelques 3 000 neurones et un demi-million de synapses.
Les composants du système nerveux biologique sont anatomiquement distincts mais fonctionnent de manière holistique, reliés par des neurones qui envoient et reçoivent des stimuli sensoriels, formant finalement une compréhension conceptuelle - ou conscience chez les êtres plus complexes.
Pour créer des robots autonomes dotés de cerveaux et de systèmes sensoriels étroitement liés, les chercheurs doivent s'éloigner de l'informatique brute et créer des systèmes légers ancrés dans la réalité sensorielle.
Bien que les modèles d'IA comme ChatGPT possèdent d'immenses connaissances, ils sont quelque peu enfermés dans le temps et hors de la réalité sensorielle, leur compréhension étant principalement guidée par leurs données d'entraînement.
Cela confère des avantages, ou plutôt confère à l'IA un ensemble de compétences différent de celui des êtres biologiques - c'est peut-être la raison pour laquelle l'humanité est désireuse de développer l'IA pour pallier les inefficacités de l'existence d'un être biologique.
Comme Amnon Shashua faits marquantsL'architecture très différente de l'ordinateur favorise les stratégies qui utilisent de manière optimale sa capacité de mémoire pratiquement illimitée et la force brute.
Cependant, si nous voulons un jour libérer l'IA des limites des centres de données et des navigateurs web, les chercheurs doivent relever ces défis et trouver des moyens de relier les systèmes d'IA à un "corps", ou au moins de leur fournir un solide ancrage sensoriel.
Cela a des applications pratiques immédiates. Prenons l'exemple des voitures sans conducteur : leurs systèmes sensoriels doivent fonctionner de la même manière que les nôtres pour fonctionner en toute sécurité. Sinon, elles n'ont aucun espoir de "voir" un obstacle potentiel et de réagir rapidement pour éviter un désastre, ce qui s'avère être un obstacle important à leur adoption massive.
Dans le même ordre d'idées, Dennis Bray, du département de physiologie, de développement et de neurosciences de l'université de Cambridge, a déclaré : "Les machines peuvent nous égaler dans de nombreuses tâches, mais elles fonctionnent différemment des réseaux de cellules nerveuses. Si notre objectif est de construire des machines toujours plus intelligentes et adroites, nous devrions utiliser des circuits de cuivre et de silicium. Mais si notre objectif est de reproduire le cerveau humain, avec sa brillance excentrique, sa capacité à effectuer plusieurs tâches à la fois et son sens de l'autonomie, nous devons chercher d'autres matériaux et d'autres conceptions".
Ces commentaires, toujours d'actualité, ont été publiés dans un rapport de la Commission européenne. Article de discussion sur la nature publié en 2012 à l'occasion du centenaire de Turing - et l'IA a évolué rapidement depuis lors.
Où en sommes-nous aujourd'hui ?
Réseaux de neurones à pointes (SNN) et matériel biologique
Aujourd'hui, les chercheurs explorent "d'autres matériaux et des conceptions différentes", comme les réseaux neuronaux à pointes (SNN), un type de réseau neuronal intimement modelé sur la fonctionnalité neuronale.
Les SNN offrent une alternative spécialisée aux réseaux neuronaux conventionnels que nous rencontrons souvent dans l'apprentissage automatique.
Au lieu de s'appuyer sur des fonctions d'activation continues pour traiter les données d'entrée, les SNN imitent les subtilités des réseaux neuronaux biologiques en utilisant des pointes discrètes pour la communication inter-neuronale.
Dans ces réseaux, chaque neurone artificiel intègre au fil du temps les pointes reçues des neurones qui lui sont connectés. Lorsque le signal accumulé, ou potentiel de membrane, dépasse un certain seuil, le neurone lui-même déclenche une pointe.
Ce mécanisme de pointes permet au réseau de saisir et de traiter des modèles spatiaux et temporels, à l'instar des neurones des cerveaux biologiques.
Qu'est-ce qui fait des SNN un point central de l'IA bio-inspirée ?
Tout d'abord, ils se distinguent par leur capacité à traiter naturellement des séquences de données temporelles, ce qui élimine le besoin d'unités de mémoire supplémentaires, comme dans les réseaux neuronaux récurrents (RNN).
Deuxièmement, les SNN ont été conçus pour être incroyablement économes en énergie. Contrairement aux réseaux neuronaux traditionnels où chaque neurone est constamment actif, la nature éparse et événementielle des SNN permet aux neurones de rester principalement inactifs et de ne déclencher des pics que lorsque c'est essentiel. Cela réduit considérablement leur consommation d'énergie.
Enfin, en imitant plus fidèlement les systèmes biologiques, les SNN ont le potentiel d'accroître leur robustesse et leur flexibilité, en particulier dans des environnements bruyants ou imprévisibles.
Bien que le concept de SNN soit issu d'une compréhension théorique des systèmes neuronaux biologiques, les progrès de la technologie matérielle ont rendu ces réseaux plus accessibles pour les tâches informatiques.
Les puces neuromorphiques, spécialement conçues pour simuler efficacement la dynamique des pointes, ont joué un rôle important dans l'utilisation pratique des SNN.
Puce analogique bio-inspirée d'IBM et SNNs
Les deux dernières années ont été marquées par des avancées essentielles dans la construction d'appareils ultra-légers, IA économe en énergie également appelées puces neuromorphiques.
Plusieurs autres types de technologies neuromorphiques sont également disponibles aujourd'hui, comme les caméras neuromorphiques inspirées des yeux biologiques.
Développé en 2023, La puce d'IBM utilise des composants analogiques tels que les memristors pour stocker des valeurs numériques variables. Il utilise également la mémoire à changement de phase (PCM) pour enregistrer un spectre de valeurs plutôt que des 0 et des 1.
Ces attributs permettent de réduire la transmission de données entre la mémoire et le processeur, ce qui constitue un avantage en termes d'efficacité énergétique. La conception d'IBM comporte "64 cœurs de calcul analogiques en mémoire, chacun contenant un réseau synaptique de 256 par 256". Il a atteint une précision impressionnante de 92,81% lors d'un test de référence sur la vision par ordinateur (CV), tout en étant plus de 15 fois plus efficace que plusieurs puces existantes.
Bien que la puce d'IBM ne soit pas explicitement basée sur les SNN, sa nature analogique et l'utilisation de memristors la rendent hautement compatible avec le modèle SNN.
En fait, les SNN pourraient être mis en œuvre plus naturellement sur ce type d'architecture.
Puce basée sur le SNN de l'IIT Bombay
En 2022, des chercheurs de l'Institut indien de technologie de Bombay, Conception d'une puce qui fonctionne spécifiquement avec les SNN.
Cette puce utilise le courant de tunnel de bande à bande (BTBT) pour des neurones artificiels à très faible consommation d'énergie. Selon le professeur Udayan Ganguly, la puce permet d'obtenir "une énergie par pic 5 000 fois plus faible pour une surface similaire et une puissance en veille 10 fois plus faible pour une surface et une énergie par pic similaires".
Ce type de puce a des applications directes dans les appareils compacts tels que les téléphones portables, les véhicules autonomes sans pilote (UAV) et les appareils IoT, répondant ainsi au besoin d'une informatique de l'IA légère et économe en énergie.
Les deux approches visent à permettre à terme ce que M. Ganguly décrit comme "un noyau neurosynaptique à très faible consommation d'énergie et le développement d'un mécanisme d'apprentissage en temps réel sur la puce, qui sont essentiels pour les réseaux neuronaux autonomes inspirés par la biologie. C'est le Saint-Graal.
Ces systèmes pourraient combiner le "système de pensée" et le "système d'action et de mouvement", à l'instar de ce que l'on observe dans les organismes biologiques.
Cela nous permettrait de franchir une étape importante vers la création de systèmes artificiels puissants, durables et étroitement alignés sur les systèmes biologiques qui inspirent l'IA depuis près d'un siècle.
L'humanité pourrait enfin libérer les IA de leur architecture monolithique, les débrancher de leurs sources d'énergie et les envoyer dans le monde - et l'univers - en tant qu'êtres autonomes.
Quant à savoir si c'est une bonne idée ou non, il s'agit là d'une discussion pour une autre fois.