Les chercheurs se tournent vers l’œil humain pour améliorer l’efficacité de la vision par ordinateur
L’architecture conventionnelle du silicium a fait progresser la vision par ordinateur, mais les chercheurs de l’Université Purdue développent une voie alternative, en s’inspirant de la nature, qui, selon eux, constitue le fondement d’une rétine artificielle. Comme notre propre système visuel, l’appareil est conçu pour détecter le changement, ce qui le rend en principe plus efficace que les systèmes de caméras numériques exigeants en termes de calcul utilisés dans des applications telles que les voitures autonomes et les robots autonomes.
“Les systèmes de vision par ordinateur consomment énormément d’énergie, ce qui constitue un goulot d’étranglement pour leur utilisation à grande échelle. Notre objectif à long terme est d’utiliser le biomimétisme pour relever le défi de l’imagerie dynamique avec moins de traitement des données”, a déclaré Jianguo Mei, directeur de Richard et Judith. Professeur de chimie à Vienne au Purdue’s College of Science. “En imitant notre rétine en termes de perception de la lumière, notre système peut potentiellement être beaucoup moins gourmand en données, même s’il reste encore beaucoup de chemin à parcourir pour intégrer le matériel et les logiciels afin que cela devienne une réalité.”
Mei et son équipe se sont inspirés de la perception de la lumière dans les cellules rétiniennes. Comme dans la nature, la lumière déclenche une réaction électrochimique dans le prototype qu’ils ont construit. La réaction se renforce régulièrement et progressivement avec une exposition répétée à la lumière et se dissipe lentement lorsque la lumière est retirée, créant ainsi ce qui est effectivement une mémoire des informations lumineuses reçues par l’appareil.
Cette mémoire pourrait potentiellement être utilisée pour réduire la quantité de données à traiter pour comprendre une scène en mouvement, une approche plus efficace sur le plan énergétique et plus tolérante aux erreurs que la vision par ordinateur conventionnelle.
L’équipe appelle leur dispositif une synapse photonique électrochimique organique et affirme qu’il imite plus fidèlement le fonctionnement du système visuel humain et qu’il a un plus grand potentiel en tant que fondement d’un dispositif pour les interfaces homme-machine. Cette conception pourrait également être utile pour les applications informatiques neuromorphiques qui fonctionnent sur des principes similaires à l’architecture du cerveau humain, a déclaré Ke Chen, étudiant diplômé du laboratoire de Mei et auteur principal d’une étude. Photonique naturelle article qui a testé l’appareil sur la reconnaissance faciale.
“Dans un système de vision par ordinateur normal, vous créez un signal, puis vous devez transférer les données de la mémoire au traitement, puis de nouveau à la mémoire ; cela prend beaucoup de temps et d’énergie pour le faire”, a déclaré Chen. “Notre appareil intègre des fonctions de perception de la lumière, de transformation du signal lumière-électrique, ainsi que de mémoire et de traitement des données sur site.”
Actuellement, les appareils robotiques ou autonomes s’appuient sur l’appareil photo numérique familier comme fondement de la vision par ordinateur. À l’intérieur de la caméra, des zones de silicium cristallin sensibles à la lumière, appelées photosites, absorbent des photons et libèrent des électrons, convertissant la lumière en un signal électrique pouvant être traité par des programmes informatiques de reconnaissance d’images de plus en plus sophistiqués. Un appareil photo de smartphone typique utilise plus de 10 millions de photosites, chacun ne faisant que quelques microns (un millionième de mètre) carré, capturant des images avec une résolution bien supérieure à celle que nos propres yeux peuvent faire.
Mais toutes ces données (qui doivent analyser toutes les informations lumineuses disponibles, que la scène change ou non) ne sont pas nécessaires pour la plupart des tâches qui utilisent la vision par ordinateur.
En revanche, la solution de Mei, comme la vision humaine, a une résolution relativement faible mais est bien adaptée à la détection de mouvement. Les yeux humains ont une résolution de l’ordre de 15 microns. Le prototype, qui abrite 18 000 transistors sur une puce carrée de 10 centimètres, a une résolution de quelques centaines de microns, et Mei a déclaré que la technologie pourrait être améliorée en abaissant la résolution à environ 10 microns.
“Notre œil et notre cerveau n’ont pas une résolution aussi élevée que celle de l’informatique sur silicium, mais la façon dont nous traitons les données rend notre œil meilleur que la plupart des systèmes d’imagerie dont nous disposons actuellement lorsqu’il s’agit de traiter les données”, a déclaré Mei. “Les systèmes de vision par ordinateur traitent une énorme quantité de données car l’appareil photo numérique ne fait pas de différence entre ce qui est statique et ce qui est dynamique ; il capture simplement tout.”
Plutôt que de passer directement de la lumière à un signal électrique, Mei et son équipe convertissent d’abord la lumière en un flux d’atomes chargés appelés ions, un mécanisme similaire à celui utilisé par les cellules rétiniennes pour transmettre la lumière au cerveau. Pour ce faire, ils utilisent un petit carré de polymère photosensible incorporé dans un gel électrolytique. La lumière frappant le point du carré de polymère attire les ions chargés positivement dans le gel vers le point (et repousse les ions chargés négativement), créant un déséquilibre de charge dans le gel.
Une exposition répétée à la lumière augmente le déséquilibre de charge dans le gel, une caractéristique qui peut être utilisée pour différencier la lumière constante d’une scène statique et la lumière dynamique d’une scène changeante. Lorsque la lumière est supprimée, les ions restent dans leur configuration chargée pendant une courte période dans ce qui peut être considéré comme une mémoire temporaire de la lumière, revenant progressivement à une configuration neutre.
Le point chargé positivement sert de grille sur un transistor, permettant à un petit courant électrique de circuler entre une source et un drain en présence de lumière. Tout comme le photodétecteur conventionnel, le courant électrique indique l’intensité lumineuse et la longueur d’onde et est transmis à un ordinateur pour la reconnaissance d’images. Mais même si la sortie d’un courant électrique est la même, c’est l’étape intermédiaire de conversion de la lumière en signal électrochimique qui crée des capacités de détection de mouvement et de mémoire.
Le transistor électrochimique de Mei fait partie d’une classe émergente de dispositifs optoélectroniques qui cherchent à intégrer la perception de la lumière et la mémoire, mais les performances de leur dispositif sont supérieures dans la mesure où le déséquilibre de charge augmente par incréments réguliers et réguliers avec une exposition répétée à la lumière et décroît plus lentement que conceptions concurrentes. Avec des plans pour que les futures itérations soient réalisées dans un matériau flexible, ils pourraient également être en mesure de produire une version portable et même biocompatible.
Plus d’information:
Ke Chen et al, Synapse optoélectronique organique basée sur le dopage électrochimique modulé par photons, Photonique naturelle (2023). DOI : 10.1038/s41566-023-01232-x
Fourni par l’Université Purdue
Citation: Des chercheurs se tournent vers l’œil humain pour améliorer l’efficacité de la vision par ordinateur (29 novembre 2023) récupéré le 29 novembre 2023 sur
Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.