Le Relief et les 3D

Le relief d’une image peut être montré de multiples façons.

Dans le monde réel nous voyons directement le relief car nos deux yeux captent deux images distinctes et notre cerveau en fait une seule tout en percevant le relief à partir des différences entre ces 2 images perçues …
Lors d’une reproduction d’image(s), montrer le relief sur une surface plate est possible de diverses façons :

Indices de profondeur : sur une image fixe, plate, ordinaire, on peut “comprendre” ou “percevoir” le relief de la scène au moyens de divers indices de profondeur : la perspective (peintures de la renaissance), le flou d’arrière plan (mode “portrait” des téléphones avec le “bokeh” ) , les différences de taille d’objets bien connus etc…
Stéréoscopie : pour reproduire la vision binoculaire du relief, on peut utiliser 2 images prises par deux objectifs espacés comme nos yeux, puis les restituer distinctement à chacun de nos deux yeux ; les 2 images plates forment le couple stéréoscopique.
Le lenticulaire : Une extension de la représentation stéréoscopique consiste à prendre plusieurs images de points de vues régulièrement espacées sur une ligne horizontale ; un dispositif restitue au spectateur un couple d’images parmi les couples possibles, couple qui peut varier quand le spectateur bouge la tête.
Perception cinétique du relief : Quand on bouge la tête de droite à gauche, même avec un œil fermé, on obtient plusieurs points de vue et notre cerveau comprend le relief comme dans la vision binoculaire. C’est tout naturel avec les travelling en vidéo, cinéma ; d’autres dispositifs sont basés sur le même mode de perception du relief, c’est notamment le cas du Gif animé et de la 3D à la Facebook,
Modélisation 3D : Si au lieu de prendre 2 images ou plusieurs successives, on peut créer une représentation numérique d’objets avec leurs profondeur, c’est la modélisation 3D (mieux que la carte de profondeur du bokey). On peut alors en tirer toutes les représentations possible du relief en image.
Complément sur les hologrammes

Indices de profondeur

Sur une peinture, une photo, un ” indices de profondeur” correspond à toute information présente dans l’image qui permet de placer les éléments qui la compose les uns par rapport aux autres dans l’espace,
La perspective a été popularisée par les peintres de la renaissance.
De même, les tailles des objets connus renseignent sur leur éloignement relatif.
Le masquage (ou occultation) renseigne sur le positionnement relatif en profondeur.
Le flou d’arrière-plan mettant en valeur un sujet principal a été utilisé en peinture avec le Sfumato.
En photographie, cet effet classique pour les portraits s’obtient avec une grande ouverture de diagramme.
Mais les smartphone ont une faible ouverture d’objectif, aussi certains smartphone simulent ce “Bokeh” (flou d’arrière-plan) cf. plus loin avec la stéréoscopie.
De même les objets proches apparaissent comme étant plus détaillés. Le spectateur est aussi sensible aux ombres et éclairages (les objets proches sont souvent plus contrastés que des objets éloignés), et aux déplacements relatifs (images animées)
Mais ces indices peuvent être trompeurs et la stéréoscopie lèvent ces artifices
Une vidéo (3D) “Les 7 anneaux” de Pierre Meindre présente ces indices et explicite l’apport spécifique de la stéréoscopie

Stéréoscopie

Dans le monde réel nos deux yeux captent deux images distinctes et notre cerveau en fait une seule tout en percevant le relief à partir des différences entre ces 2 images perçues.
La stéréoscopie consiste à présenter deux images légèrement différentes, les différences correspondant au relief, avec un dispositif fournissant une seule des 2 images à l’œil correspondant.
Ce principe a été mis en évidence par Charles Wheatstone vers 1830, juste avant l’invention de la photographie, au moyen de 2 dessins et des miroirs.
–
La photo a été inventée pour reproduire la vision du réel, mais, au début, manquaient la couleur, le mouvement et la vision du relief.
Il était donc normale que, dès le début, on reproduise en photo la perception binoculaire du relief.
On peut capter 2 images d’une même scène avec 2 points de vue espacés de l’écart interoculaire avec un appareil photo à 2 objectifs sur une surface sensible double : une plaque de verre au début (après le daguerréotype).
Reste à restituer chacune de ces 2 images à l’œil correspondant.
–
David Brewster a inventé en 1848 un stéréoscope à deux lentilles : un boîtier en ébénisterie, deux oculaires, un système de mise au point et un verre dépoli pour voir les 2 images formées côte-à-côte sur une plaque de verre .
Ce stéréoscope aurait été présenté à la reine Victoria lors de l’exposition universelle de Londres de 1851 : beau lancement publicitaire.
La stéréoscopie s’est largement développé jusqu’après la première guerre mondiale avec le couple : appareil photo à 2 objectifs pour plaques de verre et stéréoscope de Brewster pour les regarder,
On a conservé de très nombreuses plaques de verre issues de cette époque qui servent de témoignage passionnant.
–
Très rapidement Holmes a inventé en 1861 un stéréoscope pour l’observation des cartes stéréoscopiques.
Les prises de vues stéréoscopique donnent lieu très tôt à impression multiple sous forme de cartes ; des firmes surtout américaines produisent en masse des jeux de cartes comme une sorte d’encyclopédie sur les pays du monde et sur des thèmes variés.
Deux lentilles prismatiques sont insérées dans une visière et un support en bois permet de tenir la carte stéréo et il y a un manche pour la préhension de l’ensemble. Il est souvent appelé « mexicain ».
–
La structure type de ces visionneuses a donné lieu à de très nombreuses déclinaisons avec des modèles utilisés aujourd’hui (cf. comment voir).
Ainsi, un casque de “VR” contient 2 oculaires avec lentilles pour voir 2 écrans correspondant aux 2 images de la plaque de verre…
–
D’autres mode de restitution des 2 images du couple stéréoscopique ont été inventés, notamment l’anaglyphe avec les lunettes rouge et bleu/cyan.
Pour la projection (y.c. cinéma) et la télévision, on a inventé des systèmes à lunettes polarisée et à lunettes actives.

Parallèlement le rapprochement ou l’éloignement des objectifs de prise de vue permettent de faire ressortir le relief du très petit (proxi, macro-stéréoscopie) et des grands espaces (hyperstéréo).
_
Mais la stéréoscopie est bientôt fortement concurrencée.
Le développement du cinéma a apporté le mouvement, qui manquait à la photo fixe.
Avec le cinéma les mouvements des personnes et autres objets filmés ainsi que le travelling ont apporté de l’information sur le relief et l’espacement en profondeur des divers éléments de la scène filmée.
Enfin la couleur a encore rapproché la représentation photographique de la vision réelle.
Dans l’entre deux guerres les progrès en photographie ont démocratisé la prise de vue (film plan puis pellicule) et le tirage sur papier des photos d’amateur.
Le partage de vidéos courtes est maintenant accessible à tous et a envahie les smartphones, alors que la stéréoscopie nécessite toujours des dispositifs particulier peu distribués, onéreux et complexes à maitriser.
–
Cependant la stéréoscopie est toujours assez largement utilisée dans plusieurs domaines.
Pour les films d’action le cinéma 3D profite notamment de l’effet spectaculaire où un objet semble vous arriver dessus (le jaillissement).
Les casque de VR, accueillent facilement, par construction, des images stéréoscopiques, y compris des images de synthèse pour les jeux.
Et la “réalité augmentée” se démocratise avec la commercialisation très récente d’un casque grand public : 2 caméras situés sur le casque permet de fusionner l’image du monde réel avec l’image produite dans le casque.
La stéréoscopie est aussi utilisée pour certains spectacles immersifs … et par des amateurs passionnés cf. par exemple le Stéréo-Club Français.
–
Par ailleurs de nombreux domaines en microscopie, en médecine etc… utilisent la vision binoculaire synchrone entre 2 capteurs et deux oculaires, directement ou à distance ; sans qu’il y ait nécessairement un support d’enregistrement pour une restitution asynchrone.

Voir aussi l’article Stéréoscopie de Wikipédia

Conversion 2D-3D, carte de profondeur et bokeh.

A partir d’une image plate (2D), les indices de profondeurs et la reconnaissances des formes permettent de créer une deuxième image qui serait vue par un autre œil et donc former un couple stéréoscopique; c’est la conversion 2D-3D
Des logiciels permettent de produire grossièrement cette transformation, notamment pour le cinéma.
Mais il faut inventer les parties cachées de l’image initiale et apparaissant dans l’autre vue; cela nécessite le plus souvent l’intervention humaine pour éviter des artefacts.
–
Une carte de profondeur associée à une image est une image en niveaux de gris qui représente la profondeur de chaque point de l’image originale.
Certains logiciels permettent de créer une carte de profondeur à partir de la comparaison de 2 images. Inversement, un couple stéréoscopique peut être créé à partir d’une image plate et de sa carte de profondeur ; mais il faut toujours inventer les parties cachées…
–
Le “Bokeh” (flou d’arrière-plan) peut être obtenu par traitement numérique de certain appareils de prise de vue.
Comme les smartphones ont une faible ouverture d’objectif qui forme une image nette sur tous les plans, certains smartphone ont un capteur de distances (Lidar) qui enregistre une carte de profondeur en même temps que la photo.
Le flou est créé à partir de cette carte, ce qui permet de choisir le plan de netteté et l’importance du flou.
Il est même possible d’extraire cette carte , (incluse dans le jpeg natif) et d’en tirer un couple stéréoscopique (cf. ci-dessus les problèmes d’ artefacts dus à la conversion)
–
Exemple de couples stéréoscopiques créés à partir d’une image prise au smartphone avec carte de profondeur : Lettre du SCF de mars 2020 p.8

Bien d’autres méthodes permettent de créer une carte de profondeurs et de l’utiliser…

Lenticulaire

Un support plat (apparemment) permet de voir le relief sans lunette. Il y a en fait une plaque transparente striée, le réseau lenticulaire ; ces stries verticales formant loupes pour fournir une image différente à chacun des yeux.
Derrière le réseau, plusieurs images ont été “entrelacées” : dans la largeur de chaque strie verticale il y a autant de bandes verticales que d’images sources.
Ce dispositif permet une certaine latitude de points de vue.

Pour la prises de vues, un appareil se déplace en prenant des vues régulièrement espacées, le déplacement horizontal peut être rectiligne ou courbe ; on peut aussi faire tourner le sujet.
Le nombre de vues et l’espacement entre chacune dépend du réseau utilisé et de la distance avec l’objet visé. La série de vues peut aussi être réalisée par conversion 2D-3D ou à partir d’un modèle 3D.

Les écrans “autostéréoscopiques” utilisent un réseau lenticulaire pour 2 images (d’un couple stéréoscopique) qui sont sont entrelacées par logiciel.
Ce type d’écran existe sur smartphone, tablette et ordinateur (modèle spéciaux).
Mais l’image saute si on déplace la tête latéralement (car il n’y a que 2 images); aussi certaines stations de travail spécialisées disposent en plus du suivi des yeux “eye tracking” .
–
Voir Imagerie lenticulaire sur Wikipédia

Perception cinétique du relief.

Il suffit de bouger latéralement la tête avec un œil fermé pour voir les 2 images qu’aurait fournies la vision binoculaire.
Notre cerveau ayant appris le relief, il est capable de reconstituer le relief quand des images plates bougent.
Ainsi les documentaires utilisent très largement les travellings pour nous montrer le relief du sujet traité.
Il existe aussi des dispositifs spécifique utilisant cette propriété :

Le format GIF permet de stocker plusieurs images dans un seul fichier et de les afficher en succession. Il est donc possible de stocker des animations dans un fichier GIF.
Un “wiggle” est une image numérique en format gif animé qui affiche alternativement la vue gauche et la vue droite d’un couple stéréo.
On peut aussi utiliser plus de 2 images en format Gif pour une perception plus fluide (ou utiliser un format vidéo (mp4) qui optimise la taille du fichier).
Voir GIF sur Wikipédia.
Les “images 3D” de Facebook, sont des images que l’on peut faire bouger avec le curseur ou avec le doigt sur un écran tactile.
Pour obtenir une image 3D sur Facebook, on fournit une image normale et sa carte de profondeur.
Cette carte permet sert à créer les autres points de vue au déplacement du doigt, avec le même problème d’artefacts cités pour la conversion 2D-3D

Modélisation 3D

Modèle 3D par photogrammétrie
présentation du procédé (ex: intérêt en archéologie) – scène fixe, nombreuses prises de vue , traitement de création du modèle
utilisation = modèle 3D / comme pour les modèle de synthèse : combinaison, création de scène virtuelle,
(modèle de l’auteur sur téléphone : https://sketchfab.com/LagardeF et https://www.flagarde.fr/modeles3D/)

Vrai et faux hologrammes

Pour une véritable image holographique, l’hologramme est éclairé par un laser et il agit alors comme un réseau de diffraction pour former une image en relief de l’objet initial.
On produit un hologramme en éclairant un objet par une source de lumière cohérente (laser) et en enregistrant sur une surface sensible (par exemple, une plaque photographique) les franges d’interférences obtenues en combinant l’onde émise par la source laser (onde de référence) et l’onde réfléchie par l’objet.
Et chaque morceau d’hologramme peut restituer la même image que l’hologramme entier vu sous un certain angle, netteté mise à part, même si l’on a cassé la plaque.
Voir holographie sur Wikipédia

Faux hologrammes :

Fantôme de Pepper, Théâtre optique.

Une plaque semi-réfléchissante (verre métallisé ou film plastique) et des techniques d’éclairage particulières permettent de faire croire que des objets apparaissent.
Exemple 1: une plaque semi-réfléchissante est placée sur le devant d’une scène à un angle de 45 degrés par rapport au public ; encastrée sous l’écran se trouve une image lumineuse fournie par un écran LED ou un projecteur puissant.
Vu du point de vue du public, les images réfléchies semblent être sur scène. De plus comme la plaque est semi-transparente, le spectateur voit, en même temps, un acteur situé sur la scène derrière la plaque, un décor, …
Exemple 2: Une pyramide “holographique” affiche des animations 3D tournantes ou des séquences vidéo spéciales à l’intérieur d’une pyramide transparente à quatre côtés.

Ventilateur holographique 3D

Ce système utilise des LED et des hélices rotatives.
Une hélice de deux ou quatre pales contient des centaines de LED qui s’allument et s’éteignent à une fréquence donnée et dont la rotation crée le motif qui semble flotter dans l’espace.

Vision libre

Les 2 images côte à côte d’un couple stéréoscopique, sur papier ou sur écran, peuvent être vues comme une seule avec le relief, … par certains.
Cette vision libre, parallèle ou croisée, consiste à dissocier fortement deux fonctions des yeux qui normalement sont étroitement couplées, l’accommodation et la convergence des axes oculaires ; tout le monde n’en est pas capable et cela nécessite souvent un entrainement.

Références

Techniques avancées : Lenticulaire – Modèles 3D – Conversion 2D- 3D
(https://www.image-en-relief.org/stereo/component/tags/tag/lenticulaire |
https://www.image-en-relief.org/stereo/component/tags/tag/modeles-3d |
https://www.image-en-relief.org/stereo/component/tags/tag/conversion2d-3d)

Stéréoscopie, modèle 3D et lenticulaire : les métamorphoses
La vision binoculaire du relief peut être reproduite par chacun de ces trois types de représentations : couple stéréoscopique, lenticulaire, modèle 3D. Ces trois représentations peuvent être construites à partir de photos du réel. Il est donc logique que certaines transformations permettent de passer d’une représentation à l’autre. L’article détaille ces correspondances et transformations avec des exemples.
Extrait de Lettre 1054 de septembre 2022, pages 20-24 : https://www.image-en-relief.org/stereo/images/articles_divers/modeles3D/SCF_Lettre_1054-202209_p20-24.pdf