Comme Tesla, Toyota fait le pari de la vision pour la conduite autonome

Nicolas Furno |

Tesla ne va plus faire bande à part dans la quête de la solution pour la conduite autonome. Le constructeur américain exclusivement électrique était jusque-là le seul à faire le pari de la vision pour permettre à ses véhicules de rouler en toute autonomie. Ce pari se base sur l’idée que la meilleure option pour la conduite autonome est de se rapprocher du conducteur humain et de parier sur l’analyse d’images fournies par des caméras plutôt que des capteurs spécifiques, comme des radars et autres LiDAR qui manquent de contexte. La « Tesla Vision » est poussée depuis des années par Tesla, sous l’impulsion notamment de son CEO :

Tesla fait chauffer ses neurones pour sa vision à long terme

Tesla fait chauffer ses neurones pour sa vision à long terme

Elon Musk aurait poussé envers et contre tous le pari de la vision chez Tesla

Elon Musk aurait poussé envers et contre tous le pari de la vision chez Tesla

Toyota va toutefois rejoindre ce camp, même si le géant japonais — numéro un ou deux mondial selon les années — n’opte pas pour une approche aussi radicale. Comme le rapporte Reuters, Woven Planet a choisi d’utiliser des caméras analysées par un ordinateur de bord pour parvenir à la conduite autonome. La filiale du constructeur automobile dédiée à cette thématique reprend en cela la même stratégie que Tesla, avec un système basé sur l’intelligence artificielle et les apprentissages automatisés qui se forme à partir des images captées par les voitures.

Le système de caméras montées sur le toit des véhicules de Toyota pour entraîner le modèle de données (image Woven Planet).

Et comme pour Tesla, Toyota a vite réalisé que le plus gros défi de cette approche était le jeu de données indispensable à l’entraînement du modèle. Il faut des images en grand nombre et variées pour couvrir tous les cas de figure. L’entreprise américaine peut compter sur son parc de plus d’un million de véhicules qui sont tous équipés de caméras et d’une connexion internet capable d’envoyer des données. Son homologue japonais n’a pas une telle force de frappe, en tout cas pas encore.

Même si ce n’est pas le cas aujourd’hui, il semble que Toyota va reproduire la stratégie de son concurrent jusqu’au bout, en comptant sur son immense parc automobile pour réaliser cette collecte. Mais il va falloir plusieurs années pour qu’un nombre suffisant de données soient collectées par des voitures équipées de caméra et connectées, même pour un géant de l’automobile. Alors en attendant, Woven Planet continue de travailler avec des radars et LiDAR qui devraient apporter une solution plus rapide pour les besoins des « robotaxis », ces flottes de véhicules autonomes que tout le monde essaie de mettre au point.

Du côté de Tesla, on ne ralentit pas sur le choix de la vision, bien au contraire. Moins d’un an après le retrait du radar aux États-Unis et au Canada, le constructeur a annoncé que les voitures produites pour l’Europe à partir du mois d’avril seront elles aussi dépourvues de ce capteur à l’avant. Seules les huit caméras, ainsi que les capteurs ultrason placés sur les deux pare-chocs, resteront disponibles pour les fonctions liées à l’Autopilot. Ce choix impose deux restrictions initiales : une limite à 130 km/h et la distance de sécurité maximale pour toutes les fonctions d’assistance au maintien de cap.

L’une des huit caméras installées sur toutes les voitures conçues par Tesla (image MacGeneration).

Tesla promet la levée de ces deux restrictions avec une future mise à jour. L’avantage des clients européens en la matière, c’est que des véhicules sans radar roulent depuis près d’un an de l’autre côté de l’Atlantique et le constructeur a eu le temps d’améliorer son logiciel, même s’il reste encore quelques défauts par rapport aux voitures avec radar. Quoi qu’il en soit, si certains doutaient encore de ce pari de la vision, l’entreprise d’Elon Musk persiste et signe. D’autant que les radars installés sur les voitures produites jusqu’à aujourd’hui ne serviront pas éternellement.

La bêta du FSD, la conduite entièrement autonome promise depuis plusieurs années par Tesla, ne repose ainsi que sur la Tesla Vision. En Amérique du Nord, les Model 3 et Model Y qui participent au test fonctionnent sans le radar, même si la voiture en est physiquement équipée. Il n’y a pas de raison que l’Europe soit traitée différemment et on peut ainsi imaginer que le radar soit désactivé à terme sur toutes les voitures du constructeur américain.

Est-ce que ce sera aussi le cas pour celles de Toyota ? L’entreprise a encore du chemin à faire pour rattraper son retard dans le domaine…

avatar raoolito | 

ca me semble risqué quand meme, de tout miser, de "simplifier" la conduite autonome à la vision seule. Je veux dire pourquoi ne pas utiliser tout en meme temps? c'est justement la puissance des l'informatique embarquée, là ou nous on serait debordé d'informations

bon, apres, tout le monde saura que je ne suis ni ingenieur specialisé, ni meme possesseur de voiture vaguement autonome, c'est dire...

avatar Nicolas Furno | 

@raoolito

C'est justement l'argument de Tesla, je l'avais développé dans l'article sur la vision à long terme, que multiplier les sources d'informations revient à multiplier les sources d'erreur. Un radar n'est pas infaillible, il ne sait pas si une masse est un panneau sur le bord de la route ou un camion qui roule à côté, par exemple, les caméras restent indispensables pour identifier ce qu'il voit. Et cette confirmation ajoute du délai dans le temps de réaction, alors que la caméra aurait pu identifier tout de suite ce qui se passe.

C'est ça le pari, après est-ce une bonne idée ou pas, c'est bien compliqué de répondre quand on n'a pas tous les éléments.

avatar marc_os | 

@ Nicolas Furno

> multiplier les sources d'informations revient à multiplier les sources d'erreur

Mais oui mais bien sûr, on y croit.
Le meilleur moyen de convaincre les autres qu'il faut abattre son chien, c'est de prétendre qu'il a la rage.

avatar DahuLArthropode | 

@nicolasf

"multiplier les sources d'informations revient à multiplier les sources d'erreur."

Il me semblait que la redondance (y compris dans le design et la multiplicité des solutions techniques) était précisément une des techniques de base de la sûreté de fonctionnement.
Mais que valent des décennies d’expérience face au dictat de l’innovation…

avatar 406 | 

Je me demande bien comment ça fonctionnerait dans un brouillard…

avatar Nicolas Furno | 

@406

Bien, d'après les retours. La plus grosse limite qui reste, ce sont les freinages qu'on dit fantômes sur les routes à deux voies, sans limite entre les deux (les départementales chez nous). Dès qu'un camion arrive en face, il faut encore un temps de réaction à la voiture pour identifier qu'il ne s'agit pas d'un danger, dans l'intervalle elle a tendance à freiner par sécurité, mais sans raison.

avatar flux_capacitor | 

@nicolasf

Tout comme Siri se plante désormais systématiquement lors des dictées en langue française¹ (accords masculin-féminin, participes passés vs infinitif, mots totalement incongrus sortis du contexte…) car je suppose développé par une boîte américaine qui n'a pas à traiter des règles de grammaire à s'arracher les cheveux en langue anglaise, je ne vois pas ce problème réglé facilement chez nous, par une boite californienne (ni française car nos constructeurs sont encore loins du niveau de Tesla en la matière).

Car ce genre de route n'existe quasiment pas aux USA, alors que c'est la norme en France. Je veux dire, sorti des grandes villes et de leur périph, du réseau de voies express et d'autoroutes, la France ce sont des départementales ultra étroites, partout. Ou même des chemins. Dans ma région, lorsque deux véhicules croisent sur ce genre de route, on est systématiquement obligés de serrer le talus en faisant attention de ne pas y patiner et aller dans le fossé, voire de ralentir très fortement et de manger franchement sur l'herbe. À certains endroits on est même obligés de s'arrêter et que l'un des deux véhicules se gare pour laisser passer l'autre (et je ne vous parle pas de ces abrutis qui roulent en arrivant en face à fond et quasi au milieu de la route, et qui ne savent pas ou ne veulent pas serrer le bas-côté…). Dans le Finistère, des agriculteurs traversent le département entier en tracteur, à 30 km/h, sur ce genre de voie conçues pour une autre époque. Il n'y aura jamais aucune solution par élargissement de la voirie. D'une parce qu'il n'y a pas l'argent pour tout refaire, de deux parce que c'est bordés de centaines de milliers de champs, des terrains appartenant en majorité à des agriculteurs tous différents. C'est comme ça et il faudra faire avec cet anachronisme.

__________
¹ ça eut fonctionné bien mieux dans les versions antérieures d'iOS, je ne comprends pas.

avatar Nebukad | 

@flux_capacitor

La conduite autonome n’a pas encore vocation à être utilisée partout et dans toutes les situations. Les cas que tu décris et qui je l’accorde sont courants à la campagne ne seront vraisemblablement jamais pris en charge.

avatar Nicolas Furno | 

@Nebukad

Si si, la bêta du FSD a les ambitions d’une conduite entièrement autonome partout, de type niveau 5. Ça doit marcher sur n’importe quelle route et en toutes circonstances.

avatar Nebukad | 

@nicolasf

Oui cela reste l’ambition mais avant que 2 véhicules autonomes soient en capacités de décider de rouler sur un bas côté car la route est trop étroite pour se croiser, il va y avoir quelques situations cocasses.

avatar Nicolas Furno | 

@Nebukad

Ah tout à fait, mais je voulais juste rappeler que c’était prévu pour. 🙂

avatar Nicolas Furno | 

@flux_capacitor

Je ne suis pas un expert en routes américaines, mais il me semble qu’il y en a quand même beaucoup, des équivalents à nos départementales et ex nationales. Dans le centre du pays, c’est même la norme, cf la mythique Route 66.

Par contre, elles sont en général toutes beaucoup plus larges et parfois bien droites sur des distances folles, donc l’argument reste recevable. Quand on voit la route la plus dangereuse aux US, ça nous fait doucement rigoler en effet… https://m.youtube.com/watch?v=d6tgmGqXysM

avatar raoolito | 

@nicolasf

"Quand on voit la route la plus dangereuse aux US, ça nous fait doucement rigoler en effet…"

:)
sachant cependant que ya un truc contre intuitif en conduite: ce sont là ou les routes sont les moins securisée (en gros une route tortueuse avec pas de place, de nuit par brouillard et pluie - oui pourquoi pas? et des animaux qui courent !) ben là il y aura le moins d'accidents ! Comparée à une route droite de jour ou qu'on imagine bien plus sure. La raison est simple: quand le conducteur "sent" le danger il fait attention, mais pas quand il pense que ca va rouler "tout seul"
là, la conduite assistée peut faire une grosse différence en effet. D'où le fait que je trouve qu'on la met trop facilement dans des situations soit où il y a statistiquement moins de risques (mais plus chiantes pour les conducteurs) soit insolubles (le paradoxe du passage piéton ou faut savoir qui ecraser) là ou nous on ne serait pas plus avantagé. ( une sorte de Kobayashi Maru mais pour les IA :D )

avatar xavierlc | 

@raoolito

C'est exactement ça.
Dans un premier temps on a aménagé les routes de façon à les rendre plus faciles à aborder, en supprimant ou atténuant les éléments délicats à franchir. Ça renforce l'idée de sécurité que le conducteur se fait de l'endroit, c'est moins fatiguant. Ça semble logique.
Dorénavant la doctrine en matière de sécurité routière est, en particulier en agglomération, de multiplier les chicanes et autres "inconvénients" afin de renforcer l'attention du conducteur, augmenter sa charge de travail en quelque sorte, et de diminuer la sensation de sécurité.
Il ressort de tout cela que diminuer l'impression de sécurité n'est pas diminuer la sécurité, au contraire. Ce qui est d'apparence paradoxale.

avatar fte | 

@raoolito

"quand le conducteur "sent" le danger il fait attention"

Une expérience a été menée en UK : suppression des lignes blanches sur certaines routes.

Diminution drastique du nombre d’accidents.

Pendant quelques mois.

Les gens se sont vite habitués, et le nombre d’accidents est remonté au niveau initial, puis l’a dépassé.

Les aides actives à la conduite sont beaucoup plus efficaces sur le long terme.

avatar cecemf | 

@406

Très bonne question!

avatar dujarrier | 

Mon opinion personnelle est qu’un systeme de conduite autonome basé uniquement sur des capteurs de vision est voué à être moins sur/fiable qu’une conduite autonome basé sur plusieurs types de capteurs (vision, sonore, radar,…)

Un exempke tout bête : Comment réagira un systeme de conduite autonome a un avertissement sonore s’il n’a pas de capteur sonore ???

Par exemple, un vehicule avec une sirène (pompier, police,…) qu’on entend mais ne vois pas encore, et en supposant qu’il n’allume pas les feux clignotants ???

L’être humain utilise l’ENSEMBLE des ses capteurs pour apprendre, et pas seulement la vision…

avatar Dodo01 | 

@dujarrier

Là dessus tu as la techno car2car, de série depuis 2 ans sur la voiture la plus sécurisante au monde (et voiture la plus vendue d’Europe depuis 40 ans).

avatar fte | 

@dujarrier

"L’être humain utilise l’ENSEMBLE des ses capteurs pour apprendre, et pas seulement la vision…"

Autour de Zurich, les rares fois ou j’y roule, je tiens à ma vie, je me demande si les humains utilisent un quelconque capteur, ne serait-ce que la vision.

avatar 406 | 

Pour certifier le niveau 5, la voiture doit être capable de franchir le rond-point de l'Étoile sans rester bloqué.

avatar lduret | 

@406

Le test ultime !

avatar Kumbaya | 

Moi je suis aveugle, et quelque peu casse-coup il est vrai. Ça dirait à quelqu'un un petit tour place de l'Étoile? en toute autonomie, bien sûr! 😀🤣
Après, si on est toujours vivant, on s'éloigne de Paris, via l'autoroute évidemment, pour tester le 130km/h, et puis on va dans les Alpes par exemple, voir ce que ça donne dans des virages bien serrés.
Allez allez, je suis sûre qu'il y en a qui sont preneurs par ici.

avatar marc_os | 

« Ce pari se base sur l’idée que la meilleure option pour la conduite autonome est de se rapprocher du conducteur humain et de parier sur l’analyse d’images fournies par des caméras plutôt que des capteurs spécifiques, comme des radars et autres LiDAR »

Très bonne idée : L'être humain a des capacités limitées, reproduisons les pour plus de sécurité ! 😳
Non mais que vous repreniez cette argumentation à deux balles, franchement...

Non, la vraie motivation est de faire des économies sur les LIDAR et autres radars.
Car "vision" + LIDAR, ça ça représente un vrai plus par rapport à l'humain au niveau sensoriel.
Car désolé mais en plus l'œil humain n'est pas terrible quand il y a du brouillard, de la neige, de la pluie, et que de la saleté ou du givre peuvent occulter les capteurs. Alors vouloir imiter les imperfections de l'être humain, je trouve cela pour le moins étrange, surtout en matière de sécurité.

avatar tupui | 

@marc_os

Les caméras en questions sont déjà plus performantes que notre vision.

Et les choses ne sont pas si simples pour mélanger les données. On maîtrise bien l’analyse d’image « normale » mais en est encore loin d’avoir quelque chose de propre avec le LiDAR. On parle de temps de réponses très court sur du matériel qui n’a rien à voir avec ce qu’on voit dans les papiers. Et même si l’on retire ces problèmes techniques, il faut penser à l’algorithme de prise de décision qui doit combiner les choses et là bon courage… Pour avoir bosser sur la détection de bâtiments pour FlightSimulator ba même avec toutes les donnés du monde à combiner, c’est le bazar et si on ajoute des sources d’erreurs en pagailles.

avatar Brubruclaes | 

ça fait 24 ans que je conduis comme sans doute la plupart d'entre nous en utilisant juste mes yeux (bien myopes) en ce qui me concerne pour conduire. En montagne, au soleil, dans la neige, le brouillard, à 150km/h sur une route allemande (voire plus mais l'autopilot s'arrête à cette limite de vitesse)... Parfois fatigué, après quelques heures de sommeil ou m'être levé aux aurores (comme je ferai demain matin pour rallier pour la 8ième fois Bruxelles à Draguignan en Model 3P).
Qui est le plus fiable? moi ou moi et un ordinateur AMD Ryzen surpuissant aidé par 7 caméras?
On a toujours fait en faisant confiance uniquement à nos 2 yeux. Pourquoi faut il un Lidar ou radar pour utiliser le système.
On est encore loin de la conduite autonome (et honnetement je ne m'achète pas une voiture de près de 500cv pour me laisser conduire par un robot, je préfère le faire moi même) mais l'autopilot sur long trajet et sur autoroute c'est quand même plus reposant et ça calme les nerfs mis à rude épreuve par les champions du monde de la bande du milieu qu'on retrouve bien trop souvent sur les autoroutes françaises 😁

avatar Dr. Kifelkloun | 

Je suis conducteur de Tesla (Y) et la différence entre la théorie et la réalité me fait un peu rigoler... En théorie les caméras sont magiques, mais en réalité:
- si le soleil est trop bas, les caméras qui prennent le soleil de face sont inactivées
- si la route est sale (souvent le cas pendant les hivers du Nord-Est américain, avec neige sale, boue, sel tenace etc etc) les caméras deviennent rapidement inutilisables.
- si les bandes blanches/jaunes des routes ne sont pas parfaitement peintes et visibles, les caméras ne les voient pas. En hiver, la route n'est pas noire avec des bandes blanches... Elle est gris foncé dégueulasse avec des bandes grisâtres souvent invisibles! Même en été dans ma région, les bandes sont souvent mal peintes...
- si on roule de nuit par temps de pluie, la route est trop brillante pour les caméras

Bref... Je pourrais faire une longue liste d'exemples mais après presque 2 ans d'expérience, il y a bien trop de cas où la théorie est rattrapée par la réalité des conditions routières. Ces systèmes sont nickels sur des autoroutes ou routes bien planes, bien propres, sans pluie, sans neige, sans sel. J'utilise "autopilot" quand je considère que les conditions routières sont compatibles. C'est certainement très impressionnant mais il y encore une bonne marge de progression. Après, je ne suis pas certain de comprendre pourquoi les caméras seules feraient un meilleur job que caméras + radars, mais je ne suis pas compétent pour juger ça. Dans ma réalité, il y a toujours des chiffons en microfibers disponibles pour nettoyer les caméras avant un trajet! En hiver, je n'utilise quasiment pas autopilot. Malgré ça, conduire la Y est un vrai bonheur et ça serait dur de revenir en arrière...

avatar orkal | 

Pas tout à fait hors sujet.
J’ai appris quelque part que les captcha qui demandent à reconnaître des feux, des véhicules, des poids lourds etc servaient aussi à alimenter des banques de données pour la conduite autonome…
Fake ? Et sinon, pour qui ?
Merci à ceux qui savent.

avatar JONYBLAZ | 

On va droit dans le mur

avatar fte | 

@JONYBLAZ

"On va droit dans le mur"

Freine.

avatar JONYBLAZ | 

On va droit dans le mur

CONNEXION UTILISATEUR