Que contient l'algorithme de Twitter révélé au grand jour ?

Nicolas Furno |

Twitter a publié le premier avril 2023 la majorité du code source qui régit son algorithme. C’était une vieille promesse d’Elon Musk, qui soutenait déjà l’idée bien avant d’acheter le réseau social. Le code est actuellement publié dans deux dépôts sur GitHub nommés The Algorithm en toute simplicité et The Algorithm ML et le patron s’engage à fournir le reste du code source dans les prochaines semaines. D’ici là, cette publication inédite pour un réseau social d’une telle ampleur permet d’en savoir plus sur les comptes et contenus mis en avant, même s’il faut souligner d’emblée que ce n’est pas simple de comprendre ce qui se passe.

Montage Macgeneration.

La version actuelle du code dépasse les 500 000 lignes de code réparties dans plus de 5 500 fichiers différents et organisés dans une hiérarchie complexe qui dépasse les 1 200 dossiers. Autant dire que s’y plonger n’a rien d’évident quand on n’est pas dans le domaine, d’autant plus qu’il y a une variété de langages de développement et pas toujours les plus courants. Outre du Java, du Python ou du Rust, on trouve aussi du Starlak ou encore du Thrift, même si la majorité du code en nombre de lignes est en Scala, un langage né dans les années 2000 à l’école polytechnique fédérale de Lausanne qui repose sur Java.

C’est une complexité logique et attendue, un algorithme tel que celui qui est à l’œuvre chez Twitter est forcément un édifice complexe composé de multiples parties différentes. D’ailleurs, Elon Musk a même reconnu que les ingénieurs qui travaillent encore dans l’entreprise ne comprenaient pas entièrement ce code et qu’il pourrait contenir des éléments embarrassants. Ce qui n’a pas trainé : il n’a pas fallu beaucoup de temps pour repérer dans un fichier une variable nommée author_is_elon, qui désigne les messages publiés par le patron. Ce dernier n’était manifestement pas au courant, en tout cas c’est ce qu’il a soutenu dans la foulée et le ménage a rapidement été effectué.

L’un des passages qui distinguaient les tweets d’Elon Musk, mais aussi ceux des politiques démocrates et républicains aux États-Unis et qui a été retiré quelques heures après la publication du code source.

Ce code n’offrait pas de traitement de faveur aux tweets d’Elon Musk, mais il reste un petit peu embarrassant, car il prouve que son compte personnel est traité différemment. Ce qui était soupçonné jusque-là, notamment à travers cette histoire triste ou amusante selon les points de vue d’un ingénieur viré pour avoir suggéré que les statistiques en baisse du compte Twitter du milliardaire étaient liées à une baisse de popularité dans le monde réel. L’algorithme avait été retouché par la suite, causant un bug qui avait brièvement provoqué une mise en avant de tous ses tweets pour tous les utilisateurs du service.

Seuls les abonnés du Club iGen peuvent lire l‘article dans son intégralité.

-> Déjà membre ? Je me connecte
-> S‘abonner au Club iGen
Accédez aux commentaires de l'article