Que contient l'algorithme de Twitter révélé au grand jour ?

Nicolas Furno |

Twitter a publié le premier avril 2023 la majorité du code source qui régit son algorithme. C’était une vieille promesse d’Elon Musk, qui soutenait déjà l’idée bien avant d’acheter le réseau social. Le code est actuellement publié dans deux dépôts sur GitHub nommés The Algorithm en toute simplicité et The Algorithm ML et le patron s’engage à fournir le reste du code source dans les prochaines semaines. D’ici là, cette publication inédite pour un réseau social d’une telle ampleur permet d’en savoir plus sur les comptes et contenus mis en avant, même s’il faut souligner d’emblée que ce n’est pas simple de comprendre ce qui se passe.

Montage Macgeneration.

La version actuelle du code dépasse les 500 000 lignes de code réparties dans plus de 5 500 fichiers différents et organisés dans une hiérarchie complexe qui dépasse les 1 200 dossiers. Autant dire que s’y plonger n’a rien d’évident quand on n’est pas dans le domaine, d’autant plus qu’il y a une variété de langages de développement et pas toujours les plus courants. Outre du Java, du Python ou du Rust, on trouve aussi du Starlak ou encore du Thrift, même si la majorité du code en nombre de lignes est en Scala, un langage né dans les années 2000 à l’école polytechnique fédérale de Lausanne qui repose sur Java.

C’est une complexité logique et attendue, un algorithme tel que celui qui est à l’œuvre chez Twitter est forcément un édifice complexe composé de multiples parties différentes. D’ailleurs, Elon Musk a même reconnu que les ingénieurs qui travaillent encore dans l’entreprise ne comprenaient pas entièrement ce code et qu’il pourrait contenir des éléments embarrassants. Ce qui n’a pas trainé : il n’a pas fallu beaucoup de temps pour repérer dans un fichier une variable nommée author_is_elon, qui désigne les messages publiés par le patron. Ce dernier n’était manifestement pas au courant, en tout cas c’est ce qu’il a soutenu dans la foulée et le ménage a rapidement été effectué.

L’un des passages qui distinguaient les tweets d’Elon Musk, mais aussi ceux des politiques démocrates et républicains aux États-Unis et qui a été retiré quelques heures après la publication du code source.

Ce code n’offrait pas de traitement de faveur aux tweets d’Elon Musk, mais il reste un petit peu embarrassant, car il prouve que son compte personnel est traité différemment. Ce qui était soupçonné jusque-là, notamment à travers cette histoire triste ou amusante selon les points de vue d’un ingénieur viré pour avoir suggéré que les statistiques en baisse du compte Twitter du milliardaire étaient liées à une baisse de popularité dans le monde réel. L’algorithme avait été retouché par la suite, causant un bug qui avait brièvement provoqué une mise en avant de tous ses tweets pour tous les utilisateurs du service.

avatar Furious Angel | 

Article intéressant mais conclusion prévisible : les polémiques, l’absence de sources et l’enfermement dans une idéologie sont les conséquences directes de ces choix faits pour retenir l’utilisateur sur le site.

La seule bonne utilisation de Twitter : ne pas suivre n’importe quoi et SURTOUT, choisir l’affichage avec uniquement les comptes que l’on suit. Leurs suggestions ne font que remuer le plus bas de l’humanité.

avatar Nesus | 

Amusant, twitterific n’a jamais permis tout cela. Comme quoi, je n’ai jamais eu une utilisation « normale » de Twitter. Et ce fut pour le mieux.

avatar Nicolas Furno | 

@Nesus

En effet, ce n’est valable que pour le site web et l’app officielle. J’aurais pu le préciser, mais puisque ce sont les seuls qui restent désormais…

avatar Nesus | 

@nicolasf

Complètement, c’était un simple constat.

avatar fleeBubl | 

L’algo de Twitter contient … des graines ?

(((Dsl j’ai pas pu m’en empêcher)))

avatar berrald | 

@nicolasf
Article très intéressant !

À quand une fonction pour signaler les fautes sans passer par les commentaires sur le site ?

on peut ainsi avoir une assez bonne idée des critères qui font qu’une publication sera poussé|e| ou au contraire boudé|e| par Twitter.

Un retweet ou l’ajout d’un « J’aime » sont des facteurs qui améliorent la visibilité d’une publication, mais ce |ne| sont pas les plus importants.

avatar Nicolas Furno | 

@berrald

Merci pour le compliment et désolé pour les fautes, mais la fonction existe bien dans notre app iOS et sur le site du club iGen. Sinon, un mail à fautes@mgig.fr, ça peut le faire aussi.

Je corrigerai demain celles-ci.

avatar berrald | 

@nicolasf

J'utilise le site du club iGen (sur mac), mais je ne trouve pas la fonction en question…
Au pire j'utiliserai le mail fautes@mgig.fr que je ne connaissais pas ! Merci.

avatar Nicolas Furno | 

@berrald

Désolé, j’ai en effet halluciné et la fonction n’est pas proposée sur le site du club.

avatar zoubi2 | 

@berrald

"À quand une fonction pour signaler les fautes sans passer par les commentaires sur le site ?"

Je n'utilise que l'app web, donc je ne réponds peut-être pas à votre question...

En bas de page des commentaires il y a "Notre équipe" ==> liste des gus avec un"@" sous chaque individu pour lui envoyer un mail...

avatar berrald | 

@zoubi2

Rien de tel sur le site… merci quand même pour l'info !

avatar pakal | 

quel article fascinant! merci

avatar beteldor | 

Article très intéressant et pertinent. Du bon travail, chapeau.

avatar pb23 | 

Initiative indispensable pour restaurer la confiance dans les réseaux sociaux
Mais c’est parce que Musk a des motivations politiques et non financières que cela est possible
Zuckenberg n’est pas prêt de faire la même chose de son plein gré
Mais la législation pourrait évoluer après ce précédent

avatar Patrick_C | 

@pb23

Sauf que cette initiative est accompagnée en parallèle d’une perte de transparence en rendant payant l’API pour les universités : si vous n’avez que l’algorithme et pas la possibilité de mesurer les effets, cela a un intérêt limité et montre bien en effet les motivations politiques de Musk.

avatar Patrick_C | 

Pour la dérive des algorithmes, vous pouvez faire une recherche Google sur « les algorithmes sont-ils de droites ?». Cela se réfère à une étude interne de Twitter qui montrait que les choix exposés ici favorisaient les opinions conservatrices de droite, contrairement à ce que leurs plaintes régulières de censure laisse croire.

CONNEXION UTILISATEUR