Ce discours politique a été écrit par un robot. Étonnant...

Publié le 28/01/2016 à 16:24

Ce discours politique a été écrit par un robot. Étonnant...

Publié le 28/01/2016 à 16:24

Les discours de nos hommes politiques sont si calibrés qu'ils paraissent parfois écrits et prononcés par des robots, au point qu'il est parfois difficile de les distinguer. Un étudiant du MIT nommé Valentin Kassarnig a pris la chose au pied de la lettre et s'est posé une question très simple: est-il possible de faire écrire un discours par un algorithme? Un robot pourrait-il tromper l'esprit critique d'un électeur?

Le résultat de son travail, ce sont les textes surprenants qui suivent:

«Mr. Speaker. For years, honest but unfortunate consumers have had the ability to plead their case to come under bankruptcy protection and have their reasonable and valid debts discharged. The way the system is supposed to work, the bankruptcy court evaluates various factors including income, assets and debt to determine what debts can be paid and how consumers can get back on their feet. They need to have money to pay for child care. They need transportation. It allows them to get reestablished, and we think this is certainly very helpful.»

Ou celui-ci, gracieusement traduit par Le Monde.fr, qui reste à l'évidence encore perfectible:

« M. le président de la chambre, je remercie mes collègues du comité des réglementations. Je soutiens totalement cette résolution et j'exhorte mes collègues à soutenir ce projet de loi et j'exhorte mes collègues à soutenir ce projet de loi. Monsieur le président, soutenir cette réglementation et ce projet de loi est bon pour les petites entreprises [...]. Notre système économique a permis la création de deux millions d'emplois ces deux derniers mois. Vêtements, textile, transport et équipements [...]. Pratiquement tous les Etats de l'union peuvent se prévaloir d'au moins un de ces secteurs industriels. D'ailleurs, une jeune fille, Lucy, voulait s'assurer que la croissance allait continuer [sic]. »

Ces deux textes, qui pourraient sortir de la bouche de n'importe quel homme politique, ont été générés par un programme après l'analyse de 3857 discours réels donnés à la Chambre des Représentants. Ces discours étaient constitués d'environ 50000 phrases contenant une moyenne de 23 mots. Valentin Kassarnig a même pris la peine de les classifier en deux grands ensembles: "discours démocrates" et "discours républicains".

Il a ensuite développé des algorithmes dit de "machine learning" pour passer au travers de ce monceau de données, détecter des occurences, repérer des combinaisons de phrases et de mots, autrement dit "apprendre", afin de les restituer dans un ensemble et un contexte cohérent. Comble du luxe, le programme est même capable de générer, au choix, un discours républicain ou un discours démocrate (comme ceux ci-dessus). Ça paraît semble dit comme ça, mais ce genre de programmation n'a rien d'aisé.

L'étudiant a ainsi testé plusieurs solutions avant d'opter pour la technique dite N-gramme qui permet, après une analyse grammaticale de chaque phrase, de prédire le 6e mot suivant une séquence de 5 mots. Pour aller vite, c'est un peu le même système prédictif qu'utilise votre téléphone intelligent lorsque vous rédigez des messages. Si vous voulez en savoir plus sur les détails de programmation, on vous renvoie au texte exhaustif du MIT Technology Review ou carrément aux travaux du jeune homme.

Même si le résultat est évidemment encore perfectible (le programme commet encore des erreurs ou des mauvaises appréciations), les conclusions du programmeur à l'issue de son test sont terribles: «À mon avis, mon expérience a clairement démontré que la majorité des discours suivent un schéma qui les distinguent de n'importe quel autre texte, a-t-il expliqué à Fast Company. Elle montre aussi que les gens sont tellement habitués à entendre ce genre de discours qu'ils ne font même plus attention à leurs contenus.»

Verra-t-on demain des textes de véritables politiciens générés par des programmes? Valentin Kassarnig en doute: «Malgré les bons résultats que j'ai obtenu, il y a vraiment peu de chances que cette technique soit un jour utilisée par des politiciens». En revanche, estime-t-il, les applications au monde journalistique lui semblent évidentes: il suffirait d'entraîner le programme sur quelques milliers d'articles consacrés à un sujet précis pour pouvoir lui faire écrire un texte cohérent sur le même sujet.

Élégant, le jeune homme a même poussé le luxe à mettre son code source à disposition sur GitHub, histoire d'encourager tous les programmeurs a développé leurs propres solutions sur cette base.

À la une

Budget fédéral 2024: l'art de se tirer dans le pied

EXPERT INVITÉ. Le gouvernement de Justin Trudeau «s’autopeluredebananise» avec son «budget mémorable».

Gain en capital: pas une surprise

EXPERT INVITÉ. «Combien d’impôt ça va vous coûter de plus?»

L'industrie technologique mécontente des mesures sur les gains en capital

Mis à jour à 17:22 | La Presse Canadienne

L'industrie technologique est mécontente des mesures sur les gains en capital.