Henri Lemoine

Je suis Henri ! Je suis passionné par la sécurité de l'IA, en particulier le contrôle de l'IA, et la réduction des risques liés à l'IA. Dans ce but, je travaille comme ingénieur de recherche chez EquiStamp sur LinuxArena, un nouveau cadre de contrôle de l'IA pour les environnements logiciels de production en direct, en collaboration avec Redwood Research. J'ai également réalisé une évaluation de référence pour METR via EquiStamp. Je suis titulaire d'un B.Sc. en Statistiques et Informatique de McGill.

Parmi mes projets récents : LinuxArena, Control Tower, protocoles d’édition non fiables et l’exploration de l’exploitation des retours dans les protocoles de contrôle, les protocoles de bisampling, ainsi que les lois d’échelle du contrôle de l’IA.

J'ai travaillé sur des outils comme AlignmentSearch et Stampy Chat pour aider les autres à apprendre sur l'alignement. Pendant mes études de premier cycle, j’ai réalisé un projet de recherche sur la transfert sim-to-réal pour la locomotion robotique sous la direction du Prof. Hsiu-Chin Lin.

J’organise les rencontres ACX Montréal et j’ai précédemment aidé à gérer EA McGill et fondé AI Alignment McGill. Pendant mon temps libre, j’apprécie les échecs, ~~le bras de fer~~J'ai arrêté le bras de fer quand je me suis cassé le bras à Manifest. :P, et les prévisions.

Publications

Projets

Tour de Contrôle

Bibliothèque d'évaluation du contrôle IA alimentant LinuxArena

PythonDockerInspect-AITypeScript

GitHub Contribution

LinuxArena

Environnement de contrôle IA mesurant le sabotage caché par des agents IA dans des logiciels de production en direct

PythonDockerTypeScriptInspect-AI

GitHub Contribution

infiniteminesweeper.com

Un jeu de démineur multijoueur en temps réel sur un plateau infini. Les joueurs explorent ensemble un monde sans limites, en compétition sur un classement mondial.

GoReactWebSocketsProtobufsAWS S3

GitHub

Protocoles de contrôle basés sur le retour d'information

Développement de protocoles de contrôle IA basés sur le retour d'information

Inspect-AIPython

GitHub

Humanoïde Ouvert à Faible Coût

Développement d'un robot humanoïde accessible et open-source avec locomotion basée sur PPO pour le transfert sim2sim et sim2real

PythonPyTorchIsaacGymMujoco

GitHub Contribution

Journal de vie

Enregistrement audio continu performant en Rust avec optimisation SIMD

RustFFmpegAWS S3

GitHub

FriendBench

Un benchmark évaluant la convivialité des LLM — notant les modèles sur la résistance à la flagornerie, la chaleur conversationnelle et la personnalité authentique.

PythonHTMLJavaScript

AlignmentSearch / Stampy Chat

Une plateforme de génération augmentée par récupération qui aide les utilisateurs à explorer la recherche en sécurité de l’IA via une interface conversationnelle

PythonPineconeMySQLOpenAI API

GitHub Contribution

J'ai également travaillé sur des projets un peu moins sérieux : PressBench (évaluation comparative de l'auto-évaluation en développé couché par IA) et un calculateur d'échecs n-dimensionnel.