Je suis Henri ! Je suis passionné par la sécurité de l'IA, en particulier le contrÎle de l'IA, et la réduction des risques liés à l'IA. Dans ce but, je travaille comme ingénieur de recherche chez EquiStamp sur LinuxArena, un nouveau cadre de contrÎle de l'IA pour les environnements logiciels de production en direct, en collaboration avec Redwood Research. J'ai également réalisé une évaluation de référence pour METR via EquiStamp. Je suis titulaire d'un B.Sc. en Statistiques et Informatique de McGill.
Parmi mes projets rĂ©cents : LinuxArena, Control Tower, protocoles dâĂ©dition non fiables et lâexploration de lâexploitation des retours dans les protocoles de contrĂŽle, les protocoles de bisampling, ainsi que les lois dâĂ©chelle du contrĂŽle de lâIA.
J'ai travaillĂ© sur des outils comme AlignmentSearch et Stampy Chat pour aider les autres Ă apprendre sur l'alignement. Pendant mes Ă©tudes de premier cycle, jâai rĂ©alisĂ© un projet de recherche sur la transfert sim-to-rĂ©al pour la locomotion robotique sous la direction du Prof. Hsiu-Chin Lin.
Jâorganise les rencontres ACX MontrĂ©al et jâai prĂ©cĂ©demment aidĂ© Ă gĂ©rer EA McGill et fondĂ© AI Alignment McGill. Pendant mon temps libre, jâapprĂ©cie les Ă©checs, le bras de ferJ'ai arrĂȘtĂ© le bras de fer quand je me suis cassĂ© le bras Ă Manifest. :P, et les prĂ©visions.
Publications
Projets
BibliothÚque d'évaluation du contrÎle IA alimentant LinuxArena
Environnement de contrÎle IA mesurant le sabotage caché par des agents IA dans des logiciels de production en direct
Un jeu de démineur multijoueur en temps réel sur un plateau infini. Les joueurs explorent ensemble un monde sans limites, en compétition sur un classement mondial.
Développement de protocoles de contrÎle IA basés sur le retour d'information
Humanoïde Ouvert à Faible Coût
Développement d'un robot humanoïde accessible et open-source avec locomotion basée sur PPO pour le transfert sim2sim et sim2real
Journal de vie
Enregistrement audio continu performant en Rust avec optimisation SIMD
Un benchmark Ă©valuant la convivialitĂ© des LLM â notant les modĂšles sur la rĂ©sistance Ă la flagornerie, la chaleur conversationnelle et la personnalitĂ© authentique.
Une plateforme de gĂ©nĂ©ration augmentĂ©e par rĂ©cupĂ©ration qui aide les utilisateurs Ă explorer la recherche en sĂ©curitĂ© de lâIA via une interface conversationnelle
J'ai également travaillé sur des projets un peu moins sérieux : PressBench (évaluation comparative de l'auto-évaluation en développé couché par IA) et un calculateur d'échecs n-dimensionnel.