Je suis Henri ! Je suis passionné par la sécurité de l'IA, en particulier le contrÎle de l'IA, et la réduction des risques liés à l'IA. Dans ce but, je travaille comme ingénieur de recherche chez EquiStamp sur LinuxArena, un nouveau cadre de contrÎle de l'IA pour les environnements logiciels de production en direct, en collaboration avec Redwood Research. J'ai également réalisé une évaluation de référence pour METR via EquiStamp. Je suis titulaire d'un B.Sc. en Statistiques et Informatique de McGill.

Parmi mes projets rĂ©cents : LinuxArena, Control Tower, protocoles d’édition non fiables et l’exploration de l’exploitation des retours dans les protocoles de contrĂŽle, les protocoles de bisampling, ainsi que les lois d’échelle du contrĂŽle de l’IA.

J'ai travaillĂ© sur des outils comme AlignmentSearch et Stampy Chat pour aider les autres Ă  apprendre sur l'alignement. Pendant mes Ă©tudes de premier cycle, j’ai rĂ©alisĂ© un projet de recherche sur la transfert sim-to-rĂ©al pour la locomotion robotique sous la direction du Prof. Hsiu-Chin Lin.

J’organise les rencontres ACX MontrĂ©al et j’ai prĂ©cĂ©demment aidĂ© Ă  gĂ©rer EA McGill et fondĂ© AI Alignment McGill. Pendant mon temps libre, j’apprĂ©cie les Ă©checs, le bras de ferJ'ai arrĂȘtĂ© le bras de fer quand je me suis cassĂ© le bras Ă  Manifest. :P, et les prĂ©visions.

Publications

Projets

BibliothÚque d'évaluation du contrÎle IA alimentant LinuxArena

PythonDockerInspect-AITypeScript
Actuellement chef d'équipe de l'équipe bibliothÚque en cours

Environnement de contrÎle IA mesurant le sabotage caché par des agents IA dans des logiciels de production en direct

PythonDockerTypeScriptInspect-AI
Travaillé sur les environnements Job System, Model Registry, Load Balancer et Payroll System, créé 108 tùches parallÚles (non distinctes) et contribué à la fonctionnalité partagée Internet Simulator

Un jeu de démineur multijoueur en temps réel sur un plateau infini. Les joueurs explorent ensemble un monde sans limites, en compétition sur un classement mondial.

GoReactWebSocketsProtobufsAWS S3

Développement de protocoles de contrÎle IA basés sur le retour d'information

Inspect-AIPython

Humanoïde Ouvert à Faible Coût

Développement d'un robot humanoïde accessible et open-source avec locomotion basée sur PPO pour le transfert sim2sim et sim2real

PythonPyTorchIsaacGymMujoco
Politique de locomotion basée sur PPO entraßnée, itération sur la formulation de récompense pour obtenir des allures de marche robustes et résistantes aux perturbations ; exploration du transfert sim2sim et sim2real

Journal de vie

Enregistrement audio continu performant en Rust avec optimisation SIMD

RustFFmpegAWS S3

Un benchmark Ă©valuant la convivialitĂ© des LLM — notant les modĂšles sur la rĂ©sistance Ă  la flagornerie, la chaleur conversationnelle et la personnalitĂ© authentique.

PythonHTMLJavaScript

Une plateforme de gĂ©nĂ©ration augmentĂ©e par rĂ©cupĂ©ration qui aide les utilisateurs Ă  explorer la recherche en sĂ©curitĂ© de l’IA via une interface conversationnelle

PythonPineconeMySQLOpenAI API
Conception de l’architecture initiale du systĂšme RAG, mise en place de la base de donnĂ©es vectorielle Pinecone, et fine-tuning des embeddings pour la terminologie de la sĂ©curitĂ© de l’IA

J'ai également travaillé sur des projets un peu moins sérieux : PressBench (évaluation comparative de l'auto-évaluation en développé couché par IA) et un calculateur d'échecs n-dimensionnel.