Je suis un rĂ©cent diplĂŽmĂ© de McGill (B.Sc. en Statistiques et Informatique) poursuivant actuellement un MSc Ă  Mila et Ă  l'UniversitĂ© de MontrĂ©al. Je me concentre sur la recherche en sĂ©curitĂ© de l'IA, en particulier le ContrĂŽle de l'IA — dĂ©velopper des protocoles pour dĂ©ployer en toute sĂ©curitĂ© des systĂšmes d'IA en lesquels nous n'avons pas une confiance totale. Je suis ingĂ©nieur de recherche chez EquiStamp, oĂč j'ai travaillĂ© sur LinuxArena pour Redwood Research et la mise en rĂ©fĂ©rence pour METR.

Les projets rĂ©cents incluent : protocoles d'Édition Non Fiables et l'exploration de l'exploitation des retours dans les protocoles de contrĂŽle, les protocoles de bisampling, et les lois d'Ă©chelle du ContrĂŽle de l'IA.

J'ai travaillé sur des outils tels que AlignmentSearch et Stampy Chat pour aider les autres à apprendre l'alignement. Pendant mes études de premier cycle, j'ai réalisé un projet de recherche sur le transfert sim-to-réal pour la locomotion robotique sous la direction du Professeur Hsiu-Chin Lin.

J'organise les rencontres ACX MontrĂ©al et j'ai auparavant aidĂ© Ă  gĂ©rer EA McGill et fondĂ© AI Alignment McGill. Pendant mon temps libre, j'apprĂ©cie les Ă©checs, le bras de ferJ'ai arrĂȘtĂ© le bras de fer quand je me suis cassĂ© le bras Ă  Manifest. :P, et la prĂ©vision.

Publications

Projets

Un jeu de démineur infini multijoueur en temps réel. Les joueurs explorent ensemble un monde sans limites, en compétition sur un classement mondial.

GoReactWebSocketsProtobufsAWS S3

Développement de protocoles de contrÎle d'IA basés sur les retours

Inspect-AIPython

Humanoïde Ouvert à Faible Coût

Développement d'un robot humanoïde accessible et open source avec locomotion basée sur PPO pour transfert sim2sim et sim2real

PythonPyTorchIsaacGymMujoco
Politique de locomotion basée sur PPO entraßnée, avec itérations sur le façonnage des récompenses pour obtenir des allures de marche robustes et résistantes aux perturbations ; exploration du transfert sim2sim et sim2real

Lifelogging

Enregistrement audio continu performant en Rust avec optimisation SIMD

RustFFmpegAWS S3

Un benchmark Ă©valuant la convivialitĂ© des LLM — notant les modĂšles selon leur rĂ©sistance Ă  la flatterie, la chaleur conversationnelle et la personnalitĂ© authentique.

PythonHTMLJavaScript

Une plateforme de génération augmentée par récupération qui aide les utilisateurs à explorer la recherche sur la sécurité de l'IA via une interface conversationnelle

PythonPineconeMySQLOpenAI API
Conception de l’architecture initiale du systĂšme RAG, mise en place de la base de donnĂ©es vectorielle Pinecone, et ajustement fin des embeddings pour la terminologie de la sĂ©curitĂ© de l’IA

J'ai également travaillé sur des projets moins sérieux : PressBench (auto-évaluation de la capacité de développé couché de l'IA) et un calculateur d'échecs n-dimensionnel.