STAGE – Ingénieur en Sécurité des modèles génératifs de langage : injection indirecte de « prompt » (H/F
Palaiseau Polytechnique
Thales
From Aerospace, Space, Defence to Security & Transportation, Thales helps its customers to create a safer world by giving them the tools they need to perform critical tasksQUI SOMMES-NOUS ?
Construisons ensemble un avenir de confiance
Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cybersécurité & Identité numérique. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l’environnement et plus inclusif. Le Groupe investit près de 4 milliards d’euros par an en Recherche & Développement, notamment dans des domaines clés de l’innovation tels que l’IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays.
Nos engagements, vos avantages
- Une réussite commune portée par notre culture et excellence technologique, votre expérience et notre ambition partagée
- Un package de rémunération attractif (épargne salariale, variable ou 13ième mois selon les postes, restaurant d’entreprise,…)
- La possibilité de développer vos compétences en continu grâce à nos parcours de formation et nos académies internes #ENTREPRISEAPPRENANTE
- Notre attention portée à votre équilibre personnel et professionnel (Accord télétravail, RTT, congés d’ancienneté, jours enfants malades, guide parentalité, crèches, CSE / ASC,… )
- Des communautés internes permettant de vous engager sur les sujets qui vous tiennent à cœur : innovation, diversité, environnement
- Un environnement inclusif et bienveillant où vous êtes accueilli et valorisé avec notre politique handi-accueillante, notre charte LGBT+, notre initiative #StOpe pour lutter contre le sexisme.
Dans ce cadre nous recherchons un :
STAGE – Ingénieur en Sécurité des modèles génératifs de langage : injection indirecte de « prompt » (H/F) – 6 mois
Basé à Palaiseau (91)
QUI ETES-VOUS ?
- Etudiant en Ecole d’Ingénieur ou formation équivalente, vous préparez un master 2 en sciences de données ou en apprentissage automatique ?
- Vous êtes curieux et rigoureux ?
- Vous disposez d'une aisance affirmée en programmation en Python
- Vous avez un intérêt particulier pour l’apprentissage automatique et ses enjeux éthiques ?
- L’idée de participer à un projet de recherche sur des thématiques d’apprentissage automatique novatrices vous anime ?
- Enfin vous êtes à l’aise en français et en anglais ?
Vous vous reconnaissez ? Alors découvrez vos futures missions !
CE QUE NOUS POUVONS ACCOMPLIR ENSEMBLE :
Thales SIX & GTS France est numéro un européen des systèmes d’information et de communication sécurisés pour les marchés de la défense, de la sécurité et du transport terrestre. Au sein de cette entité, ThereSIS, basé à Palaiseau et Gennevilliers, est un département de recherche comportant six laboratoires (Simulation, Intelligence Artificielle, Computer Vision, Signal radio, Cybersécurité et Data Science) lui permettant de répondre aux besoins amonts de Thales SIX GTS France et plus généralement de Thales.
Dans le contexte de l'augmentation rapide de l'intégration des modèles de langage (LLM) dans diverses applications, ces derniers sont devenus des cibles potentielles pour des attaques sophistiquées, en particulier les attaques d'injection de prompts directes ou indirectes. Le présent stage se concentrera sur ces dernières, c.-à-d. les injections indirectes. Ces menaces exploitent les failles dans les frameworks de manipulations des LLM pour induire des disfonctionnements, notamment via l’exécution de code malveillant ou la propagation de malwares via des interactions anodines avec les utilisateurs. L'objectif de ce projet est de renforcer la sécurité des systèmes à base de LLM contre ces attaques émergentes en s'appuyant sur des analyses approfondies et des approches innovantes, conformément aux avancées présentées dans les études récentes. Ces attaques utilisent des stratégies complexes pour détourner le fonctionnement des LLM comme diffuser des contenus nuisibles en les manipulant sans alerter les systèmes de sécurité traditionnels. Ce projet s’appuie également sur le cadre MITRE ATLAS, qui répertorie et classe les menaces émergentes liées à l’IA, pour définir des contre-mesures spécifiques face à ce type de menace.
Dans ce contexte, vos missions seront les suivantes :
- Création d’une boîte à outils de reproduction des attaques
- Concevoir des outils permettant de reproduire des attaques réelles sur des LLM en environnement contrôlé, afin de mieux comprendre les mécanismes d'attaque et d'évaluer l'efficacité des stratégies de défense.
- Utiliser le référentiel MITRE ATLAS pour structurer l’analyse des attaques sur les LLM, afin d’aligner les défenses avec les tactiques, techniques et procédures (TTPs) des attaquants identifiées dans ce cadre, particulièrement, les injections indirectes de prompt.
- Développer et implémenter des techniques de détection capables d'identifier et de bloquer les tentatives d'injection de prompt indirect.
- Mettre en place des mécanismes robustes qui empêchent les LLM de générer du code malveillant ou de propager des malwares.
Ce projet vise à proposer une approche holistique pour sécuriser l'utilisation des LLM dans les applications critiques, en combinant la recherche académique, les innovations qui ont été présentées au cours de conférences de sécurité, et les outils de référence tels que MITRE ATLAS
Thales s’engage pour l’emploi et l’insertion des personnes en situation de handicap. A ce titre, notre établissement Thales Research&Technology France est reconnu Organisme Handi-Accueillant
Tous nos stages sont conventionnés et soumis à une gratification dont le montant est déterminé selon votre niveau d’études.
Thales reconnait tous les talents, la diversité est notre meilleur atout. Postulez et rejoignez nous !* Salary range is an estimate based on our InfoSec / Cybersecurity Salary Index 💰
Tags: C Cloud LLMs Python SANS TTPs
Perks/benefits: Conferences
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.