L'IA dans le recrutement IT : gadget ou game changer ?
Du matching par mots-cles au scoring par embeddings
Sur une mission pour un cabinet de recrutement IT (800 postes/an), nous avons remplace le keyword matching Elasticsearch par un pipeline base sur des embeddings. L'ancien systeme affichait un taux de pertinence de 35% selon les recruteurs.
Le modele sentence-transformers (all-MiniLM-L6-v2) vectorise les CV et les fiches de poste. Le scoring cosine similarity remplace le TF-IDF. Resultat apres 3 mois : pertinence a 72%, temps de pre-selection divise par 4.
Pipeline Dataiku et Agentic AI
L'orchestration tourne sur Dataiku : ingestion PDF (Apache Tika), nettoyage, vectorisation, scoring ML, puis push des top-10 candidats dans le CRM. Batch nocturne + refresh temps reel a chaque nouveau CV.
La brique Agentic AI ajoutee ensuite automatise le sourcing : un agent autonome parcourt LinkedIn et les jobboards, qualifie les profils selon les criteres du poste, et genere un message de contact personnalise. Gain : 15h/semaine pour l'equipe sourcing.
Limites et biais
- Biais de genre : le modele surnotait les profils masculins sur les postes DevOps. Correction par re-echantillonnage du dataset.
- Precision vs recall : 78% / 65%. Les profils reconvertis passent encore entre les mailles.
- RGPD : anonymisation obligatoire, consentement explicite pour le scoring automatise.
L'IA ne remplace pas le recruteur. Elle lui evite de lire 200 CV pour n'en retenir que 15.
Laura
Consultant chez AGATE IT
Expert en data & ia, notre consultant partage ses retours d’expérience et ses bonnes pratiques pour vous aider dans vos projets.