Paramètres d'affichage

Choisissez un thème pour personnaliser l'apparence du site.

Diagoriente propose un moteur de recherche sémantique innovant pour l’orientation professionnelle


04/10/2024

Le moteur de recherche de Diagoriente, capable de traiter des requêtes en langage naturel, facilite la recherche de métiers, de compétences et de formations et compte déjà plus d'un million de requêtes.

Partager la page

Depuis son lancement en juillet, Diagoriente, acteur de l’accompagnement à l’orientation professionnelle, a franchi une étape décisive en déployant un moteur de recherche sémantique de dernière génération. Avec plus d’un million d’appels enregistrés et une moyenne de 400 000 requêtes par mois, cette technologie joue désormais un rôle clé pour les utilisateurs des services de Diagoriente, ainsi que pour des acteurs de l'orientation professionnelle partenaires tels que La Bonne Alternance (en beta test) et Immersion Facilitée. Ce succès repose sur une innovation technique majeure, qui facilite la recherche de métiers, de compétences et de formations, même pour les utilisateurs en difficulté avec l’écriture ou ne maîtrisant pas les termes spécifiques.

Un moteur de recherche sémantique : l’intelligence derrière l’expérience utilisateur

L’innovation centrale de cette nouvelle technologie réside dans son moteur de recherche sémantique, capable de traiter des requêtes en langage naturel tout en interprétant le sens des termes utilisés. Contrairement aux moteurs traditionnels basés sur des correspondances exactes de mots, le moteur de Diagoriente exploite des méthodes avancées de traitement du langage pour comprendre les nuances et la signification des recherches, même lorsque les utilisateurs emploient des synonymes ou des formulations approximatives.

L’objectif est de permettre une recherche intuitive : les utilisateurs n’ont pas besoin de connaître précisément les termes présents dans la base de données pour obtenir des résultats pertinents. Par exemple, une requête comme « crèche » renverra des compétences relatives à la puériculture, même si le terme exact « crèche » n’est pas présent dans les intitulés des compétences. Le moteur de recherche s’appuie sur des techniques de lemmatisation (traitement apporté à un texte pour réduire les mots d'un même champ lexical à un seul mot de référence) et d’enrichissement sémantique, combinant ainsi puissance de traitement et expérience utilisateur.

Un défi technique : l’enjeu de la correspondance sémantique

Les travaux réalisés sur ce moteur de recherche font suite à une série d’améliorations amorcées dès 2022, incluant l’intégration de technologies complexes comme le TF-IDF (Term Frequency-Inverse Document Frequency) pour évaluer l'importance d'un terme et le Word2Vec pour le calcul des proximités sémantiques entre les termes, un vrai défi technique. Le moteur compare les mots-clés de la requête avec les documents (compétences, métiers, formations) en utilisant ces scores pour sélectionner les résultats les plus pertinents. Mais ce qui distingue véritablement ce système, c’est sa capacité à enrichir les requêtes à partir d’un vaste ensemble de vocabulaire, facilitant ainsi la correspondance avec des documents au vocabulaire varié. 

La collaboration avec des acteurs comme la Caisse des Dépôts a permis de constituer des jeux de tests pour évaluer et améliorer les performances du moteur. 

Depuis début 2024, un LLM (modèle de langage nouvelle génération) intégré au moteur améliore encore sa capacité à comprendre les requêtes d’utilisateurs sur les métiers, compétences et formations et à trouver les documents qui s’y rapportent par le sens.

La fusion des référentiels, via les processus ETL, au service de la performance

Un autre aspect technique clé dans le développement du moteur de recherche de Diagoriente est l’utilisation de pipelines ETL (Extract, Transform, Load : processus permettant d'extraire, de transformer et de charger des données d'un système à un autre) pour fusionner les différents référentiels de données. Ces pipelines permettent de centraliser et d’harmoniser les données provenant de diverses sources, facilitant ainsi l’intégration de nouveaux partenaires et augmentant la performance du service. Grâce à ce système d’extraction et de transformation de données, Diagoriente peut rapidement intégrer et structurer de nouveaux jeux de données, augmentant ainsi la couverture et la pertinence des résultats proposés par le moteur de recherche.

Ces pipelines ETL jouent un rôle déterminant dans la gestion des jeux de données, que ce soit pour la mise à jour des bases de compétences ou la fusion des référentiels métiers.

Une API puissante pour la scalabilité

L’une des réussites majeures de cette innovation est également l’ouverture du moteur de recherche sous forme d’API (interface permettant de connecter un service logiciel à un autre), accessible à d’autres acteurs de l’orientation professionnelle. Cette API puissante, développée avec FastAPI, permet d’utiliser les fonctionnalités du moteur de recherche tout en offrant une grande flexibilité et scalabilité pour l’intégration dans différents systèmes. Des partenaires comme La Bonne Alternance (beta test) et Immersion Facilitée ont déjà intégré cette API à leurs services, permettant à leurs utilisateurs de bénéficier des capacités avancées du moteur de recherche de Diagoriente dans leur recherche de métiers, de compétences et de formations.

En enrichissant continuellement l’API avec de nouvelles fonctionnalités, telles que la correction automatique, l’auto-complétion ou encore l’enrichissement de requêtes par des dictionnaires spécialisés, Diagoriente s’assure que le moteur de recherche reste à la pointe de la technologie, tout en répondant aux besoins spécifiques de chaque partenaire.

Une réponse à un enjeu d’accessibilité

L’aspect le plus important de cette innovation réside sans doute dans son impact social. En facilitant la recherche d’informations complexes pour des utilisateurs parfois éloignés des pratiques numériques ou en difficulté avec l’écriture, Diagoriente répond aux enjeux d'accessibilité et contribue à réduire les inégalités face à l’emploi et à la formation. Le moteur de recherche ne se contente pas de fournir des résultats techniques précis sur les métiers, les compétences et les formations ; il est conçu pour accompagner les utilisateurs, en simplifiant la navigation et en proposant des résultats pertinents même lorsque les requêtes sont formulées de manière imprécise.

Cette approche humaniste de la technologie, associée à un moteur puissant et évolutif, permet à Diagoriente de se positionner comme un acteur incontournable dans le domaine de l’orientation professionnelle.

Conclusion : un bilan prometteur

Avec plus d’un million d’appels depuis son lancement et un usage croissant à travers les différents services partenaires, le moteur de recherche de Diagoriente a déjà prouvé sa valeur, ce qui semble lui offrir un avenir prometteur. Sa capacité à comprendre, enrichir et contextualiser les recherches des utilisateurs le distingue des solutions traditionnelles. Alors que l’écosystème de l’orientation professionnelle évolue rapidement, Diagoriente continue de repousser les limites de l’innovation technologique au service de l'orientation et de l’accès à l’information pour tous.

Lire l'étude de la performance du moteur de recherche en situation réelle.

Partager la page


Découvrez nos autres articles