Doctorant F/H Thèse : Enrichissement sémantique de requêtes et analyse de jeux de données métagénomiques

September 3, 2024

Inria

Rennes

OTHER

Type de contrat : CDD

Niveau de diplôme exigé : Bac + 5 ou équivalent

Fonction : Doctorant

Niveau d'expérience souhaité : Jeune diplômé

A propos du centre ou de la direction fonctionnelle

Le centre Inria de l'Université de Rennes est l'un des neuf centres d’Inria et compte plus d'une trentaine d’équipes de recherche. Le centre Inria est un acteur majeur et reconnu dans le domaine des sciences numériques. Il est au cœur d'un riche écosystème de R&D et d’innovation : PME fortement innovantes, grands groupes industriels, pôles de compétitivité, acteurs de la recherche et de l’enseignement supérieur, laboratoires d'excellence, institut de recherche technologique.

Contexte et atouts du poste

Les données génomiques permettent des avancées cruciales en médecine, écologie, surveillance des océans et agronomie. Une limitation majeure est qu'il est impossible de consulter l'intégralité de ces données (pétaoctets de séquences).
Le projet Omic Finder (https://project.inria.fr/omicfinder/) fournira un moteur de recherche capable de lever cette contrainte. L'idée algorithmique centrale d'un moteur de recherche génomique est d'indexer et d'interroger de petits mots exacts (des centaines de milliards sur des millions de jeux de données), ainsi que les métadonnées associées. Le projet rassemble des équipes d'Inria spécialisées en algorithmique sur les chaînes, ontologies, architectures informatiques et les données distribuées. Elles apporteront des avancées algorithmiques, notamment en termes de frugalité computationnelle, de distributions d'index astucieuses, et de filtrage intelligent basé sur les ontologies des questions et réponses.
L'idée centrale d'Omic Finder est de construire un index de petits mots exacts présents dans des millions de jeux de données, afin qu'une requête basée sur cet index renvoie la liste des jeux de données contenant (au moins) une séquence comportant ce mot. Cela correspond à l'aspect syntaxique de la résolution des requêtes. Cette thèse de doctorat se concentre sur la création et l'exploitation d'une couche sémantique supplémentaire basée sur les métadonnées décrivant les jeux de données.

Mission confiée

La thèse portera sur :
des Requêtes intelligentes : Tout d'abord, cela permettra aux utilisateurs de spécifier des critères de pertinence a priori qui réduiront le bruit et amélioreront les performances. Par exemple, cela permettra à un utilisateur de spécifier qu'il s'intéresse au microbiome intestinal humain, de sorte que les jeux de données contenant des séquences correspondant au mot, mais obtenus lors d'une expédition océanique Tara, puissent être ignorés. Encore mieux, Omic Finder n'orientera même pas cette requête vers le dépôt Tara, évitant ainsi des calculs inutiles. Notez que nous souhaitons prendre en charge plusieurs niveaux de granularité afin de se concentrer sur le microbiome intestinal des mammifères, ou plus spécifiquement sur le microbiome intestinal des mammifères omnivores.
des Réponses intelligentes : Ensuite, cela permettra au moteur de requêtes d'Omic Finder de fournir une caractérisation a posteriori des jeux de données, similaire aux analyses d'enrichissement classiques. Par exemple, on pourrait comparer les fréquences des annotations dans les jeux de données retournés par la requête avec les fréquences des mêmes annotations dans l'ensemble des jeux de données, ou parmi les jeux de données qui correspondent aux critères sémantiques. Par exemple, on pourrait découvrir que les jeux de données retournés par une requête sur un mot particulier dans les jeux de données liés au microbiome intestinal humain sont enrichis en maladies liées au foie par rapport aux jeux de données liés au microbiome intestinal humain en général.

Principales activités

Les contributions de cette thèse porteront sur :

la création d'un index sémantique des jeux de données. Cela nécessitera de récupérer les métadonnées des principaux dépôts de jeux de données et de les représenter dans un schéma unifié, basé sur des technologies du Web sémantique telles que RDF, RDFS+OWL et bioschemas.

La comparaison du compromis entre un stockage centralisé et décentralisé des annotations sémantiques en termes de simplicité de mise en œuvre, d'impact sur les performances et de scalabilité.

la capacité des utilisateurs à exprimer des requêtes sémantiquement riches. Cela reposera sur SPARQL pour représenter les requêtes, mais nécessitera une interface utilisateur adéquate.

la capacité à décrire et caractériser les résultats des requêtes.

Compétences

Compétences techniques et niveau requis : Programmation (Python ou Java)
Langues : Français ou Anglais
Compétences additionnelles appréciées : Semantic Web

Avantages

Restauration subventionnée
Transports publics remboursés partiellement
Possibilité de télétravail à hauteur de 90 jours annuels
Prise en charge partielle du coût de la mutuelle

Rémunération

Salaire mensuel brut de 2 100 € les deux premières années et 2 190 € la troisième

Informations générales

Thème/Domaine : Biologie numérique
Systèmes d'information (BAP E)
Ville : Rennes
Centre Inria : Centre Inria de l'Université de Rennes
Date de prise de fonction souhaitée : 2024-10-01
Durée de contrat : 3 ans
Date limite pour postuler : 2024-11-03

Attention: Les candidatures doivent être déposées en ligne sur le site Inria. Le traitement des candidatures adressées par d'autres canaux n'est pas garanti.

Consignes pour postuler

Merci de déposer en ligne CV, lettre de motivation et éventuelles recommandations

Sécurité défense :
Ce poste est susceptible d’être affecté dans une zone à régime restrictif (ZRR), telle que définie dans le décret n°2011-1425 relatif à la protection du potentiel scientifique et technique de la nation (PPST). L’autorisation d’accès à une zone est délivrée par le chef d’établissement, après avis ministériel favorable, tel que défini dans l’arrêté du 03 juillet 2012, relatif à la PPST. Un avis ministériel défavorable pour un poste affecté dans une ZRR aurait pour conséquence l’annulation du recrutement.
Politique de recrutement :
Dans le cadre de sa politique diversité, tous les postes Inria sont accessibles aux personnes en situation de handicap.

Contacts

Équipe Inria : DYLISS
Directeur de thèse :
Dameron Olivier / olivier.dameron@irisa.fr

A propos d'Inria

Inria est l’institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l’interface d’autres disciplines. L’institut fait appel à de nombreux talents dans plus d’une quarantaine de métiers différents. 900 personnels d’appui à la recherche et à l’innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'eﬀorce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.

We regret to inform you that this job opportunity is no longer available

Latest Job Opportunities

September 22, 2024

La Banque Postale

Juriste M&A confirmé– partenariats stratégiques F/H

Paris

View Details

September 22, 2024

APPARTCOLOC

Assistant Administratif (H/F)

Paris 2e

OTHER

View Details

September 22, 2024

Welcome at Work

Hôte d'accueil et évènementiel F/H - Temps partiel

Paris

OTHER

View Details

September 22, 2024

BABILOU PARIS BOURSAULT

Auxiliaire petite enfance H/F

Paris 17e

OTHER

View Details

September 22, 2024

Salonletoile

Prothésiste ongulaire H/F indépendant

Clichy-sous-Bois

OTHER

View Details

Similar Jobs

September 12, 2024

Inria

Post-Doctorant F/H Recherche locale pour les problèmes de bandits-manchots combinatoires

Rennes

OTHER

View Details

September 17, 2024

CNRS

Doctorant(e) H/F

Les Anses-d'Arlet

OTHER

View Details

September 20, 2024

CNRS

Doctorant (H/F)

Caen

OTHER

View Details

September 20, 2024

CNRS

Postdoctorant (H/F)

Toulouse

OTHER

View Details

September 20, 2024

Université d'Angers

Post-doctorant.e en Psychologie, orientation clinique et psychodynamique

Angers

OTHER

View Details

September 21, 2024

Institut Curie

POST DOCTORANT EN IMMUNOLOGIE (H/F)

Paris

OTHER

View Details

New Jobs from This Company

September 20, 2024

Inria

PhD Position F/M PhD position: Steering formal reasoning problems generation for LLM reasoning improvement

Villeneuve-d'Ascq

OTHER

View Details

September 12, 2024

Inria

Post-Doctorant F/H Recherche locale pour les problèmes de bandits-manchots combinatoires

Rennes

OTHER

View Details

Explore More Opportunities at Inria

Job Opportunities in France

Inria

Doctorant F/H Thèse : Enrichissement sémantique de requêtes et analyse de jeux de données métagénomiques

A propos du centre ou de la direction fonctionnelle

Contexte et atouts du poste

Mission confiée

Principales activités

Compétences

Avantages

Rémunération

Informations générales

Consignes pour postuler

Contacts

A propos d'Inria

Latest Job Opportunities

La Banque Postale

Juriste M&A confirmé– partenariats stratégiques F/H

APPARTCOLOC

Assistant Administratif (H/F)

Welcome at Work

Hôte d'accueil et évènementiel F/H - Temps partiel

BABILOU PARIS BOURSAULT

Auxiliaire petite enfance H/F

Salonletoile

Prothésiste ongulaire H/F indépendant

Similar Jobs

Inria

Post-Doctorant F/H Recherche locale pour les problèmes de bandits-manchots combinatoires

CNRS

Doctorant(e) H/F

CNRS

Doctorant (H/F)

CNRS

Postdoctorant (H/F)

Université d'Angers

Post-doctorant.e en Psychologie, orientation clinique et psychodynamique

Institut Curie

POST DOCTORANT EN IMMUNOLOGIE (H/F)

New Jobs from This Company

Inria

PhD Position F/M PhD position: Steering formal reasoning problems generation for LLM reasoning improvement

Inria

Post-Doctorant F/H Recherche locale pour les problèmes de bandits-manchots combinatoires

Jobs Around Me

Quick Links

Contact Us