INTERIM - Ingénieur informatique / traitement de données (H/F) - Brest - IFREMER

Publiée le: 11/21/2022

Résumé de l'offre

  • Type de contrat:
    Intérim
  • Lieu:
    Brest
  • Publiée le:
    11/21/2022

Description de l'offre

Poste à pourvoir: INTERIM - Ingénieur informatique / traitement de données (H/F)

Référence du poste : PV-2022-1240

Structure d'accueil : Département Oceanographie et Dynamique des Ecosystemes

Unité de recherche - Laboratoire d’océanographie physique et spatiale

Equipe de recherche «Océanographie spatiale et interface air-mer»

Localisation :  Brest, Bretagne, FR

Durée du contrat : 8 mois

 

Date de clôture de réception de candidatures : 11/12/2022

 

 

Description de l'offre:

Le Laboratoire d'Océanographie Physique et Spatiale (LOPS) est une Unité Mixte de Recherche placée sous la tutelle du Centre National de la Recherche Scientifique (CNRS www.cnrs.fr), de l’Institut français de recherche pour l'exploitation de la mer (Ifremer www.ifremer.fr), de l’Institut de Recherche pour le Développement (IRD www.ird.fr) et de l’Université de Bretagne Occidentale (UBO www.univ-brest.fr). Il est également laboratoire de l'Institut Universitaire Européen de la Mer (IUEM). En tant qu’unité de recherche, le LOPS développe et participe à des programmes de recherche en océanographie qui contribuent au développement des connaissances sur la dynamique des océans à différentes échelles de temps et d'espace et qui étudient les relations de l'océan avec d’autres compartiments du système terrestre comme l’atmosphère, les glaces et les organismes vivants. Il participe également à la définition des moyens d'observation in situ et satellite, notamment par son laboratoire Satellites et Interface Air-Mer (LOPS-SIAM) qui élabore et diffuse via le centre de données CERSAT des produits de qualité à la communauté scientifique basés sur des observations satellite. L'utilisation pour ces domaines d'étude de bases de données massives requiert à la fois des moyens de stockage et de calcul distribué importants, disponibles en interne ou sur des plateformes de cloud computing externes, ainsi que la mise en œuvre d'outils de traitement avancés tirant parti de ces ressources de façon optimale pour l'analyse et la combinaison des différentes sources d'observation, comme les outils fournis dans le framework Pangeo (xarray, Dask,...).

Les volumes de données, qu’elles proviennent de systèmes d’observation ou de modèles numériques, augmentent de nos jours de façon exponentielle, rendant leur transfert et leur duplication locale pour analyse et traitement de plus en plus coûteux. Un nouveau paradigme s’impose donc, consistant à mettre ces données sur des plateformes partagées avec des moyens de traitement distant associés.

Au sein d’une équipe de chercheurs et d’ingénieurs de recherche couvrant différentes compétences scientifiques et techniques, vous contribuerez au développement et à la mise en œuvre de traitements et re-traitements  scientifiques massifs sur des environnements de type cloud ou HPC (High Performance Computing), dans le cadre de développements algorithmiques et de production de données.

Vous serez placé(e) sous la responsabilité directe du chef du service Satellites et Interface Air-Mer (SIAM) au sein du département LOPS.



Missions principales

Avec un profil Ingénieur en Informatique/Traitement de données , vous déploierez  des outils ou chaînes de traitement scientifique sur des plateformes HPC (comme la calculateur Datarmor d’Ifremer) et cloud (CREODIAS, WekEO, Terra Cloud, NASA Earth Data, European Weather Cloud, …) et contribuera à améliorer des outils Python pour le traitement de données scientifiques massives, hétérogènes et distribuées sur ces plateformes. Ces travaux s’inscriront notamment dans le cadre du projet SARWAVE avec l’Agence Spatiale Européenne (ESA) dont la finalité est la génération et la dissémination vers la communauté scientifique d’une série longue de mesures de vagues produites avec des algorithmes innovants à partir d’observations par satellites.



Activités principales

Dans le cadre de ce poste, Vous mettrez en œuvre les procédures et solutions techniques permettant aux utilisateurs scientifiques de migrer et lancer des traitements ou analyses sur des plateformes locales (HPC) ou externes (cloud scientifiques), en support à des projets du laboratoire mais aussi pour aider les utilisateurs locaux à appréhender ces technologies et y adapter leurs traitements. Vous devrez en particulier définir la meilleure stratégie d’allocation de ressources, déployer et tester des outils permettant d’orchestrer et suivre le traitement de collections de milliers d’images satellite sur plusieurs nœuds ou machines virtuelles, définir des bonnes pratiques et recettes, et décliner la méthodologie mise en place sur différents cas d’usage. Vous devrez donc être familiarisé(e) avec les outils de conteneurisation et de réservation de ressources sur calculateurs distants, les outils de   distribution et d’orchestration de tâches sur des nœuds multiples (traitements de type job array)  ainsi que des ordonnanceurs associés (PBS, SLURM, ...). Des connaissances sur la librairie scientifique Pangeo (xarray, Dask, ...) seront également appréciées dans un but d’adaptation et d’optimisation de codes scientifiques écrits en Python voués à être déployés sur des HPC.

Le cas d’utilisation spécifique sera le projet SARWAVE. L’objectif principal de SARWAVE est le développement d’algorithmes innovants pour mesurer des paramètres qui décrivent l’état de mer à partir des acquisitions à large fauchées du satellite Sentinel-1. La phase finale du projet inclut également la production d’un jeux de données de tests massif (l’ensemble des observations acquises sur les eaux européennes) à destination d’applications scientifiques qui seront investiguées dans le projet (e.g. propagation des vagues dans la glace, génération des vagues dans les évènements extrêmes comme les dépressions polaires, ...), mais aussi plus largement à l’ensemble de la communauté scientifique. Dans ce contexte, les missions principales de ce poste seront directement liées à la mise en place d’une capacité de traitement de données massifs et de son opération pour les aspects algorithmiques ainsi qu’à de production du jeux de données final. En particulier, les développements algorithmiques nécessitent la mise en place

  • d’un outil de production de jeux de données en soutien à des investigations algorithmiques utilisant les techniques de Deep Learning
  • d’un banc d’essais pour le traitement et retraitement agile d’un grand nombre de données afin de concevoir, implémenter, produire et valider les versions successives dans un cycle le plus court possible.

Pour ce faire :

  • Vous mettrez en œuvre des workflows scientifiques dans des environnements de recherche virtualisés permettant la reproduction de traitements sur des données volumineuses et hétérogènes.
  • Vous fournirez les éléments permettant de valider les choix techniques et d’évaluer les performances pour des retraitements massifs
  • Vous apporterez des modifications ou évolutions aux traitements déployés (Python, Dask, xarray,….) ou formats de données (Zarr, parquet,…) afin d’optimiser la durée de traitement, les ressources utilisées ou l’orchestration des différentes tâches, en fonction de la cible de traitement
  • Vous accompagnerez et apporterez un support aux chercheurs et ingénieurs du LOPS dans leur transition à l’utilisation de plateformes cloud, développera des recettes et guides pour les différents cas d’utilisation ou plateformes.


Champs relationnel

  • En interne:   Le poste sera localisé au sein du service ODE-LOPS et impliquera des échanges avec différents chercheurs ou groupes de chercheur.
  • En externe:  interactions les différents opérateurs de cloud externe
 

 

Profil recherché

  • Ingénieur informaticien  Bac+4 ou Bac+5 (Master, grande école ou équivalent)


Compétences mises en œuvre

Compétences techniques / métiers

  • Solides compétences de programmation scientifique en Python (conda, xarray, dask, notebooks Jupyter),
  • Utilisation courante des systèmes d’exploitation Linux (commandes, scripts),
  • Utilisation courante des technologies de conteneurisation et environnements cloud et HPC : docker, docker swarm, kubernetes, singularity, Helm, stockage objet, data lakes, orchestrateurs
  • Les connaissances suivantes sont un plus:
    • formats de fichiers NetCDF et zarr/parquet
  • méthodologies de développement en mode “DevOPS” (gitlab, CI, binderhub)
  • Anglais écrit et oral

Qualités personnelles

  • Sens du service
  • Goût pour relever les défis techniques
  • Esprit d’initiative et autonomie pour prendre en charge une infrastructure projet dans des contextes variés.
  • Bonnes capacités de communication et de travail en équipe,
  • Un souci du travail finalisé et opérationnel (tests, suivi des utilisateurs et de leurs besoins, ...)
 

 

Conditions de travail

  • Temps plein (35h)

 

L’Ifremer

Reconnu dans le monde entier comme l’un des tout premiers instituts en sciences et technologies marines, l’Ifremer s’inscrit dans une double perspective de développement durable et de science ouverte. Il mène des recherches, innove, produit des expertises pour protéger et restaurer l’océan, exploiter ses ressources de manière responsable, et partager les connaissances et les données marines afin de créer de nouvelles opportunités pour une croissance économique respectueuse du milieu marin.

Présents sur toutes les façades maritimes de l’hexagone et des outremers, ses laboratoires sont implantés sur une vingtaine de sites dans les trois grands océans : l’océan Indien, l’Atlantique et le Pacifique. Pour le compte de l’Etat, il opère la Flotte océanographique française au bénéfice de la communauté scientifique nationale. Il conçoit ses propres engins et équipements de pointe pour explorer et observer l’océan, du littoral au grand large et des abysses à l’interface avec l’atmosphère.

Ouverts sur la communauté scientifique internationale, ses 1500 chercheurs, ingénieurs et techniciens font progresser les connaissances sur l’une des dernières frontières inexplorées de notre planète ; ils contribuent à éclairer les politiques publiques et à l’innovation pour une économie bleue durable. Leur mission consiste aussi à sensibiliser le grand public aux enjeux maritimes.

Fondé en 1984, l'Ifremer est un établissement public à caractère industriel et commercial (EPIC), dont le budget avoisine 240 millions d’Euros. Il est placé sous la tutelle conjointe des ministères de l'Enseignement supérieur, de la Recherche et de l’Innovation (MESRI), de la Mer (MinMer), de la Transition écologique et solidaire (MTES), de l’Agriculture et de l’Alimentation (MAA).

 

Pour postuler

Date de clôture de réception de candidatures : 11/12/2022

Toutes nos candidatures sont traitées exclusivement via notre site Carrières.