Postée il y a 4 heures
Ce poste est à pourvoir dans le cadre de l’ANR High-Vision (ANR-24-CE38-4079), financé pour 4 ans. La mission de la personne recrutée consistera en du développement d’applications de vision par ordinateur (segmentation analyse par apprentissage automatique) et en traitement automatique du langage sur de grandes quantités de photographies historiques numérisées et de leurs métadonnées.
Activités
- gestion, enrichissement et structuration des données du projet
- modélisation des données (adaptation d’un modèle existant)
- mise en œuvre du plan de gestion des données
- extraction d’images et de légendes dans la presse numérisée à l’aide de plateformes dédiées et avec accompagnement (voir notamment la plateforme AIKON, projet ERC Discover: https://erc-discover.github.io/ )
- enrichissement des métadonnées (segmentation et transcription des informations inscrites au dos des photographies de presse, extraction automatique des entités nommées) avec l’accompagnement de TEKLIA (plateforme Arkindex: https://teklia.com/our-solutions/arkindex/ )
- préparation, stockage et édition des jeux de données
- coordination de stagiaires dans le cadre de sous-projets d’annotation et de segmentation d’images, utilisation de plateformes existantes
- participation à la rédaction de la documentation du projet et de notes de recherche sur le carnet du projet
- publication de data papers et d’articles avec l’aide de l’équipe
Compétences
• expérience dans les applications de vision par ordinateur
• intérêt pour les approches multimodales (texte/image) appliquées au patrimoine photographique ancien
• maîtrise de Python, Matlab et des environnements
• connaissance des standards patrimoniaux (XML, METS, IIIF)
• développement d’un modèle de données et d’un workflow adapté au patrimoine photographique
• capacité à diriger une équipe de stagiaires pour créer des jeux de données vérité terrain d’annotations de photographies anciennes sur des plateformes standards (projet AIKON/ERC Discover, Roboflow ou Arkindex)
• maîtrise du suivi de projets et du versionnage (Data Management Plan, Git-Hub, Zenodo)
• autonomie, compétences relationnelles, travail en équipe
• maîtrise de l’anglais (et préférablement) du français
Contexte de travail
Ce projet regroupe un consortium de laboratoires en sciences humaines, en vision par ordinateur et des institutions archives (Echelles, LIP6, LIPADE, Image Centre Toronto, SHD-Vincennes, Archives Nationales, MSH Mondes, Bibliothèque Historique de la Ville de Paris). Le projet s’insère en outre dans les travaux du consortium Humanum PICTORIA (https://pictoria.hypotheses.org/ ). Son objectif est de traiter et d’analyser de vastes quantités de photographies de presse de la fin du 19ᵉ siècle aux années 1940 dans une cadre interdisciplinaire. Les collections traitées sont peu documentées et ont appartenu à des journaux ou des agences d’image dont les archives écrites n’ont pas été conservées. Un traitement massif de ces images, pour retracer leurs circulations dans la presse de l’époque notamment, est le seul moyen de comprendre comment se structure une première économie globale de la photographie d’actualité au tournant du 20e siècle. Nous recherchons un candidat motivé et intéressé par l’articulation entre données, vision par ordinateur et histoire de la photographie. En collaboration avec l’équipe interdisciplinaire du projet High Vision, elle/il travaillera à la mise en œuvre de technologies d'apprentissage automatique, de traitement du langage naturel et de vision par ordinateur, pour soutenir ce projet sur des données historiques complexes. La personne rejoindra une équipe de plusieurs doctorants et stagiaires qui travaillent à la mise en place de processus et de pipelines de données documentés et accessibles. Le projet fournira des solutions transférables en matière d’approches semi-automatiques du patrimoine photographique au profit des institutions qui cherchent à traiter de vastes collections d’images.
Ce projet regroupe un consortium de laboratoires en sciences humaines, en vision par ordinateur et des institutions archives (Echelles, LIP6, LIPADE, Image Centre Toronto, SHD-Vincennes, Archives Nationales, MSH Mondes, Bibliothèque Historique de la Ville de Paris). Le projet s’insère en outre dans les travaux du consortium Humanum PICTORIA (https://pictoria.hypotheses.org/ ). Son objectif est de traiter et d’analyser de vastes quantités de photographies de presse de la fin du 19ᵉ siècle aux années 1940 dans une cadre interdisciplinaire. Les collections traitées sont peu documentées et ont appartenu à des journaux ou des agences d’image dont les archives écrites n’ont pas été conservées. Un traitement massif de ces images, pour retracer leurs circulations dans la presse de l’époque notamment, est le seul moyen de comprendre comment se structure une première économie globale de la photographie d’actualité au tournant du 20e siècle. Nous recherchons un candidat motivé et intéressé par l’articulation entre données, vision par ordinateur et histoire de la photographie. En collaboration avec l’équipe interdisciplinaire du projet High Vision, elle/il travaillera à la mise en œuvre de technologies d'apprentissage automatique, de traitement du langage naturel et de vision par ordinateur, pour soutenir ce projet sur des données historiques complexes. La personne rejoindra une équipe de plusieurs doctorants et stagiaires qui travaillent à la mise en place de processus et de pipelines de données documentés et accessibles. Le projet fournira des solutions transférables en matière d’approches semi-automatiques du patrimoine photographique au profit des institutions qui cherchent à traiter de vastes collections d’images.
Contraintes et risques
Les fonds photographiques traités contiennent des images de violence et de nudité.
Le candidat devra travailler dans les bureaux du LIP6 (Sorbonne Université) et du LIPADE (Paris Cité) à l'occasion pour travailler avec les doctorants et les stagiaires qui s'y trouvent (des bureaux seront fournis).
La participation à des conférences internationales est également prévue et financée.
Les fonds photographiques traités contiennent des images de violence et de nudité.
Le candidat devra travailler dans les bureaux du LIP6 (Sorbonne Université) et du LIPADE (Paris Cité) à l'occasion pour travailler avec les doctorants et les stagiaires qui s'y trouvent (des bureaux seront fournis).
La participation à des conférences internationales est également prévue et financée.