Projet DRIVE-SPC

Objectif : Mettre en place une solution harmonisée pour la gestion, la traçabilité et la sécurisation des données d’imagerie, complexes multi-sources et variables dans le temps, produites par les plateformes d’imageries du vivant expérimentales de la COMUE SPC (Sorbonne Paris Cité) et les laboratoires partenaires (intra et extramuros).

Projet : Logiciel de Product Life Management pour l’indexation de données d’imagerie depuis des sources multiples et avec des formats multiples, et leur croisement avec des données de toutes autres origines et natures.

Bénéfices attendus : Mise en commun de larges banques de données images multiparamétriques et multimodales permettant 1° un accès centralisé facilité aux ressources pour le stockage et les outils d’analyse, 2° une fouille de données et une analyse en open source sur le mode des larges données (Big Data), 3° la  mise en correspondance des images paramétriques issues de modalités d’acquisition différentes sur des sites différents, 4° la formation des étudiants par étude de cas et de similarités et formation par le biais d’exercices en crowd-sourcing.

DriveEcoData

Contexte et justification

Sorbonne-Paris-Cité dispose de moyens en instruments et en personnel pour l’imagerie expérimentale du vivant répartis sur une dizaine de sites :

8 équipes réparties sur 6 sites à Paris Descartes, regroupées au sein de la plateforme d’Imageries du Vivant, ex-Plateforme d’Imagerie du Petit Animal (PIPA) rebaptisée pour tenir compte des évolutions en cours :

  • PARCC-HEGP : IRM 4,7T ; Tomographie d’émission de positons petit animal (µTEP) ; micro-endoscopie de fluorescence
  • Institut Cochin : Echographie haute résolution et ultrarapide
  • Institut des Cordeliers : Echographie de contraste
  • Faculté de chirurgie dentaire : Radiographie (RX) et tomodensitométrie (TDM) X haute résolution
  • Faculté de pharmacie : Imagerie optique de fluorescence et bioluminescence développement de sondes optiques
  • Centre des saints-Pères : Imagerie par Résonance Paramagnétique Electronique (RPE, en cours de transfert vers le site Tarnier) ; et LIPADE (Laboratoire d’Informatique PAris DEscartes) : Analyse et Traitement d’Images Biologiques (ATIB)

3 sites à Paris Diderot :

  • Faculté de médecine Bichat : IRM 7T
  • Bichat CEFI : µTEP, échographie
  • Faculté de Médecine Lariboisière : RX et TDM-X à IMOSAR (Plateforme d’Imagerie Ostéo-articulaire)

1 site à Paris 13

  • Laboratoire d’Informatique de Paris-Nord (LIPN) responsable du Cloud Computing du programme interdisciplinaire SPC Imageries du Vivant (Villetaneuse).

La coordination des sites se structure progressivement : la plateforme PIPA de Paris Descartes a été labélisée IBISA en 2007 et évaluée par l’AERES en 2012. Depuis 2014, Sorbonne Paris Cité soutient le programme interdisciplinaire « Imageries du Vivant » dans lequel sont inclus toutes les équipes des sites ci-dessus ; ce sont aussi les principaux acteurs du nœud FLI Paris Centre, l’un des six nœuds de l’infrastructure nationale France Life Imaging.

La première force de cet ensemble est son implantation au sein de centres de recherche importants (PARCC, CEFI, Institut Cochin, Institut des Cordeliers, Centre des Sts-Pères, Bichat), répondant aux besoins réels d’un nombre important d’utilisateurs pour l’accès à des équipements semi lourds. Sa seconde force est de couvrir une grande partie des modalités d’imageries du vivant. La troisième est d’associer l’expertise des chercheurs associés au savoir-faire des ingénieurs spécialisés qui y sont affectés, ce qui permet de fonctionner en plateforme ouverte vers les demandes des utilisateurs extérieurs et assure ainsi un certain degré d’autonomie financière.  La quatrième force est d’avoir entamé un processus de coordination pour structurer l’activité au service de la communauté biologique et médicale. Enfin, l’implantation de plusieurs sites au sein ou à proximité immédiate des services hospitaliers collègues (radiologie et imagerie, médecine nucléaire et biophysique) et utilisateurs (oncologie, cardiologie, etc) est aussi un atout pour les possibilités de transfert qu’elle offre.

Historiquement cette activité n’a pas été pensée au départ comme une structure Sorbonne Paris Cité mais comme une ressource locale. L’adéquation avec les besoins locaux a permis de faire naitre des expertises spécialisées d’excellence dans des environnements demandeurs, les instruments d’imagerie étant des équipements délicats sur lesquels l’expert doit garder la main au risque de perdre la qualité des résultats.

Objectifs

L’objectif du projet DRIVE est de mutualiser les moyens de stockage, d’analyse et de traitement des données des plateformes d’imageries expérimentales du vivant de SPC. L’ambition est de renforcer le maillage de l’imagerie expérimentale du vivant de SPC pour lui donner les moyens de rivaliser avec celle des centres leaders au niveau mondial comme les ICMIC (Integrated Molecular and Cellular Imaging Centres) nord-américains, le consortium d’imageries de Singapour, etc. Le socle existe à SPC mais l’absence de réseau partagé entre les sites ne permet pas d’assurer une mission d’interopérabilité, encore moins de stocker les milliards d’images acquises sur chaque site ou de partager les outils de traitement d’images propres à chaque projet.

DRIVE-SPC est mené en coordination étroite avec le programme interdisciplinaire d’imageries du vivant (IDV) de SPC dont la mission est de fédérer les acteurs de la COMUE venant de toutes les disciplines de l’imagerie. L’une des actions centrales d’IDV est de déployer une plateforme délocalisée pour l’imagerie (« cloud computing ») au bénéfice de tous ses acteurs, clinique, préclinique, cellulaire, etc. Un ingénieur de recherche a été recruté pour administrer la plateforme, intervenir pour les installations locales sur sites et former les utilisateurs. C’est l’occasion unique de déployer simultanément un réseau d’images du vivant expérimentales (DRIVE) acquises sur les différents sites et de mettre à disposition de façon simple et rationnelle les outils de traitement et d ‘analyse sophistiqués, qu’ils soient commerciaux ou développés en interne sur certains sites. Le Cloud Computing mis en place dans le cadre d’IDV permettra à moyen terme le déploiement d’un réseau partagé d’images au sein de SPC.

Solution retenue pour une articulation avec le réseau IDV de SPC

Suite aux réunions de coordination au sein de SPC, la solution retenue pour une mise en route rapide du réseau d’images du vivant tout en évitant la redondance et en mutualisant les moyens est que IDV sera en charge de la partie stockage partage et gestion « hard » tandis que DRIVE mettra en place un système d’information fondé sur un outil léger de partage et gestion de données. DRIVE-SPC met donc immédiatement à disposition de la COMUE un système d’information issu du monde industriel, adapté à la gestion et à l’exploitation des images médicales issues des laboratoires de recherche et à leur croisement avec les données démographiques, biologiques comportementales, génétiques, etc. Cet outil permet de gérer non seulement un ensemble de documents et d’images, quelle que soit leur source, mais aussi les concepts utilisés en analyse d’images, les paradigmes de stimulation, les résultats des essais pharmacologiques, des tests comportementaux, et toutes les relations pouvant exister entre eux.

Cela permet de répondre à deux évolutions récentes majeures :

  • La première est la place croissante prise par les approches multimodales, par exemple opto-acoustique, IRM+TEP, IRM+ultrasons thérapeutiques, TEP+échographie, etc. En superposant les différents paramètres fonctionnels et métaboliques contenus dans les images, ces imageries bi- ou pluri-modales produisent une information multiparamétrique précieuse sur le plan physio-pharmacologique ; en outre il est souvent intéressant d’utiliser l’information d’une source d’acquisition pour améliorer la qualité des images de l’autre source.  Les ressources des deux expertises doivent être mises en commun pour pouvoir être croisées, ce qui implique le partage des images et des outils de reconstruction et d’analyse.
  • La seconde est l’accès à l’information médiate, (non visible immédiatement dans les images) qui doit être extraite par des traitements particuliers nécessitant des moyens importants en calcul. L’avancée rapide de la « radiomique », ou extraction semi-supervisée des informations sous-jacentes contenues dans les images, témoigne de son importance pour l’imagerie moderne ; les outils qu’elle utilise, gros consommateurs de capacités de calculs, exigent des silos de données communs avec des images aux formats compatibles pour la lecture.

La solution choisie, Teamcenter édité par la société Siemens PLM Software Solutions, est une solution immédiatement disponible issue du monde de l’ingénierie classique pour la gestion des données complexes multi-sources et variables dans le temps (« Product Life Management »). Elle est validée pour la gestion des données d’imagerie biomédicale, adaptée à la relecture des données, à leur confrontation avec de nouvelles données et/ou de nouvelles analyses, et surtout à la traçabilité et à la sécurisation des données, ce qui en fait un outil idéal pour le « knowledge management » des laboratoires et plateformes d’imagerie de SPC. Elle offre des fonctionnalités de visualisation qui permettent la fouille sémantique, la représentation graphique des connectivités et des réseaux.  Outre son utilisation dans l’Industrie, elle est actuellement déployée pour les réseaux de recherche en imagerie dans plusieurs sites, en France dans le cadre de BIOMIST pour la gestion des données de l’IRM fonctionnelle.

Sur le long terme, le choix d’une solution validée et répandue dans l’industrie garantit la pérennité et la compatibilité avec les déploiements futurs des solutions de stockage et de partage de données.

Références du projet

La principale référence est le projet BIOMIST[1] de gestion sémantique des données de l’imagerie biomédicale pour la recherche. Ce projet par son champ d’action et ses avancements permet de fournir des bases solides au projet mis en place pour Drive SPC.

L’objectif du projet Biomist est de fournir aux chercheurs utilisant l’imagerie bio-médicale un système d’information efficace de façon à optimiser l’utilisation et l’analyse de leurs données dans le cadre d’activités de recherche incluant de larges groupes de sujets sur des périodes prolongées. Cela devra permettre la réutilisation de données produites en recherche clinique et fondamentale dans un contexte et pour un but autres que ceux pour lesquels elles avaient été acquises.

Avec l’équipe de recherche du GIN, le domaine de l’imagerie neurofonctionnelle a été choisi comme terrain d’expérimentation. En dehors des données d’imagerie proprement dites (2D, 3D, 4D), toutes les autres données nécessaires à la définition d’une étude, notamment les données démographiques, comportementales ainsi que des données génétiques sont destinées à être gérées par le système. De plus, le but n’est pas seulement de gérer et de tracer les documents d’une étude mais également les concepts utilisés par les chercheurs tels que les paradigmes de stimulations cognitives, les tâches de traitements, les définitions des études comportementales, ainsi que toutes les relations qui peuvent exister entre ceux-ci.

[1] BIO Medical research Imaging SemanTic data management – projet financé par l’ANR (ANR-13-CORD-0007)