|
|
Résumés des interventions3 novembre 2025
Atelier Déposer dans HAL
Régine de Sousa, administratrice HAL Paris Nanterre
Cet atelier abordera les aspects suivants : -Présentation de HAL et du portail HAL Paris Nanterre -Paramétrage de son profil HAL (IDHAL) -Utiliser HAL (quels documents déposer / démonstration d’un dépôt) -Valoriser ses publications dans HAL (Créer son CV HAL / exporter vers ORCID)
Understand and define your choices for sharing your research results in an open science ecosystem Cécile Swiatek, directrice du Service commun de documentation
The scientific, technological, economic and digital environment for researchers has been changing rapidly for several years. The aim of this open science training course is to give you a practical, factual overview of public policies on opening up, sharing and protecting publicly-funded scientific publications and other academic research output at European level. To do this, we will discover the publications ecosystem, and together we will grasp the issues involved in choosing whether to share your scientific research results selectively or in their entirety.
4 novembre 2025
Réflexions sur les usages de l’IA générative dans la recherche Julien Schuh, Professeur à l’Université Paris Nanterre Directeur adjoint de la MSH Mondes Les grands modèles d’IA générative sont désormais des outils courants dans la panoplie des chercheur.euses pour produire des états des lieux de la recherche, analyser des données, expérimenter des idées ou rédiger leurs articles. Cette communication proposera un bref tour d’horizon des enjeux des usages de ces outils dans un contexte de science ouverte et d’éthique de la recherche. On abordera la question de la transparence des modèles (aussi bien dans la publication de leurs corpus d’entraînement, de leurs poids que de leur architecture), de leurs biais, de l’auctorialité augmentée liée à l’usage de LLM, et on discutera les recommandations de diverses instances de régulation, en particulier la Commission européenne
Administration Trump et bases de données américaines : les publications scientifiques en danger ?
Colin Sidre, chargé de formation à la BIU Santé médecine, Université Paris Cité
Depuis son arrivée au pouvoir en janvier 2025, l'administration Trump s'est lancée dans une entreprise de sape des institutions fédérales et des institutions de recherche aux Etats-Unis. Or, de nombreuses ressources utilisées dans le monde entier sont soutenues par ces mêmes institutions : la base de données PubMed/Medline, base de référence en santé portée par la National Library of Medicine ; la base de données en sciences de l'éducation ERIC, dont le maintien par le ministère de l'éducation US n'est pas garanti ; etc. Cette présentation vous propose de faire le point sur les risques concrets encourus par ces bases de données, les conséquences pour la recherche française et internationale et les alternatives qui se construisent.
Intelligence artificielle et édition structurée : présentation d’une preuve de concept autour de la revue Gallia - Archéologie des Gaules Valentin Chabaux, Ingénieur en humanités numériques et correspondant IR* Huma-Num, Pôle Données et humanités numériques, MSH Mondes Nicolas Coquet, Chargé de ressources documentaires, Pôle éditorial & Pôle Données et humanités numériques, MSH Mondes L’édition structurée des revues scientifiques permet non seulement d’enrichir l’information, mais aussi de faciliter son traitement informatique, améliorant ainsi l’accessibilité, l’interopérabilité et la réutilisation des contenus. Si la revue Gallia est aujourd’hui nativement structurée en XML-TEI pour la publication de ses versions imprimée et numérique, une partie importante de son corpus - correspondant aux numéros les plus anciens - n’existe que sous la forme de facsimilés mis à disposition au format PDF. Ces documents scannés posent un double défi : d’une part, la reconnaissance automatique du texte, souvent entravée par la qualité des images et les spécificités typographiques des publications anciennes ; d’autre part, la mise en correspondance de ce texte brut avec une structuration riche et normalisée conforme au standard TEI. Dans ce contexte, nous présentons un protocole mobilisant l’intelligence artificielle afin d’assister la transformation des anciens scans PDF en documents TEI. Cette chaîne de traitement semi-automatique repose à la fois sur des techniques d’OCR avancées et sur des modèles de vision par ordinateur et de classification capables d’identifier la structure éditoriale des articles. Au-delà de l’aspect technique, ce protocole contribue à la pérennisation et à la valorisation de ce patrimoine scientifique. Il ouvre la voie à une exploitation élargie d’un corpus de revue, en facilitant son intégration dans des environnements numériques interopérables, propices aux recherches croisées et à de nouvelles formes d’analyse.
Enjeux de l'utilisation des systèmes d'Intelligence artificielle générative dans le contexte académique Christelle Chidiac, Déléguée à la protection des données (DPO) de l’Université Paris Nanterre Mickaël Rigault, Juriste Conventions et Données Personnelles, Université Paris Nanterre
Cette présentation a pour objectif d'identifier et d'informer les participants sur les enjeux juridiques liés à l'utilisation de l'intelligence artificielle en contexte académique, à travers deux axes complémentaires : la protection des données et la propriété intellectuelle. D'une part, nous nous interrogerons, à travers un comparatif des conditions d'utilisation de plusieurs systèmes d'IA générative, sur les risques liés au traitement de données personnelles. Nous évoquerons également les conflits que peuvent entraîner l'utilisation de ces systèmes au regard des responsabilités et des droits conférés aux personnes par le RGPD. D'autre part, les enjeux de propriété intellectuelle liés à l'utilisation de ces outils seront présentés, notamment les risques de contradiction entre les droits des auteurs et ceux des plateformes de génération de texte. Ce mécanisme sera analysé au prisme des questions cruciales quant à la possibilité de publier ou valoriser les résultats de la recherche dans un contexte de science ouverte.
Quels défis contemporains pour l’intégrité scientifique ? Alexandre Coutté, professeur à l’UFR Staps et référent intégrité scientifique de l’Université Paris Nanterre Lors de cette présentation, les grands principes de l’intégrité scientifique seront rappelés. Ils seront notamment resitués et contextualisés dans la perspective des évolutions récentes des modes de productions et de publication de la science. Des axes de discussion seront alors proposés pour alimenter la réflexion sur la recherche scientifique et sa diffusion
Presses Universitaires de Paris Nanterre : Atelier Construire une chaîne du livre éco-responsable et durable
Nina Koulikoff, MSH Mondes, éditrice pour Espaces et Sociétés et Justice spatiale | Spatial Justice Morgan Simon, Presses universitaires de Paris Nanterre, éditrice, responsable du développement de l’édition numérique Avec la participation de Cléa Facon-Barillot, Presses universitaires de Paris Nanterre, assistante éditoriale, chargée de diffusion À l’heure où les enjeux environnementaux s’intensifient, cet atelier propose d’ouvrir un espace d’échange et de réflexion sur l’impact écologique du livre, imprimé et numérique, et invite à explorer les axes d’amélioration et les leviers d’action possibles pour construire une chaîne du livre durable.
5 novembre 2025
Methods and Tools to Make Research Source Code Shareable and Reproducible: A Brief Overview Damien Belvèze, Université de Rennes, librarian and member of the Briton ARDoISE Data Hub This presentation focuses on code sharing for replicability: methods and tools for making source code reusable. The researcher will present deterministic environments where randomness is banished as much as possible, using the most transparent methods available.
Disinformation in the Era of large language models: From Theory to Models Youcef Djenouri (USN), Associate Professor at University of South-Eastern Norway, senior researcher at NORCE (Norwegian Research Center) The rise of large language models (LLMs) has revolutionized content generation but also amplified the threat of disinformation at scale. This talk bridges theoretical insights on disinformation with practical modeling approaches, focusing on how LLMs both generate and propagate misleading content. A central theme is the role of uncertainty—how it can be modeled, quantified, and leveraged to improve the detection and mitigation of disinformation. We present recent advances in uncertainty-aware models and discuss how uncertainty quantification can enhance robustness, interpretability, and trust in AI systems designed to combat disinformation.
Biases in statistical Learning and AI Patrice Bertail, Université Paris Nanterre Algorithms are increasingly permeating our daily lives, exemplified by decision-support algorithms (recommendation or scoring algorithms) and autonomous algorithms embedded in intelligent machines (self-driving vehicles). Deployed across numerous sectors and industries for their efficiency, their outcomes are increasingly debated and challenged. In particular, they are accused of being black boxes and leading to discriminatory practices related to gender or ethnic origin. They are even sometimes intentionally biased which can lead to manipulation of opinions.
6 novembre 2025
Table ronde "Données de recherche FAIR, RGPD et réutilisation : concilier ouverture et protection" Fabrice leonel N'tchatat tounya, Université Paris Nanterre, docteur en droit privé et sciences criminelles et membre de la Chaire GoDO Lucie Cluzel-metayer, Université Paris Nanterre
La recherche, surtout en santé, sciences sociales et humaines, ne peut pas se passer de données personnelles. En ce sens, les données FAIR expriment un impératif scientifique pour accélérer la recherche en rendant les données Faciles à trouver, Accessibles, Interopérables et Réutilisables. Or, le RGPD traduit un impératif légal et éthique qui protège la vie privée des individus. La collision entre ces deux logiques créer une zone de friction, qui invite à s'interroger sur la question de savoir comment rendre des données accessibles et réutilisables sans violer le principe de limitation des finalités du RGPD ? Dans ce contexte, la conciliation s'avère une nécessité pratique.
7 novembre 2025
Formation Maîtriser ses données de recherche
Cécile Delay-Artous, pilote d'ADN, l'atelier de la donnée de Nanterre, SCD Université Paris Nanterre Adèle Etaix, Ingénieure en humanités numériques, plateforme universitaire de données de Nanterre, MSH Mondes Aude Da Cruz Lima, Ingénieure d’études CNRS en charge de la gestion et la valorisation des données de recherche, UMR MoDyCo
Les données de la recherche et la science ouverte entrent progressivement dans les pratiques des acteurs de la recherche. Cette formation aborde les questions de gestion, d’ouverture et de conservation des données issues de projet de recherche, à travers le programme suivant : Introduction et définitions (science ouverte, données de recherche, humanités numériques, sciences et société...) Cycle de vie des données FAIRisation des données et bonnes pratiques Cadre réglementaire des données (dont plan de gestion des données) Pour aller plus loin (opportunités de carrière et ressources)
Atelier Plan de Gestion de Données
Cécile Delay-Artous, pilote d'ADN, l'atelier de la donnée de Nanterre, SCD Université Paris Nanterre Adèle Etaix, Ingénieure en humanités numériques, plateforme universitaire de données de Nanterre, MSH Mondes Aude Da Cruz Lima, Ingénieure d’études CNRS en charge de la gestion et la valorisation des données de recherche, UMR MoDyCo
Cet atelier est proposé comme un complément d’application concrète à la formation « Maîtriser ses données de recherche. De l’ouverture à la gestion », et s’intéressera plus particulièrement au plan de gestion de données – outil de gestion de projet pour organiser et planifier ses données qu’il est recommandé de réaliser dans le cadre de sa thèse comme de tout projet de recherche. |