- La parole à...
Interview de Hélène Hoch, présidente du groupe Universitaire

Le 28 mars dernier se tenaient les rencontres François Gèze sur l’édition scientifique et l’intelligence artificielle, organisées par le groupe Universitaire du Syndicat national de l’édition et la FNPS, avec le soutien de la Sofia et du GFII. Nous remercions Hélène Hoch, présidente du groupe Universitaire, d’avoir répondu aux questions de l’équipe du syndicat.
Au lendemain des rencontres François Gèze à propos de l’édition scientifique et de l’intelligence artificielle, quel regard portez-vous sur cet outil technologique ?
L’intelligence artificielle (IA) est un outil technologique qui permet des innovations importantes. Nous l’avons tous constaté depuis l’émergence de ChatGPT en novembre 2022. L’IA générative implique, par exemple, l’amélioration de la pertinence des réponses du moteur de recherche à travers la fouille de données, en offrant des fonctionnalités nouvelles comme des résumés, des synthèses, la reformulation de données selon des angles précis, en langage courant, par exemple, en permettant d’effectuer des questions réponses, etc.
L’édition scientifique est l’un des secteurs les plus en pointe sur l’IA. Les éditeurs scientifiques sont non seulement des ayants droit des œuvres protégées pouvant intéresser les opérateurs d’IA et figurent parmi les premiers acteurs de l’édition à avoir conclu des partenariats ; mais ils sont aussi des utilisateurs des IA proposées par ces derniers ou encore opérateurs d’IA eux-mêmes. En réalité, ils ont même été pionniers dans l’usage de la fouille de textes et de données (« text and data mining/TDM »), toujours avec le recours à des licences. En outre, c’est sans doute l’un des secteurs où la qualité des données revêt un enjeu des plus cruciaux. Ces différentes caractéristiques placent donc les éditeurs scientifiques, y compris juridiques, à un poste d’observation mais aussi moteur dans le cadre des développements de l’IA et de la mise en place d’un écosystème vertueux de l’IA.
Pour l’édition scientifique, l’IA offre ainsi des opportunités, notamment la traduction automatique de contenus et la description d’images facilitant l’obligation d’accessibilité pour les livres numériques.
Néanmoins, comme tout outil technologique, il doit être nécessairement encadré et régulé, car le moissonnage généré par l’IA entraîne parfois l’exploitation d’œuvres ou contenus sous droits d’auteur, et il s’agit alors de regarder comment l’on doit protéger les créateurs/auteurs de contenus. Cela passe d’ores et déjà par les obligations sur la transparence des sources utilisées par les IA, par la possibilité pour les éditeurs et les auteurs d’exprimer leur opt out, par la mise en place de réflexion sur les modes de rémunération, etc.
L’IA est donc une opportunité pour accéder plus rapidement à la connaissance à condition de mettre en œuvre de manière effective les régulations et d’encadrer l’outil par l’intelligence humaine.
Quels sont les enjeux d’une « science ouverte » respectueuse du droit d’auteur des chercheurs dans le contexte de l’IA ?
Tout d’abord, comme l’indique le rapport sur la science ouverte de l’Office parlementaire d’évaluation des choix scientifiques et technologiques, l’avis du Médiateur du livre sur l’édition scientifique, et enfin le rapport de la mission du CSPLA sur la science ouverte et le droit d’auteur, le développement de la science ouverte doit se faire en respectant le droit d’auteur.
Or, les pouvoirs publics ont mis en place les principes de la « Stratégie de rétention des droits », qui prévoit qu’en contrepartie du financement de ses recherches par ces bailleurs de fonds, l’auteur ne doit pas céder tous ses droits à son institution ni à l’éditeur afin de pouvoir publier en accès libre immédiat, sous une licence ouverte, en particulier Creative Commons CC BY (toutes réutilisations y compris commerciales possibles), la version acceptée de son article et/ou la version finale publiée par l’éditeur. Tout en soulignant que les chercheurs sont des auteurs en tant que tel, le rapport du CSPLA décrit cette Stratégie comme un renoncement au droit d’auteur par les chercheurs et son imposition comme étant contraire au droit d’auteur.
De même, il indique que toute obligation de dépôt imposée aux chercheurs doit non seulement être considérée comme allant à l’encontre de la loi Lemaire, mais aussi à l’encontre de la loi. C’est dans ce contexte que l’Université de Nantes a abrogé sa délibération de 2021 imposant un dépôt des publications de ses chercheurs en « open access » et leur unique prise en compte dans leur évaluation, que le professeur Philippe Forest avait dû contester auprès du tribunal de Nantes.
Par ailleurs, depuis l’entrée en vigueur de la directive Droit d’auteur de 2019, les publications librement accessibles en ligne peuvent être récupérées par les Big Tech qui en tirent profit en créant de nouveaux produits sans avoir assuré l’investissement initial pour en vérifier la qualité, tout en profitant d’une politique publique de partage entre chercheurs. Cependant, les ayants droit peuvent s’y opposer grâce à des outils dédiés.
Ainsi, il paraît essentiel que les chercheurs qui permettent un accès ouvert vers leurs contenus effectuent l’opt out pour éviter que les outils d’IA puissent les moissonner.
Il y a néanmoins des discussions juridiques sur cette possibilité. Cela mérite donc d’être éclairci.
Comment envisagez-vous le futur du groupe Universitaire ?
L’objectif du groupe Universitaire est d’affirmer le rôle majeur du droit d’auteur et de l’éditeur dans la diffusion large des connaissances.
Qu’il s’agisse de l’open access, de l’émergence de l’IA ou des exceptions en matière européenne, et encore davantage à un moment où la science et la connaissance sont fondamentalement remises en question dans certains États, il est primordial de rappeler l’importance du travail éditorial de validation et de certification de l’information dans la mise à disposition des savoirs et des connaissances.
Que l’on évoque les ouvrages physiques ou les contenus numériques, notre enjeu est de continuer à faire savoir que seule la validation des connaissances par des éditeurs de qualité – ce qui n’est pas sans coût – garantit un accès fiable et intègre à l’information.
Par ailleurs, un second enjeu du groupe est de rappeler que les différents formats répondent à différents usages : le papier pour la lecture, l’apprentissage et la fixation par la mémoire des connaissances, le numérique pour la lecture de formats plus courts et la recherche de l’information.
Ce n’est qu’en conservant ces différents formats pour différents usages complémentaires que les étudiants pourront continuer à construire et nourrir leur esprit critique de nature à conforter la démocratie et l’État de droit.
Enfin, le groupe cherche également à rappeler l’importance de politiques publiques appropriées pour permettre aux étudiants et chercheurs d’accéder à la connaissance.