
Données d’innovation : quelle intervention de l’etat sur le partage des données ? | terra nova
- Select a language for the TTS:
- French Female
- French Male
- French Canadian Female
- French Canadian Male
- Language selected: (auto detect) - FR
Play all audios:

CHAÎNE DE VALEUR DE LA DONNÉE : L’EXEMPLE D’ORANGE FLUXVISION ORANGE INTERNALISE UN SERVICE D’ANALYSE DE FLUX DE CLIENTÈLES À PARTIR DE SES DONNÉES Malheureusement, et au-delà du cas
d’Orange, les modèles économiques de partage de données brutes restent très rares (voir l’exemple du marché des Data Brokers ci-dessous). Cela restreint la pleine réalisation de la valeur du
partage de données, en diminuant les externalités, le croisement de bases différentes ou la mutualisation. ZOOM – DATA BROKERS Le secteur de la publicité en ligne constitue un exemple
intéressant, où les acteurs se sont naturellement répartis le long de la chaîne de valeur. Ainsi, des entreprises appelées _ data brokers_ achètent des données brutes de navigation à des
sites web, pour les croiser et revendre de véritables profils de consommateurs. Ces profils sont vendus à des entreprises souhaitant mener des campagnes marketing ciblées. C’est d’ailleurs
grâce à ce secteur que nous disposons d’ordres de grandeur de la valeur effective de ces données individuelles .Le rôle de ces _ data brokers_ est évidemment très controversé, notamment
suite au scandale Facebook/Cambridge Analytica , et ils ont été épinglés dès 2013 dans un rapport sénatorial américain . Les dérives pointées par ce rapport sont édifiantes : vente de listes
de profils catégorisés comme « vieillards souffrants » ou « parent célibataire pauvre ». Leur activité est très réduite en Europe, notamment depuis l’entrée en vigueur du RGPD, qui
interdit la revente de données personnelles sans consentement explicite et _ a priori_ des individus.Différents éléments contribuent à expliquer cette exception sectorielle. Historiquement,
les _ data brokers_ (Acxiom, Experian, Equifax, etc.) travaillaient déjà sur des données personnelles en proposant des services de notation ( _ credit rating_ ) aux États-Unis. Il s’agit de
recueillir et croiser un maximum de données sur le profil d’un individu pour aider les banques à estimer leur risque de non-remboursement d’un prêt. Les deux activités étant très similaires,
la diversification était donc naturelle. Par ailleurs, tous les acteurs de ces chaînes de valeur de la donnée financière individuelle avaient déjà conscience de la valeur des données.
Enfin, il s’agit d’acteurs dont le cœur de métier est le traitement de la donnée, au contraire des industries plus classiques. Deux éléments viennent selon nous expliquer cette tendance à
l’internalisation et ces difficultés de partage. 2.2.1. De l’impossibilité de valoriser sa donnée sans en connaître _ a priori_ l’usage Partant du postulat important que la donnée n’a pas de
valeur intrinsèque – mais uniquement une valeur tirée de l’usage qui est construit à partir des données – il est important pour une entreprise de connaître l’usage qui sera fait de ses
données partagées. Cela a une importance primordiale pour estimer à quel prix il est possible de les vendre. Or, on l’a dit, l’une des sources de valeur importantes du partage de données est
la création d’externalités et de nouveaux modèles économiques, qui, par définition, ne sont pas attendus au moment du partage. Les entreprises n’ont donc pas les incitations nécessaires
pour créer des externalités avec leurs données, puisqu’elles n’arrivent pas à les monétiser correctement sans connaître l’usage par avance. Un contre-exemple marquant reste celui de
l’entreprise américaine et réseau social Twitter. En effet cette dernière monétise directement – bien que cela représente en 2015 moins de 10 % de ses revenus bruts – sa donnée brute générée
sur sa plateforme par des API (interface de programmation applicative) payantes. De nombreux usages différents peuvent être faits à partir de cette donnée, l’entreprise Twitter a tout de
même fait le choix de les ouvrir à un prix fixé, la seule différenciation sur le prix se situant principalement dans la quantité de données qu’il est possible de récupérer par intervalle de
temps. 2.2.2. Pour un usage connu, quelle part de la valeur ajoutée provient de la donnée ? Mais même lorsque l’usage est connu à l’avance, monétiser ses données au juste prix reste une
question délicate. En effet, mesurer la part de valeur ajoutée provenant des données est souvent une mission perdue d’avance. Prenons l’exemple théorique du développement d’un service de
reconnaissance d’image, basé sur des algorithmes d’intelligence artificielle. Beaucoup d’usages permettent probablement de monétiser ce service. Supposons qu’il existe un usage connu pour
lequel l’entreprise ayant développé l’algorithme parvienne à en tirer un revenu, disons 100. Mettons-nous maintenant à la place de l’entreprise qui a fourni tout ou une partie des données
permettant l’entraînement de l’algorithme. Quelle part de cette valeur suis-je en droit de réclamer ? 5, 10, 50 ? Pire, une fois que l’algorithme a été développé et entraîné, il n’a plus
besoin de mes données et les leviers restant à ma disposition pour négocier un bon prix sont malheureusement assez restreints… En résumé, monétiser de la donnée brute s’avère ardu pour les
entreprises. C’est ainsi que face à la difficulté de fixer un prix, les entreprises qui possèdent de la donnée préfèrent tout simplement ne pas la partager. Beaucoup d’acteurs peuvent se
dire : « Aucune envie que quelqu’un fasse de l’argent avec mes données. » En outre, certains risques ou coûts associés achèvent de dissuader les entreprises envisageant de monétiser leurs
données. Simon Chignard, conseiller stratégique chez Etalab, en dresse un portrait convaincant dans son article pour _ Management & Data Science_ . On peut citer notamment le risque que
la donnée partagée ne mette l’entreprise en difficulté d’un point de vue concurrentiel en favorisant l’émergence de nouveaux acteurs. Les coûts de développement technique liés à
l’interopérabilité des systèmes sont également un obstacle. Enfin, dans les initiatives de mutualisation, il y a souvent un intérêt à ne pas être le premier, voire à contribuer moins que ses
pairs, problème bien connu en économie : le passager clandestin. Du point de vue d’une entreprise (« micro »), la balance entre les gains et les risques et coûts potentiels est donc souvent
défavorable, freinant ainsi le développement de modèles économiques liés au partage de données. Aux niveaux national et européen (« macro »), une meilleure circulation des données privées
débloquerait davantage d’innovation. Ce décalage entre incitations micro et optimum macro représente un terreau propice à une éventuelle intervention de la puissance publique. 3. OUVRIR LES
DONNÉES D’ENTREPRISE ? Pour faciliter la circulation des données, plusieurs modes d’action de la puissance publique sont envisageables. Des initiatives publiques « soft » existent déjà,
notamment _ via_ les travaux, rapports et communications de la Commission européenne. On pourrait aussi envisager des incitations financières pour les entreprises prenant activement part à
des initiatives de partage de données. À notre sens, une intervention plus contraignante permettrait de répondre plus adroitement aux barrières identifiées précédemment. Nous étudions, dans
cette note, la forme d’intervention nous paraissant la plus naturelle, à savoir l’ouverture de bases de données possédées par les entreprises. Ces ouvertures de données privées sont
d’ailleurs de plus en plus envisagées, par exemple dans le très récent rapport de la commission d’enquête du Sénat sur la souveraineté numérique . Il faut, avant d’intervenir, comprendre qui
est réellement propriétaire de ces données à forts enjeux. Comme nous allons le voir, il existe un flou (voire un vide) juridique sur la notion de propriété des données. Par ailleurs,
intervenir sur la « propriété » privée et l’ouverture de données est un terrain sur lequel l’État s’est encore peu aventuré. Enfin, des ouvertures de données mal maîtrisées pourraient
induire des dommages notables pour l’économie. Les interventions de l’État devront donc être très ciblées, justifiées, et le périmètre de l’ouverture des données devra être déterminé
précautionneusement. 3.1. À QUI APPARTIENNENT LES DONNÉES DE TRACE ? Avant de décider ou non d’interventions et d’ouvertures de données, il s’agit de savoir à qui elles appartiennent
vraiment ! Si l’interrogation semble de prime abord être une considération théorique, la question de la propriété des données structure pourtant les leviers d’intervention de la puissance
publique. Les spécificités économiques des données évoquées précédemment rendent particulièrement délicat le fait de parler de propriété des données. La bonne notion pour s’intéresser aux
enjeux juridiques du partage de données est la notion de données de trace. Nous appelons données de trace les données générées par l’utilisation d’un système numérique, en grande quantité́
et collectées passivement. Quelques exemples de traces : un historique de recherche Google, les données collectées par une machine à traire les vaches (plus de 120 variables collectées par
vache et par jour !) ou l’historique de validations d’un pass Navigo. Cette notion s’oppose principalement aux créations ou œuvres numériques, produites de manière unique et ponctuelle par
un humain. Par exemple, un morceau de musique au format mp3, un modèle de conception 3D de véhicule ou encore un e-book ne rentrent pas dans le cadre de cette définition. Une autre
définition serait d’envisager les données de trace comme celles n’étant pas naturellement protégées par la propriété intellectuelle. En effet, les données de trace décrivent des faits – et
non des créations ou inventions – et ne tombent donc pas sous les régimes de propriété intellectuelle. Par exemple, il ne ferait pas sens de protéger les données sur les embouteillages
possédées par Waze comme on protège un morceau de musique : une autre entreprise pourrait tout aussi bien mesurer les bouchons (c’est d’ailleurs le cas) sans être dans une situation
répréhensible. Pourquoi ces données de trace sont-elles particulièrement pertinentes ? Il s’avère que les données de trace impliquent souvent plusieurs acteurs : le fabricant du système, son
utilisateur final, potentiellement les autres acteurs d’une chaîne de valeur. Par exemple, dans un système aussi complexe qu’un véhicule connecté, chaque pièce génère énormément de données
de trace , . Si le constructeur y a nativement accès, les sous-traitants peuvent aussi revendiquer leur accès. Naturellement, le consommateur final qui conduit le véhicule pourrait aussi
légitimement prétendre avoir accès à ces traces. De plus, les données de trace sont par définition générées comme coproduit d’une activité, et ne sont donc que rarement valorisées
directement. Il est donc crucial d’apprendre à mieux les exploiter. À propos des véhicules connectés, il est intéressant de noter que les juristes américains ne savent pas répondre avec
certitude à la question « qui possède les données produites par votre voiture intelligente ? » (« _ who owns the data generated by your smart car ? »_ ) . Concernant le droit de propriété
des données en général, la loi reste assez floue. On l’a dit, les données de traces ne sont pas naturellement couvertes par la propriété intellectuelle. Les données décrivant des faits ne
sont pas protégées par le copyright aux États-Unis . En Europe, une notion faible de propriété intellectuelle sur les bases de données existe, _ via_ une directive de 1996 . Il s’agit d’un
droit _ sui generis_ qui protège l’acteur ayant réalisé un « investissement financier, matériel ou humain conséquent » pour constituer la base de données. Des arrêts de la Cour de Justice
européenne de 2004 sont cependant venus préciser et limiter le périmètre de cette mesure : l’investissement doit avoir porté sur l’obtention des données. De même, au travers de plusieurs
décisions, le Conseil d’État a jugé qu’il n’y avait pas de droit de propriété sur les données brutes. Cela exclut de fait les données de trace telles que nous les avons définies : leur
obtention est quasiment passive, en tant que « produit secondaire » du fonctionnement d’un système. Il n’existe donc pas de droit de propriété prévu par la loi pour les données de trace. En
somme, personne ne sait dire à qui _ a priori_ devraient appartenir les traces d’utilisation d’un tracteur agricole : à l’agriculteur qui opère l’équipement ou au fabricant ? Nous
reviendrons ultérieurement et plus avant sur le secteur de l’agriculture. L’ancien commissaire européen au Numérique Günther Oettinger a d’ailleurs proposé de trancher de manière définitive
et transverse cette question du droit de propriété des traces en donnant systématiquement un droit de propriété intellectuelle à l’utilisateur de la machine. Dans la pratique, cette
incertitude sur l’aspect juridique de la propriété des données est réglée au cas par cas, de manière très pragmatique, par le droit des contrats. Des contrats de droit privé régulent qui a
accès aux données, selon les rapports de force du secteur. Par exemple, l’agriculteur acquérant un tracteur John Deere signe un contrat de licence l’obligeant à partager les données générées
par l’engin avec son fabricant. L’équilibre effectif de la propriété des données dépend donc à la fois de l’identité de l’acteur qui les collecte nativement et de ses rapports avec les
autres acteurs du secteur en question. Cette allocation des données n’est donc pas forcément toujours optimale pour favoriser l’innovation. De mauvaises surprises peuvent parfois apparaître
concernant la propriété de ces traces : l’armée norvégienne a ainsi découvert que ses avions de chasse F-35 renvoyaient des données sensibles à son constructeur américain . Enfin, en matière
de données personnelles, la question du droit de propriété est claire : il n’existe pas. En effet, philosophiquement, et dans une conception européenne, les données personnelles constituent
une extension de l’individu et ne peuvent donc pas être vendues, au même titre qu’on ne peut vendre un organe. On peut cependant envisager le droit de contrôle (consentement, contrôle des
finalités de collecte, etc.) accordé à l’individu sur ses données personnelles par le RGPD comme une forme très atténuée de droit de propriété. QUELLES CONCLUSIONS FAUT-IL TIRER DE CES
CONSIDÉRATIONS THÉORIQUES ? Les données de trace concentrent une bonne partie des enjeux liés au partage de données. Ces dernières ne rentrant pas dans le cadre de la propriété
intellectuelle, les entreprises sont incitées à les accumuler, sans les partager, de peur d’en perdre le contrôle. La typologie des acteurs (sous-traitant, fabricant, utilisateur) ayant
accès aux données dépend alors des rapports de force du secteur. Les incertitudes juridiques sont donc une raison supplémentaire pour laquelle les entreprises s’engagent encore trop peu dans
du partage. En dehors de cas très spécifiques, il n’existe pas de droit de propriété fort sur les données des entreprises. Cela permet donc à une éventuelle ouverture forcée de ces données
privées de ne pas tomber sous la qualification d’expropriation . 3.2. POURQUOI UNE OUVERTURE POURRAIT RÉPONDRE AUX BESOINS D’INNOVATION – L’EXEMPLE DE DSP2 Nous examinons maintenant en quoi
une ouverture ciblée de données permettrait de répondre à des enjeux d’innovations. L’intervention publique la plus probante en faveur d’une ouverture des données pour des besoins
d’innovation provient du secteur bancaire et de la directive DSP2 (Directive sur les systèmes de paiement, octobre 2017). Cette directive sectorielle utilise le principe de portabilité des
données personnelles introduit par le RGPD pour forcer les banques à ouvrir _ via_ des API standardisées les données de consommation bancaire de leurs clients. Ces derniers peuvent
désormais connecter automatiquement leurs comptes bancaires à d’autres applications pour recevoir des services tels que de l’analyse automatique de comptes, des levées d’alerte en cas de
grosses dépenses, des cartes de fidélité dématérialisées, etc. Cela a permis le foisonnement de start-ups (les « fintech ») innovantes proposant ces services à forte valeur ajoutée pour les
consommateurs. Parmi elles, la start-up espagnole Fintonic, créée en 2012 et qui revendique plus de 700 000 utilisateurs actifs , se sert des données historiques des comptes bancaires pour
réaliser des offres de crédit. Puisque les banques avaient à leur disposition des données qu’elles ne valorisaient pas, le régulateur a donc décidé d’en forcer l’ouverture vers des acteurs
tiers, en l’occurrence des fintechs (en s’assurant bien sûr du consentement de l’utilisateur final). Au vu de la jeunesse de la directive, il est difficile d’établir un chiffrage du gain
économique associé à cette législation. Cependant, le foisonnement de start-ups issues de cette opportunité réglementaire ainsi que le succès de certaines d’entre elles comme Fintonic
laissent à penser que cet impact est tout à fait notable. Exemple novateur et fondamental de législation sectorielle sur des données privées, la directive DSP2 concentre selon nous tous les
aspects positifs d’une régulation sectorielle sur le sujet du partage de données. Nous pensons, et c’est le sens de cette note, que l’État pourrait reproduire cet exemple dans d’autres
secteurs. 3.3. LES RISQUES CONCOMITANTS À UNE OUVERTURE Si l’intervention de la puissance publique peut se révéler pertinente et bénéfique, comme dans le cas de DSP2, elle n’est toutefois
pas sans risque. 3.3.1. Risques sur la concurrence D’abord, différents risques liés à la concurrence sont évoqués par des rapports de la Commission Européenne . Risques de collusion :
certains partages d’informations entre concurrents sont interdits, notamment pour éviter des ententes et collusions entre concurrents . Citons par exemple l’amende de 192,7 millions d’euros
contre le « cartel des yaourts » en 2015 . Désincitations à investir dans la collecte de données : si une entreprise profite d’un accès à un jeu de données mutualisées, elle pourrait choisir
d’investir moins dans ses propres moyens de collecte et de traitement des données. Risques de désavantages concurrentiels : les entreprises n’ayant pas accès à un jeu de données risquent de
devenir moins efficaces. Ce risque dépend du périmètre d’ouverture et de partage des données, point que nous discutons par la suite. Il s’agira donc de veiller à ce que d’éventuelles
ouvertures de données ne viennent pas nuire à l’intensité concurrentielle d’un secteur. 3.3.2. Risques sur le secret industriel Par ailleurs, bien que non protégées _ a priori_ par la
propriété intellectuelle, il peut arriver que les données de trace possédées par des entreprises révèlent des informations relevant du secret des affaires. Dans cette situation, une
ouverture forcée pourrait porter un préjudice sévère à l’entreprise détentrice, écueil qu’il s’agira d’éviter. 3.3.3. Risques sur les données personnelles Le partage de données personnelles
est strictement encadré dans l’Union européenne depuis le RGPD (il faut _ a minima_ recueillir le consentement et préciser une finalité). L’anonymisation et l’agrégation soigneuses de telles
données permettent souvent de les rendre non-personnelles. Par exemple, Waze agrège les positions individuelles de ses utilisateurs (données hautement personnelles) pour constituer des
estimations du trafic sans lien avec des individus précis (données non personnelles). Cependant, l’autorité compétente devra estimer et peser les risques de désanonymisation liés à une
éventuelle ouverture de données. 3.3.4. Risque politique Enfin, si les ouvertures de données d’entreprises doivent permettre la création de valeur économique, elles sont inséparables de
considérations politiques. Dans cette note, nous étudions les mécanismes de création de valeur _ via_ des ouvertures de données tout en restant agnostique à la nationalité des entreprises
qui en bénéficieront. Par exemple, faudra-t-il promouvoir des ouvertures de données de nos industriels français sur des segments où l’on sait par avance que les entreprises qui en
bénéficieront le plus seront chinoises ? Le politique sera chargé de répondre au cas par cas à ces questions. Ainsi, bien que l’État puisse agir favorablement pour la circulation des
données, chaque ouverture possède ses propres enjeux et ses propres risques associés. Nous pensons donc que toute ouverture de données privées doit être considérée de manière sectorielle,
après cartographie des données pertinentes, et en pesant précautionneusement les aspects positifs sur l’innovation mais également les potentiels aspects négatifs. En particulier, aucune
législation sur les données privées ne saurait être pensée de manière trans-sectorielle. 4 – LES LEVIERS À DISPOSITION DE L’ÉTAT Si l’État souhaite avancer sur le sujet de l’ouverture de
données entre entreprises, il convient de s’interroger sur les leviers à sa disposition. Nous avons identifié trois leviers principaux, qui ont permis par le passé et permettent encore à
l’État de procéder à des ouvertures de données. Nous passons ici ces trois leviers en revue. 4.1. DROIT DE LA CONCURRENCE Le droit de la concurrence est aujourd’hui régulièrement mis en
avant comme étant un levier primordial dans la régulation du secteur numérique. Les amendes infligées à Google par la Commission européenne ces deux dernières années (8,25 milliards d’euros
d’amende au total ) font figure d’exemple et sont sans cesse reprises par les partisans d’une régulation plus ferme envers les grandes plateformes. Par ailleurs, la question d’adapter le
droit de la concurrence à l’ère digitale pour une meilleure prise en compte des enjeux numériques reçoit aujourd’hui un intérêt au plus haut niveau. Les rapports Furman pour le gouvernement
anglais ou Crémer-Montjoye-Schweitzer pour la Commission européenne font figure d’exemples. Plusieurs idées majeures y figurent, telles qu’une régulation _ ex ante_ des grandes plateformes,
_ via_ des codes de conduite. En outre, les autorités de la concurrence se sont, par le passé, plusieurs fois intéressées aux données possédées par des entreprises. Lors de la fin des tarifs
réglementés du gaz en 2014, l’Autorité de la concurrence française a, par exemple, prononcé une mesure conservatoire contre GDF Suez. Le groupe était en effet soupçonné de profiter de son
fichier client provenant de son ancien monopole sur le gaz pour faire une concurrence déloyale aux nouveaux entrants. GDF a donc été contraint de partager cette base de données client avec
ses nouveaux concurrents . La Commission européenne, dès 2004, s’est intéressée aux enjeux d’interopérabilité, avec de lourdes sanctions financières contre Microsoft. Microsoft a, par
exemple, été condamné pour ne pas avoir offert à des développeurs tiers la documentation permettant de communiquer avec des serveurs utilisant un système d’exploitation Microsoft . Plus
récemment, la Commission européenne a également annoncé _ via_ un communiqué l’ouverture d’une enquête approfondie sur l’utilisation faite par le géant Amazon des données générées par les
vendeurs tiers sur sa plateforme. En effet, le géant américain de l’e-commerce exerce sur son site web le double rôle de détaillant mais également de commerçant _ via_ les produits qu’il
vend sous sa propre marque. Il s’agira pour l’autorité européenne de déterminer si Amazon n’a pas utilisé les données de ses vendeurs tiers à son avantage, par exemple en favorisant certains
produits d’une façon non conforme aux règles de la concurrence. L’entreprise Google, _ via_ son produit Google Shopping, a d’ailleurs été condamnée à une amende colossale en 2017 pour des
faits similaires . Cependant, sur le sujet précis du partage de données, plusieurs éléments démontrent que le droit de la concurrence n’est pas à même de répondre au besoin identifié de
produire des politiques publiques sectorielles pour du partage de données entre entreprises : Les articles 101 et 102 du Traité de fonctionnement de l’Union européenne (TFUE) ne permettent
d’appliquer des mesures qu’aux entreprises en situation de position dominante sur leur marché. Ce n’est donc pas un outil permettant des politiques d’ouvertures de données sectorielles,
s’appliquant à plusieurs acteurs, comme c’est le cas de la directive DSP2. Le droit de la concurrence ne peut que s’appliquer _ a posteriori_ si un dommage a été commis de la part d’une
entreprise. Le temps juridique nécessaire à l’application des sanctions et à leur éventuel passage devant la Cour de Justice européenne ne semble pas adapté à l’objectif d’encourager
l’innovation par l’intermédiaire du partage de données. 4.2. PORTABILITÉ DES DONNÉES PERSONNELLES Si le droit de la concurrence _ stricto sensu_ ne semble pas répondre au besoin d’encourager
la circulation des données sur différents secteurs, la portabilité des données personnelles est un moyen détourné mais efficace de répondre à ce besoin. C’est sur cette base qu’a été
rédigée la directive DSP2, qui fait figure d’exemple sur le partage de données d’entreprises et que cette note propose d’étendre à d’autres secteurs. Le rapport Crémer-Montjoye-Schwietzer la
cite d’ailleurs comme exemple et invoque la « création de nouveaux services à partir de l’accès aux données » comme une raison devant permettre d’autres régulations sectorielles
pro-ouverture des données. Malheureusement, le principe de portabilité ne s’applique qu’aux données personnelles, qui ne correspondent pas à toutes les données représentant un potentiel fort
d’innovation et possédées par les entreprises. Nous pensons donc que ce levier, bien qu’efficace, n’est pas suffisant. 4.3. DONNÉES D’INTÉRÊT GÉNÉRAL Introduites en 2015 dans un rapport
remis au ministre de l’Économie Emmanuel Macron , , les « données d’intérêt général » sont des classes de données pouvant être utiles à l’intérêt général et pour lesquelles l’État a donc une
légitimité à y avoir accès. Ce concept s’est matérialisé dans la Loi pour une République numérique de trois façons : la récupération par défaut par l’État des données « essentielles »
générées par les entreprises en position de délégation de service public ; la récupération par défaut par l’État des données essentielles des conventions de subvention ; la transmission
obligatoire de certaines données des entreprises pour des enquêtes de l’Insee. En outre, le rapport incluait initialement le développement économique comme un « intérêt général » et
discutait des modalités d’une récupération potentielle par l’État de données d’entreprises privées. La potentielle inconstitutionnalité de lois généralisées sur les ouvertures de données
privées (pour des raisons d’expropriation) et le besoin de produire des législations sectorielles y étaient d’ailleurs déjà identifiés. Cependant, la puissance publique n’a, à ce jour, pas
fait part de son intention de matérialiser cette partie du rapport _ via_ des ouvertures de données privées, et l’implémentation des données d’intérêt général dans la loi reste à ce stade
limitée aux trois points évoqués ci-dessus. En tout état de cause, les données d’intérêt général n’ont vocation à permettre qu’une récupération des données par l’État, qui pourrait alors les
ouvrir en mode « open data » pour une réutilisation par d’autres entreprises. Nous pensons que pour améliorer le partage de données entre entreprises, le rôle de la puissance publique ne
doit pas se limiter à des ouvertures « open data ». Au contraire, l’État devra légiférer sur la propriété des données dans un périmètre plus restreint, entre des acteurs bien identifiés. Par
exemple, dans le cas de la directive DSP2, les données de consommation bancaires ne sont pas ouvertes à tout le monde, mais le consommateur acquiert le droit de les réutiliser auprès
d’autres entreprises. Si les trois leviers évoqués précédemment ont chacun un intérêt, ils ne semblent pas adaptés pour répondre au besoin de générer plus d’innovation avec des données
possédées par des entreprises. Nous avons choisi d’illustrer ce manque d’outils réglementaires et les freins au partage des données avec le secteur de l’agriculture, qui se révèle être un
terreau fertile d’innovation et d’intervention de la puissance publique. 5. L’EXEMPLE DE L’AGRICULTURE Contrairement aux idées reçues, l’agriculture est un secteur économique où la
révolution numérique s’est opérée en profondeur. Les exploitants agricoles sont dorénavant dotés de tracteurs connectés, de robots de traite, et la révolution de l’IoT (Internet of Things),
la démocratisation des drones et le déploiement de la 5G promettent de nouvelles applications. Quel que soit le type d’exploitation (céréales, élevage, etc.), cette évolution permet de
meilleurs rendements, _ via_ des optimisations, des économies (d’engrais par exemple) et une automatisation croissante. On parle d’ailleurs de « _ precision farming_ », et le marché de la
robotique agricole, qui représentait 3 milliards d’euros en 2015, est promis à une croissance fulgurante (+ de 70 milliards en 2024 ). Citons quelques exemples. Les (incontournables)
tracteurs agricoles connectés. Ceux-ci recueillent par exemple des données de position, de nature des sols (avec une précision de l’ordre du centimètre), ou encore d’irrigation. Ils
deviennent également de plus en plus autonomes. Les robots de traite permettent aux exploitations laitières d’améliorer leurs rendements et le bien-être des animaux. Des centaines de
variables sont mesurées à chaque traite, pour chaque animal . 5.1. DES DONNÉES VERROUILLÉES… Ces machines connectées sont donc autant de générateurs de données de trace dont l’exploitation
pourrait encore stimuler l’innovation. Il s’avère cependant que ces données sont sous-utilisées, car elles circulent mal entre des acteurs souhaitant les contrôler et les garder. Comme nous
l’avons vu, face au flou du droit de propriété des données _ a priori_ , les acteurs utilisent entre eux le droit des contrats. Ainsi, les fabricants de matériel tentent, souvent avec
succès, de récupérer les données de trace des équipements. Il est souvent inclus dans les conditions d’achat que les données générées par les équipements (tracteurs, robots, etc.) reviennent
au fabricant. Celles-ci leur sont utiles pour améliorer les performances de leurs produits, ou mieux comprendre leurs usages. Ces données ont de la valeur pour tout l’écosystème : certains
fournisseurs de logiciels de gestion de ferme offrent ainsi des promotions lorsque les agriculteurs consentent à leur partager les données de fonctionnement de leur ferme entière . De plus,
les équipementiers semblent vouloir garder un écosystème fermé autour de leurs produits, afin de capter toute l’innovation possible. Les enjeux d’interopérabilité des équipements agricoles ,
bien que connexes aux enjeux de partage de données, sont tout à fait notables. Enfin, ces tensions autour des données cristallisent des craintes chez les agriculteurs. Par exemple, si des
données relatives aux rendements de l’exploitation sont transmises à leurs clients, la négociation n’en sera que plus difficile. Une autre crainte, certainement moins fondée, revient
régulièrement : les données pourraient être utilisées pour spéculer sur les cours des matières premières. Cette lutte pour le contrôle des données de trace agricoles, _ via_ des contrats,
génère donc des tensions et une perte de confiance généralisée entre les acteurs. 5.2. … DONC SOUS-EXPLOITÉES Comme nous l’avons vu au début de cette note, croiser des données de sources
différentes permet d’améliorer l’existant et de créer de nouveaux biens ou services. Faute de standards communs et de circulation suffisante des données de trace, le secteur agricole souffre
d’un déficit d’innovation. On pourrait, par exemple, imaginer qu’un logiciel croise les données de drones survolant les parcelles pour mesurer la santé des céréales et de capteurs passifs
d’hygrométrie afin d’optimiser la dispersion d’engrais par des tracteurs intelligents. Cela nécessiterait que les entreprises impliquées acceptent de partager avec des tiers les données
qu’elles contrôlent. Quelques start-ups, telles qu’Augmenta , s’intéressent à ce type d’applications, mais doivent ajouter des dispositifs physiques supplémentaires aux équipements car elles
n’ont pas accès aux données déjà mesurées par les machines agricoles. Un parallèle peut être dressé avec la situation des fintechs avant DSP2. Avant les standards de portabilité de DSP2,
les fintechs souhaitant valoriser les données bancaires de leurs clients les récupéraient de manière artisanale et non sécurisée. 5.3. VERS UNE AUTORÉGULATION ? Devant les tensions associées
aux enjeux des données agricoles, différentes initiatives d’autorégulation ont émergé des acteurs du secteur. Celles-ci tentent souvent d’encadrer l’utilisation des données de trace,
recueillies lors du fonctionnement des machines agricoles. Citons par exemple la charte Data-Agri sur l’utilisation et la propriété des données agricoles, initiative française lancée par la
FNSEA en 2018 . La philosophie de cette charte de bonne conduite est proche d’un « RGPD agricole » : les agriculteurs doivent donner leur consentement pour le traitement des données
produites par leurs machines. Ces traitements ne doivent pas non plus aller contre l’intérêt de l’exploitant. Aux États-Unis, le Farm Bureau syndicat agricole comparable à la FNSEA, a lancé
dès 2015 une charte avec des concepts proches sur l’utilisation des données agricoles . Les machinistes agricoles, conscients des craintes des exploitants, proposent également des chartes
relatives aux données. Ainsi, le constructeur de robots de traite et de logiciels Lely s’engage par exemple, dans sa charte, à permettre à l’utilisateur de décider si ses données peuvent
être partagées à un tiers . De telles initiatives permettent donc de lever une partie des tensions liées au contrôle des données, et se retrouvent d’ailleurs dans d’autres secteurs tels que
l’automobile. Rien n’assure cependant que ces chartes de bonne conduite seront largement adoptées ni appliquées, si les industriels n’y voient pas leur intérêt. Par ailleurs, ces initiatives
non-contraignantes n’abordent pas réellement le déficit d’innovation évoqué auparavant. Une intervention de la puissance publique, que ce soit au niveau français ou européen, pourrait
s’inspirer de la DSP2 dans le secteur bancaire, en arbitrant le contrôle des données de trace générées par les machines agricoles entre les industriels et les exploitants. 5.4. QUELS LEVIERS
D’INTERVENTION ? Dans le cas du secteur agricole, les leviers existants d’intervention de la puissance publique évoqués précédemment, se révèlent insuffisants ou inadaptés. 5.4.1. Droit de
la concurrence Le droit de la concurrence a déjà été utilisé dans le secteur agricole, sur le sujet connexe de la maintenance des équipements, ou « _ right-to-repair_ ». S’abritant
derrière les lois sur la propriété intellectuelle, des fabricants d’équipements agricoles tels que John Deere ont verrouillé l’accès aux standards et aux logiciels nécessaires à la
maintenance des tracteurs. La justice s’est d’ailleurs prononcée plusieurs fois, dans différents pays, mais sans cohérence globale. Un parallèle se dresse avec l’enjeu de l’accès aux données
de maintenance des véhicules légers. Une directive européenne de 2007 a imposé aux constructeurs d’accorder aux réparateurs l’accès aux données nécessaires à la réparation des voitures.
Cependant, le droit de la concurrence sous sa forme actuelle se révèle insuffisant dans la plupart des cas, où il n’y a pas de position dominante avérée. 5.4.2. Portabilité des données
personnelles L’utilisation du levier de portabilité des données permettrait de résoudre certaines tensions et de stimuler l’innovation dans le secteur. Par exemple, un exploitant aurait le
droit de partager les données de trace de son tracteur à un tiers, qui pourrait en extraire de nouveaux services. Cependant, la plupart des données à fort enjeu ne sont pas des données
personnelles . 5.4.3. Données d’intérêt général Une application de l’outil « données d’intérêt général » paraît ici hors de propos. Il s’agit en effet d’arbitrer le contrôle de données de
traces entre un fabricant de machine et un exploitant, non de décider d’une ouverture type « open data ». L’agriculture est donc un exemple illustrant les insuffisances du cadre
réglementaire actuel concernant les données privées. Au-delà de cet exemple particulièrement parlant, les tensions illustrées précédemment se retrouvent déjà ou seront amenées à se retrouver
dans de nombreux autres secteurs. Ainsi, des secteurs tels que l’automobile, la santé ou les mobilités devront certainement faire l’objet d’interventions des pouvoirs publics. Nous pensons
donc qu’il est nécessaire d’introduire un autre concept généraliste pour justifier de statuer au cas par cas sur des données de trace, non personnelles et dont une meilleure circulation
permettrait plus d’innovation et de concurrence. C’est le cœur de la proposition de cette note. 6. DONNÉES D’INNOVATION : NOTRE PROPOSITION 6.1. DÉFINITION