Les métadonnées : un enjeu majeur pour le secteur de la musique

Les métadonnées : un enjeu majeur pour le secteur de la musique


Play all audios:


Avec le développement d’Internet et des technologies numériques, les acteurs historiques du secteur de la musique se sont repositionnés sur toute la chaîne de valeur. En quoi les métadonnées


constituent-elles pour eux, mais aussi pour les nouveaux acteurs de l’Internet, un enjeu ? Jérôme Pons Publié le 21 avril 2015 Le secteur de la musique, qui regroupe la musique enregistrée


et le spectacle (vivant musical), se trouve au cœur de la révolution numérique. La chaîne de valeur de ce secteur couvre plusieurs étapes depuis la création jusqu’à la distribution de la


musique enregistrée ou la diffusion du spectacle. Les acteurs historiques sont impliqués à chaque étape : création (artiste auteur, compositeur), production (artiste interprète, producteur


phonographique, de spectacles), édition (éditeur phonographique, de musique), distribution physique (grossiste, détaillant), diffusion (ex : radio, télévision, lieu sonorisé, salle de


cinéma, de spectacles), consommation (ex : chaîne HiFi, poste de radio, téléviseur), stockage et échange de personne à personne sur support physique (ex : CD). D’autres acteurs historiques


interviennent en parallèle : gestion collective des droits (société de gestion collective) et dépôt légal (ex : BnF, INA). La transition numérique s’est répandue sur toute la chaîne en


proposant des alternatives aux étapes traditionnelles : distribution numérique (téléchargement et _streaming_), paiement en ligne (billetterie en ligne), consommation numérique (ex :


tablette tactile, téléphone mobile), stockage et échange de personne à personne par Internet (ex : _email_ avec pièce jointe, transfert FTP). Des étapes complémentaires ont également émergé 


: compression de la musique enregistrée dans des fichiers audio (ex : MP3) ou protection de la musique enregistrée (DRM, tatouage et empreinte numérique). La révolution numérique apporte


aussi de nouvelles possibilités avec le partage des fichiers audio par Internet (ex : réseau social, réseau pair à pair, plateforme UGC) et l’adaptation des modèles économiques (ex : gratuit


financé par la publicité, payant à l’acte ou par abonnement). - L’écosystème de la culture représente à la fois le spectacle et la musique enregistrée. Cette dernière, à travers l’industrie


du disque, appartient aux industries culturelles qui conçoivent des produits destinés à être commercialisés. - L’écosystème des télécommunications, qui s’était cantonné au téléchargement de


sonneries pour téléphones mobiles, offre un accès à Internet (ex : ADSL, 3G, WiFi) et aux services en ligne (ex : plateformes de distribution). - L’écosystème de l’informatique et des


équipements électroniques a étendu sa gamme d’équipements électroniques (ex : tablette tactile, téléphone mobile) et construit une offre de services en ligne avec les réseaux sociaux (ex :


Facebook, Twitter), les plateformes de distribution de la musique enregistrée (ex : Apple _iTunes_, Google _Google Play_ en téléchargement ou Deezer, Spotify en _streaming_) ou de vidéos


musicales (ex : Dailymotion, Google _YouTube_ en _streaming_). L’articulation entre ces trois écosystèmes passe nécessairement par les métadonnées. C’est pourquoi elles sont essentielles.


MÉTADONNÉES : DE QUOI PARLE-T-ON ? Les données multimédia (ex : musique enregistrée) et les métadonnées (ex : nom du morceau) coexistent. Les données multimédia (_media data_) sont fixées


sur un format de production (ex : PCM pour la musique enregistrée) qui va être adapté aux différents supports physiques (ex : WAV pour le CD) et plateformes de distribution (ex : AAC, FLAC


ou MP3). Les métadonnées (_metadata_) sont définies comme des « données relatives à des données » et utilisées pour identifier et rechercher (métadonnées de propriété), gérer (métadonnées de


gestion de droits), comprendre, décrire et qualifier (métadonnées de description), enrichir (métadonnées d’enrichissement) ou analyser (métadonnées d’analyse) les contenus1. Les métadonnées


peuvent être intégrées au fichier audio transportant les données multimédia (ex : champs ID3 dans un MP3) ou transportées dans des formats d’échange (ex : XML). Nous pouvons distinguer deux


grandes familles de métadonnées : les métadonnées juridiques et les métadonnées de contenu. Parmi les MÉTADONNÉES JURIDIQUES, les _métadonnées de propriété_ se réfèrent aux codes


d’identification normalisés : code EAN (« code-barres  » sur un CD ou un billet de spectacle), IPI (ayants droit), ISNI (contributeurs de type auteur, compositeur, interprète), ISRC (musique


enregistrée), ISWC (œuvre musicale) etc. Il existe également des codes d’identification propriétaires : code ASIN d’Amazon (produit), _Content ID_ de Google (contenu sur _YouTube_), COCV de


la Sacem (oeuvre musicale) etc. Les _métadonnées de gestion de droits_ sont utilisées commercialement et juridiquement : prix de vente, types de supports (ex : CD, formats des fichiers


audio), territoires d’exploitation etc. Les MÉTADONNÉES DE CONTENU regroupent les métadonnées de description, d’enrichissement et d’analyse. Les _métadonnées de description_ facilitent la


compréhension des données multimédia (d’où leur emploi massif) et se décomposent en : - _métadonnées de catalogage_ : titre du disque, nom de l’artiste, du producteur phonographique, de


l’éditeur phonographique, du morceau, sa durée, son numéro de plage, ses auteurs, ses compositeurs, ses artistes interprètes etc ; - _métadonnées_ « _caractérisantes_ » : genre musical etc ;


- _métadonnées __techniques_ : nombre de canaux audio (ex : stéréo), fréquence d’échantillonnage (ex : 44.1 kHz), quantification (ex : 16 bits) etc. Les _métadonnées d’enrichissement_


apportent des informations relatives à l’artiste et à son oeuvre : paroles de chansons, biographie, chroniques, photos, nom du producteur de spectacles, site Internet officiel, réseaux


sociaux de l’artiste, plateformes de distribution etc. À ces métadonnées s’ajoutent : - les métadonnées « conjoncturelles » qui sont générées continûment et de manière algorithmique


(notamment pour la recommandation) : nombre de ventes (disques, téléchargements), d’écoutes ou de vues et durées associées (_streaming_), notations par les consommateurs, similarités


(artistes, albums, morceaux) etc ; - les données comportementales : préférences des consommateurs (« les consommateurs ayant acheté ce produit ont également acheté celui-là ») etc. Les


_métadonnées d’analyse_ apportent une analyse fine du fichier audio associé à chaque œuvre et sont générées de manière algorithmique (notamment pour la reconnaissance automatique des œuvres


musicales ou la recherche de similarités) : tempo (120 BPM), tonalité (do#) etc. Les formats d’échange, auxquels les métadonnées peuvent être intégrées, sont associés à des langages de


représentation de données employés pour structurer, représenter et échanger les métadonnées : CSV, JSON, XML etc. LES ENJEUX DES MÉTADONNÉES POUR LE SECTEUR MUSICAL De nombreux acteurs


interagissent au sein de la chaîne de valeur. En particulier, le secteur de la musique est structuré juridiquement et opérationnellement par l’échange de rapports (_reporting_), de flux


financiers (ex : droit d’auteur, droits voisins et autres) et autres données (ex : support physique, fichier, autorisation, droits, contrat ou accord). Les interactions peuvent être


automatisées (ex : transmission d’un rapport) dès lors que tous les acteurs de la chaîne de valeur ont correctement renseigné les métadonnées (ex : ISRC, nom de l’artiste interprète, nombre


d’écoutes) et que chaque interaction est verrouillée juridiquement (ex : contrat) et techniquement (ex : format d’échange XML et norme d’échange des métadonnées DDEX). _Figure 1 : Chaîne de


valeur du secteur de la musique_ Certaines interactions établies à un bout de la chaîne se répercutent à l’autre bout. Le reversement des _royalties_ aux artistes interprètes est un exemple


parmi d’autres. Retenons que sans les métadonnées, une partie des créateurs (auteurs, compositeurs, interprètes) n’est pas rémunérée au titre du droit d’auteur ou celui des droits voisins.


Il s’agit donc du premier enjeu. Par exemple, le rapport transmis par la plateforme de distribution à chaque distributeur numérique, de type agrégateur numérique (ex : Believe, IDOL) ou


major discographique (Sony, Universal ou Warner), entraîne la rémunération de chaque producteur phonographique, suivie par le reversement des _royalties_ à chaque artiste interprète sous


contrat avec le producteur. Le deuxième enjeu concerne l’acquisition de droits d’exploitation des œuvres. Les éditeurs de services en ligne (éditeurs de service de musique en ligne et


hébergeurs de plateformes de vidéos musicales) lançant une nouvelle plateforme de distribution négocient les droits d’exploitation de la musique enregistrée : avec la Sacem pour le droit


d’auteur (gestion collective) et avec chaque producteur phonographique pour les droits voisins (gestion individuelle). Dans le second cas, les éditeurs mènent parfois des négociations


longues (afin de distribuer plusieurs millions de morceaux) et douloureuses (avec les plus gros labels discographiques)2. Troisième enjeu : la diversité culturelle et le référencement. À


l’échelle nationale, il s’agit de rendre visibles tous les répertoires musicaux français, commerciaux ou non. Les producteurs phonographiques disposant d’un petit catalogue, de peu de


visibilité et privilégiant le qualitatif au nom de la diversité culturelle, connaissent deux difficultés : l’accès aux éditeurs de services en ligne et le référencement efficace de leur


catalogue. Dans le premier cas, les producteurs peuvent recourir à un agrégateur numérique ou à une société de négociation collective des droits comme Merlin3. À l’échelle internationale, il


s’agit notamment d’harmoniser les métadonnées « caractérisantes » de type genre musical car, par exemple, la musique pop/rock française est perçue comme de la variété internationale au


Japon et n’apparaît donc pas dans les rayons pop / rock des détaillants). La reconnaissance automatique des œuvres musicales et la détection automatique des contenus constituent le quatrième


enjeu. Selon le rapport « Lescure », une « base d’empreintes numériques uniques », couplée à un dispositif de reconnaissance automatique des œuvres et de détection automatique des contenus


disponibles sur les plateformes de distribution, offrirait aux ayants droit un gain de temps dans les procédures de suppression des contenus illicites. Certains hébergeurs de plateformes de


vidéos musicales proposent ainsi des outils de reconnaissance automatique des œuvres musicales (basés sur le marquage par empreinte numérique et sur les métadonnées fournies par les


producteurs phonographiques) et des outils de détection automatique des contenus illicites. LES 3 PRÉREQUIS Trois éléments sont indispensables pour saisir ces différents enjeux. Le premier


est de disposer de bases de données musicales de métadonnées consolidées ; le deuxième de certifier l’usage des œuvres et de fiabiliser le reporting ; le troisième de disposer de services


techniques spécialisés. En outre, les rapports « Selles » et « Lescure » ont rappelé que la mise à disposition, par les producteurs phonographiques et pour chaque œuvre, de métadonnées


consolidées (harmonisées, complétées, fiabilisées) constitue un réel besoin pour le secteur de la musique4. À ce titre, Jean-Robert Bisaillon a analysé des services techniques spécialisés


(ex : CDDB / Gracenote), des logiciels (ex : Apple _iTunes_), des normes de métadonnées (ex : ID3) et plusieurs dizaines de bases de données musicales et recensé près de 300 champs de


métadonnées, ce qui nous donne un aperçu de l’ampleur de la tâche d’harmonisation des métadonnées. En outre, il a élaboré le logiciel d’indexation de métadonnées TGiT, qui implémente les


codes ISNI, ISRC et ISWC5. En France, les principales bases de données musicales sont : - la base Sacem : œuvres (déposées par ses adhérents) identifiées par les codes COCV / ISWC ; - la


base Adami : musiques enregistrées (récupérées depuis les bases des producteurs phonographiques) ; - la base Spedidam : musiques enregistrées (déclarées par ses membres) ; - la base SCPP et


base SPPF : musiques enregistrées (déposées par leurs adhérents respectifs) identifiées par le code ISRC ; - la base BIPP (SNEP / Kantar Media) : catalogues (des producteurs phonographiques)


actifs sur le marché français. Par ailleurs, les mêmes rapports ont identifié le besoin d’une« base de référence exhaustive »ou d’un« registre ouvert de métadonnées »afin de rassembler pour


chaque œuvre les métadonnées nécessaires à l’identification des œuvres et de leurs ayants droit4. En France, il existe déjà plusieurs bases de référence : - le projet Bee Music (SNEP / UPFI


/ Kantar Media) : catalogues actifs sur le marché français (structuration et consolidation de la base BIPP) ; - la base BOEM (CSDEM / SEAM) : paroles de chansons identifiées par les codes


COCV / ISWC (œuvres musicales), IPI (ayants droit) et ISRC (musique enregistrée). Il en est de même au niveau internationalavec : - la base GRD (abandonnée en 2014) : œuvres musicales ; - la


base IPD (IPDA / SCAPR) : artistes interprètes (_performers_) identifiés par le code IPN ; - la base MusicBrainz : musiques enregistrées identifiées par le code ISRC et reliées aux codes


IPI (ayants droit) et ISWC (œuvres musicales). La deuxième nécessité est de certifier l’usage des œuvres (ex : nombre de téléchargements, d’écoutes, de vues) et de fiabiliser le reporting.


Dans un engagement « Hoog », les producteurs phonographiques et les éditeurs de services en ligne se sont engagés à étudier la procédure de reporting par les éditeurs, « dans une logique de


simplification, d’économie et de fiabilité » permise notamment par la norme DDEX. À cet effet, un tiers de confiance peut s’intercaler entre un éditeur et un producteur phonographique ou une


société de gestion collective4. Enfin, il faut disposer de services techniques spécialisés. Certains répondent aux différents besoins exprimés précédemment. Ainsi, en


matièred’enrichissement des métadonnées, l’API_ MusicStory Pro_ (MusicStory) propose des métadonnées telles que des photos, des biographies ou des chroniques. Concernant lareconnaissance


automatiquement des œuvres musicales, le boîtier_Boxcast_ (Yacast) placé dans les clubs et les discothèques reconnaît automatiquement les œuvres pour la Sacem ou la SPRÉ ; l’API_MusicStory


Pro_ identifie sans ambiguïté l’artiste (IPI), la version de l’album (EAN), les titres des œuvres (ISRC) et les œuvres musicales (ISWC). Pour ce qui est de la certification de l’usage des


œuvres et la fiabilisation du _reporting_, le projet Armonia (GIE européen / BMAT) enrichit les rapports de ventes issus des plateformes de distribution et facilite la facturation et la


répartition des droits ; le tiers de confiance Transparency Rights Management certifie quant à lui le _reporting_ entre la chaîne musique de Dailymotion et la Sacem. L’AVENIR : MEILLEUR


PARTAGE DE LA VALEUR ET NORME INTERNATIONALE ? Fin 2014, l’Adami a pointé du doigt le partage « inéquitable » de la valeur dans l’abonnement au service de musique en ligne de type


_streaming_. Selon l’Adami, sur les 9,99 € facturés chaque mois, l’État perçoit 1,99 € (TVA), la Sacem 1 € (droit d’auteur), les « intermédiaires » 6,54 € (70 % producteurs phonographiques,


30 % éditeur de service de musique en ligne) et les artistes 0,46 € (répartis entre tous les artistes écoutés par l’abonné pendant un mois). Rappelons en effet que les plateformes de


distribution négocient directement les droits voisins avec chaque producteur phonographique (gestion individuelle). La collecte des droits voisins auprès des plateformes de distribution, par


les sociétés de gestion collective (et non les producteurs), fait débat et l’objet de plusieurs propositions de la Spedidam. Une norme internationale garantirait l’interopérabilité des


systèmes et la fiabilité des échanges en spécifiant une architecture (comprenant des éléments reliés par des interfaces tels qu’une base de données), des protocoles de transmission et des


messages échangés (entre éléments). Le succès, dans le secteur des télécoms, de la norme GSM peut à cet égard nourrir la réflexion. Dans les années 1980, un opérateur mobile pouvait déployer


un système propriétaire dans son pays si bien qu’un abonné mobile voyageant d’un pays à l’autre devait louer un téléphone mobile et souscrire un abonnement dans le pays d’accueil.


L’itinérance de l’abonné mobile (usage d’un même téléphone mobile, service de téléphonie mobile et abonnement à l’étranger) était alors impossible. Dans les années 1990, la norme GSM a


permis d’une part aux abonnés mobiles de devenir « itinérants » et d’autre part à chaque opérateur mobile de déployer un système garantissant l’interopérabilité technique (système GSM) et


juridique (accords bilatéraux entre opérateurs mobiles de pays frontaliers) ainsi que la fiabilité des échanges. Un abonné mobile itinérant (français) pouvait dès lors voyager en Angleterre


et consulter un service bancaire français depuis son téléphone mobile. Les échanges étant majoritairement normalisés entre l’abonné mobile et le service bancaire, la transaction s’effectue


automatiquement sur toute la chaîne. Appliquons cet exemple à l’ « itinérance du droit d’auteur ». L’abonné mobile est remplacé par un consommateur de musique anglais, le réseau mobile


anglais par une plateforme de distribution anglaise, les opérateurs mobiles anglais et français par des sociétés de gestion collective anglaise (ex : PRS for Music) et française (ex : Sacem)


et le service bancaire français par un créateur français (auteur, compositeur). Les échanges étant majoritairement propriétaires (ex : document imprimé, fichier texte, API) entre le


consommateur de musique et le créateur, la transaction ne s’effectue pas automatiquement sur toute la chaîne. _Figure 2 : Échanges majoritairement normalisés (ex : GSM) et échanges


majoritairement propriétaires (ex : gestion collective du droit d’auteur)_ Dans le secteur de la musique, la norme DDEX définit une architecture comportant plusieurs éléments (ex :


plateforme de distribution, distributeur numérique, éditeur phonographique, société de gestion collective, fournisseur de service technique spécialisé). Ces éléments d’architecture échangent


des messages de notification de la publication d’une nouvelle œuvre ou des rapports de ventes (au format d’échange XML) à l’aide de protocoles de transmission (AMEP, ECHO ou DCHO). Selon le


rapport « Phéline », les producteurs de phonogrammes et les éditeurs de services en ligne tendent à adopter la norme DDEX pour leurs rapports de ventes. Cependant, chaque nouvel entrant (ex


 : plateforme de distribution) est contraint de s’interfacer aux différents acteurs déjà en place (ex : distributeur numérique, société de gestion collective, fournisseur de base de données


musicales) et d’intégrer des solutions normalisées (ex : DDEX) ou propriétaires (ex : fichier texte, API) sur chaque interface. Le coût de ces développements spécifiques constitue une


barrière à l’entrée pour tout nouvel entrant, qui ne pourra pas les amortir sur plusieurs interfaces dans le cas de solutions propriétaires. De même, l’implémentation de DDEX est complexe


(modèle de données) si bien que des fournisseurs de services spécialisés comme NueMeta commercialisent des librairies et API compatibles DDEX auprès des nouveaux entrants. Or toutes les


_start-up_ ne peuvent pas financer de tels services et se contentent de développements spécifiques. L’architecture proposée par DDEX semble s’imposer dans le secteur de la musique


enregistrée mais ne couvre pas les secteurs connexes comme le spectacle (ex : agenda des spectacles, billetterie en ligne, captation audiovisuelle de spectacle) ou la synchronisation de


musique enregistrée (ex : film, jeu vidéo, publicité). Une norme internationale, commune à différents secteurs des industries culturelles, intégrant un ou plusieurs « registres ouverts de


métadonnées », et simple d’implémentation, serait donc bénéfique au secteur de la musique. Le développement d’une norme internationale largement adoptée (ex : GSM) nécessite une dizaine


d’années. Il est donc temps que les industries culturelles unissent leurs efforts, dès à présent, afin qu’une norme internationale, spécifiant une architecture globale rétrocompatible avec


l’existant (ex : code ISRC, DDEX etc), soit opérationnelle à l’horizon 2025. -- Crédit photo : François Quinton ACRONYMES Automated Message Exchange Protocol (norme DDEX) Application


Programming Interface (informatique) Amazon Standard Identification Number (Amazon) Base de données Interprofessionnelle des Producteurs Phonographiques (SNEP / Kantar Media) Base d’Oeuvres


de l’Edition Musicale (CSDEM / SEAM) (nombre de) Battements Par Minute (audio) Coma-Separated Values (norme IETF) DSR Choreography (norme DDEX) Digital Data EXchange (norme DDEX) Digital


Rights Management (protection) Digital Sales Report (norme DDEX) European Article Numbering (norme ISO) ERN Choreography (norme DDEX) Electronic Release Notification (norme DDEX) File


Transfer Protocol (norme IETF, Internet) Groupement d’Intérêt Economique Global Repertoire Database (consortium) Grande Surface Alimentaire (ex : Auchan) Global System for Mobile


communications (norme ETSI, téléphonie mobile) Grande Surface Spécialisée (ex : Fnac) International Performers Database (IPDA / SCAPR) Interested Parties Information (CISAC) International


Performer Number (SCAPR) International Standard Name Identifier (norme ISO, CISAC / SCAPR) International Standard Recording Code (norme ISO, IFPI) International Standard Musical Work Code


(norme ISO, CISAC) JavaScript Object Notation (norme ISO) Pulse Code Modulation (audio) REpresentational State Transfer (informatique) User-Generated Content (Internet) Vente Par


Correspondance eXtended Markup Language (norme W3C) RÉFÉRENCES Patrick ZELNIK, Jacques TOUBON et Guillaume CERUTTI, _Création et Internet_, rapport remis au Ministre de la Culture et de la


Communication, 7 janvier 2010, Rémi BOUTON, _L’enjeu des métadonnées musicales_, IRMA, 4 avril 2011 (dossier) et (interviews) _Feuille de route stratégique : métadonnées culturelles et


transition Web 3.0_, ministère de la Culture et de la Communication, janvier 2014, et _Appel à contributions pour une étude sur les métadonnées dans les médias et les industries


culturelles_, Ministère de la Culture et de la Communication, 17 juin 2014 * 1Jean-Noël GOUYET, DMAM : médias numériques, métadonnées et gestion Éditions Techniques de l’Ingénieur, TE5885,


10 août 2004 et Formats-conteneurs de médias numériques - Médias et formats – Caractéristiques - Formats de médias et formats-conteneurs de médias Éditions Techniques de l’Ingénieur, TE5885,


10 août 2009. * 2Patrick ZELNIK, Jacques TOUBON et Guillaume CERUTTI, Création et Internet, rapport remis au ministre de la Culture et de la Communication, 7 janvier 2010 et Franck RIESTER,


Didier SELLES, Alain CHAMFORT, Daniel COLLING, Marc THONON et Jean-Baptiste GOURDIN, Création musicale et diversité à l’ère numérique, rapport remis au ministre de la Culture et de la


Communication, 3 octobre 2011. * 3Christian PHÉLINE, Musique en ligne et partage de la valeur - État des lieux - Voies de négociation et rôles de la loi, rapport remis au ministre de la


Culture et de la Communication, 18 décembre 2013 et Industrie musicale : livre blanc sur le partage de la valeur à l’ère des explosions numériques, UPFI, 13 novembre 2013. * 4a4b4cFranck


RIESTER, Didier SELLES, Alain CHAMFORT, Daniel COLLING, Marc THONON et Jean-Baptiste GOURDIN, op. cit. ; et Pierre LESCURE, op. cit.. * 5Jean-Robert BISAILLON, Métadonnées et répertoire


musical québécois : un essai de mobilisation des connaissances dans le nouvel environnement numérique, INRS / UQAM, juin 2013 (thèse), TGiT, et ISNI, ISRC, ISWC.