Outils et méthodes de transcription pour l'analyse de l'interprétation vocale dans le rap : l'exemple d'IAM concept

Olivier Migliore, RIRRA 21, université Paul-Valéry Montpellier 3
Nicolas Obin, STMS Lab - IRCAM / CNRS / Sorbonne
Jean Bresson, STMS Lab - IRCAM / CNRS / Sorbonne

Si l'on considère le morceau Rapper's Delight [1] comme la date de naissance officielle du rap, le style musical fête cette année ses quarante années d'existence. Son omniprésence actuelle sur les ondes radio et son succès croissant en termes de vente et d'écoute sur les nouveaux supports de diffusion font de lui un objet musical de premier plan [2]. Pourtant, la musicologie peine globalement à l'appréhender [3]  : l'absence de partition, le peu ou l'absence de mélodie vocale et la vélocité des rythmes vocaux qui caractérisent le rap résistent aux outils traditionnels de l'analyse musicale.

Nos précédentes contributions ont montré l'intérêt d'analyser les rapports accentuels et rythmiques entre la voix et le cadre métrique musical, instaurant la prosodie musicale comme une composante stylistique majeure [4]. Nous avons démontré, par la mise en lumière de différents paramètres inédits de la prosodie musicale, que le placement vocal sur la musique différait et s'avérait singulier selon les artistes, les styles et les époques de production. Dans le cadre de la musique rap, la prosodie musicale occupe une importance toute particulière puisqu'elle se confond avec ce que les rappeurs nomment le flow, aspect emblématique de leur performance vocale à dominance rythmique. Des études musicologiques anglo-saxonnes sur le sujet tel que celles de Kyle Adams l'ont défini comme « all of the rhythmical and articulative features of a rapper's delivery of the lyrics » [5], désignant les aspects rythmiques et articulatoires du phrasé des rappeurs comme centraux. Dans son sillage, Ohriner [6], Condit-Schultz [7] et Komaniecki [8] ont proposé des analyses du flow tout à fait pertinentes, confirmant ses hypothèses de recherche mais étayant leurs travaux sur des transcriptions réalisées à l'oreille : relevés rythmiques, segmentations syllabiques, relevés de l'accentuation, relevés du placement des syllabes sur la mesure, etc. Ainsi, si les transcriptions et les interprétations de ces auteurs ne manquent pas de pertinence, les problèmes posés par l'objet sonore que constitue l'œuvre de musique populaire demeurent. Fondée sur des bases perceptives, cette analyse introduit un biais individuel qui nuit à la reproductibilité des investigations et limite « la teneur de vérité » [9] des interprétations et des conclusions qui en résultent. De nos jours, l'analyse automatique du signal sonore permet pourtant de limiter la part de décisions individuelles et ainsi d'optimiser l'interprétation musicologique en la fondant sur des données objectives. Au-delà de l'objectivation, l'analyse du signal permet de transcrire (ou de rendre accessible à l'analyse) des nuances d'interprétation qui ne sont pas nécessairement audibles ou transcriptibles par l'oreille et le cerveau humain. Ainsi, solliciter l'assistance de l'outil informatique s'avère indispensable pour proposer des transcriptions et des modèles fondés sur la réalité sonore des enregistrements, et non sur la perception de l'analyste.

Dans ce contexte, notre contribution s'attachera à présenter une chaîne de traitement semi-automatique fondée sur la réalité acoustique des enregistrements et permettant la quantification et la transcription sous forme de partition des durées syllabiques. Nous utiliserons pour cela les logiciels Audiosculpt et OpenMusic développés par l'Ircam. Nous appliquerons notre chaîne de traitement au morceau de rap français IAM concept paru en 1991 sur le premier album du groupe de rap marseillais IAM. Il s'agira ainsi de transcrire les phrasés des rappeurs Akhenaton et Shuriken. Nous exposerons d'abord les problématiques engendrées par l'analyse de la prosodie musicale du rap puis dresserons un bref état de l'art technologique de l'analyse musicale assistée par ordinateur. Nous présenterons ensuite les différentes étapes d'extraction et d'annotation des données acoustiques. Enfin, nous détaillerons la composition d'un patch OpenMusic permettant la quantification et la mise en partition des phrasés vocaux des rappeurs. Notre objectif principal est d'objectiver les données sujettes à l'analyse tout en proposant de nouveaux supports pour l'analyse musicale des rapports voix/instruments dans la musique rap.