Se connecter
Se connecter

ou
Créer un compte

ou
Pédago

La hauteur (I)

Les bases de l'acoustique : la hauteur (I)

Pour continuer sur le thème des bases de l’acoustique et après avoir fait le tour du timbre dans les précédents dossiers, penchons-nous sur la notion de hauteur.

Accéder à un autre article de la série...

OreilleD’em­blée, la notion de percep­tion de la hauteur paraît être une éviden­ce… quoique ! Rien que l’éva­lua­tion de l’in­ter­valle du demi-ton n’est statis­tique­ment pas acquise par toute la popu­la­tion !

Il convient de dire que l’oreille humaine peut perce­voir les fréquences comprises entre 20 et 20 000 Hertz. Cela pour des sujets jeunes, bien entendu (si je puis dire) car très tôt, dès 25 ans envi­ron, notre apti­tude à capter les aigus donc les hautes fréquences, décroît rapi­de­ment. Au quoti­dien, notre audi­tion ne semble pas être alté­rée, mais nous risquons de moins bien comprendre, prin­ci­pa­le­ment en milieu bruyant.

Quel para­mètre inter­vient donc dans la percep­tion de la hauteur, c’est-à-dire pour le musi­cien : la note ? C’est la fréquence, expri­mée en Hertz. Elle traduit le nombre de vibra­tions que subit en une seconde le milieu conduc­teur. En effet, pour que le son existe, il faut qu’il y ait de la matière pour le trans­mettre (air, métal, bois… gaz, solide). Dans le vide, le son ne peut pas se propa­ger.

Pour conclure, un son de 20 Hz, notre limite dans le grave, vibre 20 fois en une seconde, et un son de 20 000 Hz, limite dans l’aigu, vibre 20 000 fois par seconde !

La notion d’in­ter­valle

Comment le musi­cien retrouve-t-il au milieu de tout cela, ses repères de voca­bu­laire qui pour lui s’ex­priment par les mots suivants : ton, demi-ton, octave ?

L’oc­tave supé­rieure d’une note (vers l’aigu) est le double de sa fréquence. Exemple LA= 440 Hz donne à l’oc­tave du dessus LA= 880 Hz. L’oc­tave infé­rieure s’ob­tient à l’in­verse en divi­sant la fréquence par 2.

LaLe calcul du demi-ton est plus complexe, car dans l’his­toire, sa valeur n’a pas toujours été constante. Les valeurs d’une gamme du Moyen-Age, issues du prin­cipe de la gamme de Pytha­gore, ne sont pas celles de la gamme de notre piano d’aujour­d’hui.

Au XVIIe siècle appa­raît la gamme dite ‘tem­pé­rée’. C’est-à-dire, une gamme divi­sée en douze demi-tons perçus comme égaux par notre oreille. Inter­vient alors la notion de percep­tion loga­rith­mique et non linéaire de notre oreille et c’est pour cette raison que le demi-ton tempéré sera exprimé par la valeur racine douzième de 2.

racine= 1,059 Valeur du demi-ton tempéré

Pour calcu­ler le demi-ton supé­rieur N2, d’une fréquence N1, il faudra appliquer la petite formule suivante :

N1 x racine= N2

Tableau des fréquences de la gamme tempé­rée pour La3 = 440 Hz

Tableau
Les valeurs ont été arron­dies au dixième

Lorsque l’on se déplace en colonne dans le tableau, l’in­ter­valle fran­chi est l’oc­tave donc pour aller vers l’aigu, on a multi­plié la fréquence par 2. Lorsque l’on se déplace en ligne, l’in­ter­valle est le demi-ton tempéré donc pour aller vers l’aigu, on a multi­plié la fréquence par racine douzième de 2 soit envi­ron 1,059.

Nous avons dit précé­dem­ment qu’iden­ti­fier ce demi-ton n’était pas néces­sai­re­ment une évidence pour tout le monde ! Eh bien à l’in­verse, il faut savoir qu’une oreille parti­cu­liè­re­ment fine peut entendre le 50e de ton. Ce ‘plus petit inter­val­le’, corres­pond au pouvoir disso­cia­teur de l’oreille. Son unité de mesure est le SAVART. Notre oreille a comme nous l’avons dit, une courbe de réponse loga­rith­mique. Donc pour calcu­ler la mesure de l’in­ter­valle entre deux fréquences N1 et N2, il faudra faire l’opé­ra­tion suivante :

log = valeur de l’in­ter­valle en Savart.

  • Un demi-ton = 25 Savarts
  • Un ton = 50 Savarts

On rencontre un autre ‘micro-inter­val­le’ : le Cent, qui corres­pond à la divi­sion du ton par 200.

  • Un ton = 200 Cents
  • Un demi-ton = 100 Cents
  • 4 Cents = Un savart

Le Cent est souvent utilisé comme unité sur les accor­deurs élec­tro­niques des instru­ments et pour évaluer le ‘pitch-shif­ting’ dont nous parle­rons plus loin.

Rôle du timbre dans la percep­tion de la hauteur

Dans le cas d’un son complexe (c’est à dire tous, sauf les sons sinu­soï­daux purs) la valeur de la hauteur est donnée par la fréquence de la plus grave des compo­santes.

Pour les sons harmo­niques où les compo­santes sont toutes des multiples entiers du fonda­men­tal, la règle évidem­ment demeure, mais s’ajoute l’ef­fet redon­dant de la multi­pli­ca­tion par n entier de ce fonda­men­tal. Par exemple pour un LA= 440, on enten­dra 2×440 et 3×440 ainsi de suite dans la série des harmo­niques. Ce ‘mar­te­la­ge’ dans notre cerveau de la valeur du fonda­men­tal multi­plié n fois, ‘impri­me’ la notion de justesse à travers la percep­tion de l’écart constant entre deux harmo­niques, qui n’est autre que la valeur du fonda­men­tal et donc la hauteur du son entendu.

Magnéto à bande

Les timbres harmo­niques ou presque sont donc musi­ca­le­ment, faci­le­ment iden­ti­fiables en termes de hauteur par rapport aux spectres non harmo­niques.

Pour faire varier les hauteurs…

Lorsque l’on enre­gis­trait, il n’y a pas encore si long­temps sur de la bande magné­tique, celle-ci défi­lait à une vitesse constante (19 cm/s, 38 cm/s, 72 cm/s, pour ne citer que les vitesses les plus courantes) devant la tête d’en­re­gis­tre­ment. La lecture ensuite devait néces­sai­re­ment se faire à la même vitesse faute de quoi on consta­tait une modi­fi­ca­tion de hauteur et évidem­ment de durée des événe­ments sonores. Il n’y avait donc guère de possi­bi­lité de faire varier la durée d’un titre, sauf à en couper un bout, au contraire, en ajou­ter ou… tout réen­re­gis­trer en privi­lé­giant la durée globale et non le tempo ! À l’op­posé, il était diffi­cile d’uti­li­ser le chan­ge­ment de hauteur induit par la varia­tion de vitesse pour un ‘rat­tra­pa­ge’ de justesse musi­cale de quelques cents, car c’était au détri­ment de la durée globale du morceau… Le ‘vari-speed’ des magné­to­phones était donc une fonc­tion à mani­pu­ler avec précau­tions !

Jouer avec le temps

Pour­tant, le dispo­si­tif méca­nique permet­tant de chan­ger la vitesse d’une resti­tu­tion musi­cale sans chan­ger la hauteur existe bel et bien, et depuis fort long­temps, avec la… boîte à musique et l’orgue de Barba­rie : plus on ‘tour­ne’ la mani­velle rapi­de­ment, plus le morceau sera joué vite, mais il restera à la même tona­lité ! Les tech­no­lo­gies numé­riques ont amené une solu­tion et c’est suite aux travaux de l’Ir­cam entre autres, sur le programme ‘Chant’ à la fin des années 80, et grâce à l’aug­men­ta­tion de puis­sance des ordi­na­teurs qu’ont été mise en œuvre deux tech­niques fort pratiques, le ‘pitch shif­ting’ et le ‘time stret­ching’, dont le prin­cipe est de disso­cier les deux variables liées, hauteur/temps. En échan­tillon­nant et codant numé­rique­ment un signal, cette disso­cia­tion est effec­tive puisque l’on arrive à consi­dé­rer qu’il peut être vu comme une varia­tion d’éner­gie en fonc­tion du temps.

Analogique à numériqueCodage par échan­tillon­nage d’un signal analo­gique : on obtient des ‘échan­tillons d’éner­gie sono­re’ que l’on peut ensuite, coder sous forme de tables de données et alté­rer par une varia­ble…

Si l’on simpli­fie consi­dé­ra­ble­ment l’ana­lyse du procédé, rien n’em­pêche donc sur le prin­cipe, de relire ces données d’éner­gie à l’iden­tique, mais à une vitesse diffé­rente, ce qui aura comme effet de modi­fier la vitesse de resti­tu­tion du signal. On conserve ainsi les données fréquen­tielles iden­tiques, mais resti­tuées plus lente­ment : le tempo musi­cal a été modi­fié, mais pas la fréquence des notes, c’est le time stret­ching. À l’in­verse, on peut conser­ver le tempo de resti­tu­tion en modi­fiant la hauteur des données numé­ri­sées ; il s’agira alors de pitch shif­ting.

Les précau­tions à prendre

Pitch d'une platine
Pitch d’une platine vinyle

Les opéra­tions de trai­te­ment durée/fréquence doivent être mani­pu­lées avec précau­tions, ne serait-ce que parce que la quan­tité de données éditées peut être impor­tante et que cela influe sur les apti­tudes de stockage de nos équi­pe­ments. On devra donc parfai­te­ment mesu­rer les tenants et abou­tis­sants avant de se lancer. Et il y a des ‘lou­pés’. Exemple d’un pitch shif­ting non souhaité : le ré-échan­tillon­nage. Sans précau­tions parti­cu­lières, passer un enre­gis­tre­ment audio de 44 kHz à 48 kHz va induire une distor­sion de hauteur de plus d’un demi-ton !

Dans tous les cas où on agit sur le rapport temps/fréquence, on crée une distor­sion des para­mètres audio du signal d’ori­gine. On sait que le contenu harmo­nique et que la présence de partiels d’un son sont spéci­fiques de la note jouée, ne serait-ce que parce que le dosage entre le signal entre­tenu et le tran­si­toire d’at­taque sont carac­té­ris­tiques de chaque note : si l’on analyse en détail la struc­ture d’une note aiguë et d’une note grave de piano, on consta­tera que la propor­tion dans le son final entre choc du marteau et réso­nance de la corde est bien diffé­rente. Si l’on ‘dé-pitche’ un signal en pitch shif­ting, on aura un ‘clo­ne’ aigu de la note grave, par exemple, mais pas une ‘vraie’ note aiguë… D’où la néces­sité du multi-sampling dans une banque d’échan­tillons : on ne peut se satis­faire d’un seul exem­plaire, aussi bon soit-il, en le désac­cor­dant pour produire toutes les notes… De même, modi­fier la vitesse de resti­tu­tion d’un frag­ment sonore numé­risé n’est pas sans risques : on va évidem­ment compres­ser les tran­si­toires et modi­fier le déve­lop­pe­ment des harmo­niques, au point d’en modi­fier signi­fi­ca­ti­ve­ment l’iden­tité ; en ‘com­pres­sant’ tempo­rel­le­ment, ça peut parfois rester accep­table. Dans l’autre sens, il faut systé­ma­tique­ment oublier… Tout cela pour conclure sur le fait que si le pitch shif­ting et le time stret­ching sont deux fonc­tion­na­li­tés remarquables du trai­te­ment numé­rique du signal, il faudra les limi­ter, pour rester crédible, à des utili­sa­tions de ‘rat­tra­pa­ge’ minimes : au-dessus de 10 à 15 % de correc­tion, on dété­riore trop le signal…

On en fait quoi ?

Beatles
The Beatles, adeptes du dé-pitching

Si l’on reste dans ces propor­tions, une utili­sa­tion bien contrô­lée du time stret­ching peut permettre soit, de résoudre un problème de durée brute d’un frag­ment sonore (pour une publi­cité par exemple, où l’on raisonne à la secon­de…), et pour tous les cas de reca­lage d’une musique à l’image (passage d’un stan­dard vidéo à un autre, par exemple NTSC vers PAL). En ce qui concerne le pitch shif­ting, une appli­ca­tion très spec­ta­cu­laire est le fort astu­cieux logi­ciel Melo­dyne qui permet de ‘rat­tra­per’ la justesse d’une note soliste ou depuis sa dernière mise à jour, une des notes d’un accord ; plus besoin de chan­ter juste pour faire le tube du siècle…

Si l’uti­li­sa­tion correc­tive de ces deux fonc­tion­na­li­tés doit être faite avec parci­mo­nie, la produc­tion phono­gra­phique recèle de nombreux exemples d’ex­ploi­ta­tions artis­tiques : Jimi Hendrix, les Beatles, Emer­son Lake & Palmer, Pink Floyd ont, du temps de l’ana­lo­gique, abusé du procédé de dé-pitching, non plus à fina­lité correc­tive, mais créa­trice. Par ailleurs, la lecture ‘pitch shif­tée’ d’un son instru­men­tal peut créer, compte tenu des distor­sions timbre/durée que nous avons citées plus haut, des ‘cli­mats’ sonores uniques : une cymbale frot­tée à l’ar­chet sur la tranche et dont la lecture est ralen­tie par 1,5 à 2 donne une ambiance stel­laire dont ont usé et abusé les compo­si­teurs de musique de films de science-fiction des années 70 et 80…

← Article précédent dans la série :
Le timbre (II)
Article suivant dans la série :
La hauteur (II) →
Soyez le premier à réagir à cet article

    Vous souhaitez réagir à cet article ?

    Se connecter
    Devenir membre