La fréquence d'échantillonnage et la résolution pour l'enregistrement audio numérique

Aujourd’hui, nous allons nous intéresser à une question qu’il est essentiel de se poser avant tout enregistrement à l’heure du « tout numérique » : quel format audio doit-on utiliser pour obtenir une qualité optimale ?

Accéder à un autre article de la série...

Fréquence d’échantillonnage

Je ne vais pas m’attarder trop sur ce point, car il me semble moins important que le paragraphe suivant. Sachez que, lorsque l’on parle d’enregistrement audio, la fréquence d’échantillonnage (ou « sample rate » dans la langue de Shakespeare) représente le nombre d’échantillons que le convertisseur mesure par seconde. Vous devez tous connaître les célèbres nombres 16-bit/44,1 kHz, ne serait-ce qu’à cause de la « qualité CD ». Enregistrer en 44,1 kHz signifie que le signal audio est mesuré 44 100 fois par seconde. Et que mesure le convertisseur exactement ? Tout simplement le volume du son, mais nous y reviendrons.

Les interfaces audionumériques modernes sont capables de travailler avec des fréquences d’échantillonnage de 44,1 kHz, 48 kHz, 88,2 kHz, 96 kHz, voire 192 kHz et plus. En théorie, plus la fréquence est élevée, meilleure sera la qualité audio, car le plus grand nombre de mesures garantit une précision accrue, non ? Cependant, il faut garder à l’esprit qu’enregistrer avec un « sample rate » élevé génère d’une part des fichiers plus gros, et que d’autre part, cela sollicite plus le processeur de votre machine. Le jeu en vaut-il réellement la chandelle ? Je ne pense pas, d’autant que la différence de qualité ne me semble pas des plus significatives. En effet, le 44,1 kHz est théoriquement suffisant pour reproduire les fréquences audio jusqu’à 22,05 kHz, ce qui est au-delà de la perception humaine plafonnant au mieux à 20 kHz. Du coup, ce taux d’échantillonnage est amplement suffisant. À titre personnel, je travaille en 48 kHz, non pas à cause d’un quelconque compromis me donnant bonne conscience, mais pour une question plus pragmatique, le 48 kHz étant la norme en termes de son pour la vidéo et le surcoût en ressources étant faible par rapport au 44.1, pourquoi donc s’en priver ?

Voyons à présent la question de la profondeur de bit (« bit depth » en anglais).

La taille compte-t-elle ?

Comme je vous le disais, la fréquence d’échantillonnage détermine le nombre de mesures par seconde du volume audio. La profondeur de bit, quant à elle, sert justement à cette mesure du volume à proprement parler. Plus exactement, un bit permet de capturer, et donc retranscrire, une plage dynamique de 6 dB. Ainsi, un enregistrement en 16-bit offre une dynamique théorique de 16 × 6 = 96 dB. Cela peut paraître amplement suffisant pour une production moderne puisque les plus dynamiques d’entre elles présentent un écart de volume entre le passage le plus fort et le passage le plus faible de seulement 18 dB tout au plus. Pourquoi alors s’embêter à travailler avec un « bit depth » plus élevé ? Eh bien, il y a au moins trois bonnes raisons à cela…

La première, c’est qu’il ne faut pas confondre la dynamique présentée par un titre finalisé avec la dynamique d’un instrument lors de sa captation. Et même si cette plage dynamique sera certainement réduite lors des phases de mixage et de mastering, il est toutefois primordial d’avoir une captation la plus proche possible de la source afin de conserver une belle marge de manœuvre lors des étapes ultérieures.

La deuxième vient d’une contrainte inhérente aux appareils utilisés pour l’enregistrement. Tout dispositif analogique (micro, préampli, etc.) génère inévitablement un bruit de fond. Et bien sûr, ces bruits s’ajoutent, donc chaque élément de votre chaîne audio contribue à relever le bruit de fond global, sans parler du bruit ambiant propre à votre lieu d’enregistrement. Bref, imaginons que tout ce beau monde constitue un bruit de 20 dB. Pour ne pas être noyées dans ce fond sonore, vos captations doivent se situer au-dessus de ces 20 dB et la dynamique de votre enregistrement 16-bit passe donc de 96 dB à 76 dB en réalité. Il y a encore de quoi faire me direz-vous. Sauf qu’une autre contrainte propre à l’enregistrement numérique vient mettre son grain de sel…

En audionumérique, le 0 dB crête est une limite absolue. Au-delà, c’est le clip numérique assuré, ce qui se traduit par une bouillie sonore immonde qui n’a rien de musical. Du coup, il convient d’enregistrer bien en dessous du 0 dB afin de se prémunir de tout problème. Cette façon de faire réduit donc une fois de plus notre marge de manœuvre dynamique, à tel point que nous commençons à nous sentir quelque peu à l’étroit avec nos malheureux 16-bit… Heureusement, une solution simple existe : l’enregistrement en 24-bit.

Avec le 24-bit, la plage dynamique théoriquement disponible est de 24 × 6 = 144 dB ! Même avec un bruit de fond cumulé de 20 dB et une hypothétique marge de sécurité de 15 dB avant le clip numérique, cela laisse 109 dB à la portion de signal audio utilisable, soit largement de quoi voir venir. Par conséquent, l’ensemble de nos enregistrements se feront en 24-bit.

Pour finir, un mot sur le 32-bit ou 64-bit à virgule flottante. Si ces résolutions ont une utilité lors des phases de mixage et de mastering, il n’en est rien à l’heure de l’enregistrement. Pourquoi donc ? Tout simplement parce qu’il n’existe pas à ma connaissance de véritables convertisseurs capables d’encoder le son à ces profondeurs de bit.

Sur ce, rendez-vous au prochain épisode !

← Article précédent dans la série :
Le matériel qui sera utilisé lors de cette série Article suivant dans la série :
Les niveaux d’enregistrement →

Quel format d’enregistrement ?

Fréquence d’échan­tillon­nage

La taille compte-t-elle ?

Fréquence d’échantillonnage

La taille compte-t-elle ?