Se connecter
Se connecter

ou
Créer un compte

ou

Sujet [FAQ] Toutes les réponses à vos questions existentielles sur le 24 bits et le 96 kHz

  • 562 réponses
  • 93 participants
  • 185 590 vues
  • 128 followers
1 [FAQ] Toutes les réponses à vos questions existentielles sur le 24 bits et le 96 kHz
Ce thread a pour but de centraliser les informations sur l'intérêt des résolutions élevées en audio, par exemple 24 bits/96 kHz. Je commence par un auto-quote :


La quantification

Le 24 bits est plutôt quelque chose d'intéressant, puisque la hausse de résolution dans ce cas augmente la dynamique sur les enregistrements, ce qui peut être très utile lorsqu'on enregistre avec des préamplis qui ont un niveau de sortie en dessous de 0 dB... C'est complètement inutile par contre sur des instruments virtuels ou du tout numérique, entre autres puisque les séquenceurs (et donc les plug-ins) fonctionnent en interne avec du 32 bits à vigule flottante...


Les fréquences d'échantillonnage

Pour la question de la fréquence d'échantillonnage, l'intérêt pratique d'aller à 88.2 ou 96 kHz, bien qu'il existe, est beaucoup plus faible que celui du 24 bits, ce qui explique que des professionnels recommandent peu souvent à des home-studistes de lâcher le 44.1 kHz, mais demandent toujours du 24 bits.

Ensuite sur un enregistrement seul, à moins d'avoir une oreille d'extra-terrestre, il est impossible d'entendre ou même de visualiser sur un spectrogramme une différence notable dans le domaine de l'audible entre quelque chose d'enregistré avec un microphone et un bon préampli/une bonne carte son en 44.1 kHz et en 96 kHz. Si différence il y a, c'est que la qualité des convertisseurs n'est pas la même.

Quel est donc l'intérêt de ces fréquences d'échantillonnage élevées alors ? Dans une chaine de traitements numériques, bien que les ingénieurs/développeurs mettent des filtres anti-aliasing dans leurs produits (repliement au dessus de la demi-fréquence d'échantillonnage, voir théorème de Shannon/Nyquist), il y a toujours un peu de repliement qui se fait, surtout si certains rigolos n'ont pas mis du tout de dispositifs anti-aliasing, comme sur certains synthétiseurs numériques (ce qui peut être parfois intéressant au niveau sonore, mais très grave sur une simulation d'amplificateur guitare). Augmenter la fréquence d'échantillonnage permet de repousser la limite en fréquence du repliement, et donc de rendre les traitements plus propres. Mais là encore, il est probable que vous ne puissiez pas entendre de différence flagrante...

Enfin, le 48 et le 96 kHz sont des fréquences utilisées plutôt en vidéo. La conversion de fréquence d'échantillonnage étant moins complexe du 88.2 au 44.1 que du 96 au 44.1, il est généralement conseillé de bosser en 88.2, sauf si vous avez vraiment confiance en votre logiciel de conversion. Travailler en 48 par contre est une grosse connerie, parce que ça apporte presque rien au niveau théorique, et que la conversion 48 vers 44.1 peut être source de bordel supplémentaire par rapport au 44.1 direct...


96 kHz et 24 bits dans un home-studio ???

Pour terminer ce monologue, une remarque très importante, discuter des fréquences d'échantillonnage et de la quantification optimales c'est bien, mais il faut déjà avoir du matos derrière, et réaliser des mixages à la hauteur, pour que l'intérêt des résolutions supérieures soit pertinent dans vos projets personnels ! Ne pas savoir mixer correctement ses morceaux et bosser avec du 24 bits/96 kHz me semble être une aberration...

Petite astuce aussi pour savoir si se prendre la tête dans votre cas vaut le coup : faites un enregistrement + mixage avec du 96 kHz/24 bits. Exportez le résultat en WAV, puis convertissez le en 44.1K/16 bits. Modifiez la fréquence d'échantillonage sur tous vos enregistrements et à l'intérieur du projet, puis faites à nouveau un export. Comparez les deux sur votre système d'écoute habituel. Si vous n'entendez pas de différences notables et intéressantes, arrêtez de vous prendre la tête :mrg: Ou allez acheter du meilleur matos... Autre cas : si "les deux sonnent aussi mal", retournez bosser le mixage, en 44.1K/16 bits bien sûr :oops2:

Développeur de Musical Entropy | Nouveau plug-in freeware, The Great Escape

Afficher le premier post
51
Salut ! juste une petite question sur l'ADAT .

si j'ai compris l'adat contient 8 cannaux si la fréquence est inferieur a 96hz et 4 si la fréquence est de 96hz ou plus ?

mercie !
52
Pour disposer de l'ADAT en 88.2 et 96 kHz il faut que les deux appareils qui communiquent supportent l'ADAT SMUX, ce qui n'est pas le cas de tous. A ce moment là c'est effectivement 4 canaux par fibre optique.
53
Ok mercie duch64
54

Citation : La normalisation en 24 bits entraine quel genre d'erreur d'arrondi?
Pour moi c'est minime, 24 bits sur 144 db de dynamique ça fait 0,0000009 db d'écart entre deux valeurs consécutives, donc une erreur d'arrondi de cet ordre là.
Mais je me plante ou bien?



petite question que j'avais posé à gabou par mail, qu'elle profite à tous et d'ailleurs que tous ceux qui souhaitent y répondent.

j'ai lu tout le thread mais j'ai pas trouvé de réponse.

55
Ce qui va suivre est potentiellement entaché d'erreurs, faisez gaffe. :mrg:

Citation : La normalisation en 24 bits entraine quel genre d'erreur d'arrondi?


Ca dépend de comment était le fichier avant la normalisation.

Si on prend un signal à 0dB (donc qui utilise au mieux les 24 bits) et que tu introduis une erreur sur le bit de poids le plus faible, en puissance acoustique ça fera une erreur d'un niveau sonore inférieur de 144dB par rapport au signal, autant dire, rien.

Si je ne m'abuse, les dB des fader d'une séquenceur (ou d'une console) correspondent non pas à un volume sonore mais à une tension électrique (de même que les 24 bits d'un wav). On doit être en dBV (comme volts, ou aussi dBU) ; tandis qu'en acoustique on est en dB SPL. Or 1dBV = 2dB SPL.

Parenthèse : Si tu as fait de l'électricité tu sais que P=UxI, or avec nos appareils on pilote en tension (les bits du wav, les convertisseurs N/A, les amplis de puissance, tous travaillent en tension) des HPs qui sont une résistance. On a I=U/R, soit P=UxU/R. La puissance varie donc comme le carré de la tension électrique ; quand on passe aux logarithmes, ça fait un "fois 2".

Reprenons là où on en était.
Supposons que ton signal atteigne le 0dB sur le master fader. Saboter le 24ème bit, revient à injecter un bruit. Supposons que ce bruit vienne d'un fichier dont le niveau est constant et à 0dB V, tu l'ajoutes sur une piste, et tu règles le fader de cette piste à -72dB V (144 divisé par 2 car là on bosse en dBV et non en dB SPL). Voilà une dégradation équivalente.

Si tu n'introduis que cette erreur, et une seule fois, et même en 16 bits (soit à -48dB V), ça va pas s'entendre beaucoup.
:bravo:

Néanmoins, quand tu normalises tu peux faire des erreurs bien plus grosses que l'arrondi sur le dernier bit. Si ta normalisation ajoute 6dB V à ton fichier, tu as ajouter autant de bruit sur les bits de poids faible. Si tu es en 16 bits, soit 48dB V, ça va faire un bruit d'environ -42dB V. En 24 bits : un bruit à -66dB V.

Si tu fais un beau mix sur de bonnes écoutes, puis un pré-mastering qui vire suffisamment de basses pour pas affoler un HP de 8cm en carton, c'est pas les normalisations qui vont saloper ton son....
:volatil:


Hors sujet : Maintenant les scientifiques qui font autre chose que du Word / Powerpoint depuis 5 ans vont pouvoir me dire si j'ai écrit des conneries : Choc, Wolfen, Gabon, Nonco... merci d'avance ! :bravo:

56
Je comprend bien ce raisonnement pas de souci mais pour moi une erreur d'arrondi ce n'est pas l'apparition d'un bruit mais plutot la transformation d'une donnée pouvant prendre une infinité de valeurs (voltage) en donnée discrète (quantifiée) qui peut prendre 24 bits soit 16 millions de valeurs différentes (en théorie). La machine qui numérise peut donc hésiter entre les deux valeurs encadrant la valeur réélle et le plus vraisemblablement affectera la valeur la plus proche, c'est aussi le cas lors du retour en 24 bits après un calcul en virgule flottante (qu'on peut considérer comme un voltage soit une presqu'infinité de valeurs).
Ce qui m'intéresse c'est de savoir quelle est l'ordre de grandeur de cette incertitude, si c'est 0,0000009 db meme multiplié par 100 calculs c'est completement ridicule et très certainement inaudible.

57
La normalisation, ce n'est jamais qu'une amplification. Pour avoir une vague idee des ordres de grandeur, j'ai fait un petit script qui genere plusieurs millions de samples au hasard, que je fous dans un wav.

Ensuite, je lis le wav en float 32 bits, divise par 1000 (ce qui revient a -60 dB), sauvegarde dans un wav au format pcm 24 bits, relis le wav, multiple par 1000, et compare a l'original. J'obtiens 80 dB comme erreur minimale. Si a la place, je sauvegarde en float 32 bits, j'ai 200 dB.

Ce qui est important de comprendre, c'est que tant que tu es en virgule fixe, ces chiffres dependent beaucoup du facteur d'amplification, et de niveau original (en general, tu vas pas normaliser jusqu'a un facteur de 60 dB). Par exemple, si le facteur est 10 ( 20dB), alors l'erreur max est de 120 dB.
58

Citation : La machine qui numérise peut donc hésiter entre les deux valeurs encadrant la valeur réelle


Seul le bit de poids le plus faible (le 24 ème en 24 bits) va changer entre ces deux valeurs. Considérer que ce bit est "faux" est donc un majorant de l'erreur commise. (c'est pour ça que je ne pige pas pourquoi tu parles d'une infinité de valeurs ; ce serait le cas pour un "bug au hasard sur un bit", mais pour une erreur d'arrondi il n'y a que 2 valeurs possibles : celles qui encadrent la bonne. Ou bien je n'ai pas compris ce que tu veux dire ? :?!: )

Si la vraie valeur est 5,3 et qu'on l'approxime par un entier. Avec 5 on fait un erreur de 0,3 ; avec 6 une erreur de 0,7. Dans mes calculs j'ai supposé que l'on faisait une erreur de 1. C'est un majorant de 0,3 et 0,7.

Au niveau sonore, je pense que dans le cas général ça va se manifester par un bruit (= une valeur aléatoire).

Comment tu calcules ce 0,0000009 db ? Je pense que c'est plutôt proche de -72dBV.
59

Citation :
Je comprend bien ce raisonnement pas de souci mais pour moi une erreur d'arrondi ce n'est pas l'apparition d'un bruit



Ca devient de la semantique, mais le bruit de quantification, c'est tres exactement l'erreur resultant de l'arrondi, que l'on approche par un bruit blanc pour faire simple, mais qui n'est pas vrai du tout quand le signal est proche du 0 numerique.
60
Tu compares un signal dégradé avec un signal original en quoi cela prouve que la normalisation génére des erreurs énormes? Ta division par 1000 c'est équivalent à un bitcrushing du signal.

Si on enregistre à bas niveau et qu'on normalise je ne vois pas en quoi on dégrade le signal à part l'erreur d'arrondi que j'aimerai qu'on quantifie.

tu enregistres un signal en 8 bits par exemple.

tu obtiens

24
56
98
21
12
87
32 (c'est pas les résultats du loto).

On embarque une erreur d'arrondi par rapport au signal entrant.

On normalise en mettant le pic (98) à 256. C'est une règle de trois avec un arrondi non?

On obtient après normalisation :
62,69387755
146,2857143
256
54,85714286
31,34693878
227,2653061
83,59183673

on arrondit
63
146
256
55
31
227
84

La seule erreur qu'on a à ce niveau c'est une nouvelle erreur d'arrondit.
Sur notre échantillonage elle est de 0,69 / 256 soit 0,2%

Elle est encore moindre en 16 bits et en 24 bits elle devient ridicule ? c'était le sens de ma question.

Evidemment si le niveau de bruit était la valeur 12 on l'a augmentée mais la normalisation nous a pas pris en traitre on sait ce que ça fait.