Se connecter
Se connecter

ou
Créer un compte

ou
Pédago
50 réactions

Tout savoir sur le jitter

Le Jitter

Le jitter, ses causes et ses effets, sont des sujets qui font polémique chez les professionnels et amateurs de la prise de son comme chez les audiophiles.

Le jitter, ses causes et ses effets, sont des sujets qui font polé­mique chez les profes­sion­nels et amateurs de la prise de son comme chez les audio­philes. Dans la recherche d’une chaîne d’ac­qui­si­tion ou de resti­tu­tion audio­nu­mé­rique « parfaite », il semble inévi­table de se poser la ques­tion de la qualité du métro­nome qui bat la mesure de nos conver­tis­seurs et des commu­ni­ca­tions numé­riques entre appa­reils. Si la théo­rie du signal suppose que la prise d’échan­tillon (numé­ri­sa­tion) ou la lecture de ces échan­tillons doit se faire à inter­valles régu­liers, comment ne pas s’inquié­ter des possibles consé­quences des varia­tions de ces inter­valles ?

Du jitter dans les horloges ?

Dans le domaine de l’au­dio­nu­mé­rique, nous devons consi­dé­rer l’au­dio comme une trans­mis­sion de flux binaires. Prenons deux exemples : 

1– La musique stockée sur Compact Disc est lue en tant que succes­sion de bits (0 ou 1) par le lecteur. Ces bits sont trans­fé­rés à un Conver­tis­seur Numé­rique-Analo­gique (CNA) qui retrans­crit, au rythme d’une horloge locale, la musique dans le domaine analo­gique. 

2– Les signaux audio­nu­mé­riques AES/EBU ou S/PDIF sont des trames de données binaires trans­mises avec leur propre signal d’hor­loge, ils peuvent aussi être réfé­ren­cés à un signal d’hor­loge dédié (vidéo ou Word Clock par exemple). 

Un signal d’hor­loge numé­rique est un signal en créneau (on admet géné­ra­le­ment qu’il est souhai­table qu’au moins 50% des cycles répondent à ces exigences de fréquence et d’am­pli­tude fixe). Ce sont les tran­si­tions (lorsque le signal est en créneaux : le passage d’un bas niveau à un haut niveau ou inver­se­ment) qui véhi­culent l’in­for­ma­tion d’hor­loge.

Jitter
Fig. 1: Signal audio­nu­mé­rique présen­tant des tran­si­tions affec­tées de jitter

Le jitter (en français le gîte ou gigue) est une erreur d’ordre tempo­rel. Le jitter est la varia­tion dans le temps d’un événe­ment pério­dique – tel que les tran­si­tions d’un signal – par rapport à une réfé­rence idéale que l’évé­ne­ment suivrait s’il était parfai­te­ment régu­lier. 

Contrai­re­ment à une horloge idéale, le point de retour à zéro des impul­sions dans un flux de données varie dans le temps. Le jitter peut donc être vu comme une modu­la­tion de phase du signal audio­nu­mé­rique.

L’ampli­tude du jitter est égale à la valeur du plus grand retard moins la valeur de la plus grande avance des tran­si­tions (toujours en réfé­rence à un signal parfait), cette gran­deur se mesure en unités de temps (de l’ordre de la nano ou pico­se­conde).

Pour l’ana­lyse, le jitter est consi­déré comme un signal propre qui est extrait, par exemple, d’une trans­mis­sion numé­rique, afin d’en carac­té­ri­ser le spectre en fréquence ou certaines compo­santes spéci­fiques.

Quelles sont les origines du jitter ? 

Le jitter a pour origine les signaux d’hor­loge. Les horloges battent la mesure de nos conver­tis­seurs et des commu­ni­ca­tions numé­riques ou encore déter­minent quand un tampon de données est trans­mis de la mémoire du système à une inter­face de commu­ni­ca­tion.

Nous devons distin­guer deux types de jitter, le jitter aléa­toire et le jitter pério­dique. 

Le jitter aléa­toire est géné­ra­le­ment causé par du bruit (ther­mique prin­ci­pa­le­ment) ou de la diapho­nie entre des lignes numé­riques. Une erreur de sampling aléa­toire peut être assi­mi­lée à l’ajout d’une tension para­site aléa­toire au signal analo­gique d’ori­gine. L’ef­fet est donc un bruit ajouté à l’au­dio, son impact est diffi­cile à anti­ci­per.

Le jitter pério­dique ou déter­mi­niste est quant à lui tota­le­ment prévi­sible et repro­duc­tible. Il peut être causé, par exemple, par des varia­tions régu­lières de la tension d’ali­men­ta­tion de l’hor­loge. Ce jitter provoque des harmo­niques à certaines fréquences qui sont liées au signal audio enre­gis­tré. On peut parler de modu­la­tion de fréquence dans la mesure où le jitter inter­agit avec l’au­dio et que le bruit résul­tant dépend de cette inter­ac­tion, nous l’étu­die­rons plus loin. 

Dans le cas de trans­mis­sions numé­riques, une mauvaise adap­ta­tion d’im­pé­dance et de mauvais câbles peuvent provoquer des phéno­mènes de réflexions en bout de ligne, une atté­nua­tion ou plus fréquem­ment un filtrage des signaux rapides, menant à des pertes de synchro­ni­sa­tion ou des pertes de données, nous verrons ce cas dans le jitter des inter­con­nexions. 

En pratique, le jitter observé à un point d’un circuit audio­nu­mé­rique est un cumul de plusieurs sources de jitters aléa­toires et pério­diques. 

Les oscil­la­teurs

Les horloges présentes dans nos machines sont consti­tuées prin­ci­pa­le­ment d’un compo­sant déli­vrant un signal de fréquence la plus constante possible : l’os­cil­la­teur.

Jitter
Fig.2 Schéma de PLL simpli­fié.

Nous présen­tons les deux types les plus utili­sés, l’os­cil­la­teur à quartz (souvent appelé simple­ment « quartz ») et l’os­cil­la­teur contrôlé en tension (qu’on retrou­vera sous l’acro­nyme VCO pour Voltage Contro­led Oscil­la­tor).

Le quartz possède une excel­lente stabi­lité à une fréquence donnée unique. Cette fréquence est le point de réso­nance du cris­tal de quartz soumis à un champ élec­trique, elle dépend essen­tiel­le­ment de la forme et de la dimen­sion du cris­tal. Cette très grande stabi­lité rend ce compo­sant parfai­te­ment adapté pour la géné­ra­tion d’hor­loges d’échan­tillon­nage au plus près des conver­tis­seurs. Les meilleurs oscil­la­teurs à quartz possèdent une compen­sa­tion en tempé­ra­ture afin d’évi­ter la dérive en fréquence (capsule isolante ou « four »). 

Le VCO est un oscil­la­teur dont la fréquence est déter­mi­née par une tension de commande. Ainsi, il est possible, par l’ajus­te­ment de cette tension, d’ob­te­nir une grande variété de fréquences ; contrai­re­ment au quartz dont la fréquence est fixe. Si la préci­sion de ces horloges, même très conscien­cieu­se­ment conçues, reste infé­rieure à celle d’un quartz, elles peuvent toute­fois possé­der de bonnes quali­tés de stabi­lité. 

Les boucles à verrouillage de phase (PLL)

La boucle à verrouillage de phase ou PLL (Phase-Locked Loop) est une inven­tion française des années 30, mise en pratique de manière géné­ra­li­sée avec l’ar­ri­vée des circuits inté­grés, dans les années 60. 

Le prin­cipe d’une PLL est de compa­rer la phase d’un signal arri­vant sur son entrée avec le signal qu’elle délivre. Si les deux signaux sont parfai­te­ment en phase, aucune correc­tion n’est appor­tée. Si une diffé­rence est détec­tée, la PLL ajuste son VCO de manière à accé­lé­rer ou ralen­tir sa fréquence pour se synchro­ni­ser au signal entrant.

La concep­tion des PLL, et en parti­cu­lier celle du filtre passe-bas, a fait l’objet de très nombreuses études. Rete­nons que ce filtre déter­mine la vitesse à laquelle l’hor­loge de sortie sera alignée avec le signal d’en­trée, mais aussi la qualité de filtrage des oscil­la­tions du signal d’en­trée, autre­ment dit, du jitter du signal d’en­trée. Plus la stabi­li­sa­tion sur le signal d’en­trée sera rapide et moins le jitter entrant sera filtré, et réci­proque­ment. Ce compro­mis à trou­ver entre filtrage du jitter et respect de l’hor­loge entrante fait la qualité de la PLL.

On retrouve ce type de circuit dans trois situa­tions : récu­pé­ra­tion d’hor­loge, géné­ra­tion d’hor­loge et atté­nua­tion de jitter. 

Les PLL de récu­pé­ra­tion d’hor­loge sont utili­sées en récep­tion d’un signal numé­rique afin de détec­ter l’hor­loge de ce signal, de se synchro­ni­ser et d’ali­men­ter la machine récep­trice avec cette horloge recons­truite pour assu­rer une bonne récu­pé­ra­tion des données. En dehors de cette fonc­tion prin­ci­pale, cette PLL filtrera le jitter de trans­mis­sion.

La PLL de géné­ra­tion d’hor­loge sert à créer une horloge de sortie dont la fréquence est un multiple de celle du signal d’en­trée. Cela se fait simple­ment en ajou­tant un divi­seur dans la boucle de contre-réac­tion reliant le VCO au compa­ra­teur de phase. Cela est très courant, par exemple, pour géné­rer une horloge 256 fois plus grande qu’un signal de Word Clock, afin de synchro­ni­ser un conver­tis­seur requé­rant une horloge rapide.

Enfin, la PLL d’at­té­nua­tion de jitter va modi­fier la réponse spec­trale du jitter entrant pour le déca­ler hors de la bande audible. 

Il est à noter que les PLL four­nissent des horloges dont le jitter est plusieurs ordres de gran­deur au-dessus du jitter d’un quartz ou d’un VCO. 

Le jitter d’échan­tillon­nage ou sampling jitter

« Sampling jitter » est le nom donné aux erreurs d’hor­loge surve­nues au cours du proces­sus de conver­sion analo­gique-numé­rique, numé­rique-analo­gique ou lors de la conver­sion de fréquence d’échan­tillon­nage (afin, par exemple, de trans­for­mer un signal échan­tillonné à 44,1 kHz en signal à 96 kHz).

Les deux premiers cas (CAN et CNA) peuvent être asso­ciés avec un signal d’hor­loge concret alors que dans le cas du conver­tis­seur de fréquence d’échan­tillon­nage (ou SRC pour Sample Rate Conver­ter), il peut s’agir d’un proces­sus tota­le­ment numé­rique dans la mesure où les échan­tillons d’un signal sont déci­més ou géné­rés, afin de corres­pondre avec la nouvelle fréquence d’échan­tillon­nage. Dans ce cas, il convient de parler d’hor­loge virtuelle.

Le CAN est proba­ble­ment l’élé­ment le plus critique de la chaîne, en matière de sensi­bi­lité au jitter ; et plus encore, les conver­tis­seurs géné­rant des mots binaires de grande taille (>20bits). L’hor­loge qui synchro­nise un CAN doit donc être parti­cu­liè­re­ment stable. Une mauvaise horloge qui pilote un CAN peut engen­drer une distor­sion et/ou un bruit qui ne pour­ront plus être élimi­nés en aval dans la chaîne audio­nu­mé­rique.

Le jitter n’af­fec­tera le signal audio­nu­mé­rique que lors de l’échan­tillon­nage ou du ré-échan­tillon­nage. Les effets du sampling jitter sont de modu­ler le signal échan­tillonné. Ce phéno­mène peut produire un chan­ge­ment indé­si­rable – parti­cu­liè­re­ment s’il peut être perçu et produire une diffé­rence audible. Dans certains cas, le signal avec le jitter est préféré mais, comme l’ef­fet est souvent incon­trô­lable, il est commu­né­ment récusé pour cette même raison. L’au­di­bi­lité du phéno­mène est rela­tive à la nature du jitter ainsi qu’au signal audio affecté. 

Sampling jitter et horloge externe

Jitter
Fig.3 Dans cet exemple, la fréquence d’échan­tillon­nage est constante, mais le signal à échan­tillon­ner varie en fréquence et en ampli­tude.

Il existe un grand nombre de circons­tances où une horloge doit être extraite d’une source externe. Typique­ment, il peut s’agir d’un enre­gis­treur audio­nu­mé­rique ou d’un proces­seur surround numé­rique qui doit se synchro­ni­ser (certains diront « clocker ») sur une horloge véhi­cu­lée par le flux de données entrant ou un signal d’hor­loge externe spéci­fique. Cette synchro­ni­sa­tion se fait dans la machine « esclave » à l’aide d’un circuit consti­tué géné­ra­le­ment d’une PLL. Cette PLL va géné­rer, à partir du signal externe, un signal d’hor­loge indis­pen­sable au fonc­tion­ne­ment de la machine esclave. Dans la mesure où il s’agit d’un signal « neuf », le jitter de l’hor­loge externe n’est pas direc­te­ment lié au jitter intrin­sèque à la PLL, mais il peut y contri­buer dans une certaine mesure. Il n’est donc pas possible de parler de sampling jitter dans le cas de l’uti­li­sa­tion d’une horloge externe. Toute­fois, l’uti­li­sa­tion du circuit PLL n’est pas neutre quant à la qualité de l’hor­loge de conver­sion, puisque les gran­deurs typiques de jitter de ce type de circuit sont géné­ra­le­ment bien plus impor­tantes que celles d’un simple oscil­la­teur à cris­tal. En d’autres termes, si la PLL a lissé les défauts de l’hor­loge externe, c’est au prix de l’ajout de ses défauts propres.

C’est pourquoi – pour des perfor­mances opti­males en termes de jitter – il est préfé­rable, dans la mesure du possible, de faire tour­ner un conver­tis­seur sur son horloge interne (on peut d’ailleurs signa­ler que la majeure partie des conver­tis­seurs fiables du marché ont une archi­tec­ture telle, que leur horloge est remarqua­ble­ment stable). Ceci est valable à moins que l’on ne synchro­nise le conver­tis­seur sur une réfé­rence vidéo voire sur un autre conver­tis­seur (dans le cadre d’une confi­gu­ra­tion « multi­pistes », par exemple). Bien évidem­ment, si l’on doit tout de même avoir recours à une horloge externe, celle-ci doit être aussi stable que possible (de préfé­rence vidéo ou Word Clock) et, dans ce cas, il convien­drait de véri­fier que le construc­teur du conver­tis­seur a utilisé une PLL ultra-stable. Ceci se révè­lera en pratique extrê­me­ment diffi­cile à déter­mi­ner, puisque les docu­men­ta­tions tech­niques des construc­teurs donnent rare­ment ce type d’in­for­ma­tions, ou une infor­ma­tion très diffi­cile à inter­pré­ter puisque non norma­li­sée.

Repré­sen­ta­tion du sampling jitter dans le domaine tempo­rel

Tout signal qui n’est pas un courant continu va (par défi­ni­tion) varier dans le temps et un mauvais point d’échan­tillon­nage va affec­ter à l’échan­tillon une valeur d’am­pli­tude erro­née. 

Comme on peut le voir sur la Fig.3, l’er­reur d’am­pli­tude est propor­tion­nelle à la pente du signal analo­gique, qui croît avec la fréquence et avec le niveau de celle-ci (très impor­tant à haut niveau dans les hautes fréquences).

Jitter
Fig. 1: Signal audio­nu­mé­rique présen­tant des tran­si­tions affec­tées de jitter

La Fig.4 repré­sente la simu­la­tion de l’ef­fet d’un jitter de type aléa­toire sur un sinus pur, de fréquence égale à 1 kHz et d’une ampli­tude de 2VRMS. Le système de simu­la­tion a consi­déré un jitter aléa­toire (de type gaus­sien) ayant une ampli­tude de 10 ns RMS et a effec­tué les calculs sur chaque échan­tillon pour une fréquence d’échan­tillon­nage de 176,4 kHz (soit l’équi­valent d’un CNA ayant un facteur d’over­sam­pling de 4, tel que ceux utili­sés dans les lecteurs de CD).

On peut noter comment le sinus et le « signal d’er­reur » inter­mo­dulent. L’er­reur est le produit de la pente du sinus et du jitter ; on le véri­fie lorsque la résul­tante entre le jitter et la pente de la tona­lité est minime c’est-à-dire au maxi­mum de tension où la pente est nulle. La simu­la­tion a permis de révé­ler un niveau de 124μV RMS soit –84 dB par rapport au niveau du sinus. Consi­dé­rant que cette erreur s’étend sur toute la bande passante de 88,2 kHz repré­sen­tée par une fréquence d’échan­tillon­nage de 176,4 kHz, on peut consi­dé­rer que, mesuré sur une bande passante de 20 kHz, le niveau du bruit serait de 60μV RMS. Ce qui repré­sente un niveau rela­tif de –90,5 dB par rapport au niveau du sinus.

La repré­sen­ta­tion du jitter dans le domaine tempo­rel permet une analyse de n’im­porte quel type de jitter et de réali­ser une esti­ma­tion de ce que doit être un niveau accep­table de jitter. Par exemple il pour­rait être décidé que le niveau maxi­mum accep­table de jitter provoque­rait une erreur de niveau de quan­ti­fi­ca­tion sur le bit de poids faible dans le pire des cas (signal pleine échelle à 20 kHz). Toute­fois, même si cela permet de poser une limite (244ps peak pour une conver­sion 16bits), cela n’ap­porte aucune infor­ma­tion quant au carac­tère d’au­di­bi­lité d’un tel jitter.

Repré­sen­ta­tion du sampling jitter dans le domaine fréquen­tiel

Le jitter peut égale­ment être appré­hendé sous son aspect de phéno­mène de modu­la­tion, et être analysé en termes de compo­santes fréquen­tielles. Il peut être mathé­ma­tique­ment démon­tré qu’il existe une rela­tion entre une compo­sante spec­trale du jitter, une compo­sante spec­trale du signal audio et la modu­la­tion de jitter résul­tante. 

Si un signal est échan­tillonné avec des erreurs de points d’échan­tillon­nage, l’ef­fet produit est une modu­la­tion du signal dans le temps.

En injec­tant un jitter de forme sinu­soï­dale à un signal donné, nous obser­vons que le signal résul­tant présente, en plus de la raie du signal d’ori­gine, deux bandes laté­rales. Les deux compo­santes ont une ampli­tude rela­tive à l’am­pli­tude du jitter et à la fréquence du signal entrant, et sont déca­lées de la fréquence d’ori­gine, de moins (pour la bande de gauche) ou plus (pour la bande de droite) la fréquence du jitter. Ces résul­tats peuvent être utili­sés pour esti­mer le poten­tiel d’au­di­bi­lité de la modu­la­tion audio induite par le jitter. 

Jitter
Fig.5 Modu­la­tion spec­trale induite par le jitter.

La Fig.5 illustre cet effet sur un signal réel. Le signal entrant a une fréquence de 10 kHz et la modu­la­tion du jitter est de 3 kHz. Les deux compo­santes obte­nues par majo­ra­tion et mino­ra­tion de la fréquence du signal audio par la fréquence du jitter sont repré­sen­tées par les deux pics laté­raux en dessous et au-dessus du pic à 10 kHz. 

Notons que le cas parti­cu­lier d’un jitter sinu­soï­dal peut être étendu à des jitters de formes complexes, l’étude reste faisable en décom­po­sant ces signaux complexes en séries de Four­rier.

La nature non harmo­nique des arte­facts engen­drés par le jitter signi­fie qu’ils sont poten­tiel­le­ment plus audibles qu’une simple distor­sion harmo­nique. Il est par consé­quent primor­dial d’être capable de détec­ter et de mesu­rer ces arte­facts dans les bas niveaux, si la qualité sonore doit être opti­mi­sée. Ceci est, de plus, en rapport avec l’amé­lio­ra­tion de la plage dyna­mique des conver­tis­seurs modernes.

Influence de l’ar­chi­tec­ture des CAN et CNA

L’ef­fet du jitter sur les conver­tis­seurs peut être beau­coup plus complexe qu’une simple varia­tion d’hor­loge du signal audio­nu­mé­rique. D’autres signaux peuvent être échan­tillon­nés avec le signal audio désiré (par exemple, le bruit ultra­so­nique créé au sein du module de noise-shaping des conver­tis­seurs 1-bit).

Conver­tis­seurs et suréchan­tillon­nage

Un conver­tis­seur qui utilise le suréchan­tillon­nage (ou over­sam­pling) est un conver­tis­seur qui traite un nombre d’échan­tillons très supé­rieur, au nombre mini­mum requis par la théo­rie de l’échan­tillon­nage, pour une bande passante donnée. C’est le cas typique du très répandu conver­tis­seur Sigma-Delta. Typique­ment, les taux d’over­sam­pling sont compris entre 2x et 256x. Les perfor­mances des conver­tis­seurs over­sam­plés sont haute­ment dépen­dantes de filtres numé­riques très précis. Ces filtres numé­riques « four­nissent » au circuit des filtres de type brick wall qui stoppent les HF non dési­rées du signal audio. Dans le cas d’une conver­sion à une fréquence de 44,1 kHz, ce filtre brick wall est construit de telle sorte qu’il coupe toutes les fréquences supé­rieures à 22,05 kHz (1⁄ 2.Fe). Ainsi, toutes les fréquences supé­rieures à 22,05 kHz présentes dans le signal audio analo­gique échan­tillonné ne seront pas repré­sen­tées dans le cadre d’un système audio­nu­mé­rique travaillant à 44,1 kHz. Toute­fois, si ces fréquences n’étaient pas élimi­nées, il se produi­rait un phéno­mène d’alia­sing (qui consiste en un replie­ment des hautes fréquences dans le spectre audio échan­tillonné). 

Lors de la concep­tion d’un filtre numé­rique, le jitter est consi­déré comme nul. Un filtre numé­rique consiste en une succes­sion d’élé­ments de délai, de multi­pli­ca­teurs (résis­tances addi­tion­nelles en série) et de points de somma­tion. Les éléments de délai sont censés être parfai­te­ment iden­tiques en matière de durée de retard engen­drée. Le jitter affecte l’in­ter­valle de temps entre les échan­tillons audio succes­sifs. Ainsi, les éléments de délai numé­riques ne repré­sentent plus des points équi­dis­tants d’un point de vue tempo­rel. Le jitter module l’in­ter­valle de temps entre les diffé­rents échan­tillons ; ce qui peut radi­ca­le­ment alté­rer la réponse des filtres. 

Dans la mesure où la bande passante du jitter peut s’étendre jusqu’à la moitié de la fréquence d’échan­tillon­nage du conver­tis­seur, dans un conver­tis­seur over­sam­plé, la bande passante du jitter peut s’étendre sur un spectre beau­coup plus large que pour un conver­tis­seur non over­sam­plé. L’er­reur causée par la modu­la­tion du jitter est rela­tive au spectre du jitter. Dès lors, l’er­reur affec­tant le signal audio, numé­risé par un conver­tis­seur « over­sam­plé », affecte égale­ment un spectre élargi, propor­tion­nel­le­ment au taux d’over­sam­pling. 

Pour illus­trer ce phéno­mène, consi­dé­rons un signal de fréquence F=1kHz, échan­tillonné en présence d’un bruit (assi­mi­lable au jitter), pleine bande et plat en fréquence. Après calculs, on conclut que le jitter va produire une erreur dont le niveau rela­tif sera de –104 dB par rapport au niveau du signal à échan­tillon­ner. Cette esti­ma­tion du niveau de l’er­reur reste la même, quelle que soit la fréquence d’échan­tillon­nage du conver­tis­seur. 

Jitter
Fig.6 Le rectangle bleu repré­sente l’er­reur induite par un jitter pleine bande plat dans un conver­tis­seur 1x. Le rectangle gris repré­sente quant à lui l’er­reur induite dans un conver­tis­seur 4x. On remarque que l’er­reur a la même “valeur” sur l’en­semble du spectre. La valeur du jitter a donc été réduite sur l’en­semble du spectre de l’au­dio échan­tillonné.

La Fig.6 montre que l’er­reur induite par le jitter dans un CNA, « over­sam­plé » avec un taux de 4x, va s’étendre jusqu’à une fréquence quatre fois supé­rieure à celle d’un conver­tis­seur 1x. Dans le cadre de l’au­dio pur, nous limi­tons nos consi­dé­ra­tions à une bande passante comprise entre 20 Hz et 20 kHz. Une analyse sur cet inter­valle de fréquence montre la présence de seule­ment 1⁄4 de la puis­sance totale sur l’en­semble du spectre de l’er­reur (qui se présente sous forme de bruit) induite par le jitter. Or, un quart de la puis­sance totale implique la moitié de la tension totale ; il en résulte une erreur dont le niveau est infé­rieur de 6 dB à celle induite par le conver­tis­seur « non over­sam­plé ».

Les sources de jitter, quoi qu’il en soit, ne sont pas plates sur l’en­semble du spectre. Le jitter est majo­ri­tai­re­ment formé de compo­santes basses fréquences ; phéno­mène dû à la fois aux varia­tions de phase typiques des oscil­la­teurs et au filtrage de type passe-bas, commun dans les circuits de régé­né­ra­tion d’hor­loge. Le système d’over­sam­pling ne réduira en aucun cas l’im­pact de ces compo­santes BF.

Jitter, noise-shaping et conver­tis­seurs 1-bit

Pour des taux d’over­sam­pling élevés, il est possible de réduire le nombre de bits, tout en mode­lant le bruit de quan­ti­fi­ca­tion résul­tant hors de la bande de fréquence de l’au­dio. Cette tech­nique présente de nombreux avan­tages mais a pour incon­vé­nients de géné­rer du bruit ultra­so­nique (hors de la bande audio 20Hz-20kHz). Le niveau de ce bruit ultra­so­nique est rela­tif à l’in­ter­valle de quan­ti­fi­ca­tion. Pour un conver­tis­seur 1-bit, le bruit total est en rapport étroit avec le niveau pleine échelle du conver­tis­seur. 

L’ac­tion du sampling jitter sur ce bruit ultra­so­nique induit une modu­la­tion, iden­tique à celle causée sur de l’au­dio « clas­sique ». Cette modu­la­tion peut se retrou­ver (par replie­ment) dans le spectre audible et, dans la mesure où le bruit ultra­so­nique est présent même quand le signal audio est à un faible niveau, elle ne pourra être masquée. Son effet direct est de remon­ter le niveau du bruit de fond et par consé­quent de réduire la plage dyna­mique du conver­tis­seur.

Sampling jitter et conver­tis­seurs de fréquence d’échan­tillon­nage (SRC)

Les conver­tis­seurs de fréquence d’échan­tillon­nage sont utili­sés pour conver­tir un signal audio­nu­mé­rique de fréquence donnée en un signal de fréquence diffé­rente. La conver­sion induit, de facto, une inter­po­la­tion ou une déci­ma­tion entre les points d’échan­tillon­nage du signal audio­nu­mé­rique entrant et la géné­ra­tion de valeurs pour les nouveaux points d’échan­tillon­nage. Il existe deux types de SRC.

Dans le cas où le facteur de conver­sion entre les deux fréquences d’échan­tillon­nage est un nombre entier (par exemple passage de Fe=48 kHz à Fe=96 kHz, facteur de conver­sion égal à 2), on peut déter­mi­ner les points d’échan­tillon­nage avec préci­sion et sans erreur. Dans ce cas, il est possible d’ef­fec­tuer la conver­sion sans sampling jitter, les flux entrant et sortant doivent cepen­dant être synchro­ni­sés. À l’in­verse, une conver­sion de 44,1 kHz vers 96 kHz, par exemple, peut être effec­tuée en utili­sant un rapport mathé­ma­tique de 320/147 ; ce qui signi­fie que pour 147 échan­tillons en entrée de SRC on obtient 320 échan­tillons en sortie. Les coef­fi­cients des filtres d’in­ter­po­la­tion peuvent être basés sur cette rela­tion mathé­ma­tique. Ce type de SRC est appelé conver­tis­seur de fréquence d’échan­tillon­nage synchrone (Synchro­nous Sample Rate Conver­ter – SSRC).

Parfois, la fréquence d’échan­tillon­nage en sortie de SRC ne peut pas être verrouillée sur celle entrante (à cause des rapports mathé­ma­tiques entre les deux Fe). De plus, bon nombre d’équi­pe­ments sont conçus pour avoir une grande flexi­bi­lité d’uti­li­sa­tion ; autre­ment dit pour faire face à des rapports de conver­sion arbi­traires entre les fréquences entrantes et sortantes, ou gérer alter­na­ti­ve­ment des flux audio à des fréquences diffé­rentes. Dans ce cas, la conver­sion doit se faire par un rapport mathé­ma­tique plus complexe et qui peut varier dans le temps. Le SRC doit inclure un algo­rithme qui tente d’ali­gner les échan­tillons entrants et sortants en se basant sur leurs instants d’ar­ri­vée respec­tifs. Les filtres sont calcu­lés régu­liè­re­ment par l’al­go­rithme et, si besoin, ajus­tés.

Ce type de SRC est appelé conver­tis­seur de fréquence d’échan­tillon­nage asyn­chrone (Asyn­chro­nous Sample Rate Conver­ter – ASRC). Il peut être vu comme une géné­ra­li­sa­tion du concept du SSRC étendu à tout type de fréquences entrantes et sortantes, fixes ou variables. Ce type de compo­sant est aujour­d’hui très utilisé et son coût baisse signi­fi­ca­ti­ve­ment, ce qui lui vaut d’être très répandu dans bon nombre de produits audio, profes­sion­nels ou non.

Réso­lu­tion tempo­relle virtuelle

Les algo­rithmes utili­sés, dans un ASRC, pour l’es­ti­ma­tion des rela­tions tempo­relles entre les deux flux binaires (entrant et sortant) consi­dèrent le signal d’hor­loge de l’un des signaux comme réfé­rence et déter­minent cette rela­tion grâce à une horloge de mesure de fréquence élevée, synchrone avec l’autre train binaire.

Par exemple, pour conver­tir d’une fréquence de 48 kHz à Fe=96kHz, l’hor­loge de mesure peut être caden­cée à 256×96­kHz. On en déduit donc que le temps de quan­ti­fi­ca­tion suscep­tible de provoquer l’ap­pa­ri­tion de jitter dans les algo­rithmes d’es­ti­ma­tion tempo­relle est égale à 40 ns (=1/(256×96000)).

Carac­té­ris­tiques d’at­té­nua­tion du « jitter virtuel »

Les algo­rithmes d’es­ti­ma­tion tempo­relle des ASRC possèdent une carac­té­ris­tique d’at­té­nua­tion du jitter, que l’on peut modé­li­ser comme un filtre coupe haut, avec une fréquence de coupure. Dans la mesure où le proces­sus est entiè­re­ment numé­rique, si la réso­lu­tion mathé­ma­tique de l’ap­pa­reil est suffi­sante, la fréquence de coupure du filtre pourra être fixée rela­ti­ve­ment bas. Cela signi­fie qu’un ASRC peut avoir un haut niveau d’at­té­nua­tion du jitter. 

L’in­té­gra­tion d’un ASRC à un système est peu onéreuse ; ce qui fait que cette alter­na­tive est souvent consi­dé­rée comme une solu­tion de faible coût pour une élimi­na­tion effi­cace du jitter dans les CNA. La fréquence d’échan­tillon­nage en sortie peut être fixée par un oscil­la­teur présen­tant peu de jitter et le flux de données sera converti à cette fréquence par l’ASRC. Une mesure de l’hor­loge du CNA peut révé­ler le faible jitter au niveau de cet oscil­la­teur.

Toute­fois, le proces­sus de ré-échan­tillon­nage au sein de l’ASRC doit égale­ment être consi­déré. Le jitter d’un ASRC n’étant qu’un déca­lage des valeurs numé­riques géné­rées par l’al­go­rithme d’es­ti­ma­tion tempo­relle, il ne peut pas être mesuré direc­te­ment. Quoi qu’il en soit, il est possible de mesu­rer ce jitter par l’étude de son impact sur un signal injecté, de haut niveau et de haute fréquence. 

Jitter dans les inter­con­nexions numé­riques

Deux appa­reils distincts, d’une même chaîne audio­nu­mé­rique, peuvent commu­niquer par l’in­ter­mé­diaire d’une connexion. Cette connexion trans­por­tera les données audio, une infor­ma­tion de synchro­ni­sa­tion et parfois aussi l’hor­loge de synchro­ni­sa­tion. Les commu­ni­ca­tions AES/EBU et S/PDIF remplissent les trois fonc­tions. Il peut arri­ver que dans le cas d’un nombre consé­quent d’ap­pa­reils devant être synchro­ni­sés, une horloge maîtresse soit distri­buée aux machines (par exemple Word Clock).

Le stan­dard de synchro­ni­sa­tion AES11 recom­mande d’uti­li­ser un signal dédié pour le main­tien d’une synchro­ni­sa­tion commune : c’est ce que l’on appelle signal audio­nu­mé­rique de réfé­rence (Digi­tal Audio Refe­rence Signal – DARS). Les appa­reils permet­tant l’uti­li­sa­tion d’un DARS possèdent une entrée dédiée (« Sync in » ou « Exter­nal sync/clock ») qui peut être sélec­tion­née comme réfé­rence de Word Clock. Un avan­tage est que, dans la mesure où le signal de synchro­ni­sa­tion est indé­pen­dant du programme audio­nu­mé­rique, la source de signal sonore peut être modi­fiée sans inter­rompre le « timing » de l’ap­pa­reil (qui conti­nue de rece­voir une Word Clock stable).

Les problèmes causés par le jitter dans ces inter­con­nexions sont des problèmes de perte de synchro­ni­sa­tion ou éven­tuel­le­ment d’er­reur dans la lecture d’une donnée. L’am­pli­tude de jitter provoquant ce type de problèmes est de plusieurs ordres de gran­deur au-dessus du sampling jitter. La bonne démarche est d’es­sayer de main­te­nir le niveau en dessous de ce qui est toléré par l’ap­pa­reil rece­vant le signal.

Jitter intrin­sèque

Si une unité audio­nu­mé­rique est synchro­ni­sée à une horloge (qu’elle soit interne ou externe) rela­ti­ve­ment peut sujette au jitter ; alors, tout jitter mesuré sur l’in­ter­face émet­trice est dû à l’ap­pa­reil lui-même : il s’agit de son jitter intrin­sèque. 

Le niveau de jitter intrin­sèque est déter­miné par deux carac­té­ris­tiques : les varia­tions de phase des oscil­la­teurs du circuit d’hor­loge et, dans le cas où l’hor­loge est externe, des carac­té­ris­tiques du circuit PLL de régé­né­ra­tion d’hor­loge. 

Par exemple, un circuit PLL inté­grant un VCXO (Voltage Control crys­tal Oscil­la­tor) aura un jitter intrin­sèque infé­rieur à celui d’un circuit à base de résis­tances et de conden­sa­teurs. 

Jitter induit par le câblage

Jitter
Fig.7 Modi­fi­ca­tions de la forme des impul­sions dues au câblage

L’autre source de jitter dans les inter­con­nexions numé­riques peut venir d’une mauvaise adap­ta­tion du câble de liai­son. L’ef­fet résis­tif du câble ou bien une impé­dance inadé­quate peuvent causer sur le signal des pertes dans les hautes fréquences qui ont pour effet de modi­fier la forme des pulsa­tions binaires (voir Fig.7).

Ce fait ne consti­tue­rait pas un problème si les effets étaient les mêmes pour chaque tran­si­tion. Il en résul­te­rait alors un infime délai qui pour­rait être ignoré. Ce serait le cas unique­ment si l’on avait affaire à une alter­nance régu­lière de 0 puis de 1… Mais un « vrai » flux binaire consiste en des combi­nai­sons de bits qui peuvent chan­ger à tout moment et, combi­nées avec les pertes au sein du câble, ces diffé­rentes séquences binaires provoquent un déca­lage aléa­toire (mais corrélé aux données) et par consé­quent une augmen­ta­tion des inter­fé­rences.

De plus, l’in­ter­face AES3 utilise le même signal pour véhi­cu­ler à la fois le signal d’hor­loge et les données audio, la conjonc­tion des phéno­mènes précé­dents peut donc induire du jitter sur le signal d’hor­loge par l’in­ter­mé­diaire de la modu­la­tion des données. 

Jitter
Fig.8 Séquence de donnée en sortie d’in­ter­face AES3
Jitter
Fig.9 Séquence de donnée après passage dans 100m de câble

Une séquence compo­sée unique­ment de « 0 » induit plus de délai au niveau des tran­si­tions qu’une séquence compo­sée unique­ment de « 1 » et, dans la mesure où les données elles-mêmes varient, l’in­for­ma­tion d’hor­loge varie. 

Il convient donc de prêter une atten­tion toute parti­cu­lière aux méca­nismes d’in­ter­fé­rence (on parle d’in­ter­fé­rence inter­sym­boles) entre les données et le signal d’hor­loge.

La Fig.8 montre un train de données en sortie d’in­ter­face AES3. Tandis que la Fig.9 montre un train de données après passage au travers de 100 m de câble stan­dard. 

Jitter de données

Le jitter de données est le terme utilisé pour décrire le jitter affec­tant les tran­si­tions de la « forme d’onde » modu­lée par les données. Le flux binaire AES idéal se voit modi­fié par le codage même des données. Cette forme de jitter est la plupart du temps révé­la­trice d’in­ter­fé­rences inter­sym­boles. 

Le jitter de données peut égale­ment être produit au sein même des circuits asymé­triques où un délai peut varier entre les tran­si­tions de montée et de descente.

Jitter induit par des bruits para­sites

Si les tran­si­tions des bits n’avaient pas été « ralen­ties » par les pertes dues aux proprié­tés élec­triques du câble, leurs temps de montée/descente seraient si brefs que leurs points de passage à zéro seraient peu sensibles à l’ajout d’un quel­conque bruit. Or, l’aug­men­ta­tion des temps de tran­si­tions, due aux pertes dans le câble, rend le signal sensible au bruit et à toute sorte de para­sites exté­rieurs. Il en résulte un déca­lage du point de passage à zéro. 

Par exemple, un bruit para­site affec­tant le signal peut faire varier le moment auquel la tran­si­tion sera iden­ti­fiée, par l’in­ter­face récep­trice, en tant que telle. La sensi­bi­lité à ce type de bruit dépend de la vitesse des tran­si­tions, qui dépend elle-même des pertes surve­nues dans le câble. 

Le niveau de jitter induit par le bruit para­site est en corré­la­tion directe avec la pente de la tran­si­tion au point de passage à zéro, tout comme la tension de ce bruit est rela­tive au temps (par l’in­ter­mé­diaire de la pente). Sur des tran­si­tions rapides, un bruit d’in­ter­fé­rence ne produira que peu de jitter : la varia­tion de tension causera cepen­dant une légère dévia­tion tempo­relle. 

Il est impor­tant de noter que la « direc­tion » de la dévia­tion tempo­relle est direc­te­ment en rapport avec le type de tran­si­tion. Ainsi, pour une tran­si­tion « accé­lé­rée » par le bruit para­site, les tran­si­tions de montée inter­vien­dront plus tôt (par rapport à une réfé­rence idéale) et les tran­si­tions de descente seront retar­dées. Pour une tran­si­tion « ralen­tie » par le bruit, le contraire est vrai.

Tolé­rance au jitter

Un récep­teur audio­nu­mé­rique de type AES3 doit être capable de déco­der des signaux prove­nant d’une inter­face émet­trice. Si le niveau de jitter augmente, l’in­ter­face récep­trice commen­cera à déco­der le signal incor­rec­te­ment, géné­rant ainsi des « mute » et/ou la perte du verrouillage sur le signal d’hor­loge entrant. Le niveau maxi­mum de jitter avant lequel l’in­ter­face récep­trice commence à produire des erreurs lors de l’in­ter­pré­ta­tion des données est appelé le niveau de tolé­rance au jitter de l’ap­pa­reil.

La tolé­rance au jitter est indé­pen­dante de la fréquence pour un jitter supé­rieur à la fréquence de coupure du circuit PLL. Mais, au fur et à mesure que le taux de varia­tion de l’hor­loge (la fréquence du jitter) dimi­nue, le récep­teur est de plus en plus suscep­tible de suivre ces chan­ge­ments. Ceci signi­fie que, pour des jitter de fréquence basse, le récep­teur sera davan­tage sujet à subir l’im­por­tante augmen­ta­tion de jitter et ainsi la tolé­rance au jitter augmente. En effet, plus la fréquence du jitter est basse, plus le signal est envoyé dans la boucle et donc plus les varia­tions tempo­relles sont atté­nuées.

Pour des jitter de fréquence proche de la fréquence de coupure, il est possible qu’en raison d’une mauvaise concep­tion, la tolé­rance au jitter soit signi­fi­ca­ti­ve­ment réduite. Ce phéno­mène se produit car la réso­nance du circuit cause une oppo­si­tion entre la dévia­tion (dans la boucle) des tran­si­tions de données tempo­relles entrantes et l’es­ti­ma­tion faite par le circuit des données tempo­relles (qui consi­dère que celles-ci sont pires que s’il était soumis à l’in­fluence du jitter).

Accu­mu­la­tion du jitter

Si nous consi­dé­rons une chaîne d’ap­pa­reils numé­riques, dans laquelle l’hor­loge de chaque appa­reil est verrouillée sur celle de son prédé­ces­seur dans la chaîne, on constate que plusieurs éléments ont contri­bué à l’ap­pa­ri­tion du jitter à la fin de la chaîne. Chaque appa­reil va ajou­ter son propre jitter intrin­sèque et chaque inter­con­nexion (câblage) contri­buera au jitter. De plus, à chaque étage de la chaîne va s’ajou­ter soit un gain soit une atté­nua­tion du jitter. Les effets de ce phéno­mène varient avec les carac­té­ris­tiques de jitter indi­vi­duelles de chaque élément de la chaîne et des séquences de données ; il est possible, avec des calculs rela­ti­ve­ment simples de se faire une idée de l’im­por­tance du problème. 

Les consé­quences normales de cette accu­mu­la­tion de jitter peuvent être (au fur et à mesure de l’avan­ce­ment du signal dans la chaîne) des pertes occa­sion­nelles de données voire même une perte du verrouillage sur le signal entrant. 

Les spéci­fi­ca­tions AES3, depuis 1997, comportent deux clauses visant à limi­ter les problèmes d’ac­cu­mu­la­tion du jitter. L’une d’elles spéci­fie que tout appa­reil doit avoir, pour un jitter de type sinu­soï­dal, un gain infé­rieur à 2 dB quelle que soit la fréquence du jitter. 

À ceci s’ajoutent des spéci­fi­ca­tions de stan­dard d’at­té­nua­tion du jitter qui doivent être remplies par les appa­reils préten­dant atté­nuer le jitter d’in­ter­con­nexion. Cette atté­nua­tion préco­ni­sée est d’au moins 6 dB pour des fréquences supé­rieures à 1 kHz. Cette fréquence est très infé­rieure à la fréquence de coupure de 8 kHz préco­ni­sée par les normes de l’in­ter­face AES3 ; ces appa­reils néces­sitent donc la trans­mis­sion d’un signal d’hor­loge, séparé des données obte­nues par régé­né­ra­tion d’hor­loge, qui déter­mine la tolé­rance au jitter. 

Le jitter, ami ou ennemi ?

Le jitter est partout et vouloir s’en débar­ras­ser, même s’il s’agit d’un noble objec­tif, semble peine perdue. Si les fabri­cants commu­niquent souvent sur la stabi­lité de leurs horloges internes, il est plus rare de trou­ver les perfor­mances des circuits de régé­né­ra­tion en cas de synchro­ni­sa­tion externe, géné­ra­le­ment parce que leurs perfor­mances sont rela­ti­ve­ment mauvaises.

Une règle voudrait qu’il faille au maxi­mum éviter les synchro­ni­sa­tions externes (forcé­ment bien plus mauvaises que le plus mauvais oscil­la­teur à quartz moderne). Mais ce n’est pas toujours possible, en parti­cu­lier dans le cas de systèmes d’ac­qui­si­tion audio à sources numé­riques multiples ; idem pour la diffu­sion.

Nous avons vu qu’il est extrê­me­ment diffi­cile d’an­ti­ci­per l’au­di­bi­lité d’un phéno­mène de jitter, et c’est la base de toute la complexité de concep­tion d’un système audio­nu­mé­rique complet, à machines inter­con­nec­tées.

Si de nombreux articles ont étudié tel ou tel aspect audible de tel ou tel type de jitter, il reste que l’humble instal­la­teur, ingé­nieur du son ou audi­teur audio­phile n’a non seule­ment pas accès à ces mesures sur son système, mais surtout rien, et c’est le plus trou­blant, ne garan­tit qu’un niveau de jitter bas « sonnera » mieux qu’un certain type de jitter dont l’ef­fet s’en­tend à une fréquence donnée !

Ainsi, il est évident et reconnu que plusieurs types de jitters aux effets consé­quents et audibles appa­raissent dans le cadre de l’uti­li­sa­tion d’une horloge externe, là ou une horloge interne même médiocre fera bien mieux. Mais l’uti­li­sa­teur, vous, moi, pourra parfai­te­ment préfé­rer le son avec cette horloge « tech­nique­ment mauvaise ». 

Nous touchons là à la psychoa­cous­tique et il est plus diffi­cile dans ce cas d’ap­pré­cier, selon des critères tech­niques, ce qui fait réel­le­ment la qualité d’écoute ou d’en­re­gis­tre­ment d’un système. L’al­chi­mie, née de l’in­ter­con­nexion d’ap­pa­reils, résiste encore à une simple mesure de jitter…

Pour aller plus loin

Publi­ca­tions AES

  • « Theo­re­ti­cal and audible effects of jitter on digi­tal audio quality » Eric Benja­min et Benja­min Gannon Preprint 4826 
  • « A new method for analy­sing the effects of end-to-end jitter in digi­tal audio systems » James A.S. Angus Preprint 4716 
  • « Jitter analy­sis of asyn­chro­nous sample-rate conver­sion » Robert Adams Preprint 3712 
  • « Evalua­tion of the audible distor­tion and noise produ­ced by digi­tal audio conver­ters » Louis D. Fiel­der Jour­nal of Audio Engi­nee­ring Society, vol.35, n°7/8, 1987 
  • « Measu­ring AES-EBU digi­tal audio inter­faces » Richard C. Cabot Jour­nal of Audio Engi­nee­ring Society, vol.38, n°6, 1990
  • « Speci­fying the Jitter Perfor­mance of Audio Compo­nents », Chris Travis et Paul Lesso, Audio Engi­nee­ring Society conven­tion paper, 117th conven­tion, 2004 Octo­ber  28–31.

Docu­ments divers 

  • « Measu­ring the effects of sampling jitter » Richard C. Cabot – Audio Preci­sion
  • « Digi­tal Sound Signal : subjec­tive effect of timing jitter", W.I. Manson, BBC Research Depart­ment, BBC RD 1974/11, March 1974
  • « Jitter Theory », Julian Dunn, Appli­ca­tion and tech­ni­cal support for Audio Preci­sion APWIN users, Tech­note 23, Audio Preci­sion

Abré­via­tions 

  • ASRC Asyn­chro­nous Sample Rate Conver­ter (Conver­tis­seur de Fréquence d’Echan­tillon­nage Asyn­chrone)
  • BF Basse(s) Fréquence(s)
  • CAN Conver­tis­seur Analo­gique-Numé­rique 
  • CNA Conver­tis­seur Numé­rique-Analo­gique
  • DARS Digi­tal Audio Refe­rence Signal (signal audio­nu­mé­rique de réfé­rence)
  • DIR Digi­tal Inter­face Recei­ver (inter­face numé­rique récep­trice)
  • Fe Fréquence d’échan­tillon­nage
  • HF Haute(s) Fréquence(s)
  • PLL Phase-Locked Loop (boucle à verrouillage de phase)
  • ppm Parties Par Million
  • SRC Sample Rate Conver­ter (conver­tis­seur de fréquence d’échan­tillon­nage)
  • SSRC Synchro­nous Sample Rate Conver­ter (Conver­tis­seur de Fréquence d’Echan­tillon­nage Synchrone)
  • THD+N Total Harmo­nic Distor­tion + Noise (distor­sion harmo­nique totale + bruit)
  • VCO Voltage Control­led Oscil­la­tor (Oscil­la­teur Contrôlé en Tension)
  • WC Word Clock (signal d’hor­loge)
Hors Phase Logo

Cet article écrit par Guillaume Pille et Chris­tophe Bouillot est tiré du premier numéro du maga­zine Hors Phase.

 


Vous souhaitez réagir à cet article ?

Se connecter
Devenir membre