Resolvons une énigme pour ne pas mourir completement idiot... ;)

MarcMame

Membre expert
Club iGen
25 Janvier 2001
7 040
266
Pour les plus curieux d'entre vous, vous êtes vous déjà demandé pourquoi la fréquence d'échantillonnage du CD est spécifiquement de 44,1KHz et pas de 40 ou 44KHz tout rond ?
En effet, ce choix ne s'est pas fait sur un coup de dés...

Pour ceux que ça interessent (beaucoup s'en foutent du moment que ça marche), discutons en.
wink.gif
 
bah je sais pas... je dirais que c'est pour éviter de tomber sur un multiple des fréquences des notes de la gamme.

Ou alors c'est le choix d'un joueur de dés, qui a perdu toute sa fortune au 421 en ayant sorti 4-4-1 et qui a décidé de se refaire en déposant un brevet sur la fréquence d'échantillonage des CDAudio
sick.gif
 
Euh, ça a quelques chose à voir avec les limites de perception de l'oreille humaine ? Ou bien avec le théorème de Shannon ??
confused.gif
 
Il y a des infos sur le sujet par exemple ici

Shanonn est dans le coup : on double la plus haute fréquence musicale gérée. Maintenant pourquoi 22,05 et pas autre chose. Je suppose que ça correspond à un compromis entre une note (du moins un harmonique d'une note) et une puissance de 2.
 
Bon, j'ai une explication pour le 44,1 (en fait 44100 Hz et pas 44,1 kHz pour les puristes). C'est ici

Remarque : La fréquence d'échantillonnage du disque compact provient du standard PAL de la télévision : une image est constituée de 625 lignes dont 37 sont inutilisables, et chaque ligne peut porter trois échantillons audio sur 16 bits, on a donc (625 - 37) x 3=1764 mots transmissibles par image. Il y a 25 images par seconde, on obtient alors 1764 × 25 = 44100 échantillons par seconde.

(Le lien avec la hauteur du son est indirect, c'est bien d'échantillonage qu'il s'agit).
 
MrStone a dit:
Euh, ça a quelques chose à voir avec les limites de perception de l'oreille humaine ?
Ben non parce que sinon, n'importe quelle fréquence au delà de 40KHz aurait fait l'affaire !
 
Luc G a dit:
en fait 44100 Hz et pas 44,1 kHz pour les puristes)
? Pourquoi pour les puristes ? Quand ils achetent un kilo de patates ils en demandent 1000g ?
smile.gif


Remarque : La fréquence d'échantillonnage du disque compact provient du standard PAL de la télévision : une image est constituée de 625 lignes dont 37 sont inutilisables, et chaque ligne peut porter trois échantillons audio sur 16 bits, on a donc (625 - 37) x 3=1764 mots transmissibles par image. Il y a 25 images par seconde, on obtient alors 1764 × 25 = 44100 échantillons par seconde.
On s'approche de la vérité mais ce n'est pas tout à fait ça. Du moins ce n'est qu'une partie de la réponse (qui d'ailleurs n'est pas tout à fait exact dans cette explication...).
Ne pas oublier, pour vous aider, que la fréquence d'échantillonnage utilisée est la même dans le monde entier or le PAL n'est pas utilisé partout...
out.gif
tongue.gif
 
Début des années 80.
 
16/44.1Khz c'était le top technologique à cette époque non ? C'est la fréquence d'échantillonage maximum qu'on pouvait mettre sur un cd de 74 minutes ?
 
On met ce qu'on veut sur un CD aujourd'hui, la preuve avec nos graveurs, mais un CD Audio doit impérativement toujours être en 16bit 44,1KHz pour être conforme au cahier des charges Red Book sinon, il ne peut pas porter l'appellation de CD Audio.
 
Oui mais aujourd'hui je ne peux pas graver plus de 80 m de musique sur un cd au format cd audio. Les lecteurs sont incapables de lire une autre fréquence d'échantillonage. Je suppose que c'est le standard qui a mis tout le monde d'accord.

J'ai du mal à comprendre l'intérêt d'une session Pro Tools en 24/192 pour ensuite faire du dithering vers le 16/44.1
D'ailleurs en 24/192 , les fichiers audio doivent être gargantuesques, non ?
 
MarcMame a dit:
? Pourquoi pour les puristes ? Quand ils achetent un kilo de patates ils en demandent 1000g ?

En fait, j'ai écrit un peu vite, je faisais référence aux informaticiens qui, c'est bien connu
laugh.gif
, ne sont pas ISO : chez eux le kilo fait 1024
laugh.gif
Mais, c'était idiot puisqu'on était sur des fréquences et là, tout le monde (en principe) est d'accord sur la valeur du kilo.
zen.gif


Pour le reste, je n'en sais pas plus. Faut consulter le petit livre rouge de Philips
laugh.gif


(Sinon que c'est à un chouïa près, 2x (2^16 + 2^12)
laugh.gif
 
purestyle a dit:
Les lecteurs sont incapables de lire une autre fréquence d'échantillonage. Je suppose que c'est le standard qui a mis tout le monde d'accord.
Oui, le fameux Red Book.

J'ai du mal à comprendre l'intérêt d'une session Pro Tools en 24/192 pour ensuite faire du dithering vers le 16/44.1
On parle de dithering lorsqu'on change la quantification (de 24 à 16bit) et de rééchantillonnage lorsqu'on change la fréquence (de 192 à 44,1KHz)
Autant travailler en 24bit jusqu'au mastering et redescendre en 16 pour le master est plutôt une très bonne idée, autant un rééchantillonnage est une catastrophe pour le son et ne se justifie quasiment jamais.
Les seuls cas où il est interessant de travailler au delà de 44,1KHz pour un CD est de vouloir sortir simultanément dans un format qui supporte ces résolutions (DVD audio ou SACD) ou alors à des fins d'archives pour les ressortir dans le futur (ce qui n'arrive jamais).
Donc tu as raison, dans 99% des cas, il n'y a aucun interet à faire des sessions en autres choses que du 44,1 ou du 48KHz. Seul le 24bit est réellement interessant et utile.


D'ailleurs en 24/192 , les fichiers audio doivent être gargantuesques, non ?
Pas tant que ça. Ca tourne autour des 20Mo/mn (en mono). On est encore loin des débits vidéos, même pour du miniDV.
 
Fat Boss Slim a dit:
Y'aurait pas un lien avec le LA à 440 Hz ?
Absolument aucun.
Luc G a montré la bonne voie avec sa réponse sur le PAL mais c'est incomplet puisque contrairement au CD, le standard PAL n'est pas mondial et que d'ailleurs il n'explique pas la relation avec ce dernier.
out.gif
 
Selon le livre de John Watkinson "The Art of Digital Audio", 2ème édition, page 104, le choix de cette fréquence est un héritage des premières recherches dans le domaine de l'audio numérique. Le stockage d'audio numérique sur un disque dur était peu réaliste, les capacités nécessaires demandées à l'époque entrainant des coûts prohibitifs. A l'époque, on utilisait des magnétoscopes pour le stockage, les échantillons utilisant les niveaux noir et blanc. Si vous prenez le nombre d'échantillons steréo 16 bits que vous pouvez obtenir sur une ligne, et que vous le multipliez par le nombre de lignes enregistrées dans un champ, et le nombre de champs par seconde, vous obtenez le taux d'échantillonnage. Il en ressort que les formats NTSC et PAL (formats vidéo utilisés respectivement aux USA/Japon et Europe) peuvent supporter un taux de 44100 échantillons par seconde. Ce taux a alors été appliqué lors de la définition du compact disc.

king.gif
 
Fat boss à bien mérité sa couronne (auto proclamé
laugh.gif
)

En effet, aucun enregistreur sonore de l'époque n'était capable d'enregistrer de tels débits d'information. Il fallait donc utiliser des machines vidéos à têtes tournantes que l'on détournait de leur fonction première. Leurs vitesse relative étant très élevée (plusieurs mètres/seconde contre 76cm/s dans le meilleur des cas en audio).
Comme le standard se devait d'être mondial, il fallait pouvoir utiliser des magnétoscopes (U-Matic) PAL ou NTSC.

Le choix du 44,1KHz provient donc du fait que c'est la seule fréquence supérieure à 40KHz (loi de shannon) qui permet d'enregistrer 3 échantillons complet par ligne vidéo utile quelque soit le standard utilisé.

En PAL, on utilise la fréquence secteur de 50Hz comme référence qui impose une cadence de 25 images par seconde (50 trames entrelacées) dont découle les 625 lignes de ce standard. Sur ces 625 lignes, seules 588 sont dites "utiles" pour le signal vidéo. Comme on affiche qu'une demi-image à chaque fois (une trame), il ne reste que 294 lignes utiles.
3 échantillons par ligne x 294 lignes utiles x 50 trames par secondes = 44100Hertz.

En NTSC, on utilise la fréquence secteur de 60Hz comme référence qui impose une cadence de 30 images par seconde (60 trames entrelacées) dont découle les 525 lignes de ce standard. Sur ces 525 lignes, seules 490 sont dites "utiles" pour le signal vidéo. Comme on affiche qu'une demi-image à chaque fois (une trame), il ne reste que 245 lignes utiles.
3 échantillons par ligne x 245 lignes utiles x 60 trames par secondes = 44100Hertz.

On obtient donc le même résultat, le système fonctionne sur toute la planète.
up.gif


Le matériel utilisé (PCM701, PCM801, PCM1610, PCM1630, ...) pour convertir le signal analogique en numérique ne faisait, en réalité, que générer une vulgaire image vidéo noir & blanc sous forme de "code barre" qui était enregistrée sur une K7 vidéo comme n'importe quel autre source, les magnétoscopes n'avaient rien de particulier si ce n'est que le moindre drop vidéo avait des conséquences catastrophique sur le résultat en lecture. C'est pour cette raison que tout ceux qui ont tentés d'enregistrer sur des K7 VHS s'en sont mordus les doigts.

Bref, on en revient toujours à cette relation systématique avec le 50Hz et 60Hz définis il y a plus d'un siecle, un vrai boulet ! Même le format MPEG (27MHz) n'échappe pas à cette relation.