NMSAT :: Networked Music & SoundArt Timeline

1911 __ Duplex theory — Human hearing and sound localization
Lord Raleigh (John William Strutt) (1842-1919)
Comment : Our ability to localize sounds in a three-dimensional world - 3D sound - has been studied by researchers for almost 100 years, ever since Lord Rayleigh’s duplex theory was introduced in 1911. Lord Rayleigh, in his famous ‘‘duplex theory’’ 1907, observed that interaural time differences ITDs and interaural level differences ILDs provide salient information about the lateral position of a sound source. According to the duplex theory, ITDs dominate low-frequency sound localization, while ILDs dominate high-frequency sound localization. The ITD and ILD are important localization cues, but they cannot distinguish between sources located in the so-called ‘‘cones-of-confusion,’’ where the interaural difference cues are constant, without exploratory head motions.Human hearing and the ability to perceive the location of a sound source has long been accepted as a process requiring the use of two ears (Kistler, 1997; Butler & Humanski, 1992; Carlile, 1990).This process is referred to as binaural hearing. The subjective experience of binaural hearing during the location of a sound source was thought at first to be the result of an interactive process of evaluating two auditory cues (Kistler, 1997; Butler & Humanski, 1992; Carlile, 1990; Middlebrooks & Green, 1991). Lord Raleigh developed a "duplex theory" (Strutt, cited by Carlile, 1990) which stated that sound localization arises out of the fact that the ears are separated by both space and an acoustically opaque mass (the head) that creates two distinctive properties to incoming sounds. First, a sound originating outside the medial vertical plane will reach one ear before it reaches the other creating a time-of-arrival difference that can be detected and used in localization. This process is referred to by Fuzessery, Wenstrup, and Pollak (1990) as an interaural time difference (ITD). Second, the mass of the head causes the incoming sound to lose intensity as it passes from one side of the head to the ear on the opposite side. Fuzessery, Wenstrup, and Pollak (1990) call this process an interaural intensity difference (IID), because the head acts as a muffler. The duplex theory survived until neuroanatomists andneurophysiologists began to search for the biological mechanisms ofwhich the theory attempted to predict (Butler & Humanski, 1992). The duplex theory did prove to be, at least in part, accurate. In 1936 Stevens and Newman (cited by Butler & Humanski, 1992) proved empirically the existence of IIDs and ITDs in locating a sound source. However, they neglected to consider the possibility of other auditory cues that may provide additional localization information. The duplex theory assumed there were no other ways in which the perceptual location of a sound source could be obtained. It was not until much later that the role of the external structures of the ear, namely the pinnae, were considered. According to Butler and Humanski (1992), the role of the pinnae in localizing sound was only taken seriously when scientists began to study sound localization in situations where binaural differences were nonexistent. Some experiments were eventually performed using sound sources which lay directly on the medial vertical plane (referred to as elevation) and did not stray to either horizontal side (Butler & Humanski, 1992; Carlile, 1990; Wightman & Kistler, 1997). This component of the experiments forced the listene rto interpret the sound's location through some means other than IIDs or ITDs. It was through these experiments that the pinnae were discovered to act as directionally dependent filters for determining sound location (Butler & Humanski, 1992; Middlebrooks &Green, 1991; Wightman & Kistler, 1997). (Lucas Cantu, “Monaural Hearing and Sound Localization”, 1999)
French comment : C’est en 1907 que Lord Raleigh [Ral07] définit la théorie Duplex sur la perception sonore en trois dimensions. Cette théorie approxime une tête humaine par une sphère munie de deux orifices diamétralement opposés pour représenter les oreilles. En dehors des cas où la source sonore se trouve sur le plan médian entre les oreilles, les distances de la source sonore aux oreilles ipsilatérale et controlatérale sont différentes. Cet écart, dû au temps de parcourt différent, est à l’origine de l’interaural time delay (ITD). Cependant l’ITD est exploitable seulement pour les fréquences inférieures à 1500Hz . En dessous de cette fréquence les ondes ne sont pas perturbées par des obstacles de la taille d’un visage. On notera que l’ITD intervient particulièrement pour la localisation des sons dont l’attaque est rapide. Pour des sons continus ou dont l’attaque est plus lente le cerveau utilisera plutôt l’interaural phase différence (IPD) qui traduit la différence de phase au niveau des oreilles. Au dessus de 1500Hz l’interaural level delay (ILD) entre en jeu. De part leur longueur d’onde ces ondes rebondissent sur la tête et donc ne parviennent pas ou alors affaiblies (par diffraction) à l’oreille controlatérale. Selon Carlile [Car96] une atténuation de 40dB est obtenue pour une fréquence de 3kHz. La limite de la théorie Duplex est qu’elle donne à faire croire que l’on entend en trois dimensions parce que l’on dispose de deux oreilles. Pour s’en convaincre il suffit de savoir qu’une personne sourde d’une oreille, on parlera d’audition monaurale, peux localiser en trois dimensions une source sonore [WK97]. Pour cela elle se base sur l’apprentissage de signatures spectrales non pas associées seulement à un type de son mais à un type de son et sa position spatiale relative par rapport à lui. Ces variations spectrales reposent sur des interférences causées par les épaules, la tête et le pavillon. Cette capacité contribue aussi dans le cas classique d’audition binaurale à affiner la localisation et plus particulièrement l’élévation, à faciliter la distinction avant/arrière et à placer les sources lorsqu’elles sont sur le plan médian. Ces interférences peuvent être simulées grâce aux head related transfer function (HTRF) puis être rasinonablement restituée lors de l’écoute au casque. Afin d’être complet on peux signaler que la connaissance a priori de la source sonore augmente la précision de la détection. On peut affirmer que l’ouïe est un sens multi-modale, en effet l’homme, de façon inconsciente, effectue de légers mouvements avec la tête. En tendant l’oreille on cherche à obtenir en quelques sortes d’autres images sonores de la scène et donc affiner la précision de la détection. De surcroît on ressent les ondes sonores avec tout le corps notamment les plus graves qui sont autant ressenties qu’entendues. Précisons qu’il existe de fortes interactions entre la perception visuelle et sonore, citons deux exemples: la ventriloquie et l’effet McGurk [MD76] où la vision de lèvres articulant une syllabe alors que le son émis est une autre syllabe fait reconnaître à l’utilisateur une troisième syllabe dif-férente. (Patrice Bouvier, Raphaël Loyet, Pascal Chaudeyrac, Benoit Piranda, François de Sorbier de Pougnadoresse, “Immersion dans un monde visuel et sonore en 3D”, 2006)
Source : Rayleigh, L. (1907), ‘‘On our perception of sound direction,’’ Philos. Mag. 13, pp. 214-232.
Source : Butler, R. A., &Green, D. M. (1991), “Sound localization by human listeners”, Perception and Psychophysics, 51, pp. 182-186.
Source : Carlile, S. (1990), “The auditory periphery of the ferret II: The spectral transformations of the external ear and their implications for sound localization”, Journal of the AcousticalSociety of America, 88, pp. 2196-2204.
Source : Fuzessery, Z. M., Wenstrup, J. J., & Pollak, G. D. (1990), “Determinants of horizontal sound location selectivity of binaurally”excited neurons in an isofrequency region of the mustache bat inferior colliculus”, Journal of Neurophysiology, 63, pp. 1128-1147.
Source : Middlebroks, J. C., & Green, D. M. (1991), “Sound localization by human listeners”, Annual Review of Psychology, 42, pp. 135-159.
Source : Wightman, F. L., & Kistler, D. J. (1997, “Monaural sound localization revisited”, Journal of the Acoustical Society of America,101, pp.1050-1063.
Source : Goldstein, B. E. (1999), “Sensation & Perception”, Pacific Grove, CA: Brooks/Cole, 5th ed.
Source : Bouvier, Patrice & Loyet, Raphaël & Chaudeyrac, Pascal & Piranda, Benoit & de Sorbier de Pougnadoresse, François (2006), “Immersion dans un monde visuel et sonore en 3D”, Université de Marne la Vallée, Journées de l’Association Francophone d’Informatique Graphique, Bordeaux, 2006.
Urls : http://www.laurenscharff.com/courseinfo/SL99/monaural.html (last visited ) http://afig2006.labri.fr/Articles/130.pdf (last visited )

No comment for this page

Leave a comment

:
: