pith. sign in

arxiv: 1311.5924 · v1 · pith:TTPLDX2Dnew · submitted 2013-11-22 · 💻 cs.SD

Objets Sonores: Une Repr\'esentation Bio-Inspir\'ee Hi\'erarchique Parcimonieuse \`A Tr\`es Grandes Dimensions Utilisable En Reconnaissance; Auditory Objects: Bio-Inspired Hierarchical Sparse High Dimensional Representation for Recognition

classification 💻 cs.SD
keywords auditoryreconnaissancesonoresesentationobjetsparolerecognitionrepr
0
0 comments X
read the original abstract

L'accent est plac\'e dans cet article sur la structure hi\'erarchique, l'aspect parcimonieux de la repr\'esentation de l'information sonore, la tr\`es grande dimension des caract\'eristiques ainsi que sur l'ind\'ependance des caract\'eristiques permettant de d\'efinir les composantes des objets sonores. Les notions d'objet sonore et de repr\'esentation neuronale sont d'abord introduites, puis illustr\'ees avec une application en analyse de signaux sonores vari\'es: parole, musique et environnements naturels ext\'erieurs. Finalement, un nouveau syst\`eme de reconnaissance automatique de parole est propos\'e. Celui-ci est compar\'e \`a un syst\`eme statistique conventionnel. Il montre tr\`es clairement que l'analyse par objets sonores introduit une grande polyvalence et robustesse en reconnaissance de parole. Cette int\'egration des connaissances en neurosciences et traitement des signaux acoustiques ouvre de nouvelles perspectives dans le domaine de la reconnaissance de signaux acoustiques. The emphasis is put on the hierarchical structure, independence and sparseness aspects of auditory signal representations in high-dimensional spaces, so as to define the components of auditory objects. The concept of an auditory object and its neural representation is introduced. An illustrative application then follows, consisting in the analysis of various auditory signals: speech, music and natural outdoor environments. A new automatic speech recognition (ASR) system is then proposed and compared to a conventional statistical system. The proposed system clearly shows that an object-based analysis introduces a great flexibility and robustness for the task of speech recognition. The integration of knowledge from neuroscience and acoustic signal processing brings new ways of thinking to the field of classification of acoustic signals.

This paper has not been read by Pith yet.

discussion (0)

Sign in with ORCID, Apple, or X to comment. Anyone can read and Pith papers without signing in.