Fouille audio

Cet article est une ébauche concernant l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

La fouille audio est l'analyse informatique d'un fichier audio ou d'un ensemble de ressources sonores. Cette technique est utilisée principalement dans le domaine de la reconnaissance vocale, dans laquelle l'objectif est l'identification des mots.

Les deux principales techniques de fouille audio sont : l'indexation fondée sur texte, l'indexation fondée sur phonème. La première connue en anglais sous le nom de « large-vocabulary continuous speech recognition » (LVCSR) convertit la parole en texte puis recherche les mots dans un large dictionnaire. La deuxième technique utilise les sons et les convertit en phonèmes que le système compare à un dictionnaire de phonèmes[1]. Le but est de trouver des informations au sujet des mots, des concepts, des orateurs, ...

Logiciels

  • Dragon AudioMining®[2]
  • Aurix[3]

Notes et références

Notes

  • (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Audio mining » (voir la liste des auteurs).

Références

  1. Hasnai Nali, Blog
  2. Dragon AudioMining, Site officiel
  3. Aurix, Site officiel

Articles connexes

v · m
Type
Généralités
Glossaire
v · m
Big data
Méthodes
Services
Exploration de données
Outils
Organismes
  • icône décorative Portail de l’informatique