Accueil Blog Musique

← Retour à l'accueil du site
Rechercher un article
ocr-omr-reconnaissance-de-caracteres-musicaux

ORC et OMR, reconnaissance de caractères musicaux, où en est-on ?

Par Lionel le 26 avril 2018.



Afin de mieux comprendre ce qu'est l'OMR, il est bon de faire un petit saut en arrière (1929) dans le temps pour en apprendre plus sur l'OCR. Optical Character Recognition: ou Reconnaissance Optique des Caractères.

L'informatique rend fainéant et au lieu de recopier un très ancien article de journal, des programmeurs ont développé un logiciel qui reconnait les caractères d'imprimerie et reconstitue les mots, les phrases et l'article en question dans un format électronique. Ce format la plupart du temps est celui compris par les traitements de texte. Voir article de Wikipedia.

Une grille vient se positionner sur un caractère et en analysant les zones blanches ou noires, le calculateur détermine quelle lettre (chiffres, signes ou symboles) est présente. D'années en années, le système s'est amélioré et les ordinateurs vont aussi plus vite dans les opérations de décryptage. Partant du principe qu'un texte est toujours aligné sur une ligne horizontale imaginaire (ou visible) la grille vient s'aligner sur le bas du premier caractère à analyser et passe au suivant. Dans le temps chaque lettre était analysée, aujourd'hui avec des dictionnaires dans toutes les langues, dès que quelques lettres sont trouvées, c'est un mot entier qui est proposé. Les polices de caractère sont également connues par les logiciels qui vont donc beaucoup plus vite à analyser les signes.

Pour la musique, c'est donc un peu sur le même principe qu'est né l'OMR. Music OCR, à ne pas confondre avec la reconnaissance optique des marques qui est un autre procédé.

Beaucoup plus jeunes (1960) les systèmes mis en place vont en premier chercher les lignes des portées. Puis analyser tous les symboles musicaux présents dans la première mesure. Certains systèmes, vont ensuite sauter vers la mesure suivante, d'autres analyseront la mesure placée juste sous la première et ensuite la troisième mesure la plus basse, en colonne, avant de passer à la colonne des mesures M+1. Les logiciels sont à tous les prix et l'explication est simple pour comprendre pourquoi souvent de tels écarts.

PHOTOSCORE de Neuratron, est à mon avis la Rolls des OMR. A 300 euros la bête ont en attend un sans faute dans le résultat de l'analyse des partitions. Son fonctionnement se base sur le contenu en TEMPS de ce qui est trouvé dans une mesure. Si la partition à analyser est en 4/4, les systèmes déterminent qu'il y a des erreurs si, dans une mesure il n'y a pas la présence des quatre temps. La mesure est encadrée en rouge. Il ne reste plus, avec les outils à compléter ou corriger cette mesure pour qu'il y ait un sans faute au bout de l'analyse et de toutes les corrections.

Tout est pris en compte par ce logiciel, les nuances musicales et les voix multiples. D'autres produits existent et c'est bien d'avoir cette diversité, déjà par le prix. Mais il en ressort que l'analyse peut s'avérer désastreuse et dévoreuse de temps.

Voici quelques noms de logiciels d'OCR :
- OMER de chez Myriad. Fait bien son Job, mais il ne faut pas lui en demander plus.
- SHARP EYE,
- SMART SCORE
- AUDIVERIS
- PDFTOMUSIC

Tous ces logiciels sont des dévoreurs de temps, car si après analyse et corrections vous obtenez un très beau fichier au format XML, c'est après que cela se gâte.

Dans ce temps, il faut déjà prendre en compte la numérisation du document. Avec un scanner et les nombreux allers retours du chariot et le positionnement des feuillets bien droit sur la vitre. Ensuite en fonction de l'état du document, il y aura un taux élevé d'erreurs. Pour corriger toutes les erreurs présentes dans une partition passée par l'OMR cela peut représenter des heures et des heures pour remettre tout d'aplomb. Le logiciel a lui aussi ses limites. Rien, pour l'heure, ne remplacera l'œil humain.

Donc, pourquoi cela ne fonctionne pas bien ? Tout simplement à cause des autres logiciels qui eux ne prennent en compte que le XML produit par l'analyse d'OMR. FINALE qui lui aussi n'est pas donné, prend bien en charge le XML mais à l'exportation, il oublie de mettre dans le fichier Midi les paroles. Oubliées !!!

Bon, si le but de l'analyse est de pouvoir obtenir une plus belle partition à l'écran, c'est gagné, car si à l'affichage dans FINALE, il subsiste encore des erreurs, le temps passé là encore à corriger est quand même moindre. Il ne faut toutefois pas compter trop ses heures, car on serait très vite dégoûter des logiciels d'OMR. Si vous n'avez pas FINALE et que vous passez votre fichier XLM à la moulinette sur un site pour le transformer encore dans un autre format, c'est la catastrophe assurée.

Ce site Niversoft convertit le fichier XML en fichier NWCtxt pour l'éditeur de partition Note Worthy Composer, mais visiblement dans l'opération "moulinette" il y a des instructions XML qui sont soit oubliées, soit mal converties. J'ai pu en faire l'expérience et j'avoue aller beaucoup plus vite à encoder une partition directement dans NWC que passer par le processus décrit ci-dessus.

PDFTOMUSIC n'est pas cher, mais le résultat obtenu est quand même très satisfaisant. Toutes les partitions récupérées sur la toile qui ont été créées avec MuseScore sont rapidement converties dans le format Midi et le format propriétaire à la société Myriad pour ses autres logiciels.

SMARTSCORE est incorporé dans FINALE et franchement pour l'avoir testé avec des partitions ULTRA NEUVES de chez neuve et bien zéro. Trop dévoreur de temps pour les corrections.

Il y a aussi dans FORTE 9 PREMIUM un OMR. Et bien, là aussi, les résultats sont très moyens. Les créateurs doivent penser que, du fait qu'il y a derrière un très bon éditeur de partitions, que toutes les corrections pourront se faire facilement. Oui, mais. Souvent c'est un peu château de cartes. Vous déplacez un élément et c'est d'autres qui se déplacent et donnent naissance à d'autres erreurs. On n'en finit plus de corriger.

Certains logiciels d'OMR ne prennent en compte que le PDF ou le TIF. D'autres proposent de pouvoir scanner les partitions. Cela alourdi le logiciel, sans pour autant l'améliorer.

AUDIVERIS quant à lui prend en charge les partitions dans plusieurs formats et s'appuie sur le moteur JAVA pour fonctionner. Au départ, c'était un bon OMR, mais justement du fait de s'appuyer sur JAVA qui change de versions tous les quatre matins et qui est rejeté en masse par CHROME cela pose un gros problème puisqu'il fonctionne en page WEB. Pour l'instant le concepteur se penche depuis plusieurs mois sur ce problème pour sortir une nouvelle version via le site GITUB.

Avant de se lancer dans l'achat d'un logiciel d'OMR, il faut bien peser le pour et le contre. Quel est réellement votre besoin. Si votre TEMPS ou votre BUDGET sont comptés, oubliez. Par contre, si vous avez du temps, de bons yeux, une très bonne connaissance de l'écriture musicale, pourquoi pas.


Réagissez à cet article

Nom ou pseudo :


Adresse Email (facultatif) :


Anti-spam. Combien font Opération



2. Posté le 10 mai 2018 à 21h10 par Jean-Baptiste


Avec des résultats aléatoires, surtout si la partition originale n'a pas été faite avec un des logiciels les plus célèbres. Merci pour votre participation, Pascal.

1. Posté le 10 mai 2018 à 21h03 par Pascal


Bonjour,
Un très bon résumé sur lequel je tombe un peu par hasard. L'expérience (avec OMER) m'a montré qu'avec un peu d'habitude et l'aide d'outils bien connus, il est souvent plus rapide de saisir directement une partition que d'assurer son scan (avec des format toujours exotiques) , puis le reconnaissance et enfin les multiples corrections, ne fusse que de mise en page.

Une exception avec PDFTOMUSIC qui n'effectue pas une reconnaissance de caractère d'après des pixels mais une extraction des données numériques composant les partitions pour les fichiers exportés depuis d'autres logiciels musicaux.

Amitiés,