Archives du mot-clé indexation

SDNRI 19-21 mars 2014 (CIFED+CORIA), mon résumé

Semaine du Document Numérique et de la Recherche d’Information 2014 (SDNRI)

Présent à cette conférence qui regroupe deux mondes de la recherche : la recherche d’informations (CORIA) et l’analyse d’image de document (CIFED), je vous propose mon résumé en tant qu’industriel, plus orienté CIFED, il fallait faire des choix ;-).

L’objet de ces colloques est la présentation de ce qui se fait actuellement dans les laboratoires, pour l’analyse de document : factures, documents techniques, courrier entrant, etc.. On n’est donc pas sur la vidéo, la 3D, la réalité virtuelle.. c’est vraiment la partie dématérialisation et indexation des documents.

95% de chercheurs et 5% d’industriels (3 sociétés de mémoire… mais on était plutôt silencieux).

Les recherches actuelles portent sur :

  • Reconnaissance manuscrite, avec notamment l’intervention d’ Alex Graves, par une technique Biderictionnal RNNs
  • Améliorer la classification de documents par combinaison de descripteurs visuels et textuels (Fait par mon collègue Olivier AUGEREAU)
  • La différenciation texte manuscrit et texte typographié, afin notamment d’appliquer un OCR ou ICR en fonction de ce qui a été trouvé
  • La détection d’une première page de document dans un flux documentaire
  • La recherche de formule chimique dans un document
  • Classification de document par l’analyse de logo.
  • Classification mono-classe de document industriel
  • Génération de données semi-synthétiques pour l’amélioration des techniques d’apprentissage.
  • Analyse de document par smartphone
  • Analyse de la couleur sur des formulaires

Les recherches en cours sont biens dans les problématiques industrielles, en interne nous travaillons sur une grande partie de ces sujets à notre niveau bien sûr.

Comme certaines conférences étaient communes avec la partie CORIA, j’ai pu notamment assister à la présentation Iadh Ounis  de l’université de Glasgow, qui a présenté un système de détection d’événement par l’analyse quasi temps réel des tweets dans le monde. Des problématiques informatiques impressionnantes au regard des volumétries, plus de 100 000 tweets analysés par seconde. L’objectif étant d’informer la police, les journalistes, etc… d’événements qui se produisent. L’idée originale est de croiser dans la foulée, les recherches effectuée sur Wikipedia sur ces mêmes sujets, 2 heures après les tweets.

pour plus d’information sur ce colloque http://sdnri2014.loria.fr/ 

Retour d’expérience écran tactile grand format

Dans le cadre de l’amélioration de nos outils de production, nous avons développé une interface de classification de documents, sur un écran tactile 23″.

Nous avons développé en interface tactile, car l’utilisateur classifie des images numérisées en recto-Verso et on souhaitait lui présenter une interface et une utilisation proche de celle qu’il avait avant avec les originaux papiers.

Dans notre contexte, l’utilisateur est assis devant cet écran qui est dans la position habituelle d’un écran d’ordinateur, mais plus proche et plus penché.

L’objet de cet article est le retour de cette expérience.

Le développement a été fait en utilisant WPF en C# avec Visual Studio 2012, aucun soucis à ce stade.

Les retours au niveau interface, par rapport à une interface souris, sont les suivants :

– les zones sensibles doivent être plus grandes,
– les zones les plus utilisées doivent être en bas de l’écran,
– les barres de défilement doivent être adaptées (plus large)

Les points de vigilance sont :

– l’écran doit être penché, il doit être assez proche de l’utilisateur
– l’écran ne doit pas être brillant car son inclinaison peut être la cause de reflet (lumière d’en haut)
– prendre en compte la fatigue des membres plus sollicités que lors de l’utilisation de la souris
– la nécessité de saisir de temps à autre, n’est pas pratique sur ce type d’écran. Il n’y a pas la  possibilité de faire apparaître le clavier à l’endroit de son choix. Le fait d’utiliser un vrai clavier éloigne de l’écran l’opérateur, ce qui n’est pas bon dans ce contexte.

Au final, après plusieurs mois d’utilisation, on s’aperçoit, un abandon pour certains opérateurs et un retour à la souris, d’autres utilisent un mixte souris/écran tactile. aucun n’est au final resté au tactile pure.

Attention : une simple mouche sur l’écran peut être prise en compte par le système, voir une simple poussière … 😉