Derrière ce titre un peu simpliste se cache une fonctionnalité incontournable et fondamentale de l’ECM : l’indexation des contenus. C’est même un concept qui dépasse l’ECM puisqu’il concerne la méthode de classement et l’organisation générale d’une organisation.
Comme d’habitude, on va procéder en deux temps : d’abord définir ce que recouvre exactement l’indexation, et ensuite voir ce qu’a à offrir OnBase en la matière. Indexer un document, une donnée ou un actif quelconque revient à lui attribuer des métadonnées précises. Une métadonnée est une donnée qui sert à caractériser un document en précisant par exemple :
- La source du document (titre, auteur, date, sujet, etc.)
- La nature du document (texte, vidéo, feuille de calcul, etc.)
- Son contenu informationnel (descripteurs, mots-clés, résumé, etc.)
Bien entendu, avant d’attribuer quoi que ce soit à un document, il faut bien réfléchir à la cohérence de l’ensemble. Définir un ensemble de métadonnées n’est pas un travail à prendre à la légère, et il peut être même parfois attribué à un documentaliste.
En règle générale, plus on définit de métadonnées précises, mieux sera « rangé » le document : l’objectif étant de le retrouver facilement par la suite. Mais attention : la qualité prime sur la quantité ! Il vaut mieux mettre le focus sur quelques métadonnées très précises plutôt que de les multiplier sans grande pertinence !
Voilà pour la théorie sur les métadonnées. Maintenant, comment sont-elles exploitées par un outil ECM ? On peut le résumer en deux mots : Pull & Push.
En premier lieu, un outil ECM comme OnBase dispose de son propre “moteur de recherche” interne. Il permet de retrouver rapidement n’importe quel document ou données enregistrée dans la base. Plus les métadonnées sont précises, plus la recherche sera pointue. Ça c’est pour le “pull”, autrement dit l’extraction de données.
OnBase est capable d’interpréter les métadonnées pour déclencher des actions automatisée précises, définies à l’avance.
C’est ce qu’on appelle le “push”. On comprends mieux avec un exemple : celle d’une facture d’un fournisseur que l’on indexe.
Quelques actions possibles :
- Transférer automatiquement au service comptabilité si la métadonnée “type de document” est renseignée avec “facture”.
- Valider automatiquement la facture et l’archiver si la métadonnée “montant” est renseignée avec un montant inférieur à 150€ ou 10% du total.
- Transférer également à la direction pour validation si la métadonnée “montant” est renseignée avec un montant inférieur à 10000 €.
Nativement, attribuer des métadonnées est un travail manuel fastidieux, qui revient grosso modo à cocher des cases. On ne remplacera sans doute jamais l’oeil et le jugement humain pour ce travail, qui reste donc indispensable. Ceci étant dit, on peut utiliser des fonctions avancées pour automatiser une grande partie du travail. L’humain ne fait donc que valider l’indexation.
Jugez vous-même : si vous devez indexer 80 factures et remplir à la main nom/prénom/société/date, c’est un temps perdu considérable !
Voyons un peu comment OnBase facilite ce travail.
Petit rappel : OnBase est une solution modulaire, ce qui veut dire que certaines fonctions sont natives là où d’autres sont apportées par des modules complémentaires.
En l’occurrence, il s’agit ici des fonctions de LAD (lecture automatique de document), qui permettent d’extraire des informations d’un document numérisé.
Lecture de code-barre
Cette fonctionnalité permet de lire un code barre auquel on associe un type de contenu, par exemple une facture. Apposé sur un document, il permet de l’identifier immédiatement et de l’indexer en conséquence. Pratique pour gagner du temps quand doit numériser et indexer de grands volumes de documents différents !
Illustrons avec un exemple : j’ai besoin de faire remplir un document à un client. Je crée ce document en y incluant un code barre contenant le numéro d’ordre. Lorsque le document me revient, il peut être numérisé et automatiquement indexé grâce au code barre.
Advanced Capture
Ce module automatise l’indexation en analysant et en décomposant les différentes parties d’un document. Il ne fonctionne qu’avec les documents dont on connaît déjà la structure, comme une facture ou un bon de livraison d’un de mes principaux gros fournisseurs : le document est donc “prévisible” les mêmes informations (date, expéditeur, etc.) sont toujours au même endroit. L’opération est impossible sur des documents non-structurés comme des emails ou des fichiers bureautique ; et n’est pas rentable sur de faibles volumes en raison du paramétrage nécessaire : en effet le module doit être “formé au préalable à reconnaître un type de document bien précis.
Il n’est donc indiqué que dans le cas de grands volumes de documents structurés.
Intelligent capture for AP
Celui là est un peu particulier, car il a été pensé spécifiquement pour l’indexation de factures (non, nous ne sommes pas obsédés par les factures !). Il fait preuve d’intelligence artificielle en étant capable de lire sémantiquement une facture et d’extraire tout seul les informations nécessaires.
Interactive Data Capture
Les deux modules précédents reposent sur la reconnaissance optique des caractères (OCR), qui n’est pas encore une technologie infaillible.
Pour cette raison, un contrôle humain est encore conseillé. Ce module facilite ce contrôle en permettant de visualiser le document que l’on vient de numériser, et de sélectionner avec la souris les zones contenant le texte à indexer.
Il peut évidemment être utilisé indépendamment d’un processus de capture automatisé. Pratique pour éviter de taper tout le texte ! On a fait le tour des modules qui automatisent l’indexation en extrayant les données du document. Plutôt complet non ?
En conclusion, un point important : lorsque l’on indexe un document, on est pas obligé d’extraire toutes les données, si celles-ci existent déjà au sein du système d’information.
Par exemple, si on dispose d’une métadonnée unique (par exemple un numéro de commande ou un numéro de compte client), OnBase est capable de rapprocher cette métadonnée avec d’autres existantes, et ce même si elles se trouvent dans un système différent comme un ERP.
Vous gardez toujours le pouvoir de décision, mais vous économisez (beaucoup) de temps. 🙂