Für eine adäquate Durchführung der Datenzuordnungen ist das richtige
Werkzeug nötig, um widersprüchliche Resultate zu vermeiden
. Die Lösung bestand darin, alle Elemente, die zusammengehören, in einer speziellen Gruppe namens "Clique" zu speichern. Die Clique vermeidet inkonsistente Zuordnungen und unübersichtliche Ergebnisse.
Eine Einschränkung beim Zuordnen von Daten durch einen menschlichen Benutzer besteht darin, dass das Resultat möglicherweise fehleranfällig ist. Vielleicht werden Dinge übersehen, vielleicht passieren Fehler durch mangelnde Konzentration. Keiner ist perfekt. Dies ist ein echtes Risiko, selbst wenn das Werkzeug einwandfrei funktioniert. Um dieses Risiko zu mildern, hilft Redundanz.
Es ist eher unwahrscheinlich, dass alle Anwenden den gleichen Fehler begehen. Folglich bedeuten mehr Anwenden, die Zuordnungen erstellen, auch eine bessere Qualität in den Ergebnissen. Die Herausforderung besteht darin, die einzelnen Zuordnungen zu einer gemeinsamen Ergebnisliste zu konsolidieren.
Situation
Dieses Beispiel basiert auf dem Vorherigen mit der Zuordnung von Präsidenten. Stellen Sie sich im Gegensatz zum vorherigen Beispiel vor, dass ein Team die Datenzuordnung durchführt, nämlich Alice, Bob und Clara. Dies ist ein Auszug dessen, was sie erarbeitet haben:
Liste 3
: Adams, John
Liste 1
: John Adams
Liste 2
: J. Adams
Liste 1
: John Adams
...
Liste 3
: Adams, John
Liste 1
: John Adams
Liste 2
: J. Adams
Das ist fast so schlimm wie im Sprichwort "Zwei Juristen, drei Meinungen": Alice hat eine Zuordnung verpasst, Bob hat eine falsche Zuordnung gemacht und Clara hat noch eine andere Zuordnungen übersehen.
Eines wird klar: Die Konsolidierung der Zuordnungen mehrerer Anwender ist kein triviales Unterfangen.
Konsolidierung der Zuordnungen mehrerer Anwender
Es ist anzunehmen, dass ein Algorithmus "John Adams", "J. Adams" und "Adams, John" basierend auf den Zuordnungen des Teams konsolidieren würde. In den Zuordnungen von Alice und Clara fehlen zwar Hinweise auf diese Zuordnungen, aber es steht auch nichts dagegen.
Die Frage ist jedoch, ob das graue "..." - Element auch in der "John Adams" Clique landen würde, wie Bob vorschlägt. Die Antwort lautet: Es kommt darauf an. Wenn es Zuordnungen von Alice oder Clara gibt, die das graue "..." - Element in einer anderen Clique enthalten, wird es höchstwahrscheinlich nicht zu "John Adams" zugeordnet. Wenn es jedoch keine solche Übereinstimmungen gäbe, wird dieses graue "..." - Element wahrscheinlich der Clique "John Adams" zugeordnet werden. . So können beide Ergebnisse entstehen.
Liste 2
: J. Adams
Liste 1
: John Adams
Liste 3
: Adams, John
Liste 2
: J. Adams
Liste 1
: John Adams
...
Liste 3
: Adams, John
Ist dies ein Fehler des Konzepts? Definitiv nicht. So etwas kann immer Mal bei der Datenzuordnung vorkommen.
Korrekturlesen der Zuordnungen zur Erhöhung der Konsolidierungsqualität
Vor der Konsolidierung eines gemeinsamen Ergebnisses kann die Überprüfung der Zuordnungen der Anwendeter wertvoll sein. Stellen Sie sich vor, ein weiterer Anwender, Dave, kann falsche Zuordnungen beseitigen, bevor diese die Konsolidierung beeinträchtigen. Anstatt Dave alle Cliquen manuell überprüfen zu lassen, könnte er sich auch die zugeordneten Paare ansehen. Und noch besser: Er kann jetzt sehen, wie viel Unterstützung (Support) ein bestimmtes Paar erhält. Die Unterstützung ist die Anzahl der Benutzer, die die Zuordnung erstellt haben.
Zugeordnetes Element A.
|
Zugeordnetes Element B.
|
Unterstützung
|
Daves Urteil
|
... |
... |
.. |
.. |
Liste 1
: John Adams |
Liste 2
: J. Adams |
2 |
|
Liste 1
: John Adams |
Liste 3
: Adams, John |
2 |
|
Liste 2
: J. Adams |
Liste 3
: Adams, John |
2 |
|
Liste 1
: John Adams |
... |
1 |
|
Liste 2
: J. Adams |
... |
1 |
|
Liste 3
: Adams, John |
... |
1 |
|
... |
... |
.. |
.. |
Mit einem einfachen Abstimmungsmechanismus schließt Dave aus, was seiner Meinung nach falsch war. Folglich ist das Ergebnis des Konsolidierungsprozesses jetzt viel besser fundiert.
Liste 2
: J. Adams
Liste 1
: John Adams
Liste 3
: Adams, John
Matchmerize kann einen Korrekturschritt integrieren, bevor die Zuordnungen mehrerer Anwender konsolidiert werden
Eine der Stärken von Matchmerize besteht darin, dass mehrere Anwender an derselben Zuordnungs-Aufgabe arbeiten können. Folglich kann Matchmerize die Eingaben in einer gemeinsamen Ergebnisliste zusammenfassen.
Und natürlich ist auch der oben erläuterte Beurteilungsschritt verfügbar. Dies macht Matchmerize einzigartig, da es keinen anderen Ansatz gibt, der so etwas bietet. Automatisierungswerkzeuge können die Ergebnisliste basierend auf Textähnlichkeitsmaßen konsolidieren. Dies funktioniert jedoch nur bei einfachen Problemen, bei denen ohnehin keine menschliche Intelligenz und keine kontextbasierte Ähnlichkeit erforderlich ist.
Erfahren Sie mehr über die Mängel der textbasierten Ähnlichkeit beim Zuordnen von Daten