HTML 5 support, e.g. Safari, Chrome, Firefox, Edge, IE 11
Data Analytics
Data Matching
Windows, OSX, Linux
)

Matchmerize Logo Matchmerize
Die Webanwendung für das Zuordnen von Listen (Data Matching), wenn eine Künstliche Intelligenz (KI) dafür nicht smart genug ist

Die Webanwendung für das Zuordnen von Listen (Data Matching), wenn eine Künstliche Intelligenz (KI) dafür nicht smart genug ist
Eine einfache Matching-Aufgabe
die mit Fuzzy Matching über Textähnlichkeit leicht machbar ist


Das Zuordnen von Einträgen zwischen zwei Listen mit US-Präsidentennamen funktioniert gut über Textähnlichkeit. Es gibt jedoch auch Schwächen, z.B. die falsche Übereinstimmung zwischen L. Johnson und A. Johnson.
Finden Sie heraus, was hier Sinn macht!
Eine schwierige Matching-Aufgabe
für die ein tieferes Verständnis des Kontextes erforderlich ist


Es ist viel schwieriger, die Namen der US-Präsidenten den Spitznamen zuzuordnen. Hintergrundwissen ist erforderlich. Für einen Mensch ist dies eine Leichtigkeit, vor allem mit einem unterstützenden Werkzeug.
Sehen Sie hier, wie dabei mit Matchmerize hilft!

Datenzuordnung (Data Matching): Ein wichtiger Vorbereitungsschritt für fortgeschrittene, datenwissenschaftliche Analysen

Es wäre traumhaft für viele Datenwissenschaftler, sich einfach nur auf Analysen, Erkenntnisse, Vorhersagen und all die anderen Dinge zu konzentrieren, die wirklich Spaß machen.

In der Realität sind jedoch viele vorbereitende Schritte erforderlich, z.B. die Datenbereinigung. Auch für quellenübergreifende Analysen müssen häufig die Daten verschiedener Listen noch einander zugeordnet werden (auch als Datenharmonisierung bezeichnet bzw. Data Matching).

Oft kann dies programmatisch erfolgen. Gerade wenn es eine Identifikator für die Einträge gibt, geht die Zuordnung auch über eine Tabellenkalkulation. Ansonsten können auch manchmal Textähnlichkeiten helfen. In allen anderen Fällen lässt sich aber auch die händische Zuordnung durch einen Menschen mit Hilfe von Matchmerize effektiv und effizient gestalten.

Erfahren Sie mehr über die Mängel der textbasierten Ähnlichkeit beim Zuordnen von Daten

Matchmerize wurde für schwierige Datenzuordnungsprobleme designt, in denen Tabellenkalkulationen und Automatisierungswerkzeuge versagen

Für Data Matching gibt es verschiedene Werkzeuge. Je nach Datenlage und Situation haben diese ihre eigenen Stärken und Schwächen. Grundsätzlich sind bei der Entscheidung für das richtige Werkzeug zwei Aspekte zu berücksichtigen:
  1. Die Schwierigkeit der Zuordnung
  2. Die Datenmenge
Unabhängig vom Werkzeug und dem Grad der Automatisierung wird menschliche Anstrengung benötigt: Entweder beim Zuordnen der Daten oder beim Validieren der algorithmisch berechneten Zuordnungen.

Nur am Rande: Falls/Sobald es eine starke KI gibt, dürfte Data Matching wohl das kleinste Problem der Menschheit sein ;-)

Tabellenkalkulationen

Ideal für wenige Daten, insbesondere wenn ein SVerweis funktioniert. Mit mehreren Listen steigt die Wahrscheinlichkeit widersprüchlicher Zuordnungen. Langsam und fehleranfällig. Z.B. Excel, Numbers

Automatisierungstool

Ideal für große Datenmengen, wenn Textähnlichkeit hilft. Oft ist eine manuelle Validierung der Zuordnungen erforderlich. Bei schwierigen Zuordnungen nutzlos. Z.B. Knime, R, Alteryx

Matchmerize

Ideal in Situationen mit schwierigen Zuordnungen. Beibehaltung der Zuordnungskonsistenz wie bei einem Automatisierungstool bei gleichzeitigem Übertreffen von Tabellenkalkulationen bzgl. Geschwindigkeit

Mehr über die Funktionsweise von Matchmerize

Matchmerize einzusetzen umfasst 5 Schritte für Einzelnutzer oder 7 Schritte für ein Team

Ganz allein


Der erste Schritt besteht darin, ein neues Matchmerize-Projekt zu erstellen. Dazu ist lediglich ein Projektname erforderlich
Im zweiten Schritt werden die Datensätze hochgeladen, die Sie für die Zuordnung (das Data Matching) verwenden möchten. Für jeden Datensatz müssen Sie nur die Spalte auswählen, die die Einträge für die Zuordnung enthält. Es werden CSV- sowie Excel-Dateien unterstützt.
Im dritten Schritt werden Einstellungen vorgenommen. Am wichtigsten ist, dass Sie entscheiden müssen, wie die Datensätze zugeordnet werden sollen, z. Liste A gegen Liste B oder vielleicht eine Kombination aus Liste A und Liste B gegen sich selbst.
Im vierten Schritt werden die Daten zugeordnet. Wenn Sie Unterstützung benötigen, können Sie jederzeit Teamkollegen einladen. Falls Sie niemanden haben, können wir Ihnen auch ein kostenpflichtiges Team anbieten.
Schließlich werden alle Ihre Zuordnungen zu einer Wahrheit zusammengeführt. Diese widerspruchsfreie Verknüpfungsliste kann als Excel-Datei heruntergeladen werden.

Mit einem Team


Der erste Schritt besteht darin, ein neues Matchmerize-Projekt zu erstellen. Dazu ist lediglich ein Projektname erforderlich
Im zweiten Schritt werden die Datensätze hochgeladen, die Sie für die Zuordnung (das Data Matching) verwenden möchten. Für jeden Datensatz müssen Sie nur die Spalte auswählen, die die Einträge für die Zuordnung enthält. Es werden CSV- sowie Excel-Dateien unterstützt.
Im dritten Schritt werden Einstellungen vorgenommen. Am wichtigsten ist, dass Sie entscheiden müssen, wie die Datensätze zugeordnet werden sollen, z. Liste A gegen Liste B oder vielleicht eine Kombination aus Liste A und Liste B gegen sich selbst. Schreiben Sie außerdem eine kurze Erklärung in Matchmerize für Ihr Team. Dann sehen diese auch gleich worum es geht.
Der vierte Schritt besteht darin, Ihre Unterstützer für Sie arbeiten zu lassen. Sie geben deren E-Mail-Adressen an und Matchmerize sendet ihnen Anmeldeinformationen per E-Mail. Keine Sorge, wenn das Team bei Zuordnungen unterschiedlicher Meinung ist. Matchmerize erzeugt am Ende ein konsistentes Ergebnis.
Der fünfte Schritt besteht darin, das Team die Daten zuordnen zu lassen. Sie können natürlich jederzeit starten und das Team unterstützen.
Der sechste Schritt besteht darin, zu beurteilen, ob das Team es richtig gemacht hat. Daher werden alle zugeordneten Paare aufgelistet und können verworfen werden, wenn Sie feststellen, dass diese nicht korrekt sind.
Schließlich werden alle Zuordnungen der Teamkollegen und Ihr Urteil (optional) in einer Wahrheit zusammengeführt. Diese widerspruchsfreie Verknüpfungsliste kann als Excel-Datei heruntergeladen werden.

Kein Team? Kein Problem!

Wir können Ihnen weiterhelfen und die benötigten grauen Zellen für Ihre Zuordnungsaufgabe bereitstellen. Melden Sie sich gerne bei uns!

Matchmerize ist anders als bereits existierende Lösungen zum Datenzuordnen (Data Matching)

Zuordnung von Listeneinträgen

Matchmerize dient zum Zuordnen von Daten aus verschiedenen Listen. Jeder Eintrag enthält Text (z. B. Produktnamen) und möglicherweise eine Kennung (z. B. Produktnummern).

Eine oder mehrere Datenquellen

Matchmerize kann dabei helfen, Einträge aus einer Liste mit sich selbst (was einer Duplikatsuche entspricht) oder zwischen mehreren Listen zuordnen.

Wenn eine KI nicht smart genug ist

Matchmerize ist für schwierige Aufgaben gedacht, bei denen textbasierte Ähnlichkeit keinen Sinn macht und solche Algorithmen fehlschlagen.

Menschliche Weisheit macht den Unterschied

Matchmerize ermächtigt Menschen, ihre geistige Kraft effektiv zu nutzen, um schwierige Zuordnungsaufgaben (Data Matching) zu lösen.

Auf die Plätze, fertig, los!

Matchmerize ist schnell einsatzbereit. Einfach Daten hochladen, Spalten auswählen und schon kann die Zuordnung beginnen.

Schneller als erwartet

Matchmerize verfügt über eine UX, mit der Daten schnell zugeordnet werden können. Es geht einfach schneller als mit Texteditoren oder Tabellenkalkulationen.

Das Team ist der Star

Mit Matchmerize können mehrere Personen an einem Projekt arbeiten. Die kombinierte menschliche Gehirnleistung liefert noch bessere Ergebnisse.

Perfekt wie ein Diamant

Matchmerize behandelt die Zuordnungen mit Sorgfalt und vermeidet Konflikte und Widersprüche. Insbesondere, wenn mehrere Personen die Daten zuordnen.

Die Matchmerize-Werkbank-Tour starten

Anwendungsbeispiel 1: Preisvergleiche zwischen Produktlisten, die von Online-Shops ausgelesen wurden

Situation

Ein Web-Scraping-Tool sammelte Hunderte von Produktnamen und Preisen. Es gilt einen Preisvergleich durchzuführen. Hierfür ist die Zuordnung der gleichen Produkte aus den verschiedenen Listen anhand ihrer Namen nötig.

Komplikation

Unterschiede in den Produktnamen sind programmatisch schwer zu erkennen. Dies führt zu vielen Falsch-Positiven (Zuordnungen, die nicht zusammengehören), z.B. werden "Telefon A, Rot, 4-Kern-CPU, ..., 128 GB, ..." und "Telefon A, Rot, 4-Kern-CPU, ..., 256 GB, ..." leichtfertig zusammengeführt, da lediglich ein drei Zeichen langer Unterschied besteht.

Frage

Wenn eine programmatische Zuordnung so schwierig ist, kann eine Person diese Aufgabe lösen? Und wie kann diese Person dabei unterstützt werden, hocheffizient zu werden?

Sehen Sie sich dieses Video an und erfahren Sie, wie es funktioniert

Video coming soon

Anwendungsbeispiel 2: Pharma-Daten-Analyse unter Einbezug von nicht einfach verknüpfbaren dritten Datenquellen

Situation

Für ein pharmazeutisches Data Science Projekt mussten verschiedene Kennzahlen berechnet werden. Die verwendeten Daten stammen aus zahlreichen Quellen, z.B. Business Warehouse, Marktforschung, Web Scraping-Daten usw.

Komplikation

Glücklicherweise funktioniert der (unscharfe, fuzzy) Textvergleich für Wirkstoffnamen recht gut. Die Datenquellen enthalten jedoch auch chemische Namen (z. B. Ascorbinsäure), Trivialnamen (z. B. Vitamin C), Formeln (z. B. C6H8O6), Übersetzungen ("Ascorbic Acid"), E-Nummern (E 300). Folglich wird das programmgesteuerte Zuordnen dieser Datenquellen ziemlich kompliziert sein.

Frage

Wenn eine programmatische Anpassung so schwierig ist, kann eine Person diese Aufgabe lösen? Und wie kann diese Person dabei unterstützt werden, hocheffizient zu werden?

Sehen Sie sich dieses Video an und erfahren Sie, wie es funktioniert

Video coming soon

Der Einsatz von Matchmerize ist für kleinere Projekte kostenlos

Freifahrtschein

0

  • 3 Teamkameraden

  • 3 Dateien pro Projekt

  • 100 Zeilen pro Datei

Hier kostenlos registrieren Keine Kreditkarte benötigt

Maßgeschneidert

?

  • Was auch immer nötig ist...

  • Unsere Ambition ist es, dies zu ermöglichen!

  • Dem sollen keine Grenzen gesetzt sein

Ich hätte gerne ein Angebot