Matchmerize
Die Webanwendung für das Zuordnen von Listen (Data Matching), wenn eine Künstliche Intelligenz (KI) dafür nicht smart genug ist
Datenzuordnung (Data Matching): Ein wichtiger Vorbereitungsschritt für fortgeschrittene, datenwissenschaftliche Analysen
Es wäre traumhaft für viele Datenwissenschaftler, sich einfach nur auf Analysen, Erkenntnisse, Vorhersagen und all die anderen Dinge zu konzentrieren, die wirklich Spaß machen.
In der Realität sind jedoch viele vorbereitende Schritte erforderlich, z.B. die Datenbereinigung. Auch für quellenübergreifende Analysen müssen häufig die Daten verschiedener Listen noch einander zugeordnet werden (auch als Datenharmonisierung bezeichnet bzw. Data Matching).
Oft kann dies programmatisch erfolgen. Gerade wenn es eine Identifikator für die Einträge gibt, geht die Zuordnung auch über eine Tabellenkalkulation. Ansonsten können auch manchmal Textähnlichkeiten helfen. In allen anderen Fällen lässt sich aber auch die händische Zuordnung durch einen Menschen mit Hilfe von Matchmerize effektiv und effizient gestalten.
Erfahren Sie mehr über die Mängel der textbasierten Ähnlichkeit beim Zuordnen von DatenMatchmerize wurde für schwierige Datenzuordnungsprobleme designt, in denen Tabellenkalkulationen und Automatisierungswerkzeuge versagen
- Die Schwierigkeit der Zuordnung
- Die Datenmenge
Nur am Rande: Falls/Sobald es eine starke KI gibt, dürfte Data Matching wohl das kleinste Problem der Menschheit sein ;-)
Matchmerize
Ideal in Situationen mit schwierigen Zuordnungen. Beibehaltung der Zuordnungskonsistenz wie bei einem Automatisierungstool bei gleichzeitigem Übertreffen von Tabellenkalkulationen bzgl. Geschwindigkeit
Matchmerize einzusetzen umfasst 5 Schritte für Einzelnutzer oder 7 Schritte für ein Team
Ganz allein
Mit einem Team
Kein Team? Kein Problem!
Matchmerize ist anders als bereits existierende Lösungen zum Datenzuordnen (Data Matching)
Zuordnung von Listeneinträgen
Matchmerize dient zum Zuordnen von Daten aus verschiedenen Listen. Jeder Eintrag enthält Text (z. B. Produktnamen) und möglicherweise eine Kennung (z. B. Produktnummern).
Eine oder mehrere Datenquellen
Matchmerize kann dabei helfen, Einträge aus einer Liste mit sich selbst (was einer Duplikatsuche entspricht) oder zwischen mehreren Listen zuordnen.
Wenn eine KI nicht smart genug ist
Matchmerize ist für schwierige Aufgaben gedacht, bei denen textbasierte Ähnlichkeit keinen Sinn macht und solche Algorithmen fehlschlagen.
Menschliche Weisheit macht den Unterschied
Matchmerize ermächtigt Menschen, ihre geistige Kraft effektiv zu nutzen, um schwierige Zuordnungsaufgaben (Data Matching) zu lösen.
Auf die Plätze, fertig, los!
Matchmerize ist schnell einsatzbereit. Einfach Daten hochladen, Spalten auswählen und schon kann die Zuordnung beginnen.
Schneller als erwartet
Matchmerize verfügt über eine UX, mit der Daten schnell zugeordnet werden können. Es geht einfach schneller als mit Texteditoren oder Tabellenkalkulationen.
Das Team ist der Star
Mit Matchmerize können mehrere Personen an einem Projekt arbeiten. Die kombinierte menschliche Gehirnleistung liefert noch bessere Ergebnisse.
Perfekt wie ein Diamant
Matchmerize behandelt die Zuordnungen mit Sorgfalt und vermeidet Konflikte und Widersprüche. Insbesondere, wenn mehrere Personen die Daten zuordnen.
Anwendungsbeispiel 1: Preisvergleiche zwischen Produktlisten, die von Online-Shops ausgelesen wurden
Situation
Ein Web-Scraping-Tool sammelte Hunderte von Produktnamen und Preisen. Es gilt einen Preisvergleich durchzuführen. Hierfür ist die Zuordnung der gleichen Produkte aus den verschiedenen Listen anhand ihrer Namen nötig.
Komplikation
Unterschiede in den Produktnamen sind programmatisch schwer zu erkennen. Dies führt zu vielen Falsch-Positiven (Zuordnungen, die nicht zusammengehören), z.B. werden "Telefon A, Rot, 4-Kern-CPU, ..., 128 GB, ..." und "Telefon A, Rot, 4-Kern-CPU, ..., 256 GB, ..." leichtfertig zusammengeführt, da lediglich ein drei Zeichen langer Unterschied besteht.
Frage
Wenn eine programmatische Zuordnung so schwierig ist, kann eine Person diese Aufgabe lösen? Und wie kann diese Person dabei unterstützt werden, hocheffizient zu werden?
Sehen Sie sich dieses Video an und erfahren Sie, wie es funktioniert
Anwendungsbeispiel 2: Pharma-Daten-Analyse unter Einbezug von nicht einfach verknüpfbaren dritten Datenquellen
Situation
Für ein pharmazeutisches Data Science Projekt mussten verschiedene Kennzahlen berechnet werden. Die verwendeten Daten stammen aus zahlreichen Quellen, z.B. Business Warehouse, Marktforschung, Web Scraping-Daten usw.
Komplikation
Glücklicherweise funktioniert der (unscharfe, fuzzy) Textvergleich für Wirkstoffnamen recht gut. Die Datenquellen enthalten jedoch auch chemische Namen (z. B. Ascorbinsäure), Trivialnamen (z. B. Vitamin C), Formeln (z. B. C6H8O6), Übersetzungen ("Ascorbic Acid"), E-Nummern (E 300). Folglich wird das programmgesteuerte Zuordnen dieser Datenquellen ziemlich kompliziert sein.
Frage
Wenn eine programmatische Anpassung so schwierig ist, kann eine Person diese Aufgabe lösen? Und wie kann diese Person dabei unterstützt werden, hocheffizient zu werden?
Sehen Sie sich dieses Video an und erfahren Sie, wie es funktioniert
Der Einsatz von Matchmerize ist für kleinere Projekte kostenlos
Freifahrtschein
0
-
3 Teamkameraden
-
3 Dateien pro Projekt
-
100 Zeilen pro Datei
Maßgeschneidert
?
-
Was auch immer nötig ist...
-
Unsere Ambition ist es, dies zu ermöglichen!
-
Dem sollen keine Grenzen gesetzt sein