Erst aufräumen, dann anreichern. In dieser Reihenfolge.
Dubletten zusammenführen, veraltete Felder aussortieren, Formate vereinheitlichen und danach gezielt die Lücken füllen. Damit dein CRM weniger, aber verlässlichere Datensätze hat, auf die sich Vertrieb und Automatisierung stützen können.
Was mit Bereinigen und Anreichern gemeint ist
Datenpflege klingt nach einer Aufgabe für einen ruhigen Nachmittag. In der Praxis ist es zwei verschiedene Arbeiten, die aufeinander aufbauen. Bereinigen heißt: das Vorhandene in Ordnung bringen. Dubletten zusammenführen, veraltete Angaben aussortieren, Schreibweisen und Formate angleichen. Anreichern heißt: das Fehlende ergänzen, also Felder wie Branche oder Firmengröße auffüllen, die vorher leer waren.
Die Reihenfolge ist kein Detail. Wer auf einen unsauberen Bestand losreichert, verdoppelt Kosten und Fehler, weil dieselbe Firma mehrfach angereichert wird und falsch zugeordnete Datensätze falsche Felder dazubekommen. Deshalb geht es hier zuerst ums Aufräumen und erst danach ums Auffüllen.
Das Anreichern selbst behandle ich ausführlicher auf den Seiten zur KI-Datenanreicherung und speziell zu Firmendaten und Kundenstammdaten. Auf dieser Seite geht es um den Schritt davor, ohne den das Anreichern auf wackligem Grund steht.
Nicht zu verwechseln mit einem Audit
Ein CRM-Audit findet heraus, wo die Probleme liegen. Es bewertet den Ist-Zustand und liefert dir eine Liste: hier stimmen die Daten nicht, dort hakt die Pipeline-Logik, da fehlt die Automatisierung. Beim Audit wird nichts verändert, es wird geschaut und aufgeschrieben.
Die Bereinigung ist der Schritt danach, für den Teil, der die Daten betrifft. Hier wird tatsächlich angefasst: zusammengeführt, korrigiert, vereinheitlicht. Ein Audit ist sinnvoll, wenn du erst mal den Überblick brauchst und nicht sicher bist, wie tief das Problem sitzt. Wenn ohnehin klar ist, dass der Bestand voller Dubletten und veralteter Felder steckt, kannst du den Umweg sparen und direkt bereinigen.
Was in den meisten CRMs im Argen liegt
Vier Muster tauchen fast immer auf. Selten alle gleich stark, aber meistens genügt eines davon, damit Vertrieb und Reporting nicht mehr auf die Zahlen vertrauen.
Dubletten
Derselbe Kontakt zweimal, dreimal, mit leicht anderer Schreibweise. Das entsteht durch Importe, Formulare und manuelles Anlegen. Solange die Dubletten drin sind, teilt sich die Historie auf mehrere Datensätze auf und niemand sieht das ganze Bild.
Veraltete Felder
Leute wechseln den Job, Firmen ziehen um, Nummern werden abgeschaltet. Ein CRM altert leise. Das Tückische ist, dass ein veraltetes Feld genauso aussieht wie ein aktuelles, bis eine Mail zurückkommt oder jemand am Telefon niemanden mehr erreicht.
Uneinheitliche Formate
Telefonnummern mal mit, mal ohne Ländervorwahl. Firmennamen als "GmbH", "G.m.b.H." und "gmbh". Länder als "DE", "Deutschland" und "Germany" im selben Feld. Danach lässt sich nicht sauber filtern und jede Automatisierung stolpert.
Lücken an den falschen Stellen
Genau die Felder, nach denen der Vertrieb segmentieren müsste, sind leer: Branche, Firmengröße, Rolle. Erst wenn der Rest sauber ist, lohnt es sich, diese Lücken gezielt zu füllen.
Warum die Reihenfolge über das Ergebnis entscheidet
Anreicherung braucht einen Anker, über den ein Datensatz der richtigen Firma zugeordnet wird. Meistens ist das die Domain aus der E-Mail-Adresse. Wenn im Bestand aber drei Varianten derselben Firma liegen, einmal mit korrekter Domain, einmal mit Freemail-Adresse, einmal mit Tippfehler, dann bekommen alle drei getrennt Daten dazu. Du zahlst dreimal und hast danach immer noch drei Datensätze statt einem.
Deshalb kommt erst das Zusammenführen. Ein Datensatz pro Firma, ein sauberer Schlüssel, dann greift die Anreicherung dort, wo sie hingehört. Das Gleiche gilt für Formate: eine Telefonnummer ohne Ländervorwahl lässt sich schlechter validieren, ein uneinheitlich geschriebener Firmenname erschwert das Matching. Sauberes Fundament zuerst, dann füllt sich der Rest deutlich zuverlässiger.
Wann eine Bereinigung fällig ist
Es muss nicht der große Umbau sein. Oft reicht schon eines dieser Anzeichen, damit sich das Aufräumen bezahlt macht.
- Ihr habt Kontakte doppelt und dreifach im System und wisst bei einem Datensatz nie sicher, ob es der aktuelle ist.
- Eine Mailing-Liste kommt mit spürbarer Bounce-Rate zurück, weil Adressen veraltet sind.
- Filter und Listen liefern zu wenig Treffer, weil dieselbe Angabe in fünf Schreibweisen im Feld steht.
- Ihr wollt anreichern, aber es fühlt sich falsch an, auf einen Bestand loszulassen, der erkennbar unsauber ist.
- Vor einem CRM-Wechsel oder einer HubSpot-Migration soll der Bestand einmal grundlegend aufgeräumt werden, damit der Müll nicht mit umzieht.
So gehe ich bei der Bereinigung vor
Vorsichtig, in dieser Reihenfolge, und mit dir bei jeder Entscheidung, die etwas löscht oder überschreibt.
Bestand sichten
Ich schaue mir an, wie viele Datensätze du hast, wo die Dubletten liegen, welche Pflichtfelder wie oft leer sind und in welchen Feldern die Formate auseinanderlaufen. Das ist noch keine Bereinigung, sondern die Grundlage dafür. Wenn du vorher ohnehin wissen willst, wie es um dein System steht, ist das ein Fall fürs CRM-Audit.
Regeln festlegen
Bevor irgendwas gelöscht oder überschrieben wird, klären wir die Regeln. Welcher von zwei Dubletten gewinnt? Wie soll eine Telefonnummer am Ende aussehen? Was passiert mit einem Feld, das widersprüchlich gefüllt ist? Diese Entscheidungen triffst du, nicht der Automatismus. Ich halte sie fest, damit sie nachvollziehbar bleiben.
Testlauf auf einer Kopie
Die Bereinigung läuft erst auf einer Stichprobe oder einer Kopie, nicht direkt auf dem Live-Bestand. Du siehst an echten Datensätzen, was zusammengeführt, korrigiert und vereinheitlicht wird, bevor es den produktiven Bestand berührt. Löschen ist schwer rückgängig zu machen, deshalb dieser Zwischenschritt.
Bereinigen, dann anreichern
Erst wenn die Regeln sitzen, läuft die Bereinigung über den Bestand: entdoppeln, Formate vereinheitlichen, offensichtlich Totes markieren. Auf dem sauberen Fundament setzt dann die Anreicherung auf und füllt die Lücken, die wirklich zählen. Beides landet als Workflow direkt in deinem CRM, meist über n8n, sodass neue Kontakte gleich sauber reinkommen.
Was das im Alltag ausmacht
Ein Rechenbeispiel, bewusst als solches gekennzeichnet, keine gemessene Zahl. Angenommen, in 20.000 Datensätzen stecken 15 Prozent Dubletten. Das sind 3.000 überflüssige Kontakte, die du bei jeder Anreicherung mitbezahlst und die jede Segmentierung verwässern. Räumst du sie vorher weg, sinken die Kosten der anschließenden Anreicherung entsprechend, und der Vertrieb arbeitet nicht mehr an Karteileichen vorbei.
Wenn die sauberen Daten anschließend automatisch zwischen mehreren Systemen konsistent bleiben sollen, etwa CRM und ERP, ist das eher ein Fall für die CRM-Integration. Und wie eine solche Datenpflege in der Praxis aussieht, steht in der Case Study zur CRM-Datenanreicherung.
Häufige Fragen zum Bereinigen
Erzähl mir, wie es um deinen Bestand steht.
Sag mir kurz, welches CRM du nutzt, wie viele Kontakte drin sind und was dich am meisten stört, Dubletten, veraltete Adressen oder das Chaos in den Feldern. Im Erstgespräch schätze ich Aufwand und Reihenfolge ein, bevor irgendwas angefasst wird.
- Kostenloses Erstgespräch, ca. 15 Minuten
- Testlauf auf einer Kopie, bevor der Live-Bestand berührt wird
- Im Zweifel markieren statt löschen, du entscheidest bei jedem Schritt
