Rechtlicher Hinweis — wichtig für Deutschland
Das Versenden von physischen (postalischen) Marketingbriefen an Unternehmen in Deutschland ist nach §7 UWG grundsätzlich ohne vorherige Einwilligung erlaubt — anders als bei Kalt-E-Mails oder Telefonakquise. Aus Impressum-Seiten extrahierte Daten sind öffentlich verfügbar und nach §5 TMG gesetzlich zu veröffentlichen. Die Verarbeitung dieser Daten zur Kontaktaufnahme mit demselben Unternehmen fällt unter berechtigtes Interesse (Art. 6(1)(f) DSGVO). Prüfen Sie Ihren konkreten Anwendungsfall vor dem Start einer Kampagne mit einem Anwalt.
Warum B2B-Akquise in Deutschland anders funktioniert
B2B-Kaltakquise per E-Mail in Deutschland hat zwei Probleme: niedrige Zustellbarkeit (Spam-Filter, gemeinsame IPs) und rechtliche Risiken (DSGVO-Einschränkungen bei unerwünschtem elektronischen Marketing an Einzelpersonen). Der Posteingang ist voll und rechtlich kompliziert.
Physische Post hingegen wird kaum genutzt, ist für B2B rechtlich klar und hat quasi keine algorithmische Konkurrenz. Ein physischer Brief eines echten Unternehmens an einen Geschäftsführer wird geöffnet. Das Problem ist die Skalierung — man kann nicht 100 Unternehmen manuell recherchieren, den richtigen Ansprechpartner finden und personalisierte Briefe vorbereiten.
Deutschland löst dieses Problem unbeabsichtigt. Per Gesetz (§5 TMG) muss jede Unternehmenswebsite ein Impressum veröffentlichen, das enthält: vollständigen Namen des Geschäftsführers, rechtlichen Firmennamen, eingetragene Adresse mit PLZ und Stadt, Telefonnummer, E-Mail, Steuernummer oder USt-IdNr. und in vielen Fällen Handelsregisternummer.
Das ist eine strukturierte, gesetzlich vorgeschriebene, öffentlich verfügbare Datenbank mit deutschen Unternehmenskontakten. Die Pipeline liest sie automatisch aus.
So funktioniert es Schritt für Schritt
↓ Firmenliste: Name, Adresse, Telefon, Website, Kategorie
Tavily API → Impressum-Seite finden
↓ Strategie 1: site.com/impressum
↓ Strategie 2: site:domain impressum
↓ Strategie 3: Fallback auf Startseite
Exa API → semantische Suche als Fallback
↓ findet Kontaktdaten per Firmenname wenn Tavily nichts findet
Gemini 2.5 Flash → strukturierte JSON-Extraktion
↓ Geschäftsführername, E-Mail, Adresse, PLZ, Stadt
Supabase → Upsert + Deduplizierung nach apify_place_id
↓
Pandas → CSV-Export → CRM-Import oder Serienbriefmerge
Schritt 1 — Google Maps über Apify
Apifys compass/crawler-google-places Actor durchsucht Google Maps anhand von Geokoordinaten und Radius. Eingabe: Stadtmittelpunkt-Koordinaten, Radius in km, Unternehmenskategorie. Ausgabe: Firmenliste mit Name, Adresse, Telefon, Website-URL, Google-Maps-Kategorie. Kosten: ca. 7 $ pro 1.000 Ergebnisse.
Warum Apify und kein direktes Scraping? Google Maps hat keine offene API für die Massen-Unternehmenssuche. Direktes Scraping mit Selenium oder Playwright wird sofort blockiert. Apify übernimmt Proxy-Rotation, Rate-Limiting und Deduplizierung — die 7 $/1k sind es wert, diese Infrastruktur nicht selbst warten zu müssen.
Schritt 2 — Impressum-Erkennung (Tavily + Exa)
Für jede Unternehmenswebsite probiert die Pipeline drei Strategien der Reihe nach, um die Impressum-Seite zu finden. Tavily ist ein KI-gestützter Web-Extraktor, der sauberen Text auch aus JS-gerenderten React/Angular-Sites zurückgibt — Standard-Requests mit BeautifulSoup scheitern bei 40-60 % moderner deutscher Unternehmenswebsites.
Falls Tavily das Impressum nicht findet, führt Exa eine semantische Suche anhand des Firmennamens durch, um Kontaktdaten aus einer anderen Quelle zu finden. Der zweistufige Ansatz erreicht ~90 % Abdeckung gegenüber ~60 % mit einer Methode allein.
Schritt 3 — Gemini 2.5 Flash Extraktion
Der rohe Impressum-Text wird an Gemini 2.5 Flash mit einem Prompt übergeben, der eine strukturierte JSON-Karte extrahiert: vollständiger Name des Geschäftsführers, E-Mail, Telefon, Straße, PLZ, Stadt, rechtlicher Firmenname, Steuernummer. Gemini Flash wurde gegenüber GPT-4 aus drei Gründen gewählt: starke Leistung bei deutschem Text, Extraktionsgeschwindigkeit unter einer Sekunde, und Kosten von Bruchteilen eines Cents pro Anfrage.
Anreicherungsrate: bei ~70-80 % der Unternehmen wird erfolgreich ein Geschäftsführername extrahiert. Bei den restlichen sind Impressum-Seiten fehlerhaft oder nicht vorhanden.
Schritt 4 — Speicherung und Export
Ergebnisse werden per Upsert in Supabase (PostgreSQL) gespeichert, mit Deduplizierung nach Apifys eindeutiger place_id. Status-Tracking: pending → done / no_impressum / error. Ein erneuter Lauf der Pipeline in derselben Stadt erzeugt keine Duplikate. Pandas exportiert eine gefilterte CSV (nur Kontakte mit E-Mail) zum CRM-Import oder für den Serienbriefmerge beim Druckdienstleister.
Der Impressum-Vorteil
Das Impressum-Gesetz (§5 TMG) wurde zum Verbraucherschutz entwickelt — damit jeder ein Unternehmen identifizieren und kontaktieren kann. Als Nebeneffekt entsteht so die strukturierteste B2B-Kontaktdatenbank Europas.
Vergleich mit UK oder USA: Unternehmenskontaktdaten sind dort über LinkedIn, Unternehmenswebsites und WHOIS-Einträge verstreut. In Deutschland stehen sie auf einer standardisierten rechtlichen Seite jeder Unternehmens-Domain.
Das Impressum enthält in der Regel zuverlässigere Daten als ein LinkedIn-Profil: die rechtliche Unternehmensadresse (kein virtuelles Büro), den tatsächlichen Geschäftsführer (keinen PR-Kontakt) und eine direkte E-Mail-Adresse.
Das ist ein struktureller Vorteil, der nur auf DACH-Märkten existiert — Deutschland, Österreich (§25 MedienG) und die Schweiz haben ähnliche Anforderungen.
Was die Pipeline produziert
Ein typischer Lauf mit Ziel Küchenstudios in München (Radius 20 km):
- 107 Unternehmen aus Google Maps
- 89 mit gefundenen Website-URLs
- 76 mit entdeckter Impressum-Seite
- 61 mit extrahiertem Geschäftsführernamen
- 54 mit gefundener E-Mail-Adresse
- Gesamtkosten Pipeline: 4,80 $
- Zeit: 22 Minuten
Die 54 Kontakte mit E-Mail werden als CSV exportiert mit Spalten: Firmenname, Geschäftsführername, E-Mail, Straße, PLZ, Stadt, Telefon, Google-Maps-Kategorie, Website-URL.
Ein Kunde nutzte dies für postalische Akquise und verschickte 100 Briefe zu je 1,20 € (Druck und Lieferung). Drei warme Antworten in der ersten Woche bei Gesamtkosten von 120 €.
Wichtige Implementierungsentscheidungen
Warum ~250 Zeilen Python und kein No-Code-Tool
Make.com und n8n können einfache API-Ketten verwalten. Diese Pipeline hat bedingte Logik in jedem Schritt: drei Impressum-Erkennungsstrategien mit Fallback, Gemini-Prompt-Kalibrierung je Unternehmenstyp, Deduplizierungslogik die SQL-Upsert mit Status-Tracking erfordert, und Pandas-Filterung mit mehreren Ausgabeformaten. No-Code-Tools haben Schwierigkeiten mit mehrstufiger bedingter Verzweigung und benutzerdefinierten Datentransformationen. Python erledigt das in 250 lesbaren Zeilen.
Warum Gemini Flash statt anderer Modelle für deutschen Text
Impressum-Seiten sind dichte Rechtstexte mit deutschspezifischer Formatierung: "Geschäftsführer: Max Mustermann" vs. "Verantwortlicher: M. Mustermann" vs. nur ein Name im Fließtext. Gemini 2.5 Flash verarbeitet deutsche Rechtstextstruktur besser als gleichwertige Alternativen, wahrscheinlich aufgrund deutscher Web-Daten im Training. Der Extraktions-Prompt wird einmal pro Unternehmenskategorie kalibriert, nicht pro Unternehmen — das hält die Kosten minimal.
Idempotenz durch Design
Die Pipeline kann jederzeit in derselben Stadt neu gestartet werden, ohne Duplikate zu erzeugen. Supabase-Upsert per apify_place_id (Google Maps' eindeutige ID je Betrieb) stellt sicher, dass ein bereits vorhandenes Unternehmen aktualisiert statt dupliziert wird. Status-Tracking erlaubt das Fortsetzen eines teilweise fehlgeschlagenen Laufs ohne erneute Verarbeitung erfolgreicher Einträge.
Pipeline skalieren
Die aktuelle Implementierung läuft sequenziell — ein Unternehmen nach dem anderen für die Impressum-Erkennung. Für große Läufe (500+ Unternehmen) würde das Hinzufügen von asynchroner Verarbeitung mit asyncio und rate-limitiertem Tavily/Exa-Batching die Laufzeit von 25 auf ~5 Minuten reduzieren. Die Supabase-Upsert-Schicht unterstützt bereits gleichzeitige Schreibvorgänge.
Wer von dieser Pipeline profitiert
Jedes B2B-Unternehmen, das neue Kunden akquirieren muss in Deutschland, ohne Kaltakquise per Telefon oder bezahlte Werbung. Wenn Sie an lokale deutsche Unternehmen verkaufen und einen systematischen Weg suchen, neue Kunden zu gewinnen — ist diese Pipeline für Sie. Die wirksamsten Anwendungsfälle:
- Dienstleister für lokale KMU — Marketingagenturen, IT-Berater, Steuerberater, Reinigungsdienste, die Handwerksbetriebe und Einzelhändler in einer bestimmten Stadt oder Region ansprechen.
- B2B-Produktlieferanten — Unternehmen, die Geräte, Materialien oder Software an bestimmte Branchenvertikalen verkaufen (z. B. Restaurantausstattung an Gaststätten, Sicherheitsausrüstung an Bauunternehmen).
- Event- und Messeakquise — Aufbau einer Einladungsliste für Branchenveranstaltungen, indem alle Unternehmen einer bestimmten Kategorie im Umkreis von 50 km erfasst werden.
- Partner- und Händlerrekrutierung — Potenzielle Wiederverkäufer oder Partner in bestimmten deutschen Städten finden, ohne für LinkedIn Sales Navigator zu zahlen.
Die Pipeline ist parametrisiert: Suchanfrage bei Google Maps, Koordinaten und Radius ändern — eine komplett andere Lead-Liste erhalten. Eine Codebasis, unbegrenzte Marktsegmente.
Verwendete Tools
Was die Pipeline geliefert hat
Über sechs Produktionsläufe im Münchner Stadtgebiet mit Ziel Küchenstudios, Haushaltsgerätehändler und Innenarchitekturbüros lieferte die Pipeline konsistente Ergebnisse, die realen Akquise-Bedingungen standhalten.
Die Zahlen
Ein typischer Lauf, der mit 100 Startunternehmen bei Google Maps beginnt:
- 89 Website-URLs entdeckt (89 % Abdeckung)
- 76 Impressum-Seiten gefunden (85 % derjenigen mit Website)
- 61 Geschäftsführernamen aus Impressum-Text extrahiert
- 54 E-Mail-Adressen gefunden und validiert (54 % Gesamtkonversion)
- Gesamte API-Kosten: 4,80–6,20 $ pro Lauf
- Gesamte Laufzeit: 18–25 Minuten
Ergebnisse der Briefkampagne
Ein Kunde nutzte die Pipeline, um eine Liste von 100 Küchenstudio-Geschäftsführern in Bayern zu erstellen. Er führte eine physische Direktmailkampagne durch: personalisierte Briefe mit dem extrahierten Namen als Anrede, eine einseitige Leistungsübersicht und eine Antwortkarte. Gesamtkosten: 120 € für Druck und Lieferung.
Innerhalb von 14 Tagen: 3 warme Antworten — 2 vereinbarte Telefonate und eine Anfrage für ein persönliches Treffen. Einer wurde zahlender Kunde. Kosten pro warmem Lead: 40 €. Kosten pro gewonnenem Kunden: 120 €.
Bekannte Engpässe
E-Mail-Abdeckung ist die Haupteinschränkung: Etwa 30-35 % der deutschen Unternehmenswebsites verwenden ein Kontaktformular statt einer veröffentlichten E-Mail-Adresse. Die Pipeline markiert diese Einträge als "nur Kontaktformular" und exportiert die URL zur manuellen Nachverfolgung. Telefonnummern füllen die Lücke in den meisten Fällen — das deutsche Impressum erfordert mindestens eine Kontaktmethode, daher erreicht die Telefonnummern-Abdeckung 85-90 %.
Die Pipeline übernimmt Lead-Erkennung und Anreicherung. Akquise-Texte, Sequenzierung und Konversion liegen außerhalb des Tools und hängen vom Zielsegment und dem konkreten Angebot ab. Die wichtigste Zeitersparnis liegt in der Recherche: Das manuelle Finden und Validieren des richtigen Entscheiderkontakts dauerte früher 4-6 Minuten pro Unternehmen. Die Pipeline bringt das auf unter 15 Sekunden pro Datensatz.
Häufige Fragen zur B2B-Leadgenerierung in Deutschland
Ich baue B2B-Leadgenerierungs-Pipelines für die Akquise auf dem deutschen Markt. Google Maps → Impressum → CRM, branchenspezifisches Targeting, Integration für Briefversand. Sprechen wir über Ihr Zielsegment.