Warum jeder wachsende Online-Shop an dieselbe Grenze stosst
Vorverkaufs-Support ist der versteckte Engpass im Online-Handel. Kunden stellen immer wieder dieselben Fragen: Produktabmessungen, Stilkompatibilitat, Montageanleitungen, Preise fur individuelle Wandgroßen. Jede einzelne Antwort ist einfach. Das Volumen ist es nicht.
Mehr Support-Mitarbeiter einzustellen skaliert die Kosten linear mit dem Traffic. Ein generischer Chatbot gibt generische Antworten und verliert das Vertrauen, sobald er einen Preis falsch angibt. Die echte Losung benotigt etwas, das sowohl semantische Fragen ("etwas Ruhiges und Modernes fur ein Schlafzimmer") als auch harte Faktenabfragen ("Was ist der genaue Preis von SKU 000389 mit 10% Verschnittmarge") bewaltigen kann — ohne beides zu verwechseln.
Das ist das Problem, das Hybrid RAG lost. Und das ist die Architektur, die wir fur da-vinchi.pl gebaut haben.
Die zentrale Architekturentscheidung: zwei Wahrheitsschichten
Ein einfaches LLM uber Dokumenten halluziniert Preise. Ein reiner SQL-Bot verfehlt semantische Absichten. Hybrid RAG teilt Wissen in zwei Schichten: SQL fur harte Fakten (Preis, SKU, Lager), pgvector fur weiches Wissen (Stil, Raumguides, FAQ). Der Agent fragt beide ab — und erfindet nie eine Zahl, die er nicht aus der Datenbank abgerufen hat.
Das gesamte Vorverkaufsgesprach — ohne Mitarbeiter
Wie das Zwei-Schichten-Wissenssystem funktioniert
Die grundlegende Architekturentscheidung ist, harte Fakten von weichem Wissen zu trennen und sie uber verschiedene Pfade abzurufen.
↓
LangGraph ReAct Agent — entscheidet, welche Tools er aufruft
↓ ↓
pgvector (Supabase) PostgreSQL (Supabase)
semantisch: "ruhiger Schlafzimmerstil" SQL: Preis BETWEEN 100 AND 140
→ Stilguides, Raumtreffer → SKU, exakter Preis, Lagerbestand
↓ ↓
Agent fuhrt Ergebnisse zusammen — Produktauswahl mit echten Preisen → Antwort
SQL-Schicht (harte Fakten): SKU, Endpreis, Lagerbestand, Farben, Raumtags. Der Agent konstruiert keine URL oder keinen Preis aus dem Gedachtnis. Jede dem Kunden gezeigte Zahl stammt aus einer Live-Datenbankabfrage.
pgvector-Schicht (weiches Wissen): 142 semantische Chunks uber 5 Typen — FAQ, technische Spezifikationen, Stilguides, Raumempfehlungen, Verkaufsskripte. Anfragen wie "etwas fur ein skandinavisches Interieur" triggern Vektor-Ahnlichkeitssuche, liefern den richtigen Stilkontext und fuhren dann zu SQL-Filtern.
Was jedes Tool tut und warum es existiert
Wie die Wissensbasis aufgebaut wird
Zwei unabhangige Pipelines speisen das System:
Katalog-Import: CSV aus dem Shop-Backend → Deduplizierung → Out-of-Stock-Filterung → 355 aktive SKUs in PostgreSQL. Wiederholbar ohne Duplikate.
Wissensbasis-Aufbau: Strukturierte Markdown-Dokumente → 142 Chunks uber 5 semantische Typen. Die Chunking-Strategie variiert je nach Dokument: FAQ wird pro Frage aufgeteilt, Raumguides tragen strukturierte Metadaten, Stil-Mappings enthalten Farb- und Kategoriefelder.
Beide Pipelines laufen unabhangig und konnen erneut ausgefuhrt werden, wenn sich Produktkatalog oder Richtlinien andern.
Was ausgeliefert wurde
- 355 aktive SKUs in strukturiertem SQL
- 142 semantische Wissens-Chunks in pgvector
- 5 Agent-Tools fur den gesamten Vorverkaufsfluss
- Null halluzinierte Preise im Produktionstesting
- Vollstandiges Web-Chat-Widget in den Shop eingebettet
- LangSmith-Tracing fur jeden Agent-Lauf
- pytest-Kaufer-Szenario-Integrationstests in CI
Haufige Fragen zur KI-Kundenservice-Automatisierung
Eingesetzte Technologien
Ich entwickle RAG-basierte Kundenservice KI fur E-Commerce: Produktkatalog-Integration, semantische Suche, Preisberechnungen, FAQ-Handling. Funktioniert mit jedem Produktkatalog — Tapeten, Mobel, Elektronik, B2B-Zubehör. Standort Munchen, Kunden in ganz Europa.