TL;DR
- 78% wiadomości na marketplace AI obsłuży z grounded retrieval (dane zamówienia + spec produktu + polityki).
- Nie pozwalaj LLM odpowiadać na: spory gwarancyjne, A-to-z claims, pytania o produkty custom, lub cokolwiek implikującego zobowiązanie zwrotu.
- Pierwsza odpowiedź pod 60 minut to próg score'u sprzedawcy, na który optymalizujesz — nie „instant".
- Ton liczy się tak samo jak dokładność. Ciepły boilerplate bije zimną precyzję w komunikacji marketplace.
Co działa
1. Grounded pytania o status zamówienia
„Gdzie moja paczka?" to 31% wszystkich wiadomości od kupujących. Z trackingiem zamówienia i dostępem do API kuriera LLM daje lepszą odpowiedź niż człowiek w krótszym czasie.
2. Wyjaśnienia specyfikacji z danych produktowych
„Czy pasuje do Civic 2017?" „Czy można w zmywarce?" Pobierz z atrybutów produktu, odpowiedz z cytowaniami.
3. Pytania o politykę
Zwroty, wysyłka, opcje płatności. Zbuduj dokument polityk, retrievuj z niego, nigdy nie wymyślaj.
4. Triage wielojęzyczny
LLM tłumaczący polski czy niemiecki na angielski z zachowaniem kontekstu bije Google Translate o szerokość ulicy. Nawet jeśli odpowiada człowiek, AI-tłumaczony triage skraca czas odpowiedzi o 40%.
Gdzie się wykłada
1. Reklamacje gwarancyjne i jakościowe
Wszystko implikujące wadę wymaga człowieka. LLM-y nadto przepraszają, nadto obiecują zwroty i tworzą zobowiązania, których Twoja polityka nie może spełnić.
2. Wiadomości A-to-z i sporowe
Wiadomości sporów na marketplace to komunikacja prawno-finansowa. Zawsze człowiek, zawsze udokumentowane.
3. Pytania o custom-product lub spoza katalogu
Jeśli odpowiedzi nie ma w bazie produktów, LLM zhallucinuje wiarygodnie. Te kieruj do ludzi.
4. Cokolwiek emocjonalnego
„Moja babcia dostała to i..." — nawet jeśli prośba jest operacyjnie prosta, kontekst emocjonalny wymaga ludzkiej empatii i osądu. Klasyfikatory sentymentu większość z tego łapią.
Tip operatora: Zbuduj warstwę routingu zanim zbudujesz warstwę odpowiadania. Najtrudniejszy problem inżynieryjny w AI support nie jest generacją — jest decyzją, na co nie odpowiadać. Używamy 3-klasowego klasyfikatora: AI-handle, AI-draft-human-send, human-only.
Metryki, które się liczą
- Resolution rate bez eskalacji: 78% to zdrowy baseline. Powyżej 88% oznacza, że pozwalasz AI brać ryzyka, których nie powinno.
- First-response time: Cel pod 60 min, nie pod 60 s. Kupujący nie ufają natychmiastowym odpowiedziom na sprawy wrażliwe.
- Human override rate: Jaki procent draftów AI człowiek edytuje przed wysłaniem? Poniżej 15% oznacza, że Twój dokument polityk jest dobry.
- CSAT post-resolution: Mierz lukę między AI-resolved a human-resolved. Jeśli AI jest więcej niż 5 punktów poniżej, uprość bota.
"Wyłączyliśmy bota od claimów gwarancyjnych po tygodniu. CSAT na nich poszedł z 3,8 na 4,6 z człowiekiem w pętli. Zostawiliśmy bota na 'gdzie moje zamówienie?' i CSAT tam jest 4,7 — wyżej niż ludzie, bo szybciej." — Marek S., support lead u sprzedawcy elektroniki na Amazon DE
Chcesz wsparcie AI, które wie kiedy oddać człowiekowi? Engine CX FeedPilot ogarnia wszystkie cztery kategorie wyżej z routing logic wbudowaną. Zobacz jak to działa.
Obsługa klienta 24/7 w 18 językach
AI ogarnia łatwe rzeczy. Ludzie ogarniają resztę. Kupujący nie wyczuwają różnicy.
Wypróbuj za darmo →