TL;DR

  • 78% wiadomości na marketplace AI obsłuży z grounded retrieval (dane zamówienia + spec produktu + polityki).
  • Nie pozwalaj LLM odpowiadać na: spory gwarancyjne, A-to-z claims, pytania o produkty custom, lub cokolwiek implikującego zobowiązanie zwrotu.
  • Pierwsza odpowiedź pod 60 minut to próg score'u sprzedawcy, na który optymalizujesz — nie „instant".
  • Ton liczy się tak samo jak dokładność. Ciepły boilerplate bije zimną precyzję w komunikacji marketplace.

Co działa

1. Grounded pytania o status zamówienia

„Gdzie moja paczka?" to 31% wszystkich wiadomości od kupujących. Z trackingiem zamówienia i dostępem do API kuriera LLM daje lepszą odpowiedź niż człowiek w krótszym czasie.

2. Wyjaśnienia specyfikacji z danych produktowych

„Czy pasuje do Civic 2017?" „Czy można w zmywarce?" Pobierz z atrybutów produktu, odpowiedz z cytowaniami.

3. Pytania o politykę

Zwroty, wysyłka, opcje płatności. Zbuduj dokument polityk, retrievuj z niego, nigdy nie wymyślaj.

4. Triage wielojęzyczny

LLM tłumaczący polski czy niemiecki na angielski z zachowaniem kontekstu bije Google Translate o szerokość ulicy. Nawet jeśli odpowiada człowiek, AI-tłumaczony triage skraca czas odpowiedzi o 40%.

Gdzie się wykłada

1. Reklamacje gwarancyjne i jakościowe

Wszystko implikujące wadę wymaga człowieka. LLM-y nadto przepraszają, nadto obiecują zwroty i tworzą zobowiązania, których Twoja polityka nie może spełnić.

2. Wiadomości A-to-z i sporowe

Wiadomości sporów na marketplace to komunikacja prawno-finansowa. Zawsze człowiek, zawsze udokumentowane.

3. Pytania o custom-product lub spoza katalogu

Jeśli odpowiedzi nie ma w bazie produktów, LLM zhallucinuje wiarygodnie. Te kieruj do ludzi.

4. Cokolwiek emocjonalnego

„Moja babcia dostała to i..." — nawet jeśli prośba jest operacyjnie prosta, kontekst emocjonalny wymaga ludzkiej empatii i osądu. Klasyfikatory sentymentu większość z tego łapią.

Tip operatora: Zbuduj warstwę routingu zanim zbudujesz warstwę odpowiadania. Najtrudniejszy problem inżynieryjny w AI support nie jest generacją — jest decyzją, na co nie odpowiadać. Używamy 3-klasowego klasyfikatora: AI-handle, AI-draft-human-send, human-only.

Metryki, które się liczą

  • Resolution rate bez eskalacji: 78% to zdrowy baseline. Powyżej 88% oznacza, że pozwalasz AI brać ryzyka, których nie powinno.
  • First-response time: Cel pod 60 min, nie pod 60 s. Kupujący nie ufają natychmiastowym odpowiedziom na sprawy wrażliwe.
  • Human override rate: Jaki procent draftów AI człowiek edytuje przed wysłaniem? Poniżej 15% oznacza, że Twój dokument polityk jest dobry.
  • CSAT post-resolution: Mierz lukę między AI-resolved a human-resolved. Jeśli AI jest więcej niż 5 punktów poniżej, uprość bota.
"Wyłączyliśmy bota od claimów gwarancyjnych po tygodniu. CSAT na nich poszedł z 3,8 na 4,6 z człowiekiem w pętli. Zostawiliśmy bota na 'gdzie moje zamówienie?' i CSAT tam jest 4,7 — wyżej niż ludzie, bo szybciej." — Marek S., support lead u sprzedawcy elektroniki na Amazon DE

Chcesz wsparcie AI, które wie kiedy oddać człowiekowi? Engine CX FeedPilot ogarnia wszystkie cztery kategorie wyżej z routing logic wbudowaną. Zobacz jak to działa.

AIObsługa klientaLLMOperacjeCX

Obsługa klienta 24/7 w 18 językach

AI ogarnia łatwe rzeczy. Ludzie ogarniają resztę. Kupujący nie wyczuwają różnicy.

Wypróbuj za darmo →