Jedes andere System verliert die Kontrolle nach dem Warm Transfer. GoFonIA bleibt im Raum — als stiller Supervisor: Live-Monitoring, KI-Coaching per Whisper, Barge-in bei Bedarf und Echtzeit-Bewertung des Agenten. Inbound wie Outbound. Der Mensch verkauft. Die KI führt.
Bei klassischen Transfer-Implementierungen — Vapi, Retell, sogar natives LiveKit-Transfer — passiert Folgendes: Der KI-Agent verlässt den Raum oder übergibt die SIP-Session — und verliert damit atomisch jede Kontrollmöglichkeit. Die Subscription-Matrix wird aufgelöst. Kein Track mehr. Kein Audio-Zugriff. Kontrollverlust ist architekturimmanent, nicht ein Bug.
Das ist wie ein Chirurg, der nach dem ersten Schnitt den OP verlässt. Kein seriöses System würde das akzeptieren — aber in der KI-Telefonie ist es leider Standard. „Move participant" ist ein Workaround für Systeme, die keine persistente Supervisor-Rolle kennen.
Der LiveKit-Raum hält Caller, Agent und GoFonIA. Die Subscription-Matrix bestimmt, wer wen hört. GoFonIA ist stumm geschaltet, aber voll aktiv: Es hört beide Seiten mit, analysiert in Echtzeit und kann jederzeit per Whisper coachen oder per Barge-in eingreifen. Kein menschlicher Supervisor nötig — die KI übernimmt diese Rolle.
Die entscheidende Erkenntnis: Der LiveKit-Raum ist kein Transportmedium — er ist der Call Control Layer selbst. Solange GoFonIA im Raum bleibt, behält es:
Vollzugriff auf alle Audio-Tracks (Caller + Agent) über Subscriptions — jederzeit, ohne Neuaufbau.
Selektives Publizieren in Tracks: Whisper nur an Agent, Barge-in an alle.
Kompletten Session-State in Redis ohne Re-Initialisierung — der Raum lebt, der State lebt.
Kontrolle über den Call-Lifecycle bis zum finalen BYE — kein Kontrollverlust, kein Blindflug.
„Move participant" ist ein Workaround für Systeme, die keine persistente Supervisor-Rolle kennen. Kein anderer Ansatz kann diese vier Eigenschaften gleichzeitig leisten, ohne den Raum offen zu halten.
Ein Kunde ruft an. GoFonIA qualifiziert, stellt an den Fachagenten durch — und bleibt als stiller Beobachter im Gespräch.
ViciDial leitet Inbound-Call an GoFonIA als Remote Agent. GoFonIA nimmt an, Leg 1 (Caller) ist im LiveKit-Raum. KI führt Erstgespräch, erfasst Anliegen, prüft Kundenhistorie.
GoFonIA ruft per Outbound-SIP den passenden Agenten aus der Inbound-Gruppe an. Leg 2 (Agent) tritt dem Raum bei. GoFonIA stellt vor: „Herr Müller hat eine Frage zur Rechnung vom 15.05." — dann stumm.
GoFonIA trackt Sentiment, Skript-Treue, Compliance-Flags — und handelt als KI-Supervisor: Erkennt Engpässe, flüstert Anweisungen („Frag nach der Kundennummer", „Lösung B anbieten"). Der Agent hört nur Caller und GoFonIAs Stimme. Kein menschlicher Supervisor nötig.
Gespräch beendet. GoFonIA erstellt Agent-Score: Freundlichkeit, Lösungsquote, Gesprächsdauer, Compliance. Score geht an ViciDial-Disposition. Agent ist sofort wieder frei in der Inbound-Gruppe. Caller-Leg geschlossen.
ViciDial wählt Leads an, GoFonIA qualifiziert vor, stellt warm an den Closer durch — mit Live-Verkaufsunterstützung.
ViciDial Outbound-Campaign übergibt an GoFonIA als Remote Agent. GoFonIA ruft Lead an. KI qualifiziert: Bedarf, Budget, Timeline, Entscheider. Bei Positiv-Qualifikation → Schritt 2.
GoFonIA briefet den Closer vor dem Join: „Herr Schmidt, 5k Budget, will bis Ende Q2 entscheiden, Einwand war Preis." Closer tritt Raum bei, Leg 2 offen. GoFonIA wird stumm.
GoFonIAs Objection-Detection meldet „Preis" zum dritten Mal. GoFonIA flüstert dem Closer: „Jetzt Rabatt Staffel 2 anbieten". Closer reagiert sofort. Lead merkt nichts. Die KI ist der Supervisor.
Call beendet. GoFonIA bewertet Closer: Closing-Rate-Trend, Einwandbehandlung, Gesprächsführung. Score an ViciDial für Incentive-Berechnung. Closer zurück in Closing-Gruppe.
Die Entscheidung, ob ein Call komplett von der KI abgewickelt wird oder ein Mensch übernimmt, trifft GoFonIA in Echtzeit anhand der Situation — nicht anhand einer starren Routing-Tabelle.
GoFonIAs Tool-Registry kann pro Tenant bis zu 10 APIs einbinden. Dabei unterscheiden wir zwei Kategorien — je nachdem, ob GoFonIA nur liest oder aktiv handelt.
Vapi, Retell und Synthflow denken in Calls, nicht in Räumen. Ihr Architekturparadigma ist: Anruf annehmen → verarbeiten → übergeben → fertig. GoFonIAs Paradigma ist fundamental anders:
Das ist kein Feature-Unterschied — das ist ein fundamentaler Paradigmenwechsel. Die Konkurrenz müsste ihre gesamte Architektur neu bauen, um das nachzubilden. Systeme, die in Calls denken, können keine persistenten Räume.
ViciDis klassischer Remote Agent bridged Caller und Agent per SIP-B2BUA — danach ist die Verbindung blind. Keine Kontrolle, kein Monitoring, kein Coaching. GoFonIA ersetzt nicht nur den Remote Agent, sondern augmentiert ihn: Der Call Control Layer bleibt durchgehend in der Signalkette. Beide Legs voll instrumentiert. Und GoFonIA selbst ist der Supervisor — kein Mensch muss mithören. Die KI analysiert, flüstert, greift ein. LiveKit kontrolliert die Tracks — und GoFonIA den gesamten Call-Lifecycle.
Kein Vapi. Kein Retell. Kein Synthflow. Kein klassischer ViciDial-Remote-Agent. Nur GoFonIA.
Jetzt testen →