Zum Inhalt

Gespräche aufnehmen, transkribieren und weiterverarbeiten

Kurz erklärt

Mit Aufnahmen können Gespräche live aufgenommen oder Audio-Dateien hochgeladen, automatisch transkribiert und direkt weiterverarbeitet werden. Transkripte und Verarbeitungsergebnisse lassen sich bearbeiten, durchsuchen und gezielt an KI-Agenten übergeben, um Inhalte effizient weiterzuverarbeiten.

Typischer Ablauf:

  1. Aufnahme starten oder Datei hochladen
  2. Transkription und KI-Verarbeitung abwarten
  3. Transkript prüfen, bearbeiten oder durchsuchen
  4. Ergebnisse der KI-Verarbeitung einsehen, ausführen oder bearbeiten
  5. Ergebnisse im KI-Chat weiterverarbeiten

Hinweis

Für Aufnahmen wird Google Chrome benötigt. Andere Browser – insbesondere Safari oder iOS-Shortcuts – können dazu führen, dass Aufnahmen nicht korrekt funktionieren.

Browser-Anforderungen

Google Chrome ist für die Nutzung von Aufnahmen zwingend erforderlich. Safari und andere Browser werden nicht unterstützt und können zu Fehlfunktionen führen.

Auf Apple-Geräten (iOS/iPadOS) öffnen Home-Screen-Shortcuts Webseiten grundsätzlich in Safari – auch wenn sie ursprünglich in Chrome erstellt wurden. Das Öffnen der Aufnahme-Seite über solche Shortcuts kann daher zu technischen Problemen führen.

Empfohlene Vorgehensweise:

  • Google Chrome manuell öffnen
  • Aufnahme-Seite direkt im Chrome-Browser aufrufen
  • Seite als Favorit/Lesezeichen in Chrome speichern
  • Aufnahme-Seite ausschliesslich über diese Chrome-Favoriten öffnen

1. Aufnahmen öffnen

Klicken Sie im Seitenmenü auf Aufnahmen. Sie gelangen zur Aufnahmenübersicht, in der alle bestehenden Aufnahmen mit Status angezeigt werden.

Screenshot: Seitenmenü mit markiertem Menüpunkt „Aufnahmen" und Übersichtsliste


2. Aufnahme starten

Oben rechts stehen Ihnen zwei Optionen zur Verfügung: Aufnehmen und Datei hochladen.

Screenshot: Buttons „Aufnehmen" und „Datei hochladen" oben rechts

2.1 Aufnehmen

Startet eine neue Live-Aufnahme. Nach dem Klick auf den "Aufnehmen-Button" öffnet sich ein Pop-up mit drei Optionen:

Screenshot: Aufnahme-Pop-up mit markierten Optionen „Schnellaufnahme", „Individuelle Aufnahme", „Vorlagen"

Zugriffstypen

Der Zugriffstyp legt fest, wer eine Aufnahme sehen und darauf zugreifen kann. Bei Aufnahmen wird zwischen Private (nur für die erstellende Person sichtbar) und Team (alle Nutzer im Workspace haben Zugriff) unterschieden. Eine detaillierte Erklärung der Zugriffstypen finden Sie auf der Seite Zugriffstypen.

Schnellaufnahme

Die Schnellaufnahme eignet sich für spontane Gespräche. Die Aufnahme startet sofort, ohne dass vorab Einstellungen vorgenommen werden müssen. Der Zugriffstyp wird dabei automatisch auf Private gesetzt. Nach der Erstellung der Aufnahme kann der Zugriffstyp jederzeit manuell angepasst werden.

Individuelle Aufnahme

Bei der individuellen Aufnahme können vor dem Start Titel und Beschreibung zur inhaltlichen Einordnung festgelegt werden. Auch der Zugriffstyp wird hier bereits vorab definiert, entweder Private oder Team.

Die Sprache des Gesprächs wird standardmässig automatisch erkannt, kann jedoch manuell festgelegt werden. Die Teilnehmenden können ebenfalls automatisch erkannt oder manuell definiert werden.

Über die Verarbeitungsoptionen wird bestimmt, wie das Transkript weiterverarbeitet wird. Dabei wird zwischen manuellen Optionen, die explizit aktiviert werden müssen, und Standardoptionen unterschieden, die automatisch angewendet werden.

Optional kann zusätzlicher Kontext für die KI-Verarbeitung hinterlegt werden, etwa Ziel oder Hintergrund des Gesprächs. Dies kann die Qualität der Ergebnisse verbessern.

Vorlagen

Vorlagen enthalten vorkonfigurierte Einstellungen für wiederkehrende Anwendungsfälle. Der Zugriffstyp richtet sich nach der Konfiguration der jeweiligen Vorlage. Beim Start der Aufnahme werden sowohl die hinterlegte Verarbeitung als auch der definierte Zugriffstyp automatisch angewendet.

2.2 Datei hochladen

Ermöglicht das Hochladen einer bestehenden Audio-Datei. Die Konfiguration entspricht der individuellen Aufnahme, ergänzt um den Datei-Upload.

Screenshot: Button „Datei hochladen" mit geöffnetem Konfigurationsdialog


3. Aufnahme beenden und Verarbeitung

Während der Aufnahme stehen Pause, Stop und Abbrechen zur Verfügung.

Screenshot: Laufende Aufnahme mit Pause-, Stop- und Abbrechen-Buttons

Nach Klick auf Stop wird:

  • die Aufnahme abgeschlossen
  • das Gespräch transkribiert
  • das Transkript gemäss den gewählten Optionen verarbeitet

4. Status und Übersicht

In der Aufnahmenübersicht zeigt die Status-Spalte den aktuellen Stand. Sobald alle Schritte abgeschlossen sind, steht der Status auf Bereit.

Die Detailansicht erreichen Sie:

  • durch Klick auf den Titel, oder
  • über das Drei-Punkte-Menü → Details anzeigen

Screenshot: Aufnahmenliste mit markierter Status-Spalte und Drei-Punkte-Menü


5. Detailansicht einer Aufnahme

Die Detailansicht ist in die drei Tabs Details, Transkript und KI-Verarbeitung unterteilt.

Im Tab Details werden der Titel (editierbar), Startdatum und Uhrzeit, Sprache, Zugriffstyp sowie die Teilnehmenden angezeigt. Rechts befinden sich der Status sowie die Option Archivieren.

Screenshot: Detailansicht einer Aufnahme mit Tab-Navigation und Statusanzeige

Archivierte Aufnahmen werden nicht mehr in der Standard-Listenansicht angezeigt. Über die Filteroption Archivierte anzeigen können sie jederzeit wieder eingeblendet werden. Dies eignet sich, um abgeschlossene Fälle übersichtlich abzulegen.


6. Transkript

Transkript bearbeiten

Screenshot: Transkript-Tab mit Audio-Player oben und Textbereich darunter

Im Tab Transkript wird das vollständige Gespräch als Text zusammen mit dem Audio-Player angezeigt. Mit Play lässt sich das Gespräch abspielen, wobei der aktuell gesprochene Text automatisch hervorgehoben wird. Ein Klick auf eine beliebige Textstelle führt die Wiedergabe im Audio zur entsprechenden Position.

Zur Bearbeitung erscheint beim Überfahren einer Textstelle ein Edit-Button, über den manuelle Anpassungen vorgenommen werden können. Über das Suchfeld lässt sich das gesamte Transkript per Volltext durchsuchen. Mit der Funktion Transkript neu generieren lässt sich das komplette Transkript neu erstellen – dabei wird das bestehende Transkript vollständig ersetzt.

Mit Transkript chatten

Über Mit Transkript chatten wird das gesamte Transkript an einen KI-Agenten übergeben.

Ablauf:

  1. Button anklicken
  2. KI-Agent auswählen
  3. Transkript wird in einen neuen Chat übernommen

7. KI-Verarbeitung

Der Tab KI-Verarbeitung zeigt alle definierten KI-Prozesse für diese Aufnahme.

Screenshot: KI-Verarbeitung-Tab mit Prozessliste links und Ergebnisbereich rechts

KI-Prozesse

Links werden die verfügbaren Verarbeitungsprozesse angezeigt, z. B. Zusammenfassungen oder strukturierte Berichte. Alle Prozesse arbeiten auf Basis des Transkripts.

Automatische und manuelle Prozesse

Je nach Konfiguration:

  • Automatisch: Der Prozess startet direkt nach der Transkription.
  • Manuell: Der Prozess muss über das Play-Icon gestartet werden.

Nach Abschluss wird das Ergebnis direkt angezeigt.

Mit Verarbeitungsergebnis chatten

Das Ergebnis eines KI-Prozesses kann an einen KI-Agenten übergeben werden. Dabei wird nicht das Transkript, sondern das Verarbeitungsergebnis in den Chat übernommen. Dies eignet sich für die gezielte Weiterverarbeitung einzelner Inhalte.


8. Arbeiten im KI-Chat

Unabhängig davon, ob der Chat aus dem Transkript oder aus einem Verarbeitungsergebnis gestartet wurde:

  1. Agent auswählen
  2. Inhalt wird in einen neuen Chat übernommen
  3. Wechsel in den KI-Chat

Im KI-Chat können Sie:

  • schreiben oder diktieren
  • zusätzliche Dateien hochladen
  • Inhalte analysieren, überarbeiten oder erweitern

→ Detaillierte Anleitung zum KI-Chat: KI-Chat – Anleitung


9. Aufnahmen löschen

Screenshot: Drei-Punkte-Menü mit Option „Löschen" in der Aufnahmenübersicht

Aufnahmen können über die Aufnahmenübersicht gelöscht werden. Öffnen Sie dazu in der entsprechenden Zeile das Drei-Punkte-Menü und wählen Sie Löschen.

Beim Löschen einer Aufnahme werden sämtliche zugehörigen Daten dauerhaft entfernt. Dazu gehören die Aufnahme selbst (Audio), das Transkript sowie alle daraus generierten Verarbeitungsresultate. Die Löschung ist permanent und kann nicht rückgängig gemacht werden.