Dezember 13, 2022

Kurz erklärt: Wie der Sprachassistent von HiJiffy funktioniert

Verstehen Sie die Technologie hinter unserem Sprachassistenten besser.

HiJiffys Konversations-KI zeichnet sich durch die effiziente Verarbeitung von Textnachrichten und die Beantwortung verschiedenster Gästeanfragen aus. Da wir die neusten Entwicklungen in der Kommunikationstechnologie immer im Auge behalten, haben wir unser Aplysia OS innoviert und erweitert, um Hoteliers und Gästen leistungsstarke neue Funktionen zu bieten.

Die Kommunikation über Sprachnachrichten gewinnt in einem erstaunlichen Tempo an Popularität – täglich werden bis zu sieben Milliarden allein über WhatsApp verschickt. Infolgedessen steigen auch die Erwartungen an Unternehmen, Sprachunterstützung anzubieten. Dank der neuesten Innovation bei HiJiffy sind KI-gesteuerte Sprachassistenten nun auch in der Hotellerie verfügbar.

Was sind Sprachassistenten?

Sprachassistenten sind im alltäglichen Leben angekommen und werden in verschiedenen Branchen bereits eingesetzt. Die Menschen integrieren sie in Alltag, um tägliche Aufgaben zu vereinfachen, mehr Komfort zu genießen und Zeit zu sparen. Hier haben wir einige Beispieltätigkeiten gesammelt, die mit einem Sprachassistenten vereinfacht werden: 

  • Anrufe tätigen, Nachrichten empfangen, öffnen, versenden oder vorlesen lassen;
  • Nachrichten, Wettervorhersagen, Wechselkurse und Definitionen suchen;
  • Notizen machen und Erinnerungen einstellen;
  • Ereignisse planen oder verschieben und im Kalender eintragen;
  • Wecker stellen, die Bildschirmhelligkeit anpassen, WLAN ein- oder ausschalten, Musik abspielen und weitere Standardapps nutzen;
  • Route von Punkt A nach B planen, anzeigen und dorthin navigiert werden;
  • In der Freizeit nach Unternehmungen, Restaurants oder Urlaubszielen suchen;

Sprachassistenten gehören zu den Konversationsagenten, die auf künstliche Intelligenz (KI) basieren. Sie verstehen menschliche Sprache und antworten mit einer künstlichen, aber menschenähnlichen Stimme. Mithilfe von Spracherkennung, KI und natürlicher Sprachverarbeitung (NLP) können Sprachassistenten Gespräche führen und Antworten bereitstellen.

Begrüßen Sie die neue Stimme in Ihrem Hotel

HiJiffy wurde 2016 mit der Vision gegründet, durch die Entwicklung fortschrittlichster Konversations-KI, spezialisiert für die Hotellerie, Hotels stärker mit ihren Gästen zu verbinden. Unser Sprachassistent versteht Gästeanfragen, die im Audioformat gestellt werden, wie Fragen zu Check-in- und Check-out-Zeiten oder den Öffnungszeiten des Hotel-Spas oder Restaurants. Der Sprachassistent kann sein vorhandenes Wissen nutzen, um nicht nur schriftliche, sondern auch sprachliche Antworten zu liefern.

Wie funktioniert ein Sprachassistent-System?

In den folgenden Abschnitten gehen wir näher auf die wesentlichen Bestandteile des Sprachassistent-Systems ein:

  • Sprache-zu-Text (STT)
  • Text-zu-Sprache (TTS)
  • Entscheidungsfindung
  • Architektur

Dies sind die vier Schlüsselelemente, die notwendig sind, um ein funktionierendes Sprachassistenten-System zu haben. Es gibt jedoch auch andere kleinere Prozesse, die das System verbessern.

Unser Sprachassistent basiert auf der Architektur von HiJiffy und Aplysia OS und schafft eine solide Grundlage, die es den Benutzern ermöglicht, auf die Tools und Funktionen zuzugreifen, die bereits in unsere Gästekommunikations-Hub vorhanden sind. 

Voice assistant 01 kurz erklärt: wie der sprachassistent von hijiffy funktioniert

So ist das Organisationssystem unseres Sprachassistenten strukturiert:

  • Audio vom Benutzer empfangen
  • Audio in Text umwandeln (STT)
  • Die beste Antwort auf den Text vorhersagen (Entscheidungsfindung)
  • Antwort in Audio umwandeln (TSS)
  • Antwort an den Benutzer zurückgeben

Sprache-zu-Text (STT)

Das Umwandeln von Audiodateien oder gesprochenen Eingaben von einem Mikrofon in Text wird als Sprache-zu-Text (Speech-to-Text, STT) bezeichnet. Ein ideales STT sollte in der Lage sein, die gegebene Eingabe (Audio) „wahrzunehmen“, die gesprochenen Wörter zu „erkennen“ und dann die erkannten Wörter als Eingabe (Endtext) zu verwenden. 

Wir bieten derzeit ein generisches Modell an, das unter den vielen verfügbaren Modellen und Varianten weitverbreitet ist. Es handelt sich um einen statistischen, historischen Ansatz, der aus drei Schlüsselkomponenten besteht.

Voice assistant 02 kurz erklärt: wie der sprachassistent von hijiffy funktioniert

  • Extraktion von Merkmalen
    • Extraktion verschiedener Merkmale wie Leistung, Tonhöhe und Konfiguration des Stimmtrakts aus dem Audio. Auf diese Weise können die wesentlichen Audio-Teile erkannt werden, wie Hintergrundgeräusche und irrelevante Informationen.
  • Akustisches Modell
    • Umwandlung der extrahierten Merkmale in ein statistisches parametrisches Sprachmodell, das vorhersagt, welchem Phonem jede Wellenform entspricht, normalerweise auf Zeichenebene.
  • Sprachmodell
    • Feststellen, ob Wortkombinationen mithilfe eines Sprachmodells realisierbar sind. Es verwendet Grammatikprinzipien und Wahrscheinlichkeiten des gemeinsamen Vorkommens bestimmter Laute in Sätzen.

Es gibt auch weitere verfügbare Ansätze; dies ist nur ein Beispiel, um zu zeigen, wie aus Audio Text abgeleitet werden kann.

Text-zu-Sprache (TTS)

Das Gegenteil der Sprache-zu-Text-Konvertierung ist die Text-zu-Sprache (Text-to-Speech, TTS), ein Prozess, der natürliche Sprache modelliert und Text in Sprache für die audiovisuelle Präsentation umwandelt. Die neuesten TTS-Modelle folgen der folgenden Struktur:

Voice assistant 04 kurz erklärt: wie der sprachassistent von hijiffy funktioniert

  • Textvorbereitung und Normalisierung
    • Der eingegebene Text wird vorbereitet und verarbeitet. Er wird in die sprachlichen Merkmale der Zielsprache in Form eines Vektoreingangs in das akustische Modell umgewandelt.
  • Akustisches Modell
    • Umwandlung des vorverarbeiteten/normalisierten Textes in eine Sequenz von Wellenformblöcken, die dann die Stimme des Sprachassistenten erzeugen.

Auf diese Weise kann ein Computer Stimme durch Text reproduzieren. Die Technologie hat sich so weit entwickelt, dass es möglich ist, Stimmen zu kopieren. Der Sprachassistent kann unter anderem eine Stimme generieren, die genau wie Ihre klingt, damit die Kommunikation authentisch klingt.

Entscheidungsfindung 

Um die am besten geeignete Antwort auf die Nachricht des Benutzers zu finden, muss der Sprachassistent zunächst den Inhalt der Nachricht erfassen, die der Benutzer gesendet hat. Wie der Chatbot von HiJiffy wird auch der Sprachassistent das NLP von Aplysia und unsere optimierten Hospitality-Modelle einsetzen, um die beste Antwort auf die Anfrage des Gastes zu finden.

Architektur

Es wird die HiJiffy-Architektur verwendet und es werden in unserem Sprachassistenten alle Prozesse und Funktionen, die die Konversations-KI derzeit bietet, verfügbar sein. Mit anderen Worten: Die Funktionen, die in unserer Konversations-KI verfügbar sind, werden auch in unserem Sprachassistenten und Chatbot verfügbar sein, darunter die Fähigkeit, die vom Benutzer gesprochene Sprache zu bestimmen. 

Einige kleinere Arbeitsprozesse verbessern die Funktionalität unseres Sprachassistenten zusätzlich zu den oben genannten Hauptfunktionen; insbesondere die Auswahl einer bestimmten Stimme für den Sprachassistenten Ihres Hotels, die am besten zu Ihrer Marke passt. 

Zusammenfassend werden die zuverlässige und qualitativ hochwertige Architektur von HiJiffy und das Aplysia OS, welche alle zugrunde liegenden Innovationen liefert, als Grundlage für den Sprachassistenten dienen.


Vielen Dank an Eduardo Machado von unserem Aplysia Lab für seinen Beitrag zu diesem Artikel.

Eduardo machado kurz erklärt: wie der sprachassistent von hijiffy funktioniert

Eduardo Machado
Data Engineer

Letzte Einträge

Personalmangel in der Hotellerie: So unterstützen Sie Ihre Rezeption mit KI

Personalmangel in der Hotellerie: So unterstützen Sie Ihre Rezeption mit KI

Erfahren Sie, wie KI die Rezeption effektiv unterstützt und das Gästeerlebnis bereichert.
Hotelbranding: Die Bedeutung der Personalisierung von Chatbots, um sie an Ihre Markenstrategie anzupassen

Hotelbranding: Die Bedeutung der Personalisierung von Chatbots, um sie an Ihre Markenstrategie anzupassen

Warum Hotel Branding wichtig ist und wie Sie mit HiJiffy Personalisierungen durchführen können

Möchten Sie exklusive Informationen über das Hotelmanagement erhalten?

Tragen Sie sich in unsere Liste ein und erhalten Sie jeden Monat die besten Artikel.

Newsletter