Hibiki ist ein fortschrittliches Modell, das sich auf die Streaming-Sprachübersetzung konzentriert. Es generiert durch die Echtzeitakkumulation ausreichender Kontextinformationen blockweise korrekte Übersetzungen. Es unterstützt die Übersetzung von Sprache und Text und kann Klangumwandlungen durchführen. Das Modell basiert auf einer Multi-Stream-Architektur und kann gleichzeitig die Quellsprache und die Zielsprache verarbeiten, um einen kontinuierlichen Audiostrom und zeitlich getaktete Textübersetzungen zu erzeugen. Zu den Hauptvorteilen gehören eine hochgenaue Sprachumwandlung, eine latenzarme Echtzeitübersetzung und die Kompatibilität mit komplexen Inferenzstrategien. Hibiki unterstützt derzeit die Übersetzung von Französisch nach Englisch und eignet sich für Szenarien, die eine effiziente Echtzeitübersetzung erfordern, wie z. B. internationale Konferenzen oder mehrsprachige Livestreams. Das Modell ist Open Source und kostenlos und eignet sich für Entwickler und Forscher.