Jedes Tool, das transkribiert, zielt auf eine bestimmte Nische ab, und Sonix hat diejenigen ausgewählt, die Besprechungen oder Präsentationen aufzeichnen und dann eine typisierte Version zum Suchen oder Verbreiten benötigen.
Daher kann es für einen Studenten genauso nützlich sein wie für eine Führungskraft, Transkriptionen zu liefern, die für zukünftige Referenzzwecke leicht indiziert werden können.
Um für diese Aufgaben erfolgreich zu sein, muss die Software genau und erschwinglich sein.
Ist Sonix.ai dieses Tool und kann ein Onlinedienst mit einer installierten Anwendung konkurrieren?
- Möchten Sie Sonix.ai ausprobieren? Schauen Sie sich die Website hier an
Pläne und Preise
Wie bei vielen Transkriptionsdiensten basiert das Sonix-Kostenmodell auf der Zeit. Die Länge einer Aufzeichnung, die Sie zur Verarbeitung in den Dienst hochladen, und die Kosten für diese Ressource betragen 10 US-Dollar pro Stunde, wenn Sie den Pay-as-you-go-Standarddienst verwenden.
Die Kosten pro Stunde können auf 5 US-Dollar gesenkt werden, wenn Sie sich für 22 US-Dollar pro Monat für jeden Benutzer beim Premium-Abonnement anmelden. Für Unternehmen, die mehr als 100 Stunden pro Monat transkribiert benötigen, sind Mengenrabatte verfügbar.
Der Standardplan bietet die grundlegendsten Funktionen, und Premium bietet zusätzliche Funktionen wie Mehrbenutzerzugriff und Teamfreigabe. Und Enterprise bietet alles, was Premium bietet, mit viel zusätzlicher Administration und einem erweiterten Support-Modell.
Was die Transkriptionsdienste angeht, ist Sonix einer der teureren und sicherlich nicht etwas, das sich die Mehrheit der Studenten oder Heimanwender vernünftigerweise leisten könnte.
Design
Die Website my.sonix.ai verwendet ein außergewöhnlich sauberes Design und das Erstellen eines Kontos ist kostenlos.
Zum Zeitpunkt des Schreibens handelt es sich ausschließlich um einen webbasierten Dienst, und Sonix verfügt über keine mobile App, die erfasst und zur Verarbeitung von Audioaufnahmen gesendet werden kann.
Da wir uns jedoch später damit befassen werden, gibt es einfache Möglichkeiten, um dieses Problem zu umgehen und das Fehlen einer mobilen App etwas zu beheben.
Der Startpunkt für jeden Transkriptionsauftrag ist das Sonix.ai-Dashboard, in dem Sie das bereits transkribierte Audio anzeigen und neue zu verarbeitende Audiodaten hinzufügen können.
Da dieses System für mehrere Benutzer konzipiert wurde, enthält es ein virtuelles Ordnersystem, mit dem Transkriptionen so organisiert werden können, wie es für geeignet erachtet wird.
Durch Klicken auf "Hochladen" gelangt der Benutzer zu einer Seite, auf der mehrere Dateien im System abgelegt werden können. Wenn das Konto über ausreichend Guthaben verfügt, können diese verarbeitet werden.
Alle Standard-Audiodateiformate werden unterstützt, einschließlich wav, mp3, mp4a, aiff, acc, ogg und wma. Sie können auch einige Videoverpackungsstrukturen hochladen. Die maximale Dateigröße beträgt 4 GB. Bevor Sie eine große Videodatei mit 4K-Auflösung hochladen, empfehlen wir Ihnen, ein anderes Tool zum Aufteilen des Audios zu verwenden, um das Hochladen zu beschleunigen.
Eine gute Möglichkeit, den Upload zu beschleunigen, besteht darin, einen Cloud-Speicher wie Google Drive, One Drive, Box oder Dropbox zu verwenden und diesen direkt mit dem Konto zu verknüpfen. Sie können dem System auch eine E-Mail mit Google Mail senden, um einen eleganteren Workflow zu erstellen, als Dateien auf einer Webseite abzulegen.
Diese Automatisierung wird über Zapier bereitgestellt und ermöglicht eine viel umfassendere Integration, wenn das Unternehmen, das sie verwendet, in diese Technologie investiert hat, um seine Geschäftsprozesse zu verbinden.
Eine weitere nette Geste ist, dass Sie zusammen mit der Audio- oder Videodatei vorhandene Transkriptionen einbinden können, um den Vorgang schneller abzuschließen und die Genauigkeit zu verbessern.
Eine weitere nette Geste ist, dass Sie zusammen mit der Audio- oder Videodatei vorhandene Transkriptionen einbinden können, um den Vorgang schneller abzuschließen und die Genauigkeit zu verbessern.
Aufgrund der Art der Cloud-basierten Verarbeitung ist es unmöglich zu beurteilen, wie schnell oder langsam die Verarbeitung sein könnte, aber Sonix.ai ist unserer Erfahrung nach relativ schnell. Normalerweise dauert die Transkription zwischen 10% und 20% der Zeit, da die Aufnahme dauert. Daher dauert das Durchführen einer 10-minütigen Aufnahme normalerweise weniger als 2 Minuten.
Sie müssen der Verarbeitung nicht folgen, da das System Ihnen nach Abschluss der Arbeiten eine Benachrichtigung per E-Mail sowie einen Link zur neuen Transkription sendet.
Sobald die Datei verarbeitet ist, können Sie sie auf der Seite öffnen und bearbeiten, um die Ergebnisse zu überprüfen. Außerdem können Sie den Text in einer Vielzahl nützlicher Formate exportieren, einschließlich derer, die von einigen Apps als Untertitel definiert wurden.
Die Anzahl der vom System unterstützten Sprachen und Dialekte beträgt 36, darunter mehrere englisch-, französisch-, kantonesisch-, mandarin-, portugiesisch- und spanischsprachige Länder sowie alle gängigen west- und osteuropäischen Sprachen sowie einige asiatische und arabische.
Aufnahmen
Neben der Arbeit, die in die KI floss, um die Geräusche zu interpretieren, die Menschen machen, stellt die Seite "Aufnahmen" hier wahrscheinlich einen erheblichen Codierungsaufwand dar.
Hier können sowohl das Audio als auch das zugehörige Transkript verglichen und manuell mit Details zu Sprecherwechseln und Korrekturen von Fehlinterpretationen erweitert werden.
Für alle, die ein Transkript durcharbeiten, um den Text zu polieren, wird auf dieser Seite die Position des Kohlegesichtes angegeben. Es ist sinnvoll, dass einige Anstrengungen in diesen Teil gesteckt wurden, da er sehr einfach zu verwenden und zu befolgen ist.
Bei dem Versuch, den Benutzer darauf hinzuweisen, wo Probleme auftreten könnten, wird Sonix.ai den Inhalt farblich kennzeichnen, um die Abschnitte hervorzuheben, die weniger sicher sind. Diese Funktion kann nützlich sein, obwohl Sonix.ai selbst in den Bereichen Fehler machen kann, in denen die Transkription den Status "Sehr sicher" hat.
Die besten Aspekte dieser Seite sind, wie die Audiowiedergabe und der Text synchronisiert werden, sodass durch Platzieren des Cursors im Text die Wiedergabeposition in denselben Abschnitt verschoben wird.
Neben der einfachen Bearbeitung ist es auch möglich, Abschnitte in verschiedenen Stilen hervorzuheben und Notizen neben der Transkription zu machen.
Sie können auch den Timecode anpassen, was besonders nützlich ist, wenn die Aufnahme mit einer langen Pause oder einer unerwünschten Präambel beginnt.
Richtigkeit
Sonix beschreibt Sonix.ai als "die beste automatisierte Transkriptionssoftware mit modernster KI".
In Anbetracht unserer Tests würden wir dieses Produkt als stark abhängig von der Qualität der Aufzeichnung und vielen anderen Faktoren beschreiben, die nicht einfach zu kontrollieren sind.
Bei der Verarbeitung unserer klassischen historischen Sprachaufzeichnungen war es für einige Sprecher sehr schwierig, auch wenn sie für uns klar klangen.
Diese Ergebnisse standen in deutlichem Kontrast zu einigen mehr gleichzeitigen Aufzeichnungen, bei denen die Genauigkeit akzeptabel, aber kaum herausragend war.
Wir sind zu dem Schluss gekommen, dass der Ansatz von Sonix verschiedene Annahmen enthält, die je nach Sprecher und Qualität der Aufnahme funktionieren können oder nicht.
Was faszinierend war, ist, dass der Dienst seine Transkription farblich codiert, basierend darauf, wie sicher er von dem ist, was gesagt wird, und diese Selbstanalyse ist sehr aufschlussreich.
Unter bestimmten Umständen wird korrekt erkannt, dass ein Abschnitt möglicherweise verdächtig ist, in anderen Teilen ist es jedoch sicher, dass der Abschnitt völlig falsch transkribiert wurde.
Ein paar häufige Probleme scheinen es zu krümmen, und eines davon sind Leute, die keine grammatikalisch perfekte Prosa sprechen. Um ihre Sprache direkter zu gestalten, haben sie einige Wörter aus ihren Sätzen entfernt, was zu einem dramatischeren Stil führt. Wenn diese von Sonix transkribiert werden, scheint es entschlossen zu sein, diese Wörter wieder hinzuzufügen, um sie an das interne Grammatikmodell anzupassen, und nicht an das, was tatsächlich gesprochen wurde.
Die Transkription liest sich besser als Dokument, ist aber nicht wirklich repräsentativ für das, was gesagt wurde.
Sonix ist sicherlich besser, wenn die Qualität der Aufnahme und die Klarheit des Lautsprechers hoch sind, wie wir mit einem kleinen Clip von Stephen Fry bewiesen haben, der Harry Potter liest. Es ist jedoch nicht möglich, immer eine solche Kontrolle über die Klangqualität zu haben, und es wurden dennoch Fehler bei diesem Test gemacht.
Ein weiterer Problembereich sind formale Namen und technische Wörter oder Abkürzungen. Diese können durch Hinzufügen zum benutzerdefinierten Wörterbuch behoben werden. Dies erfordert jedoch Arbeit, damit das System besser erkennen kann, wenn Namen oder Akronyme verwendet werden.
Für diejenigen, die ein perfektes Transkriptionswort benötigen, bietet Sonix eine Auswahl an zugehörigen professionellen Transkriptoren, die eine Aufzeichnung bearbeiten und diese Probleme beheben können. Dies macht jedoch den Zweck der verarbeiteten Transkription etwas zunichte.
Sicherheit
Der Schwerpunkt der Sonix.ai-Sicherheit liegt auf den Servern, auf denen das Audio verarbeitet und die Transkriptionen gespeichert werden.
Der gesamte Datenverkehr wird mit TLS (Transport Layer Security) verschlüsselt. Sobald sich die Dateien auf dem Server befinden, der durch mehrere Firewall-Schichten geschützt ist, werden der Intrusion Protection und alle Daten durch die serverseitige AES-256-Verschlüsselung geschützt. Und das Unternehmen verspricht, dass Mitarbeiter keinen Zugriff auf Aufzeichnungen oder Transkriptionen haben, es sei denn, sie haben die ausdrückliche Erlaubnis dazu.
Das entscheidende Problem bei diesem Ansatz ist, dass ein einfacher Login und ein Passwort alles umgehen können. Sonix.ai verfügt über keine Zwei-Faktor-Authentifizierung und kein leicht zugängliches Protokoll darüber, wer wann auf Dateien zugreift.
Unter Sicherheitsgesichtspunkten kann dies als übermäßiges Vertrauen in die Integrität derjenigen angesehen werden, die das System verwenden, um keine Aufzeichnungen mit anderen außerhalb des Unternehmens zu teilen oder potenziell sensible Dateien zu behalten, wenn sie das Unternehmen verlassen.
Kurz gesagt, die Sicherheit muss besser sein und der Nachverfolgung oder Benutzeraktivität muss eine höhere Priorität eingeräumt werden.
Endgültiges Urteil
Angesichts der relativ hohen Kosten haben wir erwartet, dass Sonix eine bessere Leistung erbringt als es.
Vielleicht hatten wir Pech bei der Auswahl der zu transkodierenden Dinge, aber es schien immer noch eine übermäßige Menge an Fehlern zu machen.
Positiv zu vermerken ist, dass diese Gleichung schnell und ein bemerkenswert einfach zu verwendendes System ist. Wir empfehlen jedoch, einige Beispielaufzeichnungen mit dieser Lösung durchzuführen, bevor Sie ein Abonnement abschließen.
Das größte Problem bei Sonix sind die hohen Kosten, und selbst wenn es das richtige Werkzeug für Ihre spezielle Anforderung ist, gibt es günstigere Möglichkeiten, Audio an anderer Stelle in Text umzuwandeln.