Vokalischer Rückblick

Inhaltsverzeichnis:

Anonim

Vocalmatic ist ein Online-Transkriptionsdienst, der von der kanadischen Firma Enactics Inc. entwickelt wurde.

Laut seiner Website soll es "Menschen helfen, die mit Audioaufnahmen arbeiten, Zeit sparen, ihre Audio- und Videodaten in Text umzuwandeln".

Was ist das Besondere an diesem Tool angesichts der Anzahl der verfügbaren Online-Transkriptionstools?

  • Möchten Sie Vocalmatic ausprobieren? Schauen Sie sich die Website hier an

Pläne und Preise

Wenn Sie sich bei Vocalmatic anmelden, erhalten Sie sofort 30 Minuten Transkriptionszeit. Wenn diese abgelaufen ist, können Sie zusätzliche Stunden ab 15 US-Dollar für eine einzelne Stunde kaufen.

Je mehr Stunden Sie kaufen, desto weniger kosten sie. 90 bis 100 Stunden kosten durchschnittlich nur 6 US-Dollar pro Stunde.

Diese Preise gelten für einzelne Benutzer, und Enactics bietet flexible Preise für Unternehmen, für die mehrere Benutzer Zugriff benötigen, und das Volumen wird voraussichtlich hoch sein.

Wenn Sie eine Massenanforderung haben, können Sie die Kosten am besten senken, indem Sie einen Tagespass verwenden. Diese ermöglichen die unbegrenzte Nutzung des Dienstes für einen Tag mit einem Limit von drei Dateien pro Stunde.

Die Verwendung dieser Pässe kostet einen Tag 15 US-Dollar, drei Tage 17 US-Dollar und sieben Tage 25 US-Dollar. Wenn Sie Ihre gesamte Arbeit in Blöcken organisieren können, ist dies die günstigste Möglichkeit, Vocalmatic zu verwenden.

Design

Auch nach Online-Transkriptionsstandards ist Vocalmatic grundlegend. Umgekehrt ist es jedoch auch für Benutzer mit eingeschränkten Computerkenntnissen bemerkenswert einfach zu verwenden.

Der unkomplizierte vierstufige Prozess beginnt damit, dass Sie festlegen, ob Sie Audio, Video oder ausschließlich für amerikanische Kunden haben, anrufen und Ihre Wörter direkt transkribieren lassen möchten.

Die meisten Benutzer verwenden Audio- oder Videodateien. In Schritt 2 werden diese auf die Vocalmatic-Site hochgeladen. Die derzeit unterstützten Typen umfassen: mp3-, m4a-, mp4-, flac-, ogg-, wav-, aac-, opus-, oga-, mogg-, webm- und wma-Audiodateien.

Im dritten Schritt definieren Sie, welche Nationalität der Sprecher hat, und im vierten Schritt geben Sie an, wie Ihnen die Ausgabe gefallen soll.

Sprachen sind sicherlich eine Stärke dieses Systems, da es derzeit Englisch, Spanisch, Französisch, Deutsch, Portugiesisch, Italienisch, Niederländisch, Polnisch, Tschechisch, Rumänisch, Chinesisch (Mandarin), Chinesisch (Kantonesisch), Japanisch, Philippinisch, Vietnamesisch, Arabisch transkribiert , Persisch, Hindi, Thailändisch, Koreanisch, Urdu, Türkisch, Hebräisch, Griechisch, Bulgarisch, Russisch, Finnisch, Schwedisch, Dänisch, Afrikaans, Amharisch, Armenisch, Aserbaidschanisch, Indonesisch, Malaiisch, Bengali, Katalanisch, Baskisch, Galizisch, Georgisch, Gujarati , Kroatisch, Zulu, Isländisch, Javanisch, Kannada, Khmer, Laotisch, Lettisch, Litauisch, Ungarisch, Malayalam, Marathi, Norwegisch, Serbisch, Ukrainisch, Singhalesisch, Slowakisch, Slowenisch, Sundanesisch, Suaheli, Tamilisch und Telugu.

So beeindruckend diese Liste auch ist, nicht alle Akzente und Dialekte in jeder Sprache werden erkannt.

Eine Standardausgabeoption verwendet eine einfache Formatierung, und die SRT-Option ist für diejenigen gedacht, die Untertitel für ein Video erstellen.

Wenn Sie diese Auswahl getroffen und die Datei bereitgestellt haben, beginnt das System, die Datei in Text umzuwandeln, wenn Sie noch genügend Zeit für das Konto haben.

Es wird eine E-Mail gesendet, um mitzuteilen, dass das System den Prozess gestartet hat, und eine weitere E-Mail wird gesendet, sobald der Vorgang abgeschlossen ist.

Wie lange es dauert, hängt ganz davon ab, wie beschäftigt die Vocalmatic-Server sind. Im Allgemeinen haben wir jedoch festgestellt, dass es kurz vor dem Zeitpunkt der Aufnahme war oder vielleicht etwas länger.

Das Rendern einer 19-minütigen Aufnahme dauerte etwa 28 Minuten, andere kürzere Teile waren jedoch proportional schneller.

Sobald die Datei verarbeitet wurde, können Sie in einem Editor nachsehen, wie sie funktioniert hat, und einige Anpassungen an Formatierung und Inhalt vornehmen.

Dieses System bietet keine grammatikalische Formatierung. Es werden keine Zeilenumbrüche zwischen Sätzen eingefügt, unabhängig von der Sprechlücke, und es werden nicht immer Namen großgeschrieben.

Außerdem wird der Timecode zwischen den Transkriptionsblöcken eingefügt, auch wenn Sie ihn nicht für die Generierung von SRT-Dateien verwenden.

Das Audio kann im Inhaltseditor wiedergegeben werden, es wird jedoch nicht versucht, Ihnen zu zeigen, wo sich das Audio in der Transkription befindet.

Sobald Sie mit den Ergebnissen zufrieden sind, kann der Text im Standardmodus als Word-Dokument oder Textdatei exportiert werden, und SRT-Dateien, wenn Sie diesen Ausgabemodus ausgewählt haben.

Richtigkeit

In den häufig gestellten Fragen zu Vocalmatic heißt es: „Wir erwarten eine Genauigkeit von 80 - 90% bei klarem Audio. Wenn es viele Hintergrundgeräusche gibt oder wenn gleichzeitig gesprochen wird, kann die Transkription eine Genauigkeit von weniger als 10% aufweisen. “

Nun, bei den begrenzten Tests, selbst bei Ausschnitten aus Hörbüchern mit möglichst klarem Audio, konnten wir dieses Genauigkeitsniveau nicht erreichen.

Selbst bei den besten Versuchen wiederholt es oft einen Teil eines Absatzes oder von Wörtern, erhält einen falschen Namen, der den Satz zuvor richtig geschrieben hat, und verunreinigt die Transkription mit Fehlern.

Wenn die Aufzeichnungen nicht makellos sind, wie z. B. unsere Tests für historische Reden, können die Ergebnisse unverständlich sein.

Was uns am meisten beunruhigt hat, ist, dass Vocalmatic bei einem Problem mit einem Wort oder einer Phrase einzelne Buchstaben zufällig ausspuckt. In Englisch, der Sprache, die wir zum Testen verwendet haben, ist ein Buchstabe "y" für sich genommen kein Wort und auch nicht "m", "k" oder "t".

Dass die Ausgabe keinem Wörterbuch oder definierten grammatikalischen Formen entspricht, scheint für die Software kein Problem zu sein. Es fehlt auch ein Verständnis des Kontextes, da es den Sohn wiederholt als „Sonne“ interpretierte.

Wenn Sie alle Korrekturen berücksichtigen und Punkt, Komma und Großschreibung korrekt hinzufügen, erfordern selbst die besseren Versuche eine erhebliche Anpassung, um als genau zu gelten.

Endgültiges Urteil

Dieser Service ist nicht billig, so schnell oder sehr genau.

Die Freude, 30 Minuten Freizeit zu haben, lässt störend schnell nach, auch wenn die Lösung leicht zugänglich und sehr einfach zu bedienen ist.

Ein Vorteil, den die Freizeit einem potenziellen Kunden bietet, besteht darin, dass Sie ein Beispiel für die Aufzeichnungen hochladen können, die Sie wahrscheinlich transkribieren müssen, und sehen können, wie sie funktionieren.

Nur wenn Text zurückgegeben wird, der im Allgemeinen das darstellt, was im Audio gesprochen wurde, würden wir fortfahren, aber versuchen Sie einige andere Optionen, bevor Sie für diesen bezahlen.

Im Vergleich zu einigen anderen Optionen, insbesondere Transcribe by Wreally, Trint und Happy Scribe, ist dies nicht genau genug, um die Kosten wert zu sein.

Vielleicht sind wir unfreundlich und es ist brillant, Suaheli oder andere Sprachen zu transkribieren, aber allein aufgrund seiner Bemühungen mit Englisch würden wir uns für etwas anderes entscheiden.