Microsoft Azure-Test: Modernste Sprachverarbeitung

Inhaltsverzeichnis:

Anonim

Microsoft Azure Speech to Text ist eine der fortschrittlichsten Spracherkennungsplattformen. Als Teil der Cognitive Speech Services-Produktpalette von Microsoft werden Deep-Learning-Algorithmen verwendet, um eine schlechte Klangqualität zu überwinden, und es können verschiedene Sprachstile für genaue Audio-Transkriptionen angepasst werden. In dieser Microsoft Azure Speech to Text-Überprüfung werden wir uns diesen Dienst genauer ansehen.

Es ist erwähnenswert, dass Microsoft Azure Speech to Text keine traditionelle benutzerfreundliche Diktiersoftware ist. Stattdessen handelt es sich um eine entwicklerorientierte Plattform, mit der Unternehmen ihre eigenen Produkte erstellen, testen und verwalten können. Wenn Sie nur einen Stapel von Audiodateien transkribieren möchten, sind alternative Sprach-Text-Apps möglicherweise die bessere Option. In unserem Best Speech-to-Text-Softwarehandbuch finden Sie die besten Alternativen.

Microsoft Azure Speech to Text: Pläne und Preise

Mit Microsoft Azure Speech to Text können Sie bis zu fünf Stunden Audio kostenlos transkribieren und ein benutzerdefiniertes Sprachmodell pro Monat erstellen. Mit dem kostenlosen Plan ist jedoch immer nur eine einzige gleichzeitige Audioanforderung verfügbar, was bedeutet, dass diese Option für die meisten Unternehmen nicht realisierbar ist.

Die Abrechnung von Azure-Sprachdiensten wird in Schritten von einer Sekunde aufgeteilt.

Wenn Sie mehr als einen Sprachclip gleichzeitig transkribieren möchten, müssen Sie auf das Standard-Azure-Preissystem aktualisieren. Dies kostet 1 US-Dollar pro Audio-Stunde und unterstützt bis zu 20 gleichzeitige Anforderungen. Zusätzliche Gebühren fallen an, wenn Sie ein benutzerdefiniertes Audiomodell verwenden oder Mehrkanal-Sounddateien transkribieren müssen. Diese zusätzlichen Dienste kosten 1,40 USD bzw. 2,10 USD pro Audiostunde.

Obwohl Microsoft seine Preise wie im Industriestandard im Format "pro Audiostunde" auflistet, wird die Abrechnung tatsächlich in Schritten von einer Sekunde aufgeteilt, sodass Sie nicht für mehr Verarbeitungszeit als erforderlich bezahlen.

Microsoft Azure Speech to Text: Funktionen

Die wichtigste Funktion von Azure Speech to Text ist der Zugriff auf das leistungsstarke Verarbeitungssystem für natürliche Sprachen von Microsoft. In den letzten Jahren hat die Sprach-KI von Microsoft mehrere wichtige Meilensteine ​​erreicht. Dies bedeutet, dass jetzt Aufgaben erledigt werden können, die für einen Spracherkennungsdienst bisher nicht möglich waren, z. B. das genaue Transkribieren von Übersprechen bei Gesprächen in kleinen Gruppen.

Der Microsoft Azure Speech to Text-Dienst kann für optimale Genauigkeit in Office 365 integriert werden.

Azure arbeitet mit Dutzenden von Sprachen und Dialekten und kann mithilfe benutzerdefinierter Spracherkennungsmodelle trainiert werden, um sich besser an den Sprechstil, Hintergrundgeräusche und den Wortschatz eines Benutzers anzupassen. Wenn sich Ihre Organisation bereits für das Microsoft-Produkt-Ökosystem engagiert, können Sie die Office 365-Benutzerdaten nutzen, um die Spracherkennungsgenauigkeit für organisationsspezifische Begriffe zu verbessern. Dies kann vor allem ohne Beeinträchtigung Ihrer Datensicherheit erfolgen, da Speech to Text lokal ausgeführt werden kann.

Microsoft Azure Speech to Text: Setup

Microsoft Azure wurde eher für Entwickler als für Verbraucher entwickelt. Dies bedeutet, dass das Einrichten ein aufwändiges und etwas herausforderndes Verfahren ist, das am besten jemandem überlassen wird, der über viel technisches Know-how verfügt.

Das Einrichten von Azure ist nur dann einfach, wenn Sie über Programmiererfahrung verfügen.

Der schnellste Weg, Azure zu konfigurieren, besteht darin, das Azure Speech SDK in einer Programmiersprache wie Java oder C ++ zu verwenden. Dazu müssen Sie sich für ein kostenloses Azure-Konto registrieren und ein leeres Projekt in Ihrer Entwicklungsumgebung erstellen. Anschließend müssen Sie Microsoft Visual Studio verwenden und ein kurzes Programm schreiben, um das SpeechRecognizer-Objekt von Microsoft zu initialisieren.

Microsoft Azure Speech to Text: Benutzeroberfläche

Wie andere Massentranskriptionsplattformen soll Microsoft Azure Speech to Text als API (Application Programming Interface) ausgeführt, zu Office 365-Programmen hinzugefügt oder in neue Plattformen und Dienste integriert werden. Aus diesem Grund gibt es keine einzige Azure Speech to Text-Oberfläche. Was der Endbenutzer sieht, hängt davon ab, wie Azure Speech to Text integriert wurde.

Das Azure-Onlineportal ist intuitiv und einfach zu bedienen.

In der Zwischenzeit wird der Entwickler, der Azure verwaltet, dies über das Online-Azure-Portal von Microsoft tun, das sich modern anfühlt und einfach zu navigieren ist. Das Auffinden der Ressourcenseite für Sprachdienste dauert nur wenige Minuten. Sobald eine Instanz zu Ihrem Konto hinzugefügt wurde, können Überwachungswarnungen und -nutzung in einem einzigen Fenster angezeigt werden.

Microsoft Azure Speech to Text: Leistung

Im Rahmen unserer Microsoft Azure Speech to Text-Überprüfung wollten wir unbedingt sehen, wie diese Plattform die Herausforderung der Verarbeitung von rohen Sprachaufzeichnungen bewältigt. Sobald unser Azure-Konto betriebsbereit war, haben wir eine Reihe von Clips mit unterschiedlichen Hintergrundgeräuschen hochgeladen . Auf ganzer Linie hat Azure unsere Proben gut verarbeitet, da wir im Verlauf unserer Evaluierung nur eine Handvoll Fehler festgestellt haben.

Durch Aktivieren des benutzerdefinierten Sprachmodells von Azure wurde unsere Transkriptionsgenauigkeit verbessert.

Azure hatte zunächst leichte Probleme bei der Verarbeitung ungewöhnlicher oder spezieller Ausdrücke wie Namen von Sportteams und wissenschaftlicher Begriffe. Dies wurde jedoch schnell gelöst, indem die Ausgabeoption für benutzerdefinierte Modelle aktiviert wurde. Nachdem wir diese Option aktiviert hatten, konnte sich Azure an das einzigartige Vokabular und den von uns verwendeten Sprechstil anpassen.

Microsoft Azure Speech to Text: Unterstützung

Um zu lernen, wie Sie mit dem Azure Speech Services SDK über verschiedene Programmiersprachen interagieren und die Azure Speech to Text-Funktionen in Ihre eigene Plattform integrieren können, benötigen Sie auf jeden Fall Hilfe. Glücklicherweise hat Microsoft einen umfassenden Katalog mit Schulungsmaterialien für die Azure-Plattform erstellt, in dem Sie Codebeispiele und nützliche Tipps finden.

Der Schulungsabschnitt der Azure-Site enthält viele hilfreiche Ressourcen.

Außerdem erhalten alle Azure-Kunden kostenlose Unterstützung für die Abrechnung und Abonnementverwaltung, auf die über ein Ticketsystem zugegriffen werden kann. Gegen eine wiederkehrende Gebühr, die bei 29 USD pro Monat beginnt, kann Ihrem Konto eine eingehendere Unterstützung hinzugefügt werden.

Microsoft Azure Speech to Text: Endgültiges Urteil

Die Azure Speech to Text-Plattform nutzt modernste Technologie, um einen nahezu perfekten Transkriptionsdienst bereitzustellen. Es eignet sich am besten für Unternehmen, die bereits in das Microsoft Office 365-Ökosystem investiert haben, da benutzerdefinierte Sprach- und Vokabularmodelle sicher aus Ihrem vorhandenen Dokumentenarchiv generiert werden können. Einige kleine Unternehmen haben möglicherweise Probleme mit Azure, da die ordnungsgemäße Einrichtung die Aufmerksamkeit eines qualifizierten Microsoft Cloud-Entwicklers erfordert.

Der Wettbewerb

Amazon Transcribe, Google Cloud Speech-to-Text und Watson Speech-to-Text sind direkte Konkurrenten von Microsoft Azure. Diese drei Plattformen sind auch alle in der Lage, Batch-Transkriptionen mit hohem Volumen genau durchzuführen. Google Cloud ist der einzige enge Konkurrent, der mit mehr Sprachen als Azure arbeiten kann. Es ist jedoch teurer und kostet nur 0,006 US-Dollar pro 15 Sekunden, verglichen mit 0,017 US-Dollar pro Minute (0,00425 US-Dollar pro 15 Sekunden).

Weitere Alternativen zu Microsoft Azure Speech to Text finden Sie in unserem Best Speech to Text-Softwarehandbuch.