Wprowadzanie głosowe - co to jest?

Osoba stale tworzy nowe sposoby, aby uczynić swoje życie wygodniejszym i wygodniejszym. Przejawia się we wszystkim - w życiu codziennym, w życiu codziennym, w pracy. Jednym z najnowszych innowacyjnych rozwiązań było wprowadzanie głosowe, które zaczęło być aktywnie wykorzystywane przez użytkowników na całym świecie.

Co to jest?

Wprowadzanie głosowe jest rodzajem zastępowania standardowego wejścia z klawiatury. Dane są pobierane za pomocą mikrofonu urządzenia, przekształcane i wyświetlane jako zwykły tekst.
Ta technologia jest szczególnie ważna dla osób niepełnosprawnych lub tych, którzy mają do czynienia z dużą ilością tekstu. Zazwyczaj są to copywriterzy, pisarze, tłumacze.

Narzędzia do wprowadzania głosowego

Aby rozpoznać język i przekonwertować go na tekst, użyj specjalnego oprogramowania. I wśród jego liderów można zauważyć fundusze od internetowych gigantów Google i Yandex.


Google

Dane wejściowe głosowe Google są zintegrowane z praktycznie wszystkimi produktami firmy. Obejmuje to wyszukiwanie, przeglądarkę Google Chrome, system operacyjny Android, Dokumenty Google. Jest to bardzo wygodne - nauczysz się używać głosu w jednej technologii, możesz z powodzeniem zastosować je w innym.

"Android"

Wprowadzanie głosowe w tym systemie operacyjnym jest dostępne "od razu po rozpakowaniu" w wielu wersjach. Możesz go aktywować, używając ustawień Język i klawiatura lub Język i Wprowadzanie. Potem praktycznie we wszystkich miejscach, w których jest wprowadzanie tekstu, to zestaw SMS-ów lub SMS-ówpojawi się ikona mikrofonu. Kliknięcie go uruchomi proces nagrywania, po czym system zajmie trochę czasu, aby rozpoznać i zwrócić wynik.


Warto zauważyć, że ta funkcja jest również dostępna w trybie offline w niektórych najnowszych wersjach Androida. To prawda, do tego będziesz musiał pobrać małe archiwum dla wybranego języka. Kolejna ważna kwestia - jeśli użytkownik nie odpowiada standardowemu głosowi, zawsze można ustawić osobę postronną.

Google Chrome i Google Docs

Wprowadzanie głosowe na komputerze jest dostępne przez przeglądarkę Google Chrome. Podobnie jak w systemie operacyjnym Android, podczas odwiedzania strony Google na pasku wyszukiwania widoczna jest ikona mikrofonu. Pozwala nagrywać dźwięk i wyszukiwać żądany obiekt w sieci bez wchodzenia z klawiatury.
Bardziej rozbudowana wersja jest używana w usłudze online dokumentów Dokumentów Google. Oprócz pisania, funkcje poruszania się po nim, formatowania, edycji tabeli. Ogólnie rzecz biorąc, wszystko, co możesz zrobić za pomocą klasycznych środków wejściowych - klawiatury lub myszy.

Yandex

Yandex nie ma tak dużego zestawu platform, które mogłyby wykorzystywać wprowadzanie głosowe. Tak więc, chociaż jest prezentowany w produktach "Szukaj", "Rozmowa" i "Tłumacz". Ponadto nawigatorzy z Yandex są w stanie rozpoznać język i rozmawiać z użytkownikiem.
"Szukaj" można znaleźć w "Yandex Browser". Jest on domyślnie wbudowany i działa jak Chrome. Oparta jest również na własnej technologii rozwoju firmyDostępne również w celach komercyjnych w postaci Speech.Kit. Łącząc go z projektem, możesz użyć nieograniczonej liczby żądań uznania. Ta usługa jest jednak płatna.

Inne produkty

Poza pisaniem głosowym od internetowych gigantów, istnieją inni bezpłatni programiści, którzy aktywnie opracowują i promują przedstawioną technologię. Niektóre są realizowane w formie usług online (np. Speechpad.ru, august4u.ru, bestfree.ru), ale niektóre z nich stanowią pełnoprawny program z możliwością instalacji na komputerze (speechka, realspeaker). Mimo że zasoby wolnych programistów są nieco mniejsze, ich rozwiązania działają nie gorzej. A czasami korzystają z Google API w ogóle.

Zalety i wady

Wprowadzanie głosowe na komputerze ma swoje znaczące zalety i wady:
  • Jest to zdecydowanie wygodne. Ręce mogą być wolne podczas pracy, a prędkość wzrasta, a wydajność wzrasta.
  • W mobilnych wersjach narzędzi głosowych możesz pracować z urządzeniem bez przerywania, na przykład, jazdy.
  • Ponadto programy wprowadzania głosowego pozwalają odmówić użycia niezręcznego miniaturowego systemu operacyjnego, co niewątpliwie wpływa na jakość i szybkość wprowadzania danych.
  • Wśród wad można zauważyć zwiększone wymagania dotyczące jakości mikrofonu. Powinien być najbardziej wrażliwy. Nawet algorytm rozpoznawania nie zawsze działa tak, jak byłoby to pożądane. Hałas i zakłócenia zewnętrzne mogą powodować awarie, aw rezultacie błędy wtekst W każdym razie będzie trzeba go edytować po wpisaniu. Tak więc dyktować tekst musi być ostrożny i jasny. A to zwiększa czas pisania.

    Podsumowując

    Technologia wprowadzania głosu jest stale ulepszana. Coraz więcej osób może spotkać ludzi, którzy rozmawiają ze swoim smartfonem, godzinami lub komputerem. Wprowadzanie głosu jest aktywnie wykorzystywane w projektowaniu i produkcji inteligentnych domów i innych powiązanych rozwiązań opartych na interakcji urządzeń z użytkownikami. Być może w przyszłości technologia przyjdzie do bardziej wyrafinowanego wyglądu, gdy zacznie rozpoznawać język o wysokim stopniu dokładności, niezależnie od hałasu i zakłóceń.

    Powiązane publikacje