Microsoft
Microsoft: Mowa jest przyszłością komputerów
Microsoft uważa, że naturalnym krokiem ewolucji, po klawiaturze i ekranie dotykowym, jest mowa. Właśnie za jej pomocą będziemy komunikować się z komputerami.
|
Zig Serafin, główny menadżer Microsoftu ds. Unified Communications Group, uważa, że następnym krokiem ewolucji sposobu komunikowania się człowieka z komputerem, po klawiaturze/myszce i ekranie dotykowym, jest mowa. Ma to sens, szczególnie dla nałogowych oglądaczy serialu Star Trek, którzy doskonale wiedzą, że znacznie prościej jest powiedzieć komputerowi co ma robić, niż wpisać komendę. Gigant z Redmond planuje oprzeć wszystkie swoje produkty na technologii rozpoznawania mowy - aktualnie taka funkcja jest implementowana w systemie Windows 7, Windows Mobile 6.5, a nawet wyszukiwarce Bing Mobile. Microsoft pracuje nad technologią rozpoznawania mowy już od 10 lat, choć nie bez przerwy. Prace ruszyły na dobre, odkąd w 2007 roku przejęto firmę Tellme Networks. Interfejs użytkownika tej firmy jest aktywowany głosem, a zintegrowany w oprogramowaniu Microsoftu, pozwoli internautom na przeglądanie witryn internetowych w przeglądarce, przy pomocy komend głosowych. Oprogramowanie pozwala nawet na dyktowanie wiadomości tekstowych, zamiast wpisywania ich z klawiatury. |


KUP NAJTANIEJ
1) otoczenie. Jak odróżnić głos zalogowanego usera od głosów innych osób w okolicy, ew z radia albo telewizora? Żwłaszcza od głosów rodziny takowego, nawet nam po milionach lat ewolucji rozpoznanie przez telefon czy rozmawiamy np z mamą czy córką ew jej siostrą sprawia problemy (a co dopiero komputerowi). No chyba że będzie z ruchu ust czytał, ew jakiś mikrofon krtaniowy dołożą
2) jak zaimplementować do algorytmów język naturalny? jak będzie ograniczona ilość poleceń to klawiatura i myszka /ekran dotykowy będą szybsze a więc i lepsze. Z emocjami w głosie też będą problemy.
Ogólnie ze względu na punkt 1 łatwiej i szybciej będzie założyć sobie na głowę czepek czytający w myślach (ew podpiąć się do układu nerwowego jak w net-force, jak powszechnie wiadomo nerwy krzyżują się na karku i tam można by dać stosowne gniazdko)
- sterować okienkami jest szybciej myszą albo dotykiem (multidotyk),
- sterować zwykłą aplikacją również nie da się ergonomicznie głosem,
- pisanie programów i skomplikowanych tekstów (dużo znaków specjalnych, formatowania, etc...) nie da szybko głosem - znacznie prościej nauczyć się pisać 10 palcami,
- uzupełnianie formularza, kopiowanie formularzy (typowa praca biurowa) - j.w. szybciej mysza + klawiatura
Jedyna rozsądna funkcja, w której można użyć rozpoznawanie głosu to pisanie tekstu: e-mail, GG/Skype, praca dyplomowa, etc... Tylko kto w pracy będzie dyktował do mikrofonu tekst e-maili (prywatnych), GG/Skype (prywatnych)??? Klawiatura i monitor zapewniają dużą prywatność tego co się robi, interfejs głosowy wręcz przeciwnie więc według mnie będzie mało popularny.
jak na przyklad wez wszystkie pliki jpg z folderu zmien na gif o max rozmiarach 800x600 bez deformacji