Сөйлеуді тану дегеніміз не?

Дауысыңызды кіріс әдісі ретінде пайдалану

Сөйлеуді тану - бұл жүйеге ауызша кіруге мүмкіндік беретін технология. Сіз компьютеріңізбен, телефонмен немесе құрылғымен сөйлесесіз және ол кейбір әрекетті бастау үшін енгізу деп айтқан сөзіңізді пайдаланады. Технология енгізудің басқа әдістерін ауыстыру үшін пайдаланылады, басқа жолмен басу немесе таңдау сияқты. Құрылғыларды және бағдарламалық жасақтаманы пайдалануды ыңғайлы ету және өнімділікті арттыру құралы болып табылады.

Медициналық салада, робототехникада және басқа да адамдарда әлсіз адамдарға көмек ретінде (сөйлескенде мүгедектігі бар немесе қолдарымен немесе саусақтарымен емес, елестетіп көріңіздер) әскерді қоса алғанда, сөйлеуді танудың көптеген қосымшалары бар. дерлік компьютерлер мен мобильді телефондар сияқты ортақ құрылғылар арасында таралуына байланысты сөйлеуді тану әсерін тигізеді.

Белгілі смартфондар сөйлеуді тануды қызықтырады. IPhone және Android құрылғылары - бұл мысалдар. Олардың көмегімен сіз қоңырауға қоңырау шалып, қоңырау шалуды «Call office» сияқты айтасыз. Басқа командалар, мысалы, «Bluetooth қосыңыз» сияқты көңіл көтеру мүмкін.

Сөйлеуді тану проблемалары

Сөйлеуді тану, мәтінге сөйлеу (STT) деп аталатын нұсқасында, ауызша сөздерді мәтінге аудару үшін ұзақ уақыт пайдаланылды. ViaVoice өз қорабында айтқандай, «сіз сөйлесесіз, ол түрлері». Бірақ біз бұл туралы білетін болсақ, СТТ-мен бір проблема бар. 10 жылдан астам уақыт бұрын мен ViaVoice-ті сынап көрдім және ол менің компьютерімде бір апта бойы жұмыс істемеді. Неліктен? Бұл өте қате болды және мен көп уақыт пен энергияны сөйлесіп, түзетуді аяқтадым. ViaVoice - бұл саладағы ең үздіктердің бірі, сондықтан қалғанын елестетіңіз. Технология жетілдіріліп, жетілдірілді, бірақ мәтінге сөйлеу әлі де адамдарға сұрақ қояды. Оның негізгі қиындықтарының бірі - адамдар арасында сөз сөйлеудегі үлкен өзгерістер.

Барлық тілдер сөйлеуде танылмайды, ал сөйлейтіндер көбінесе ағылшын тілінде емес. Нәтижесінде сөйлеуді тану бағдарламалық жасақтамасын іске асыратын құрылғылардың көпшілігі тек ағылшын тілінде ғана жұмыс істейді.

Аппараттық талаптардың жиынтығы белгілі бір жағдайларда сөйлеуді тануды қиынға салды. Сізге фондық шуды сүзуге жеткілікті ақылды микрофон қажет, бірақ сонымен бірге дауысты табиғи түрде түсіру үшін жеткілікті күшті.

Фондық шу туралы айтқанда, ол бүкіл жүйенің сәтсіздікке әкелуі мүмкін. Нәтижесінде, сөйлеуді тану, көптеген жағдайларда, пайдаланушының бақылауынан тыс шуылға байланысты болмайды.

Сөйлеуді тану, VoIP сияқты жаңа телефондар мен коммуникациялық технологияларға арналған енгізу әдісі ретінде, жаппай мәтінді енгізу үшін өнімділік құралы ретінде қарағанда жақсы болуды дәлелдейді.

Сөйлеуді тану туралы өтініштер

Технология көптеген салаларда танымал болып келеді және төмендегідей табысты болды:

- Құрылғыны басқару. Android телефонына «OK Google» деп айту жай ғана сіздің дауыстық командаларыңыздың бәріне құлақ салатын жүйені өртеп жібереді.

- Car Bluetooth жүйесі. Көптеген автомобильдер өзінің радиотехникасын Bluetooth арқылы смартфонға қосатын жүйемен жабдықталған. Сосын смартфонға қол тигізбестен қоңырау шалуға және қабылдауға болады, тіпті жай ғана оларды айту арқылы нөмірлерді тере аласыз.

- Дауыс транскрипциясы. Адамдар көп нәрсені теру керек жерлерде, кейбір зияткерлік бағдарламалық қамтамасыз ету олардың ауызша сөздерін жазады және оларды мәтінге аударады. Бұл белгілі бір сөзді өңдеу бағдарламалық жасақтамасында. Дауыс транскрипциясы көрнекі дауыстық поштамен жұмыс істейді.