Google Speech API жана Python аркылуу сүйлөөнү таануу: 4 кадам

Мазмуну:

1-кадам: ReSpeaker USB 4-Mic Array
2 -кадам: Керектүү китепканаларды орнотуңуз
3-кадам: Python менен Pyttsx3 китепканасында текстти сүйлөө
4 -кадам: Бардыгын бириктирүү: Google Speech Recognition API жана Pyttsx3 китепканасын колдонуу менен Python менен сүйлөө таанууну куруу

2025 Автор: John Day | [email protected]. Акыркы өзгөртүү: 2025-01-23 14:51

Google Speech API жана Python аркылуу сүйлөөнү таануу

Кеп таануу

Сүйлөөнү таануу Жасалма интеллектин субфилдики болгон Табигый Тилди Иштетүүнүн бир бөлүгү. Жөнөкөй сөз менен айтканда, сүйлөөнү таануу - бул компьютердик программалардын сүйлөө тилиндеги сөздөрдү жана фразаларды аныктоо жана аларды адам окуй турган текстке айландыруу жөндөмү. Ал үн жардамчы системалары, үйдү автоматташтыруу, үнгө негизделген чатботтор, үн менен иштөөчү робот, жасалма интеллект ж.

Кепти таануу үчүн ар кандай API (Application Programming Interface) бар. Алар акысыз же акы төлөнүүчү кызматтарды сунушташат. Булар:

CMU Sphinx
Google Кеп Таануу
Google Cloud Speech API
Wit.ai
Microsoft Bing үн таануу
Houndify API
IBM текстке сүйлөө
Snowboy Hotword Detection

Биз бул жерде Google Speech Recognition колдонобуз, анткени ал эч кандай API ачкычын талап кылбайт. Бул окуу куралы, Seeed Studioдогу ReSpeaker USB 4-Mic Array сыяктуу тышкы микрофондун жардамы менен Pythonдогу Google Speech Recognition китепканасын кантип колдонуу керектигин көрсөтүүнү көздөйт. Сырткы микрофонду колдонуу милдеттүү болбосо да, ноутбуктун микрофонун да колдонсо болот.

1-кадам: ReSpeaker USB 4-Mic Array

ReSpeaker USB Mic-бул Seeed Studio тарабынан иштелип чыккан AI жана үн тиркемелери үчүн иштелип чыккан төрт микрофон түзмөгү. Ал 4 жогорку өндүрүмдүүлүккө ээ, бөлмөнүн каалаган жеринен үнүңүздү алуу үчүн иштелип чыккан көп багыттуу микрофондорго жана 12 программалоочу RGB LED индикаторуна ээ. ReSpeaker USB микрофону Linux, macOS жана Windows операциялык тутумдарын колдойт. Чоо -жайын бул жерден тапса болот.

ReSpeaker USB Mic төмөнкү элементтерди камтыган жакшы пакетте келет:

Колдонуучу көрсөтмөсү
ReSpeaker USB Mic Array
Микро USBден USB кабелине

Ошентип, биз баштоого даярбыз.

2 -кадам: Керектүү китепканаларды орнотуңуз

Бул окуу куралы үчүн мен Python 3.x колдонуп жатам деп ойлойм.

Китепканаларды орнотолу:

pip3 SpeechRecognition орнотуу

MacOS үчүн, адегенде PortAudio программасын Homebrew менен, анан PyAudioду pip3 менен орнотушуңуз керек болот:

portaudio орнотуу

Биз pyaudio орнотуу үчүн төмөнкү буйрукту иштетебиз

pip3 pyaudio орнотуу

Linux үчүн, PyAudio'ду apt менен орното аласыз:

sudo apt-get python-pyaudio python3-pyaudio орнотуңуз

Windows үчүн PyAudio пип менен орното аласыз:

пяудиону орнотуу

Жаңы python файлын түзүңүз

nano get_index.py

Get_index.pyге коддун үзүндүсүн чаптаңыз:

pyaudio импорттоо

p = pyaudio. PyAudio () маалымат = p.get_host_api_info_by_index (0) numdevices = info.get ('deviceCount') i үчүн диапазондо (0, numdevices): if (p.get_device_info_by_host_api_device_index (0, i).get (n, i) '))> 0: басып чыгаруу ("Input Device id", i, " -", p.get_device_info_by_host_api_device_index (0, i).get (' name '))

Төмөнкү буйрукту аткарыңыз:

python3 get_index.py

Менин учурда, команда экранга төмөнкү чыгарууну берет:

Киргизүү түзмөгүнүн id 1 - ReSpeaker 4 Mic Array (UAC1.0)

Киргизүү түзмөгүнүн id 2 - MacBook Air микрофону

Device_indexти индекстин номерине төмөнкү коддун үзүндүсүндө тандооңуз боюнча өзгөртүңүз.

speech_recognition sr катары импорттоо

r = sr. Recognizer () сүйлөө = sr. Микрофон (device_index = 1) булак катары сүйлөө менен: басып чыгаруу ("бир нерсе айт! …") аудио = r.adjust_for_ambient_noise (булак) аудио = r. угуу (булак) аракет: recog = r.recognize_google (аудио, тил = 'en-US') басып чыгаруу ("Сиз мындай дедиңиз:" + recog "sr. UnknownValueErrorдон башка: print (" Google Speech Recognition аудиону түшүнө алган жок ") sr. RequestError башка e: print ("Google Кеп Таануу кызматынан жыйынтык сурай алган жок; {0}". Формат (e))

Түзмөк индекси 1 тандалып алынган, анткени ReSpeaker 4 Mic Array негизги булак болуп калат.

3-кадам: Python менен Pyttsx3 китепканасында текстти сүйлөө

Pythonдо текстти сүйлөөгө айландыруу үчүн бир нече API бар. Мындай APIлердин бири pyttsx3, бул менин пикиримде тексттен сүйлөөгө эң жакшы жеткиликтүү пакет. Бул пакет Windows, Mac жана Linuxто иштейт. Муну кантип жасоо үчүн расмий документтерди текшериңиз.

Пакетти орнотуу үчүн пипти колдонуңуз.

pip pyttsx3 орнотуу

Эгерде сиз Windowsто болсоңуз, анда сизге кошумча Windows пакети керек болот, pypiwin32 ал жергиликтүү Windows сүйлөө APIсине кирүү үчүн керек болот.

пип орнотуу pypiwin32

Текстти python скриптине айландырыңыз Төмөндө pyttsx3 аркылуу текстти сүйлөөгө коддун үзүндүсү келтирилген:

pyttsx3 импорттоо

кыймылдаткыч = pyttsx3.init ()

engine.setProperty ('чен', 150) # Ылдамдык пайызы

engine.setProperty ('көлөмү', 0.9) # Көлөмү 0-1

engine.say ("Салам, дүйнө!")

engine.runAndWait ()

4 -кадам: Бардыгын бириктирүү: Google Speech Recognition API жана Pyttsx3 китепканасын колдонуу менен Python менен сүйлөө таанууну куруу

Төмөнкү код Google Speech Recognition аркылуу адамдын сүйлөгөн сөзүн таанууга жана pyttsx3 китепканасынын жардамы менен текстти сүйлөөгө айландырууга жооптуу.

speech_recognition sr катары импорттоо

импорт pyttsx3 кыймылдаткычы = pyttsx3.init () engine.setProperty ('чен', 200) engine.setProperty ('көлөмү', 0.9) r = sr. Recognizer () сүйлөө = sr. Микрофон (device_index = 1) булак катары сүйлөө менен: audio = r.adjust_for_ambient_noise (булак) audio = r.listen (булак) аракет кылыңыз: recog = r.recognize_google (audio, language = 'en-US') print ("Сиз айттыңыз:" + recog) engine.say (" Сиз мындай дедиңиз: " + recog" engine.runAndWait () sr. UnknownValueErrorдон башка: engine.say ("Google Speech Recognition аудиону түшүнө алган жок") engine.runAndWait () sr. RequestErrorден башка e: engine.say ("Болгон жок Google Speech Tanı таануу кызматынан жыйынтык сураңыз; {0} ". format (e)) engine.runAndWait ()

Бул терминалда чыгарууну басып чыгарат. Ошондой эле, ал ошондой эле сүйлөөгө айландырылат.

Сиз айттыңыз: Лондон Улуу Британиянын борбору

Кеп таануу жалпысынан кандайча иштээрин жакшыраак түшүнөсүз деп үмүттөнөм жана эң негизгиси, Python менен Google Speech Recognition API аркылуу муну кантип ишке ашыруу керек.

Эгерде сизде кандайдыр бир суроолор же пикирлер болсо? Төмөндө комментарий калтырыңыз. Бар болуңуз!

Сунушталууда:

Смартфон аркылуу видео агымы жана көзөмөл 4WD робот машинасы (Bluetooth аркылуу): 5 кадам

Смартфон аркылуу видео агымы жана көзөмөлү 4WD Robot Car (Bluetooth аркылуу): Саламатсызбы! Мен Arduino үчүн уникалдуу TFT калканына арналган макалалардын сериясын улантам. Бул макала " көрүү " ээ болгон 4WD роботун өнүктүрүүгө арналат. сүрөттөрдү өткөрө турган жалпы жана арзан ОВ7670 камерасын колдонуп

Жылдызды таануу Computer Vision аркылуу (OpenCV): 11 кадам (Сүрөттөр менен)

Жылдызды таануу Computer Vision (OpenCV) аркылуу: Бул көрсөтмө сизге сүрөттөгү жылдыздардын үлгүлөрүн автоматтык түрдө аныктоо үчүн компьютердин көрүү программасын кантип түзүүнү сүрөттөйт. Бул метод OpenCV (Open Source Computer Vision) китепканасын колдонот, үйрөтүлгөн HAAR каскаддарынын топтомун түзөт

Жүздү таануу жана идентификация - OpenCV Python жана Arduino аркылуу Arduino Face ID: 6 кадам

Жүздү таануу жана идентификация | OpenCV Python жана Arduino аркылуу Arduino Face ID: жүздү таануу AKA жүзүнүн идентификатору - азыркы учурда уюлдук телефондордогу эң маанилүү өзгөчөлүктөрдүн бири. Ошентип, менде " менин Arduino проектим үчүн жүз ID барбы " жана жооп ооба … Менин саякатым мындайча башталды: 1 -кадам: Бизге жетүү

HTTP аркылуу XinaBox жана Ubidots аркылуу аба ырайын кантип курса болот: 7 кадам

XinaBox жана Ubidots аркылуу HTTP аркылуу аба бекетин кантип куруу керек: XinaBox xChips (IP01, CW01 жана SW01) аркылуу Ubidotsто өз аба ырайы станцияңызды жасоону үйрөнүңүз ESP8266 Негизги жана Wi-Fi модулу (xChip CW01) колдонуучуларга жөнөтүүгө мүмкүндүк берет. XinaBoxтун модулдук xChips булутунан алынган маалыматтар. Бул маалыматтарды алыстан көзөмөлдөсө болот

Жүздү таануу+таануу: 8 кадам (сүрөттөр менен)

Жүздү таануу+таануу: Бул камерадан OpenCV менен жүздү таануунун жана таануунун чуркоосунун жөнөкөй мисалы. ЭСКЕРТҮҮ: Мен бул проектти сенсорлордун сынагы үчүн жасадым жана камераны сенсор катары таануу үчүн колдондум. Ошентип, биздин максатыбыз ушул сессияда 1. Анаконду орнотуу

Google Speech API жана Python аркылуу сүйлөөнү таануу: 4 кадам

Мазмуну:

Кеп таануу

1-кадам: ReSpeaker USB 4-Mic Array

2 -кадам: Керектүү китепканаларды орнотуңуз

3-кадам: Python менен Pyttsx3 китепканасында текстти сүйлөө

4 -кадам: Бардыгын бириктирүү: Google Speech Recognition API жана Pyttsx3 китепканасын колдонуу менен Python менен сүйлөө таанууну куруу

Сунушталууда:

Смартфон аркылуу видео агымы жана көзөмөл 4WD робот машинасы (Bluetooth аркылуу): 5 кадам

Жылдызды таануу Computer Vision аркылуу (OpenCV): 11 кадам (Сүрөттөр менен)

Жүздү таануу жана идентификация - OpenCV Python жана Arduino аркылуу Arduino Face ID: 6 кадам

HTTP аркылуу XinaBox жана Ubidots аркылуу аба ырайын кантип курса болот: 7 кадам

Жүздү таануу+таануу: 8 кадам (сүрөттөр менен)

Arduino негизделген өндүрүштүк автоматташтыруу -- VFD (Variable Frequency Drives): 10 кадам

Топурактын нымдуулук сенсорун колдонуу боюнча толук көрсөтмө W/ Практикалык мисал: 7 кадам

CIRCUITO TEMPORIZADOR ПРОГРАММАЛАНГАН БАСАДО EN ARDUINO: 3 кадам

Түнкү камера: 16 кадам (сүрөттөр менен)

Fuzz Pedal: 18 кадам (Сүрөттөр менен)

Электрдик сигара кутусу гитарасы: 18 кадам (сүрөттөр менен)

Лазердик спирограф: 22 кадам (сүрөттөр менен)

Vibrating Motors: 5 кадам

Кантип: Soldering: 10 кадам (Сүрөттөр менен)

Реконструкцияланган саат: 5 кадам (сүрөттөр менен)

Arduino менен ATtiny программасы: 7 кадам (Сүрөттөр менен)

P10 DMD дисплейи Arduino жана RTC DS3231 менен: 4 кадам (сүрөттөр менен)

Raspberry Pi Zero менен өзүңүздүн чөйрөңүздү жарыктандырыңыз: 5 кадам (сүрөттөр менен)

Жөнөкөй балдар RGB схемасы: 3 кадам

Автоматтык чиркөө коңгуроосу: 6 кадам

$ 35 Зымсыз Фокусун Турнадан 2: 5 кадам