DIY умная колонка для управления голосом устройствами умного дома Home Assistant на ESP32 и ESPHome

  Рет қаралды 14,664

У Павла!

У Павла!

Ай бұрын

ESP32S3 Zero: alii.pub/6xwe6f?erid=2SDnjbtG1n9
Микрофон INMP441: alii.pub/6xwe6t?erid=2SDnjc4dvkZ
Усилитель D класса MAX98357: alii.pub/6xwe7e?erid=2SDnjcdFex9
Bluetooth колонка из видео: alii.pub/6xwe9j?erid=2SDnjd2yTTf
Колонка еще лучше: alii.pub/6xwe8k?erid=2SDnjcxXVcd
Насчет колонок можно поступить интересно. Их можно купить дешевле в разделе "все по одной цене" Для этого добавляем в избранное колонку и в разделе "все по одной цене" ищем.
В этом видео я показал как сделать умную колонку для управления голосом устройствами умного дома Home Assitant. Колонка создана на ESP32 S3.
Протестирована работа на компьютере с процессором Intel celeron N100. Работает очень быстро и хорошо. Материнскую плату с этим процессором можно купить тут: alii.pub/6xkmnn?erid=2SDnjdx6t1X
Статья с схемой подключения всех элементов для умной колонки на базе esp32 S3 тут и код для ESPHome можно найти тут: psenyukov.ru/%d0%b2%d1%8b%d0%b...
Так-же есть возможность создания умной колонки на микроконтроллере ESP32. Об этом я делал статью тут: psenyukov.ru/%d1%83%d0%bc%d0%b...
Как настроить Home Assistant Для управления голосом, я делал видео тут: • Управление голосом сер...
И статья про это тут: psenyukov.ru/%d1%83%d0%bf%d1%8...
Меня можно поддержать на Boosty: boosty.to/upavla
Подписаться на телеграмм канал можно по ссылке: t.me/+K05yDjyd4tJmYjky
или
t.me/ypavla
Мой 3d принтер: alii.pub/6bu5tp
Крутой тепловизор Infiray p2 pro: alii.pub/6qyhgs
Теги: #Упавла! #homeassistant #умныйдом #voiceassistant
================================================
Помощь каналу: www.donationalerts.ru/r/ypavla
Реклама: ООО "АЛИБАБА.КОМ (РУ)" ИНН: 7703380158

Пікірлер: 154
@upavla
@upavla Ай бұрын
Подписывайтесь на мой телеграмм канал: t.me/ypavla
@RezKuz
@RezKuz Ай бұрын
Очень жду видео про ускорение распознавания речи. Тема очень интересная. Спасибо за действительно познавательные и интересные видео!
@user-yo1hz6et8f
@user-yo1hz6et8f Ай бұрын
Плюсую, локальное распознавание речи - тема. Не нужны гугли, яндексы, огрызки, никакого слежения и рекламы.
@AndrewKobelev
@AndrewKobelev 25 күн бұрын
есп32 ничего не распознаёт, кроме "хайЛексин" силёнок маловато. А вот малинка и ли другие одноплатники справляются +- сносно. Только памяти не менее 2Гиг желательно. Распознавание речи реализовать на компе за пару вечеров -- можно, проверено лично.
@skylol4eg
@skylol4eg 16 күн бұрын
@@AndrewKobelev А можно пару ссылок на форумы, где подобное реализовывали? Чета захотел попробовать)
@AndrewKobelev
@AndrewKobelev Күн бұрын
@@skylol4eg Проект Ирина
@viktorg2765
@viktorg2765 Ай бұрын
Супер! Про локальные базы для ускорения распознавания речи было бы интересно посмотреть
@AndrewKobelev
@AndrewKobelev 21 күн бұрын
на ютубе про это масса роликов.
@inhab88
@inhab88 Ай бұрын
Спасибо за видосы. Развивай тему. Очень интересно! Удачи.
@maksimlenin3159
@maksimlenin3159 27 күн бұрын
Супер!!!! Огромное спасибо за ваши труды!
@sledleo
@sledleo 29 күн бұрын
Респект, классная тема! Ждем продолжения по этим занимательным устройствам!
@user-bq7cc3lo6s
@user-bq7cc3lo6s Ай бұрын
Павел, тебе респект. Я в этом деле начинающий, а лопатить литературу нет времени. Из твоих уроков получилось сделать сервер, прошить и встроить zigbee, не первого раза конечно. Я думаю многим будет интересен этот проект на основе тв приставки. Я думаю тема с колонкой очень актуальна и развивать её надо.
@user-qr4qh4lf4v
@user-qr4qh4lf4v Ай бұрын
Да,интересно, продолжай
@Amicsification
@Amicsification Ай бұрын
Блин, очень интересно, спасибо. У меня есть заготовки под несколько ламп гайвера. Похоже надо будет такую лампу переводить на esphome ) жаль я не умею)
@dNix
@dNix Ай бұрын
Лампу гайвера лучше переводить на WLED. Там сразу всё под это заточено и с Home Assiastant WLED интегрируется в пару кликов, он сам их обнаруживает в сети. Только лучше использовать ESP32, на ESP8266 стабильность плохая.
@ELFMEDIA
@ELFMEDIA 27 күн бұрын
У esphome мало готовых эффектов, или их придётся писать самому на labda, wled лучше
@alexmega
@alexmega Ай бұрын
Микрофон подключается не по протоколу i2c, а по i2s, это кардинально разные протоколы.
@user-fg6xg7bc4u
@user-fg6xg7bc4u Ай бұрын
Отличная тема! Попробовал, все запустилось без проблем. У меня сервер умного дома крутится на виртуалке Synology DS920+ и время распознавания составляет 5-7 секунд, поэтому тема по сокращению времени распознавания очень необходима!
@NikeRossXP
@NikeRossXP 28 күн бұрын
1. потому что не нужно из сетевого накопителя делать сервер 2. потому что это переоцененное говно
@user-fg6xg7bc4u
@user-fg6xg7bc4u 28 күн бұрын
@@NikeRossXP Этот сетевой, как вы говорите, накопитель который вы судя по комментарию видели только на картинке, фору даст любому arm одноплатнику (которые в основном используют для этих целей) при этом выполняя еще кучу разных задач, так что запихайте ваше диванное мнение... ну вы сами знаете куда ;))
@user-fg6xg7bc4u
@user-fg6xg7bc4u 28 күн бұрын
А Павел красавчик! И только благодаря его четким и развернутым видео я вдохновился идеей умного дома и несколько не пожалел. Практически на любой вопрос по HASS да и в принципе по умной автоматике в его материалах можно найти ответ.
@NikeRossXP
@NikeRossXP 28 күн бұрын
@@user-fg6xg7bc4u еще бы сейчас переплачивать за целерон с веб-интерфейсом для даунов то что в него пихаются всякие пакеты, конечно позволяет говорить "кучу разных задач", но вот что он всё это делает неполноценно любители поесть говна умалчивают. Можешь попробовать сделать нетривиальную задачу: поднять на нём openvpn-сервер одновременно на tcp и udp протоколах, без необходимости генерировать сертификаты для каждого пользака. Это базовая конфигурация, если что. "для этих целей" сейчас становятся всё более популярны всякие intel-n100 минипк, производительность можешь сравнить сам.
@lexx725
@lexx725 19 күн бұрын
У меня при компиляции куча варнингов. Даже не знаю, что делать
@asustek78
@asustek78 17 күн бұрын
спасибо
@Ivashco92
@Ivashco92 Ай бұрын
Павел! Конечно интересно, как запустить на приставке
@maksys4101
@maksys4101 29 күн бұрын
Спасибо за видео. Очень хочется узнать об локальной базе распознавания голоса. Буду благодарен за это видео. 👍👍👍
@indevor8337
@indevor8337 14 күн бұрын
Для желающих повторить. Вместо Wisper используйте VOSK, скорость распознавания 0.3 секунды, вместо 7-8, распознавание окончания разговора, дефолт либо умеренный. Иначе не успеете сказать то что хотели) По сравнению с шопотом, воск на несколько порядков быстрее и точнее. гуглится: vosk home assistant
@EvgenMo1111
@EvgenMo1111 16 сағат бұрын
а tts какой можешь посоветовать,? а то все какое то унылое, можно с робоголосом
@indevor8337
@indevor8337 16 сағат бұрын
@@EvgenMo1111 поставил Silero-TTS-Service (в гугле гитхаб проект) - ставится через докер (плагином командная строка) , шикарный голос. Основан на silero-models на хабре есть статья и примеры голосов.
@user-df1yx7gv7c
@user-df1yx7gv7c Ай бұрын
Отлично, а как прошить плату Esp
@asyvolkova1047
@asyvolkova1047 29 күн бұрын
Даёшь голос!
@IvanIvanov-ny4nz
@IvanIvanov-ny4nz Ай бұрын
Отличное видео, спасибо! Сколько таких колоном можно расставить по квартире?
@ELFMEDIA
@ELFMEDIA 27 күн бұрын
Сколько хотите
@pmpkng19
@pmpkng19 Ай бұрын
На умной панели такой же контроллер, и подключить вроде можно микрофон На ней нельзя будет сделать голосовое распознавание?)
@iqubik
@iqubik Ай бұрын
Я бы про тв бокс поинтересовался
@user-wm4gp6vz1l
@user-wm4gp6vz1l 25 күн бұрын
А как можно распознавание сделать в оффлайн режиме?
@satiAgasava
@satiAgasava Ай бұрын
Идея шикарная. Используя 3д принтер смогу сделать что угодно! Подскажите пожалуйста, можно ли несколько таких колонок соединить в один мозг как с яндекс алисой?
@upavla
@upavla Ай бұрын
Не знаю таких способов
@satiAgasava
@satiAgasava Ай бұрын
@@upavla Благодарю за ответ!
@Dialbist
@Dialbist Ай бұрын
Полезное видео! Я вот только не могу понять, если дешифратор по i2s (кстати не путать с i2c) и после него усилитель, если колонка больше 3w, можно ли так
@AndrewKobelev
@AndrewKobelev Ай бұрын
Конечно можно. У "дешифратора" ровно такие же контакты на входе, а выходы -- линейные, до 12 каналов можно сделать, а не моно 3 ватта. PCM5102 называется.
@user-or3gd1ls4v
@user-or3gd1ls4v Ай бұрын
Павел! Можешь прокометировать тему про китайские реле для управления шторами, в УДЯ напрямую они не залетают, через связку аккаунтов добавляются, но нет функции СТОП, только вверх или вниз до упора... Что с этим можно сделать...
@upavla
@upavla Ай бұрын
Можете куда-то в телеграмм ссылку на реле скинуть. Я не очень понимаю о чем речь
@user-or3gd1ls4v
@user-or3gd1ls4v Ай бұрын
​​@@upavla отправил в чат в телегу
@teenjak
@teenjak Ай бұрын
Непосредственно сейчас хочу занять сбором такой колонки-ассистента. Поэтому любое раскрытие темы интересно. И локальный запуск модели в том числе. А ещё в документации ESPHome сказано, что ассистент очень прожорливый в плане ресурсов поэтому не рекомендуется использовать его с некоторыми другими компонентами. Мне же хочется чтобы колонка параллельно работала в режиме media player. Это реально вообще?
@AndrewKobelev
@AndrewKobelev 24 күн бұрын
Начните с ассистента, а не с колонки
@Sergey_Evdokimenko
@Sergey_Evdokimenko Ай бұрын
модуль на DUAL Core или можно не DUAL?
@Dialbist
@Dialbist Ай бұрын
И ещё хотелось бы точнее понять, а чем разница использования разных плат esp32 и что точно не подойдёт?
@AndrewKobelev
@AndrewKobelev Ай бұрын
ESP32 S3 подойдёт идеально, а ESP32 S1, 2 или ESP32 C3 тоже подойдёт, просто будет больше нагрузка на сервер.
@DmitryByankin
@DmitryByankin Ай бұрын
Подскажите на S3 версии у вас нет следующей проблемы: В esphome сделал media player а не speaker чтобы можно было музыку играть, но при включенном распознавании горячей фразы звук музыки очень сильно заикается - не хватает мощности обычной esp32. В моменте ответа голосового ассистента это не видно т.к. он ставит на паузу распознавание пока фраза не закончится. Вот думаю имеет ли смысл брать S3 варисию или она тоже не справится.
@kaimichaelson6349
@kaimichaelson6349 Ай бұрын
Вот кстати тоже интересует, потому что в моем юзеркейсе колонка обязательно должна играть спотифай
@upavla
@upavla Ай бұрын
Я даже не знал, что есть возможность сделать просто колонку для спотифай в esphome
@DmitryByankin
@DmitryByankin Ай бұрын
@@upavla насчёт поддержки спотифай не могу сказать, но для esphome voice assistant есть 2 взаимо исключающих варианта в конфигурации: speaker и media player. Второй будет отображаться как источник вывода аудио в HA и на него например можно выводить голосовые уведомления или музыку.
@vyshnyvetskyy
@vyshnyvetskyy 29 күн бұрын
А у меня вопрос) А нельзя ли скрестить блютуз колонку и еспешку таким образом, чтобы работоспособность осталась и у одного, и у другого? По сути, вывод усилителя можно запаять на плату колонки (к выводам на динамик) или ещё проще, найти у платы колонки "вход" на усилитель и припаяться туда (тогда сторонний усилитель нам вовсе и не нужен)?
@AndrewKobelev
@AndrewKobelev 29 күн бұрын
скорее всего можно . надо раздобыть схему вашей блютус колонки.
@user-ly6vq6hg2s
@user-ly6vq6hg2s 11 күн бұрын
А есть способ добавить интонацию голосу? Очень хотелось сделать себе такую калонку и не одну но очень беспокоит ужасное произношение фраз.
@iqubik
@iqubik Ай бұрын
Павел, а вы вначале говорите что esp32 не умеет wake word, только s3. А в конце показываете пример на esp32
@AndrewKobelev
@AndrewKobelev Ай бұрын
ESP32 S3 умеет, а ESP32 S1 или ESP32 C3 не умеет делать wake word ВНУТРИ Себя, а делегирует это задание серверу
@vyshnyvetskyy
@vyshnyvetskyy 29 күн бұрын
там распознавание идёт уже на сервере Хоум Асситант (он постоянно слушает эфир)
@sionmr2
@sionmr2 Ай бұрын
Павел, а есть вариант интеграции алисы в хом ассистант, без использования яндекс колонки? Скажем, сценарий, когда есть выделенная машина, на которой крутится сервер ha, и просто туда через микрофонный вход и выход, скажем, на внешнюю колонку.
@AndrewKobelev
@AndrewKobelev 28 күн бұрын
Есть.
@ELFMEDIA
@ELFMEDIA 27 күн бұрын
@@AndrewKobelev И как вы Алису без Яндекс колонки в HomeAssistant запихнёте? Там с родной-то их колонкой всё через одно место работает
@AndrewKobelev
@AndrewKobelev 21 күн бұрын
@@ELFMEDIA никак не запихну. Товарищ спрашивал про "сценарий, когда есть выделенная машина, на которой крутится сервер ha, и просто туда через микрофонный вход и выход, скажем, на внешнюю колонку" -- это ведь проще, чем городуха на "блюпуп колонке, I2S микрофоне и ESP32 S3"
@VitaliySunny
@VitaliySunny Ай бұрын
Спасибо за обзор, интересный проект. Сравнение производительности было бы интересно посмотреть. Коммерческие колонки как раз характеризуются быстрым откликом на множество команд. Приблизиться к этому - это значит получить open-source решение не завязанное на каком-либо вендоре.
@AndrewKobelev
@AndrewKobelev 21 күн бұрын
Коммерческие колонки характеризуются быстрым откликом на множество команд. Потому, что они используют ресурсы вендора, например, Алиса использует ресурсы Яндекса , а это гигантское количество серверов. У которых есть хозяин, обслуживающий их. Опенсорсные "решения", такой роскошью не располагают. Можно только рассчитывать на домашний сервер.
@VitaliySunny
@VitaliySunny 21 күн бұрын
@@AndrewKobelev Речь про задержки сети, естественно в локалке self-hosted решения будут гораздо быстрее чем облачные решения, даже не смотря на "супер-пупер" сервера облака.
@AndrewKobelev
@AndrewKobelev 20 күн бұрын
@@VitaliySunny сравнил время отклика четырёх серверов, привожу максимальные (самые плохие) значения -- локального 3мс , РФ 18мс, DE 57mc, US 178mc. Разница, конечно есть, но уловить даже 0.1 с, затруднительно. Когда сеть нашей организации объединили через космическую связь (до этого была модемная), то пинг достигал до 1,5 сек, и да, такая задержка чувствовалась, но это было 20 лет назад. Тем не менее локальный сервер обладает решающим преимуществом в плане той же безопасности, мы же не хотим, чтобы наш умный дом накрылся медным тазом, как иранская ядерная центрифуга в 2010 г.
@nikitasevryuk3995
@nikitasevryuk3995 13 күн бұрын
А возможно выводить на такое устройство заданное сообщение? Например, предположим встал на весы и устройство объявляет: ваш вес Хх килограмм.
@upavla
@upavla 13 күн бұрын
Да, можно
@nikitasevryuk3995
@nikitasevryuk3995 13 күн бұрын
@@upavla если будет возможность, просьба тоже показать на видео или в статье как это работает на самодельной колонке esp для упревлени голосом
@Kirilloff73
@Kirilloff73 Ай бұрын
Читая коментарии, возникла мысль о том, что было бы здорово, если бы можно было как-нибудь перепрошить яндексовские колонки, которые поподписе. Их на просторох Авито можно найти за шапку сухарей. При этом в них отличные микрофоны и динамики.
@AndrewKobelev
@AndrewKobelev Ай бұрын
Во первых, "прошить" -- реально, там Линукс (или РТОС) стоит и процессор 4х ядерный и памяти достаточно (раз в 20 больше, чем в ЕСП), из конфетки сделать гавно легко. Только зачем? У меня 2 такие колонки работают без подписки. Весь цимес этого проекта в том и заключается, что автор умудрился запилить распознавалку на этом "ПочтиАрдуино". Я тоже запустил торгового бота на ЕСП32 для биржи бинанс. И этим гордился. А народ спрашивал " а сколько % в день даёт сей агрегат", "а на компе это реально запустить?", вместо того, чтобы восхищаться "как тебе удалось впихнуть торговый терминал и робота-трейдера в эту дешевую микросхему".
@Kirilloff73
@Kirilloff73 29 күн бұрын
Моя идея,заключается в том, чтобы хоть как-то реанимировать и использовать яндекс колонку (по подписке ), которую я в своё время лоханувшись купил на Авито. И сейчас она валяется без дела, т.к. без подписки это кирпич. А вот если бы её можно было-бы перепрошить и использовать как колонку в этом видео было бы очень здорово. Потому, что яндекс колонка наверняка лучше будет слышать на расстоянии т.к. у неё массив микрофонов, да и ответ будет звучать поприятнее.
@AndrewKobelev
@AndrewKobelev 29 күн бұрын
@@Kirilloff73 Надо сбросить вашу Алису на заводские настройки, а потом заново её активировать. А подписку не включать. У меня 2 колонки с алисой, лайт и DEXP. Обе работают без подписки полтора года как. Некоторые функции не работают, например, нельзя запустить какую нибудь произвольную музыкальную композицию. Вебрадио работает, диалог алиса поддерживает, этого мне достаточно.
@AndrewKobelev
@AndrewKobelev 28 күн бұрын
@@Kirilloff73 попробуйте сбросить колонку на фабричные настройки. И заново активируйте через свежесозданный аккаунт. А подписку не подключайте. Если не получается никак сбросить, мой совет-продайте на том же Авито, и купите колонку типа как У Павла и "массив микрофонов", ибо надеяться на то, что используете "алисины" микрофоны - зыбкая идея. И с чего это "ответ будет звучать поприятнее", это всецело зависит от TTS модуля.
@ELFMEDIA
@ELFMEDIA 27 күн бұрын
@@Kirilloff73 Нет пока никаких прошивок под их железо
@lDemen
@lDemen Ай бұрын
Подскажите, как оно работает при включенном телевизоре/музыке/пылесосе итд?
@vyshnyvetskyy
@vyshnyvetskyy 29 күн бұрын
Мне вот тоже интересно) Если сосед перфоратором работает целый день, делает из стен - сыр... сможет ли "колонка" голос распознавать?
@AndrewKobelev
@AndrewKobelev 23 күн бұрын
Отлично работает, включенный телевизор/музыка/пылесос не помеха
@AndrewKobelev
@AndrewKobelev 23 күн бұрын
@@vyshnyvetskyy сможет
@user-he9uh6bu8j
@user-he9uh6bu8j Ай бұрын
Такие колонки на озоне есть по 300р
@dkmcdk724
@dkmcdk724 29 күн бұрын
Я уже подумал что на S3 распознование работает, у Espressif есть такая реклама, а тут ESP32 просто как WiFi-микрофон используют..( При чем можно сказать без реального практического применения..
@ELFMEDIA
@ELFMEDIA 29 күн бұрын
На S3 работает распознавание wake word - начальной фразы обращения (например, "окей набу" или какую настроите). Остальная процедура stt на сервере.
@AndrewKobelev
@AndrewKobelev 19 күн бұрын
"на S3 распознАвание работает" -- действительно работает, у Espressif есть документация на Гитхаб с примерами. "А тут ESP32 просто как WiFi-микрофон используют." - именно так и есть.
@dartwejders
@dartwejders Ай бұрын
Можно ли свое кодовое слово использовать? И прикрутить голос покачественней?
@upavla
@upavla Ай бұрын
Есть много вариантов. Именно моя использует локальные команды которые поддерживает сама esp32 s3 таких команд только 3. Если сделать так, чтоб распознавание отправлялрсь в home assistant, то там распознаваний команд будет больше. В списке штук 20. Так же можно ещё базу команд прикрутить и там будет ещё больше вариантов. Ну и по поводу голоса. Тоже есть варианты разные
@dartwejders
@dartwejders Ай бұрын
@@upavla Спасибо за ответ. Ну вы же понимаете что сама esp поддерживает ровно то что в нее залито при прошивке. А прошивку компилируете вы в Esphome. Так что вопросы остаются. Надеюсь доснимите в других обзорах)
@dNix
@dNix Ай бұрын
@@dartwejders Я так понимаю, в ESP заливается микронейроночка натасканная на одну конкретную активационную фразу. Таким образом нельзя выбрать произвольную фразу, только те, что заранее подготовлены. Так работают и яндексовские колонки и активация голосового ассистента в смартфонах.
@AndrewKobelev
@AndrewKobelev 19 күн бұрын
@@dNixВсё верно, "в ESP заливается микронейроночка натасканная на одну конкретную активационную фразу. Таким образом нельзя выбрать произвольную фразу, только те, что заранее подготовлены." А как готовить, описано в ЕСП-шной документации.
@dNix
@dNix 19 күн бұрын
@@AndrewKobelev Понятно, что если что-то сделано человеком, вероятно кто-то другой сможет это повторить. Я мало знаю про ML, сложно оценить насколько это трудоёмко. Наверное не очень. Наверное даже достаточно среднестатистических домашних мощностей. Но надо же подготовить и разметить датасет. Сотни, тысячи правильных и неправильных слов, разными голосами, в разном темпе, с проглоченными окончаниями, с разными дефектами, интонациями. Очень близкие слова, слова включающие в себя активационное или похожее... В датасетах же вся ценность.
@PonikaLabs
@PonikaLabs 28 күн бұрын
Супер. Только esp32 ц3. Не c
@upavla
@upavla 27 күн бұрын
Наоборот
@Mbyte-rx8lj
@Mbyte-rx8lj Ай бұрын
А как-то голос менять можно? А то он сильно режет уши.
@upavla
@upavla Ай бұрын
Ну там можно поменять на мужской например. Есть несколько вариантов
@AndrewKobelev
@AndrewKobelev 21 күн бұрын
Конечно можно! Для умного дома синтез речи городить нет необходимости. Ответов то, типа "свет в туалете включён" немного вариантов, и вообще можно записать фразу "выполнено , мой господин! " и проигрывать её, как ответ на все команды.
@Dialbist
@Dialbist Ай бұрын
Выходит что на Rasp 3b+ не имеет смысла делать?
@AndrewKobelev
@AndrewKobelev Ай бұрын
любой Распберри Пи легко уделает десяток-другой ЕСПшек.
@serega40404
@serega40404 25 күн бұрын
Можно подключить гугл ттс и какое нибудь внешнее распазнование, но это скорее всего будет платно, а так да, rpi не вытянет нейронки по синтезу и распознаванию речи
@AndrewKobelev
@AndrewKobelev 24 күн бұрын
@@serega40404 Вытянет, просто синтезировать будет чудовищно долго.
@AndrewKobelev
@AndrewKobelev 24 күн бұрын
Смотря ЧТО делать. Если аналог того, что в видео, то , несомненно, на RPi 3, 2 и даже 0 и 1 такая беспроводная колонка с микрофоном заработает, ресурсов у малины в 10 раз больше, чем у ESP32. Если пытаться взвалить на малину 0,1,2,3 серверные функции, распознавание и синтез речи, да ещё заставлять управлять умным домом, то вся эта городильня...даже распознает команду 1-2 раза, затем свалится в коматозное состояние. Получается, что в первом случае просто расточительно использовать Распберри там, где справляется ЕСП, можно найти применение получше, а во втором -- просто не "взлетит".
@serega40404
@serega40404 23 күн бұрын
@@AndrewKobelev gtx730 вытянет киберпанк, просто fps будет мало)
@444STG
@444STG Ай бұрын
подскажите а как реализовать аналог алисы без подписок?
@AndrewKobelev
@AndrewKobelev Ай бұрын
Берёте Алису -лайт, или там Марусю...и не оформляете подписку. И алиса безо всякой подписки отвечает на вопросы, сообщает прогноз погоды и включает, например , Радио Джаз.
@444STG
@444STG 29 күн бұрын
@@AndrewKobelev ну музыку то не будит включать плюс стучит на тебя самому Якину ☝️😳
@AndrewKobelev
@AndrewKobelev 28 күн бұрын
@@444STG Если вам нужно включать музыку, алиса включит одну из 100500 интернет-радиостанций. Боитесь, что сам Якин узнает, тогда "Ирину" запустите или "Сару", она будИт включать, всё , что запрограммируете.
@AndrewKobelev
@AndrewKobelev 28 күн бұрын
@@444STG как страшно жить! :-)
@444STG
@444STG 27 күн бұрын
@@AndrewKobelev дорого стоит 5,5к за хрень которая на тебя стучит
@user-jf3kl2ok8s
@user-jf3kl2ok8s 29 күн бұрын
Я что-то прослушал. Сначала автор говорит что распознавать будет esp32-c3, потом говорит что у него celeron и поэтому думает долго. И я так понимаю никакого распознавания нет и в помине. Есть сравнение ранее записанных отрывков с тем что произносится и все. Да когда это работает без инета конечно же круто. Но для таких тугих как я хотелось бы более разжеванного материала.
@ELFMEDIA
@ELFMEDIA 29 күн бұрын
На ESP32 S3 работает распознавание wake word - начальной фразы обращения (например, "окей набу" или какую настроите). Остальная процедура stt на сервере.
@smartpal3754
@smartpal3754 Ай бұрын
Не i2c а i2s произносится по-разному.
@upavla
@upavla Ай бұрын
Да, оговорился
@alex_cube
@alex_cube Ай бұрын
Интересный проект. Спасибо за такие виедео. Жаль не получится сделать колонку на HASS на базе TV Box H96 Max на процессоре Rockchip RK3318. Ему явно не хватит ресурсов для распознавания голоса. Вот если бы был способ вынести распознавание на отдельную машину, да ещё и встроить её в колонку, это было бы вообще шикарно.
@upavla
@upavla Ай бұрын
На тв приставке этой добились хорошего распознавания. 2 секунды думает. Но там с локальной базой
@bambatv
@bambatv Ай бұрын
@@upavla Можно пример как это сделать?
@fisher7452
@fisher7452 Ай бұрын
​@@bambatvтакое ощущение, что Вы не посмотрели видео до конца. Но я тоже за освещение темы локальных голосовых баз, хотя меня пока и Алиса мини вполне устраивает
@AndrewKobelev
@AndrewKobelev Ай бұрын
Не городите ерунду, у Rockchip RK3318 ресурсов на пару порядков больше, чем у любого МК , даже ЕСП.
@ELFMEDIA
@ELFMEDIA 29 күн бұрын
@@AndrewKobelev При чём тут МК, распознавание голоса на сервере происходит, кроме wake word. Если целик не вывозит, то тв приставка тоже не вывезет
@MARK2580
@MARK2580 27 күн бұрын
мужик, ты в курсе что в браузере есть такая замечательная функция как ЗАКЛАДКИ !!!! ещё и клавиатура вся обосрана, постеснялся бы такое снимать.
@spajalnikom
@spajalnikom Ай бұрын
А без ассистента можно сделать? Как Алиса?
@upavla
@upavla Ай бұрын
Ещё так глубоко не вникал. Но там делали так, что колонка отвечала беря информацию из гугла
@spajalnikom
@spajalnikom Ай бұрын
@@upavla мне инфа не нужна. Просто для умного дома вкл выкл и все.
@AndrewKobelev
@AndrewKobelev Ай бұрын
Так алиса--это ведь голосовой ассистент
@ELFMEDIA
@ELFMEDIA 29 күн бұрын
У Алисы просто этот ассистент живёт в облаке на серверах Яндекса
@AndrewKobelev
@AndrewKobelev 24 күн бұрын
@@spajalnikomконечно можно! Только это надо, как у Алисы, где всё вынесено на гигантские серверные кластеры, вы же автономии хотите? В общем, если надо вкл-выкл по голосовым командам, то самое тяжелое - это запустить распознавание речи в текст. Это кусочек от проекта Ирина, или Сара. Делается за пару вечеров. Надо найти какой-то комп или одноплатник под сервер. Если сможете на него установить numpy (и желательно, но не обязательно, matplotlib) , значит железо, скорее всего, потянет и вам это тоже по плечу. Только надо решить, какое устройство и по какому протоколу будет делать ВКЛ-ВЫКЛ.
@MrDoctorant
@MrDoctorant Ай бұрын
добрый день. я к сожалению не программист, но интересуюсь)) и возник вопрос: а можно вашу разработку скрестить с голосовым ассистентом из этого видео: kzbin.info/www/bejne/mKaQpX2KdpKegdUsi=9msnNuvYFAMEWhjO
@rainnbrain
@rainnbrain 27 күн бұрын
в заголовке ты пишешь esp32, а по итогу это на esp32 не будет работать, нужен esp32s3, ну так сразу написать нельзя было?
@upavla
@upavla 27 күн бұрын
Почему не будет работать? Я в видео работу и на esp32 показал. И инструкцию сделал на работу esp32. Повнимательнее. Демонстрация работы есть в видео и ссылка на схему подключения естьв описании видео. И не "тыкайте".
@Dennis_Gray
@Dennis_Gray 27 күн бұрын
м-да, чего только не придумают из-за больной паранойи... вам самим не смешно?)))))
@upavla
@upavla 27 күн бұрын
А что должно быть смешного в колонке менее чем за 1000 рублей?
@OlegPogodaev
@OlegPogodaev 29 күн бұрын
Какой геморой и убогость по сравнению с Алисой!
@user-lz1bd3jd6o
@user-lz1bd3jd6o Ай бұрын
Алиса устраивает! Зачем эта наабу?
@upavla
@upavla Ай бұрын
Вам не нужна:)
@user-lz1bd3jd6o
@user-lz1bd3jd6o Ай бұрын
@@upavla Не в этом смысл. Может у нее приемущества есть? Чем она лучше? Или только одно приемущество - цена? Может надо сравнить с Алисой. Чем лучше та или другая система?
@ruslanumaev3569
@ruslanumaev3569 Ай бұрын
фишка в локальности@@user-lz1bd3jd6o
@begineras
@begineras Ай бұрын
@@user-lz1bd3jd6o алиса умеет работать без интернета?
@user-rb7dx8he4l
@user-rb7dx8he4l Ай бұрын
Может быть потому что Алиса вас всегда слушает. И что она на свои сервера посылает никто не знает. А тут локальное решение
Когда на улице Маябрь 😈 #марьяна #шортс
00:17
Normal vs Smokers !! 😱😱😱
00:12
Tibo InShape
Рет қаралды 97 МЛН
Зу-зу Күлпәш. Стоп. (1-бөлім)
52:33
ASTANATV Movie
Рет қаралды 1,2 МЛН
Como ela fez isso? 😲
00:12
Los Wagners
Рет қаралды 11 МЛН
АЛИСА ОТКРЫВАЕТ ДВЕРИ .УДИВИ СОСЕДА.
11:34
Вскрываем сейф с Flipper Zero
12:03
Павел Жовнер
Рет қаралды 73 М.
АЛИСА, ВКЛЮЧИ СВЕТ НА ESP32
8:56
Kirill Ivanychev
Рет қаралды 3,2 М.
Кто такие BambuLab? И что они творят?
33:37
Sergey Irbis
Рет қаралды 18 М.
Apple. 10 Интересных Фактов
24:26
Dameoz
Рет қаралды 114 М.
Apple. 10 Интересных Фактов
24:26
Dameoz
Рет қаралды 114 М.
Why spend $10.000 on a flashlight when these are $200🗿
0:12
NIGHTOPERATOR
Рет қаралды 18 МЛН
3D printed Nintendo Switch Game Carousel
0:14
Bambu Lab
Рет қаралды 3,8 МЛН
What’s your charging level??
0:14
Татьяна Дука
Рет қаралды 5 МЛН
How much charging is in your phone right now? 📱➡️ 🔋VS 🪫
0:11