Брат мой. От души тебе. Я 2-й день ищу нормальный пример для работы vosk... Не какие не работали. Даже официальные... А твой вариант и простой и рабочий. Спасибо!
@shevich_off Жыл бұрын
ПРОСТО ХОРОШ МЕСЯЦ ИСКАЛ ТАКОЙ ТУТУРОИЛ, ТЫ МЕНЯ СПАС, СПАСИБО
@Соседсверху-ш7ц Жыл бұрын
Братан,огромное тебе спасибо. Наконец-то он у меня заработал. Я столько способов искал, но ты единственный человек который написал код который действительно работает. 3 день я был в поисках правильного написания кода... Я очень рад и искреннее благодарен за то что ты сделал это видео. Желаю тебе развития и много хороших моментов жизни. Ты просто лучший. Спасибо
@alex_cube Жыл бұрын
Спасибо огромное! Касперский ругнулся, мол кто там посмел трогать микрофон, но после подтверждения всё заработало.
@POTYOMKIN_3 ай бұрын
00:00 Создание распознавания речи без интернета с использованием Python 01:31 Выбор модели зависит от требований к оперативной памяти. 02:54 Создание программы распознавания речи 04:17 Создание потока для распознавания речи 05:57 Создана функция для чтения и обработки данных с дополнительными условиями. 08:00 Модель распознавания речи может достаточно хорошо распознавать средние и короткие фразы с маленькой моделью. 09:29 Создание генератора в Python 10:59 Модель распознавания речи работает без интернет-соединения.
@zarill3225 ай бұрын
3:27 что делать если ты указал путь но чето он не работает
@rinami31113 жыл бұрын
Новый ролик, круто, долго ждал!
@alx8439 Жыл бұрын
Идея с генератором и непрерывным распозованием хорошая, но для полноценной работы нужна многопоточность или многопроцессность: - получение аудио с микрофона - распозование этого аудио - обработка распознанного текста и вычленение намерения - обработка намерения Иначе это будет работать только в лабораторных (идеальных) условиях
@DimPyProg Жыл бұрын
В самом ассистенте так и сделано С многопоточностью
@alx8439 Жыл бұрын
@@DimPyProg проект на гитхабе? Я почему спрашиваю: тот код, что я видел в других твоих видео по ассистенту делает это ПОСЛЕДОВАТЕЛЬНО, а надо, чтобы это были разные потоки. Возможно я чего-то не разглядел в видео. Объясню почему это важно на простом примере: если ты задал вопрос ассистенту и он на него отвечает, у тебя должна быть возможность его прервать, сказав например "Сара, хватит". Но если весь твой код работает в один поток, то пока он не закончит говорить, он не начнет слушать
@mcomponent3 жыл бұрын
Ролик нравится, информативно. Есть предложение для улучшения твоего контента. Есть такая штука как virtualenv (модуль для питона) - он позволяет создавать 1-ой командой в указанной папке нужное окружение на указанную версию python и ставить библиотеки туда - очень сильно помогает, если не хочется засорять систему пакетами ради 1 проекта. И наконец небольшая идейка на новое видео: Преобразование Фурье. Для этого есть библиотеки (FFT/Fast Fourier Transform, DFT/Discrete Fourier Transform, IFT/Inverse Fourier Transform и другие). На нём работают шазам и сжатие JPEG.
@10GL102 жыл бұрын
Привет,позволь обратиться за помощью,я пытаюсь сделать голосового помощника но в какие видео не зайду то одна из всех нужных библиотек не устанавливается,то другая из за версий питона,что мне делать?Поменяю версию питона,другие библиотеки перестают работать
@mcomponent2 жыл бұрын
@@10GL10 проверь свою версию PIP. Желательно, используй последнюю версию python, это 3.10. Гайды тоже проверяй, они могут быть старые. Так же, на официальном репозитории PyPI можно проверить статус библиотеки. Для более детальной информации скинь сами ошибки и название библиотек.
@10GL102 жыл бұрын
@@mcomponent может чтобы было удобнее в ВК перейдем?Если ты не против
@АлексейС-й2м2 жыл бұрын
Спасибо большое за ролик! 🤝
@fsoky3 жыл бұрын
классно!
@КайратИсмаилов-о2п2 ай бұрын
Спасибо. Все работает. Круто.
@load-net2 жыл бұрын
Где обещанный исходник, не могу найти
@nicedim Жыл бұрын
Спасибо!!! Мега прикол - запустилось с первого раза - шоке
@StSamulet9 ай бұрын
Отличный ролик, спасибо) У меня задача, нужно диалоги из wav файлов разбирать, чтобы не целым текстом, а в виде диалога получать.. вроде, у vosk есть возможность идентифицировать говорящего. Не могу раскурить, да и документацию по vosk не найти. Можете такой ролик запилить, или дать намёк, куда смотреть )
@mahunj8 ай бұрын
как добавить свои слова в модель? чтобы распознавал
@ncorp25582 жыл бұрын
Как сделать что-бы голосовой помощник мог понять и русский и английский, я попробовал (,), (or), (and), не получается
@TravelingAsia1087 ай бұрын
Круто, спасибо за инструкцию. А как сделать так, чтобы уже готовый mp3 файл переводил он в текст? Удобно же на диктофоне наговорить где-то, а потом закинуть в программу
@RIKA-fn6uy2 ай бұрын
Для того чтобы он озвучил заранее записанные фразы используй расширение не mp3 а waw
@pixelsDVMT Жыл бұрын
Модули установил. код один в один, не запускается, куча ошибок
@tiris_25242 жыл бұрын
Мега красава у тебя все получиться с ютубом.Вообще пишу на c++, но на c++ нет обучалок по этой библиотеки. Ну хоть принцип работы понял спасибо
@NeorBlogIT3 жыл бұрын
Оаоаоа новый ролик наконец-то
@mitkosokolov938210 ай бұрын
how can we create our own model ?
@MineFox_ServerPlay Жыл бұрын
А как мне в пайчарме воск модел смол задействовать
@VALSE_17 ай бұрын
import json, pyaudio from vosk import Model, KaldiRecognizer model = Model('vosk-model-small-ru-0.4') rec = KaldiRecognizer(model, 16000) p = pyaudio.PyAudio() stream = p.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True, frames_per_buffer=8000) stream.start_stream() def listen(): while True: data = stream.read(4000, exception_on_overflow=False) if (rec.AcceptWaveform(data)) and (len(data) > 0): answer = json.loads(rec.Result()) if answer['text']: yield answer['text'] for text in listen(): print(text) проблема в том что он просто не пишет, ты ему говоришь а он ничего не делает микрофон включён
@lostfuture34162 жыл бұрын
Как можно вместо рапсознавания речи определить высоту звука?
ты забыл после p= pyaudio.PyAudio добавить () p= pyaudio.PyAudio() попробуй
@FyzMe8 ай бұрын
В какой переменной ответ сохраняется?
@kvakazhabra Жыл бұрын
Подскажи, есть зависимость от размера модели и временем распознавания речи? То-есть чем больше модель тем дольше распознает? Хочу засунуть в VR тренажер на UE5 что скажешь?
@P4elikstaks Жыл бұрын
Что делать когда я говорю открой вк или открой вконтакте то он вместо этого пишет открой века пока открой контакты и тд
@RIKA-fn6uy2 ай бұрын
Нужно сделать подобие триггеров для более точного распознавания
@RIKA-fn6uy2 ай бұрын
Либо плохой микро
@АлишерФайзуллаев-е4з3 жыл бұрын
Никак не могу это добавить в джанго проект. Папку с моделью вставил в папку приложения, но пишет:failed to create model. Возможно кто-то знает как в джанго добавить воск?
@qrmans2 жыл бұрын
DimPy почему у меня не запускается модель
@rayti75955 ай бұрын
Сигма крутой уважение тебе вечное пупсик шмупсик
@МаркБурима Жыл бұрын
что с этим можно сделать? line 3, in from vosk import Model, Kaldirecognizer ImportError: cannot import name 'Model' from partially initialized module 'vosk' (most likely due to a circular import)
@РексДинозаврик Жыл бұрын
Попробуй переустановить библиотеку Vosk и обнови pip чтоб обновить pip посмотри гайди на ютубе а чтоб билиотеку воск переустановить и обновить ето такие команди обновить: pip upgrade vosk удалить: pip uninstall vosk установить: pip install vosk
@okru22882 жыл бұрын
как вы тренировали модель?есть видео?
@alex_konor21972 жыл бұрын
Нет, он с гайда слизал и болт положил. У него в 2021 году работало всё, теперь не работает библиотека под WIn64 и с питоном3
@QewSob Жыл бұрын
А как с аудио или видео перевести в текст!
@tiollife2866 Жыл бұрын
У меня выдаёт ошибку в вайле
@kahiko77653 жыл бұрын
Что делать если мне на второй строчке , где from vosk import Model, KaldiRecognizer, питон пишет ошибку?...
@kahiko77653 жыл бұрын
from vosk import Model, KaldiRecognizer ImportError: cannot import name 'Model' from partially initialized module 'vosk' (most likely due to a circular import)
@emigrate89 Жыл бұрын
OSError: [Errno -9996] Invalid input device (no default output device)
@BangoSteve2 жыл бұрын
Можно ли это как-то использовать в телеграм боте?
@alexmiz8063 жыл бұрын
Кто знает, как написать бота автопостинга твоих отложенных постов для телеграм на python?
@ГорячийМексиканец-ч9в Жыл бұрын
Чувак, красава! За 10 минут сделал! Большая модель грузится в память несколько секунд. Распознаёт хорошо даже мелкая (микрофон динамический за 100$). Не распознает слов "чувак" и "красава", повышает культурный уровень так сказать ЛОЛ. Потестить бы responsiveness на GPU...
@vlkardakov3 ай бұрын
Замечание: В конце этот код ничего не распознал, потому что вы выделили область в терминале. При этом код ставится на паузу.
@monetary_supply3 жыл бұрын
Смотрю у большинства ошибки))) у меня ошибка с папкой model. Код дальше model = Model() не идёт. Уже не знаю почему так. Может нужно отдельно папку в path добавить, корневая папка там есть. Может кто-то справился с этим?
@lauhG33 жыл бұрын
ты из zip извлек папку ??
@DimPyProg2 жыл бұрын
model = Model( " тут путь к модели(к папке) " )
@puk1ch2752 жыл бұрын
@@DimPyProg не работает
@puk1ch2752 жыл бұрын
@@DimPyProg модель должна быть на диске С?
@DimPyProg2 жыл бұрын
@@puk1ch275 модель может находиться в любом месте на диске, если модель лежит в той же папке, что и код, тогда достаточно указать только название папки с моделью, но если модель лежит, например, на другом диске, то в коде нужно указывать полный путь к модели
@vitalirb13637 ай бұрын
У меня ничего не работает
@errorgradov80502 жыл бұрын
Привет,я сделал все в точности,но при попытке запуска в консоль ничего не выводится кроме того,что Vosk запущен,пожалуйста помоги :(
@DimPyProg2 жыл бұрын
Микрофон проверь
@errorgradov80502 жыл бұрын
@@DimPyProg все проверил,но результат опять тот же
@Alex_java3 жыл бұрын
@DimPy, подскажи пожалуйта.Для чего мы импортируем json?
@DimPyProg3 жыл бұрын
сама библиотека vosk использует json, можешь увидеть это в 17й строке
@EFIM_immersive_fun2 жыл бұрын
Сам интро делал? Красиво...
@EdGull3 жыл бұрын
Спасибо!
@d3ka8183 жыл бұрын
Требуется для такой программы нечеткое сравнение комманд, и сколько грузит оперативы
@DimPyProg3 жыл бұрын
нечеткое распознавание команд требуется для голосового ассистента, а не для распознавания речи, оперативки есть примерно 4-4,5 гб (большая модель)
@d3ka8183 жыл бұрын
@@DimPyProg Я знаю что для ассистента, я сделал его по твоим прошлым видео, и сравнение стоит на 50% так как микрофон не очень, (через спич рекогнайшн) и думаю переписывать с воском или нет?
@d3ka8183 жыл бұрын
@@DimPyProg маленькая
@DimPyProg3 жыл бұрын
Перепиши, но тогда у тебя не будет распознавать я английский язык
@DimPyProg3 жыл бұрын
Не смотрел
@romanvolkov78346 ай бұрын
Как добавить свои слова, то есть нужно распознавание терминов, сленга и английских слов в русской речи
@ВоИстину-ц6ш3 жыл бұрын
ЧТо с этим делать if text = 'пока': ^ SyntaxError: invalid syntax
@DimPyProg3 жыл бұрын
if text == 'пока':
@nePh0ntomtochno2 жыл бұрын
очень круто но у меня проблема сможешь помочь в лс?
@ДмитрийНеизвестный-ь4ы2 жыл бұрын
пробился через все трудности, установил пайаудио...и упоролся с воск модель...что за фигня, указываю путь как ты и говорил, выдает ошибку
@DimPyProg2 жыл бұрын
а папку вытащил из архива? там папка в папке
@LinfeR2 жыл бұрын
укажи абсолютный путь. у меня тоже такое было пофиксил именно так
@hfhtuyf2 жыл бұрын
Спс за видос. Жалко что исходников не получается найти. Ссылка на саму группу, но и там и не найдешь)))
@kirill_monster2 жыл бұрын
тут кода всего то...
@savadram49102 жыл бұрын
а как он распознает какой микрофон брать?
@DimPyProg2 жыл бұрын
данный код использует микрофон по умолчанию в винде
@ВоИстину-ц6ш3 жыл бұрын
Ну что ж ты кода не оставил:(
@LOGOSTT Жыл бұрын
Фоновая музыка мешает
@Юзер42 Жыл бұрын
Спасибо! Не работает!
@xetmu58833 жыл бұрын
Кликбейты освоил?
@kirill_monster2 жыл бұрын
9:00 ты нажал на текст и работа приостановилась
@DimPyProg2 жыл бұрын
точно)
@Anton-ni8un3 жыл бұрын
Без интернета перестал распознавать. А как к вайфай подключился, снова стал распознавать. А говоришь без интернета работает.
@DimPyProg3 жыл бұрын
Возьми и проверь
@yarostishkaplay60793 жыл бұрын
Все работает без инета! У меня ассистент с помощью этой библиотеки распознает
@Cheertttt2 жыл бұрын
Почему-то плохо распознаёт, да быстро, но не точно, даже с большой моделью, микрофон вроде нормально звучит :(
@0000GamingToday5 ай бұрын
Спс
@romanbolgar2 жыл бұрын
Ничего непонятно но очень интересно. Особенно непонятно зачем мы так долго пишем.... Создаётся впечатление, что все программисты графоманы Вот я сейчас эти строки не пишу, а говорю Наверное собственно для этого и пытаются сделать вот такие программы Ну в чём проблема Почему до сих пор уже нету готовых решений Не приходится программировать программистов Увы пока это непосильная задача они не понимают даже русский....
@DimPyProg2 жыл бұрын
ты сам хоть понял, что написал?
@klimchegg2 жыл бұрын
@@DimPyProg у тебя когда ты отключаешь инет, он снова сам включается.
@klimchegg2 жыл бұрын
Чувак, у тебя когда ты отключил инет он заново сам подключился.
@DimPyProg2 жыл бұрын
Прикольно Называется автоподключение)
@МихаКувалда-в2п Жыл бұрын
Россия 🇷🇺🇷🇺🇷🇺🇷🇺🇷🇺
@XAXAXAXAXXAXAXAXAXAXAX Жыл бұрын
Спасибо мужик!
@creazybitcoiner4582 жыл бұрын
Огромная благодарность. Давно искал нечто подобное. Но вот вопрос, у меня как только загрузилась модель прогрузилась окно консоли закрывается, если запускать через PyCharm выдает "Process finished with exit code 0" программа сработала без сбоев, и закрылась. Что я сделал не так? Код из видео оставлю тут может кому пригодится. import json import pyaudio from vosk import Model, KaldiRecognizer model = Model('model_small') rec = KaldiRecognizer(model, 16000) p = pyaudio.PyAudio() stream = p.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True, frames_per_buffer=8000) stream.start_stream() def listen(): while True: data = stream.read(4000, excerption_on_overflow=False) if (rec.AcceptWaveform(data)) and (len(data) > 0): answer = json.loads(rec.Result()) if answer['text']: yield answer['text'] for text in listen(): print(text)
@DimPyProg2 жыл бұрын
Ну, для начала, я думаю, нужно переписать весь код до конца, чтобы он работал
@creazybitcoiner4582 жыл бұрын
@@DimPyProg Чем этот код отличается от того что работал на 8:12?
@DimPyProg2 жыл бұрын
@@creazybitcoiner458 ты не дописал 2 строки
@creazybitcoiner4582 жыл бұрын
@@DimPyProg Те что закоменчены? Поржал, а если серьезно?
@dieselekin2 жыл бұрын
Отличное видео
@rinami31113 жыл бұрын
Вы не знаете как можно реализовать проверку на администратора в беседе вк? Я знаю что нужен метод messages.getConversationMembers и оттуда нужно взять параметр is_admin, но это лишь в теории) на практике бот просто игнорит эту команду, осталось реализовать лишь эту функцию и мой бот в принципе готов, реализовывал более сложное, но на столь простом сижу уже 3 дня)
@wildemann16953 жыл бұрын
Привет, Дим! Можешь пожалуйста сделать скрипт на накрутку фотографий для вк? И сделать туториал по такому скрипту) Буду очень благодарен) Если что, мой вк: vk.com/fl0rex