Thorsten-Voice TTS in Windows nutzen | DDC / VITS

  Рет қаралды 5,795

Thorsten-Voice

Thorsten-Voice

Күн бұрын

Пікірлер: 54
@simonsayshomeassistant
@simonsayshomeassistant Жыл бұрын
Hey Thorsten, great videos!
@ThorstenMueller
@ThorstenMueller Жыл бұрын
Thank you, dear Simon 😊
@joharakiri
@joharakiri 9 ай бұрын
Wow ich nutze tgpt mit piper schon richtig lang in Linux und wollte das jetzt auf Windows auch einrichten. Und jetzt erklärt mir das genau die Stimme die mir auch sonst immer als Stimme von tgpt bei meinen technischen Problemen hilft 😂
@ThorstenMueller
@ThorstenMueller 9 ай бұрын
😂
@ThorstenMueller
@ThorstenMueller 9 ай бұрын
Das freut mich sehr 😊. Danke auch für den Hinweis auf tgpt. Das kannte ich gar nicht und habe gleich mal etwas damit rumprobiert, aber noch ohne TTS Ausgabe.
@joharakiri
@joharakiri 9 ай бұрын
@@ThorstenMuellerDie TTS Ausgabe von tgpt ist per Terminal sehr simpel. Man muss es nur mit -q verwenden damit die Ladeanimation nicht vorgelesen wird und dann den Output direkt per | ins tts tool leiten. Oder aber man schreibt ein zweizeiliges Skript und hat alles sofort zur Verfügung. Ich nutze das inzwischen zum Nachschlagen viel mehr als Google.
@lemonscript
@lemonscript Жыл бұрын
Hey, hast du die stimme mit open source tools erstellt? Wenn ja, mit welchen? Würde mich interessieren
@lemonscript
@lemonscript Жыл бұрын
Ach, hat sich erledigt, ich hab den anfang nicht mitbekommen wo du coqui erwährnst. Hast du die stimmen lokal erzeugt oder coquis online service dafür genutzt? Ich versuche aktuell auch meine stimme zu klonen. Kannst du vielleicht auch von deiner erfahrung berichten? Wieviel audiomaterial hast du gebraucht, wie lange hat das training der AI gedauert, etc.
@ThorstenMueller
@ThorstenMueller Жыл бұрын
Ich habe 2019 begonnen meine Stimme zu klonen, da gab es Coqui noch nicht 😆. Hier einige (hoffentlich) hilfreiche Videos von mir dazu: - kzbin.info/www/bejne/oIvVpK2VaM9kbMU - kzbin.info/www/bejne/mHvNq4allMuCiZo - kzbin.info/www/bejne/aoq3aYqQicSrapo
@IchWarNivek
@IchWarNivek 8 ай бұрын
Das macht so Spaß mit deiner Stimme rumzuwerkeln 😀 Gibt es einen Trick wie ich Umlaute ÄÖÜ aussprechen lassen kann? :D
@ThorstenMueller
@ThorstenMueller 8 ай бұрын
Das freut mich sehr zu hören 😊. Manchmal gibt es unter Windows Probleme mit Umlauten wenn man espeak-ng nutzt. Die Nutzung von espeak sollte das Umlautproblem lösen. github.com/thorstenMueller/Thorsten-Voice/issues/50#issuecomment-1622363116 Wenn du es probiert hast, würde ich mich über kurze Rückmeldung freuen, ob es dein Problem lösen konnte.
@IchWarNivek
@IchWarNivek 8 ай бұрын
@@ThorstenMueller Hey :-) Ja hat super funktioniert. Danke :)
@ThorstenMueller
@ThorstenMueller 8 ай бұрын
@@IchWarNivek Dann viel Spaß mit "meiner" Umlaut-sprechenden Stimme 😊.
@pixelboomer
@pixelboomer 2 ай бұрын
Ich komme nicht weiter, alle Schritte klappen, bis auf "pip install pip tts -U" - da bekomme ich eine Fehlermeldung "Requirement already satisfied: pip in d:\tts\lib\site-packages (24.2)" und jede Menge rote Fehlermeldungen "ERROR: Ignored the following versions that require a different python version: 0.0.10.2 Requires-Python >=3.6.0,
@pixelboomer
@pixelboomer 2 ай бұрын
Hab jetzt Python nochmal deinstalliert und eine ältere Version installiert. Jetzt funktioniert das ganze
@ThorstenMueller
@ThorstenMueller 2 ай бұрын
Das freut mich, dass du es lösen konntest 😊.
@guilloisvincent2286
@guilloisvincent2286 Жыл бұрын
Nice ! but coqui TTS is not free 😢there is no free alternative ?
@ThorstenMueller
@ThorstenMueller Жыл бұрын
Hi, i'm not sure what you mean with "free". Maybe you mean Coqui Studio which isn't imho open source. But the TTS tooling/framework is.
@Bonk1971
@Bonk1971 Жыл бұрын
It’s not for commercial use
@svenpaulus363
@svenpaulus363 Жыл бұрын
Hallo Thorsten. Ich habe ab der Eingabe von der Aktualisierung des Setuptools das Problem das es das Update nicht aufspielt und mir eine Error Meldung ab der Zeile Using cached wheel-0.42.0-py3-none-any.whl.meta data (2.2 kB) , anzeigt. ab da kann ich nichts weiter ausführen. Wo liegt da das Problem und gibt es dazu eine Lösung. Für deine Hilfe wäre ich dir sehr dankbar.
@ThorstenMueller
@ThorstenMueller 11 ай бұрын
Arbeitest du mit einer virtuellen Python (venv) Umgebung?
@svenpaulus363
@svenpaulus363 11 ай бұрын
@@ThorstenMueller ja arbeite ich. Ich befolge deine Anweisung im Video und ab der Aktualisierung klappt wie gesagt leider nichts mehr.
@ThorstenMueller
@ThorstenMueller 11 ай бұрын
@@svenpaulus363 Vielleicht mal testweise ein neues Python venv aufsetzen - vielleicht ist da was komisch. Dann nach der Aktivierung des neuen venv direkt probieren "pip install pip setuptools wheel -U", vielleicht hilft das. Ist aber sicher einen Versuch wert. Viel Erfolg dabei 😊.
@evij.8781
@evij.8781 Жыл бұрын
Hey Thorsten, tolle Arbeit und toll erklärt. Es hat prima geklappt. Deine Stimme hört sich großartig an. Noch eine kleine Frage. In coqui kann man mit einem Punkt eine kleine Pause zwischen zwei Worten generieren. Manchmal hört sich diese Pause aber wie ein wh an, so als wäre was abgeschnitten. Weißt Du woran das liegen könnte?
@ThorstenMueller
@ThorstenMueller Жыл бұрын
Guude und vielen Dank für das tolle Feedback zu meiner künstlichen Stimme 😊. Ich bin mir nicht sicher, wie ich mir "wh" vorstellen muss - klingt das vielleicht nach einer Ausatmen Pause? Das Modell interpretiert einen Punkt als Satzende und in meinen Aufnahmen ändere ich die Betonung am Satzende. Vielleicht ist es das. Bringt ein Komma oder Semikolon als Pausenzeichen mehr?
@enricowiegmann8509
@enricowiegmann8509 Жыл бұрын
Ist es möglich, diese TTS-Stimmen auch z.B. in Balabolka zu nutzen? Die zweite Frage: Gibt es einen Trick, damit Umlaute richtig gelesen werden?
@ThorstenMueller
@ThorstenMueller Жыл бұрын
Hi, nein das ist derzeit noch nicht möglich. Ich versuche noch eine einfache Einbindung in Windows mittels SAPI zu ermöglichen. Das könnte dann auch in bspw. Balabolka funktionieren. Ja, machmal gibt es mit espeak-ng unter Windows Probleme mit deutschen Umlauten. Es sollte helfen, statt espeak-ng das "normale" espeak (also ohne -ng) funktionieren. Ich habe einige Hinweise dazu hier beschrieben: www.thorsten-voice.de/einfach-loslegen/#umlaut
@danielspelten623
@danielspelten623 7 ай бұрын
Hey, ist es möglich irgendwie das Paket auf Windows hinzuzufügen damit sämtliche Programme die TTS nutzen diese Voice hier nutzen könnten?
@ThorstenMueller
@ThorstenMueller 7 ай бұрын
Die Antwort lautet "SAPI" 😊. Ich habe schon versucht meine Stimme dort zu hinterlegen, aber das ist wirklich ein Albtraum. Daher habe ich das Thema erstmal runterpriorisiert, aber es wäre schon noch irgendwann mein Wunsch, dass das möglich ist.
@PflanzPfoten
@PflanzPfoten 4 ай бұрын
@@ThorstenMueller Eine Frage die ich auch stellen wollte. Also gibt es keine einfache Möglichkeit deine Stimme direkt in Windows zu Installieren, so wie es mit neuen Fonts derFall ist? Dass ist schade, die standard Stimmen sind grauenhaft in Windows und ich wollte gerne eine natürlich klingende, wie die im DDC Format, um mir im Firefox Browser, im Reader etwas vorlesen zu lassen. Manchmal habe ich nämlich Probleme dies selbst zu lesen, nicht weil ich es nicht könnte, sondern eher weil mein Kopf dann nicht mitspielt. Bin ja eher eine Freundin der einfachen und Praktischen Dinge =)
@ThorstenMueller
@ThorstenMueller 3 ай бұрын
@@PflanzPfoten Das verstehe ich. Wie geschrieben habe ich bereits Versuche unternommen, die etwas enttäuschen gelaufen sind. Vielleicht finde ich (in näherer Zukunft) nochmal Zeit und Motivation für einen neuen Versuch ;-).
@flyingwingrec
@flyingwingrec 4 ай бұрын
Funktioniert bei mir nicht. Python ist installiert wird aber in der Kommandozeile nicht gefunden. Finde den Fehler nicht woran das liegen könnte.
@ThorstenMueller
@ThorstenMueller 4 ай бұрын
Also ein "python -V" auf der Kommandozeile liefert keine installierte Python Version?
@flyingwingrec
@flyingwingrec 4 ай бұрын
​@@ThorstenMueller Ja, ich habe die neueste Version von Python 3.12 Installiert sowie die anderen Tools auch. Beim kontrollieren in der Kommandozeile wie in den Video beschrieben, kommt :Python konnte nicht gefunden werden. Fuehren Sie die Verknuepfung ohne Argumente aus, um sie ³ber den Microsoft Store zu installieren, oder deaktivieren Sie diese Verknuepfung unter. Mehr kommt dann nicht. Da weiß ich dann nicht wie ich weiter vorgehen sollte.
@ThorstenMueller
@ThorstenMueller 4 ай бұрын
@@flyingwingrec Kannst Du eventuelle mal nach dem genauen Pfad deiner Python Installation schauen. Dann den vollständigen Pfad angeben und nicht nur "python". Ändert das was?
@flyingwingrec
@flyingwingrec 4 ай бұрын
@@ThorstenMueller wie gebe ich den Befehl in der Kommandozeile ein? Python wurde bei mir in "User/AppData/Local/Program/Python/Python321" Installiert.
@NoxmilesDe
@NoxmilesDe Жыл бұрын
Ist deine Stimme auch bei Mozilla Common Voice drin?
@ThorstenMueller
@ThorstenMueller Жыл бұрын
Ich hatte es der Mozilla Community mal erwähnt. Allerdings weiß ich nicht, ob sie es (bisher) technisch integriert haben 🤔.
@Thelucyinside
@Thelucyinside Жыл бұрын
Hallo, und zwar habe ich das Problem, dass nachdem ich tts Instaliert hatte, die Komandozeile den Befehl nicht findet. Weis da jemand etwas was ich da nicht weis? :) Ansonnsten cooles Projekt, von dem was ich bis jetzt sehen konnte.
@ThorstenMueller
@ThorstenMueller Жыл бұрын
Danke für deine nette Rückmeldung zu meinem Projekt 😊. Nutzt du eine virtuelle Python Umgebung dafür und ist die aktiviert? Sonst wird der "tts" Befehl nicht gefunden.
@Thelucyinside
@Thelucyinside Жыл бұрын
@@ThorstenMueller Ah, nein ich hatte tatsächlich keine virtuelle Python Umgebung genutzt. Danke für die Antwort!
@mal-avcisi9783
@mal-avcisi9783 3 ай бұрын
"du wirst peisn brauchen" 🤣🤣
@ThorstenMueller
@ThorstenMueller 3 ай бұрын
Ei sicher 😂
@andiratze9591
@andiratze9591 Жыл бұрын
Hey Thorsten. Kannst du mal ein Tutorial machen, wie man in espeak deine Stimme und andere wie z.b. die Mbrola Voices installiert aber bitte nicht espeakNG, weil das keine Benutzeroberfläche hat. Ich will an einem großen Projekt arbeiten und wäre über eine Benutzeroberfläche dankbar, die mehrere deutsche Stimmen enthält.
@ThorstenMueller
@ThorstenMueller Жыл бұрын
Danke für den Themenvorschlag 😊. Da muss ich mal schauen, wie oder ob das irgendwie möglich ist, da "mbrola" Stimmen (glaube ich) sich technisch von Coqui oder Piper Stimmen stark unterscheiden.
@andiratze9591
@andiratze9591 Жыл бұрын
Mich würde ja interessieren, welche Stimmen man überhaupt alle in espeak verwenden kann. Deine Stimme als DDC-Model klingt auf jeden Fall schon mal sehr gut.
@Vito_0912
@Vito_0912 Жыл бұрын
So ungewohnt die deutsche Stimme zu hören ^^. Btw. ich glaube der englische Untertitel ist nicht richtig konvertiert oder eingefügt worden. Zumindest hatte er im Web und als mir das aufgefallen ist, auch in der App nicht funktioniert
@ThorstenMueller
@ThorstenMueller Жыл бұрын
Hehe, ja ich finde meine deutschsprachigen Videos auch ungewöhnlich. Die nächsten werden auch wieder englisch, musst dich also nicht permanent umgewöhnen 😆. Guter Hinweis mit den Untertiteln. Muss ich mal schauen. Ich wünsche Dir noch einen schönen Abend.
@Dylldophlo
@Dylldophlo Жыл бұрын
Eigentlich habe ich ja gehofft dass es sich um ein TTS Voice handelt das man einfach in Windows installieren kann um die schreckliche englische Anna weg zu bekommen. Trotzdem gute Arbeit, hört sich verdammt gut an.
@ThorstenMueller
@ThorstenMueller Жыл бұрын
Vielen Dank 😊. Ich habe vor einigen Monaten mal in einen Microsoft Forum gefragt, wie ich meine Stimme ganz einfach in Windows als Stimme anbieten kann. Aber habe leider keine Antwort bekommen. Meinst du, meine TTS Stimme in Windows wäre eine sinnvolle Ergänzung? Vielleicht muss ich das Thema aktiver verfolgen.
@Dylldophlo
@Dylldophlo Жыл бұрын
​@@ThorstenMueller Also wenn ich so auf der Suche nach einer TTS Stimme bin, die nichts kostet, lande ich meist auf Kostenpflichtigen Seiten die dann oft nicht einmal ein Sample in Deutsch anbieten oder genau so "gut" sind wie Hedda, Steffi und diese ganzen veralteten SAPI Voices. Auf Github gäbe es noch das Projekt eSpeak: speech synthesis, aber die heruntergeladen Stimmen errinnern mehr an den Talking Parrot von Creative aus den 90ern. Ich weis nicht, ob neuere Windows Versionen mittlerweile ertragbare TTS Stimmen in Deutsch mitliefern, denn ich gurke ja immer noch mit mit veralteter Soft/Hardware rum. Wenn ich nicht auf obigen Seiten lande, dann finde hauptsächlich auch Seiten wo Blinde oder Menschen mit Leseschwäche nach vernünftiegen TTS Stimmen suchen. Ist aber alles recht alt, entweder begnügen sich diese Menschen einfach mit dem gelieferten oder haben sich eben für etwas kostenpflichtiges entschieden (Halbwissen: ich glaube da gibt es einen Kostenzuschuß). Ich habe mich auf einigen Kostenspflichtigen Seiten herumgetrieben, gefallen finde ich da an keiner der Stimmen. Das wirkt alles so steril von der Sprache. In der Küche hab ich einen alten HP Pavillion mit Touchscreen, für Musik, Video, Hörspiele und Rezepte. Wäre schön wenn man sich da bei der Küchenarbeit auch mal etwas vorlesen lassen könnte. Auch ein altes Gerät, aber er tut es, und zwar gut, auch wenn das Displayglas oft gut geschmiert ist. Ist natürlich auch vermutlich ein großer Aufwand so eine SAPI Stimme zu erstellen, ich will dich keineswegs da in eine Richtung schieben. Auch Fremdwörter sind problematisch, ein einfaches Guide oder Happy Birthday bringt deine Stimme schon ins straucheln. Aber, in Deutsch hört es sich super an.
@ThorstenMueller
@ThorstenMueller Жыл бұрын
@@Dylldophlo Ja, ich glaube eine neue SAPI Stimme bereitzustellen ist sicherlich nicht ganz einfach, aber ich hoffe bald etwas Zeit zu finden, mich da etwas genauer einlesen zu können. Dann kann ich bestimmt abschätzen, wieviel Aufwand da rein gesteckt werden müsste.
Unlock All Windows Text-to-Speech Voices!
10:47
The Morpheus Tutorials
Рет қаралды 5 М.
Мясо вегана? 🧐 @Whatthefshow
01:01
История одного вокалиста
Рет қаралды 7 МЛН
Quando A Diferença De Altura É Muito Grande 😲😂
00:12
Mari Maria
Рет қаралды 45 МЛН
Voice Cloning In Multiple Languages - Open Source
16:49
Prompt Engineering
Рет қаралды 93 М.
Rechner übers Netzwerk clonen mit Clonezilla
15:26
Benjamin Wagner
Рет қаралды 605
But what is a neural network? | Deep learning chapter 1
18:40
3Blue1Brown
Рет қаралды 18 МЛН
HOW TO COMBINE COMPUTERS into a SUPERCOMPUTER for multiboxing.
17:24
so-vits-fork Installation Tutorial for Windows 10
7:33
UnitedShoes
Рет қаралды 62 М.
Create Your Own AI Animated Character (step by step)
15:21
Sharp Startup
Рет қаралды 1,2 МЛН
How to Create Voiceover Using Google Cloud Text to Speech
3:27
Your AI Voice Sounds WRONG! Here's Why 🤖 → 🗣️
18:14
Thorsten-Voice
Рет қаралды 568