【AIで音声をテキストに変換】Whisperの使い方を解説!〜 Pythonを使って無料でSpeech-to-Textを動かそう 〜

  Рет қаралды 13,078

Pythonプログラミング VTuber サプー

Pythonプログラミング VTuber サプー

Күн бұрын

Пікірлер: 38
@kani2735
@kani2735 18 күн бұрын
今回の動画恐ろしく今の僕にぴったりな内容でした。 今まさに会議時に人の声を聞き分けたり、会議の概要をまとめるアプリを作っています。assemblyaiは話者識別できるし精度も悪くないのでおすすめです!あと復活して嬉しいです!
@pythonvtuber9917
@pythonvtuber9917 18 күн бұрын
ご視聴いただきありがとうございます!! assemblyaiというの初めてしりました✨✨ AIは色々なことができて本当便利ですよねー!!
@sora_bean
@sora_bean 27 күн бұрын
Docker入門で知り、過去動画を見漁ってます 素晴らしい解説動画をありがとうございます 書籍も購入させていただきました!
@pythonvtuber9917
@pythonvtuber9917 26 күн бұрын
ご視聴いただきありがとうございます!! 書籍もご購入いただきありがたいです☺️ 動画でも書籍でも何かプログラミング学習のお役に立っていたら嬉しいです✨
@AI-tf2ey
@AI-tf2ey 26 күн бұрын
先月からchatgpt使ってウィスパー作りました。 職場でかなり重宝してます!
@pythonvtuber9917
@pythonvtuber9917 26 күн бұрын
わー!!すごいです✨✨ 実際にお仕事でも使えるプログラムが作れると嬉しいですよね!!
@トリ-g9q
@トリ-g9q 14 күн бұрын
おお!これ今日ちょうど使ったところです。パワーのないパソコンだとWhisperのロードに時間がかかるのが玉にキズですか、無料で上手い感じにテキスト化してくれるのは嬉しい!ですよね。僕はlargeモデルだけ使ってます。
@pythonvtuber9917
@pythonvtuber9917 14 күн бұрын
おー!!私のPCではLargeモデル動かなかったので羨ましいです!! こんなに凄いのに無料なのが嬉しいですね☺️
@jpy7362
@jpy7362 27 күн бұрын
ありがとうございます!
@pythonvtuber9917
@pythonvtuber9917 27 күн бұрын
super thanks 大変ありがたいです!!!
@パル-x3u
@パル-x3u 26 күн бұрын
pythonで音声解析できるなんて技術の進歩は素晴らしいですね(高校生) 投稿された動画リスト見てきましが凄いですねこれ見ればpython丸わかりじゃないですか ということで次は機械学習についてお願いします
@pythonvtuber9917
@pythonvtuber9917 26 күн бұрын
AIすごいですよね!! 機械学習については専門の方とのコラボとかを予定してるので楽しみにしていてください☺️
@387
@387 27 күн бұрын
音声認識は以前SpeechRecognitionで作ったことがあるよ それよりも精度は上がってるんだろうなぁ🙄 (ところでサプーちゃんは今日もかわいい😇)
@pythonvtuber9917
@pythonvtuber9917 27 күн бұрын
SpeechRecognitionというのもあるんですね!!AIの進化はすごいですよね😳 サプーの姿が可愛くてついつい大きく映してしまいます☺️
@MikuHatsune-np4dj
@MikuHatsune-np4dj 24 күн бұрын
同音異義語や駄洒落観たいに人間でも錯覚するような言葉を試してみたくなります
@pythonvtuber9917
@pythonvtuber9917 24 күн бұрын
確かに人間でも聞き間違えしやすい言葉もありますからね!!
@taimura2126
@taimura2126 4 күн бұрын
8:09のあたりで$32と表示されていますが、GPU動かすとお金かかってしまいますか?
@せだ-b5l
@せだ-b5l 25 күн бұрын
OpenAIから出たrealtimeAPIについて、使い方などを紹介した動画を作ってくださると嬉しいです。
@pythonvtuber9917
@pythonvtuber9917 25 күн бұрын
realtimeAPIのリクエストありがとうございます!考えてみますね!
@raba-340
@raba-340 23 күн бұрын
faster_whisperに変更して、ローカルのGPU(GTX1660)も使用するようにしたら、large-v3で実時間の23%で変換できました
@pythonvtuber9917
@pythonvtuber9917 23 күн бұрын
おー!!速いですね!! faster_whisperは動かしたことが無かったので、どの程度速くなるか共有いただけてありがたいです☺️
@人人-d8i
@人人-d8i 27 күн бұрын
ビデオカード持ってる前提での方法でやって欲しいな
@pythonvtuber9917
@pythonvtuber9917 27 күн бұрын
リクエストありがとうございます!
@raba-340
@raba-340 27 күн бұрын
ffmpegはどこで使われてるんだろう
@pythonvtuber9917
@pythonvtuber9917 27 күн бұрын
Whisperの中のどの部分か?ということですかね?うーんどこでしょう🤔
@toms-in3xr
@toms-in3xr 27 күн бұрын
@@pythonvtuber9917 オーディオファイルを読み込んでデコード、バッファーとして取り込んでndarrayとして扱えるようにする部分で使われてたはずです~
@pythonvtuber9917
@pythonvtuber9917 27 күн бұрын
わーー!!そうなんですね!! 教えていただきありがとうございます☺️
@YASSHY
@YASSHY 27 күн бұрын
今日のサプーちゃん、ほっぺがふっくらしている様に見える。
@pythonvtuber9917
@pythonvtuber9917 27 күн бұрын
角度によって微妙に見え方が違いますよね!
@ptptsoushu
@ptptsoushu 27 күн бұрын
今日は前半はすっごい簡単〜(^-^)vと思ったら、後半ついていけませんでした(T . T) 引き続き修行します. リクエストですがLLM+RAGやろうと思うので解説動画あげていただけると嬉しいです。強化学習やファインチューニングとの違いを知りたいです
@pythonvtuber9917
@pythonvtuber9917 27 күн бұрын
ご視聴ありがとうございます!! 確かにGoogle Cloudに慣れていないと後半は難しいかもですね😵 LLM+RAGのリクエストありがとうございます!考えてみますね!
@son-o9w
@son-o9w 26 күн бұрын
この、「滑舌の問題で文字起こしが変」という要素は、何らかの認証に使えないかとちょっと考えました。それくらい、フェイクやなりすましを恐れる昨今です。 この手のものは、まだマシンパワーに頼るところですよね。現実がSFを追い抜いたとわずかに思いつつも、まだSFのほうが先を行ってると実感すること多しです。スマホで大きなモデルが難なく動くとこまでが当面のゴールでしょうか。
@pythonvtuber9917
@pythonvtuber9917 25 күн бұрын
確かに完璧じゃないほうが人間っぽい感じがありますよね! スマホで大きなモデルを動かすとなるとハードの方ももっと進化する必要があるかもですね🤔
@milkman5966
@milkman5966 27 күн бұрын
v3が発表されてからしばらく経つけど次は発表されないのだろうか🤔
@pythonvtuber9917
@pythonvtuber9917 27 күн бұрын
キャプションにも書いたのですが先週にturboというモデルが追加されていましたね!
@milkman5966
@milkman5966 27 күн бұрын
@@pythonvtuber9917 ありがとうございます! ※マーク見逃しておりました😅 試しに使ってみたら比較にならない程早くなっていて驚きました!!!
@Unmo1234
@Unmo1234 27 күн бұрын
감사합니다. 이번에 tensorflow & OCR로 번호인식 프로젝트 하려고합니다. 이 영상으로 약간 도움됬네요
@pythonvtuber9917
@pythonvtuber9917 27 күн бұрын
시청 해 주셔서 감사합니다
[1hr Talk] Intro to Large Language Models
59:48
Andrej Karpathy
Рет қаралды 2,2 МЛН
Yay, My Dad Is a Vending Machine! 🛍️😆 #funny #prank #comedy
00:17
小蚂蚁会选到什么呢!#火影忍者 #佐助 #家庭
00:47
火影忍者一家
Рет қаралды 128 МЛН
НИКИТА ПОДСТАВИЛ ДЖОНИ 😡
01:00
HOOOTDOGS
Рет қаралды 3,1 МЛН
🕊️Valera🕊️
00:34
DO$HIK
Рет қаралды 18 МЛН
Webページの見た目を整えよう!!【CSSの基本】〜初心者向け〜
50:42
Pythonプログラミング VTuber サプー
Рет қаралды 6 М.
初心者は何を使えばいい?【Pythonの仮想環境を比較】〜オススメを紹介 〜
44:04
Pythonプログラミング VTuber サプー
Рет қаралды 31 М.
【スピードUP】Pythonを速くさせる方法を13個ご紹介!!
17:08
Pythonプログラミング VTuber サプー
Рет қаралды 16 М.
[Introduction to VSCode] Customize the free editor VSCode for Python coding! ~Beginners~
17:01
Pythonプログラミング VTuber サプー
Рет қаралды 242 М.
【Pythonプログラミング入門】デコレータを解説! 〜VTuberと学習〜【初心者向け】
20:40
Run your own AI (but private)
22:13
NetworkChuck
Рет қаралды 1,6 МЛН
【Linux入門】初心者向け!Linuxの基本的なコマンド操作を学ぼう!  〜 Ubuntu 環境で実演〜
1:10:37
Yay, My Dad Is a Vending Machine! 🛍️😆 #funny #prank #comedy
00:17