Пікірлер
@user-sw3vd5ks2n
@user-sw3vd5ks2n 4 сағат бұрын
看,听,说 结合起来用在机器人上想起来起来有点可怕啊
@mspark6599
@mspark6599 6 сағат бұрын
@franklee6588
@franklee6588 11 сағат бұрын
把AI影片追成了连续剧,感谢老师!
@skyacaniadev2229
@skyacaniadev2229 13 сағат бұрын
做语音的要先转 spectrogram 然后用 CNN 加 transformer 吗?
@chakery3
@chakery3 14 сағат бұрын
我又來學習了!
@akingtoy
@akingtoy 15 сағат бұрын
感謝老師
@user-gh2bl7ly4y
@user-gh2bl7ly4y 15 сағат бұрын
太棒了
@forestren1525
@forestren1525 16 сағат бұрын
有背景音樂🎶,啊,原來是這樣,可能是直接音訊訓練出來的,原來可能是這樣。。。太有趣了
@zy5522
@zy5522 16 сағат бұрын
謝謝老師!!
@KbaMercury
@KbaMercury 18 сағат бұрын
請問老師,這個方法也能應用在ddpm這類的模型上嗎?
@v86861062
@v86861062 18 сағат бұрын
好有趣(笑)
@richardwang1162
@richardwang1162 19 сағат бұрын
我發現他好像不會唱歌🤣
@pulap3211
@pulap3211 20 сағат бұрын
請問預言家生出的兩個預測,再跑model後的「第三個」(綠色) 對於下一次的預測或輸出有什麼影響嗎? 影片內容沒有提到這部分
@jiayu7428
@jiayu7428 20 сағат бұрын
老师这是连夜爆肝啊😂❤❤
@jaybestemployee
@jaybestemployee 21 сағат бұрын
其實gpt4都經常沒有足夠邏輯能力,這次4o也沒有特別的期待。這次多模態也只是增加了輸入輸出的方式(語音,視力), 但是如果還是偶爾突發沒邏輯,幻想,失憶什麼的。那只會是一個不知累的尬聊專家,但正經事/長期是沒什麼重要價值的。不過要是能做一只不用吃東西,也不會掉毛,也可以開關(你不想它晚上亂叫) 的AI鸚鵡寵物,或許也不錯
@chinawalk
@chinawalk 22 сағат бұрын
gpt 在说话的时候的背景音乐,其实是为了区分 gpt说话还是人类说话。这个方式非常好。因为gpt可能是全程录音。这样可以把自己说的话排除出去。
@user-mm7ot5zq2c
@user-mm7ot5zq2c 23 сағат бұрын
我記得OpenAI有提到GPT-4o 主要是省略了原本都要經過文本的轉換,GPT-4o直接把語音做成LLM,故而能大幅提高回應效率,聲音情緒辨識並非GPT-4o的主要改良關鍵,這次老師似乎搞錯方向
@Britas1030
@Britas1030 21 сағат бұрын
你有看完嗎
@betterworld-liu
@betterworld-liu 23 сағат бұрын
下课!
@user-uh4gm8ls8n
@user-uh4gm8ls8n Күн бұрын
現在連官方技術報告都沒有了不過也可以理解
@tommyyu2063
@tommyyu2063 Күн бұрын
就像電影雲端情人 我們離這個以前只出現在想像中和電影裡的未來 越來越近了
@willy7703
@willy7703 Күн бұрын
我10幾年讀大學的時候 有想過模型可以改良得更好 但我還沒想過 10年左右的時間 AI可以發展到這種高強度...
@sdyeung
@sdyeung Күн бұрын
還有一個問題待解是 這個 voice chat 的 gpt 4o 跟 prompt based 的gpt 4o 是不是同一個模型
@nameisroy1991
@nameisroy1991 Күн бұрын
說不定是請幾千個印度人在後面回答問題
@hct0204
@hct0204 Күн бұрын
感謝您
@wayhi3308
@wayhi3308 Күн бұрын
分析很有道理,确实有洞察力
@xygen9527
@xygen9527 Күн бұрын
感覺這堂課過不久 老師的聲音就會被4o取代了
@user-zr4bh5kj4e
@user-zr4bh5kj4e Күн бұрын
听、说、看分离讲解得很清晰,谢谢老师
@banthailand
@banthailand Күн бұрын
追老師的生成式Al講座,像追劇,感恩!前天還在想,老師什麼時後講ChatGPT-4o,現在就等到了!很多年前,我們都認為機器人不會有情感,但現在看了ChatGPT-4o的表現,應該會讓很多人改變觀點了,情感是在聽覺中的,思考則包含在視覺中,語言意思感則包含在"口說"中,這是人類的特性!Ai可以做到了
@tsajm6bh
@tsajm6bh Күн бұрын
太好了, 很久沒看到老師對新技術的分析了, 希望以後除了基本理論的內容,也更新多一些新論文解讀和新技術的分析。現在ai的發展太快了。
@jungjung7996
@jungjung7996 Күн бұрын
好小聲
@zzzjohnpaper
@zzzjohnpaper Күн бұрын
謝謝老師
@user-xv4he4mt4x
@user-xv4he4mt4x Күн бұрын
誰花時間聽你在那邊「猜測」?
@fanchuankang1228
@fanchuankang1228 Күн бұрын
🙇‍
@janson7463
@janson7463 Күн бұрын
可以先訓練一個理解音樂與歌曲的模型,使之分離情境與歌詞。之後再分別處理個別的資訊,這樣也算是一個單一模型。包含多模態行為與解構。同理可用於更多的模態,但重點是訊號輸入的初期,利用一個大模型做分離,而不再利用特殊目的單純模型。與之對稱的生成是輸出,收到來自於多個模態的結果時,有一個預先處理語調資料來源,找到最接近的幾個候選者,再開始生成。因此不需要即時混成情緒與語調。有點類似歌曲生成。
@user-tj1pl5tg5e
@user-tj1pl5tg5e Күн бұрын
@chinawalk
@chinawalk Күн бұрын
情绪,说话人识别,语气,都是可以识别。只是需要很强的算力才能很快很快。所以,算力足够强,那速度就足够快。就能块到 gpt4o的样子。
@BruceChouTW
@BruceChouTW Күн бұрын
最愛這種拆解產品技術的內容,比論文解讀更有趣
@Hara_GameTW
@Hara_GameTW Күн бұрын
配個早餐剛剛好❤
@zhasilo
@zhasilo Күн бұрын
不在大學了,還是要上早八,不對,是早三。感謝李老師。
@Ethan76620
@Ethan76620 Күн бұрын
❤❤
@user-cl8gb6ud9r
@user-cl8gb6ud9r Күн бұрын
其實在open ai的gpt-4語音交談時就有求同感受了,至少跟google 小姐不同,希望之後的導航google 小姐回應可以更人性一點!
@sdyeung
@sdyeung Күн бұрын
我沒有用過現時openai 的語音交談 現時可否打斷gpt 說話? Update: 是可以手動打斷的
@user-mm7ot5zq2c
@user-mm7ot5zq2c 23 сағат бұрын
@@sdyeung AI在回應時,本來就允許再輸入新的內容
@louis-dieudonne5941
@louis-dieudonne5941 25 минут бұрын
成本太高了
@bubble996
@bubble996 Күн бұрын
好棒ㄛ 可以ㄔ美味蟹堡配影片 賺爛了😍
@user-nn8vb4gp4f
@user-nn8vb4gp4f Күн бұрын
謝謝老師~要早點休息😊😊😊
@mengyuge3369
@mengyuge3369 Күн бұрын
谢谢李老师
@wuhaipeng
@wuhaipeng Күн бұрын
非常棒的讲解!
@YetEthanOnly
@YetEthanOnly Күн бұрын
額外模組才是聰明人幹的事情😂
@user-xx9wi6wh6l
@user-xx9wi6wh6l Күн бұрын
对于音色 (GPT说话的声音), 我有一点想法: 1. 音色被encoder忽略了, 那么音色就是由decoder来决定的, GPT的训练阶段不需要考虑音色. (传统的ASR-Text-TTS这个里面, text就是没有包含音色信息的) 2. 音色也可能被encoder编码了, 这样子就很有意思了, 可能在prompt里, 就能指定gpt, 请用什么样的声音和我说话. 还是希望能快点用到gpt4o, 体验一下
@c2c246
@c2c246 Күн бұрын
謝謝老師,在下立刻開始上課!
@tony10130
@tony10130 Күн бұрын
太香了
@wedxzass
@wedxzass Күн бұрын
老師太愛AI了,一大早起來就看到有新影片,謝謝老師~~