softmax是为了解决归一问题凑出来的吗?和最大熵是什么关系?最大熵对机器学习为什么非常重要?

  Рет қаралды 13,777

王木头学科学

王木头学科学

Күн бұрын

Пікірлер: 19
@benny81305
@benny81305 3 ай бұрын
這頻道是寶藏嗎?
@xylineone
@xylineone 3 жыл бұрын
很好的内容希望视频主能继续坚持做下去
@ztc106
@ztc106 2 ай бұрын
沒想到我二年就看過,現在再看一次。之前的影片,entropy 部分,log 的底數2,這次 log 的底數為 e。Up主在 bili bili 解釋「以2为底,log计算出来的信息量单位是bit,以e为底计算出来的信息量单位是纳特/nats,本质相通,单位不同。」
@chiaominchang
@chiaominchang 8 ай бұрын
耶看完了 要再複習一下交叉 感謝
@ztc106
@ztc106 3 жыл бұрын
46:01 裡的式子都必須都為 0,是因為「對所有可能的 x,P(tilde)(x) > 0 都成立」嗎?
@ixy6864
@ixy6864 2 жыл бұрын
23:32 傅里叶变换与概论密度函数共轭!!!
@chenning1799
@chenning1799 2 жыл бұрын
我感觉你说到1个分类和2个分类的区别,好像不怎么合适。其实,我觉得1个分类跟2个分类从概率来说,分别不大。一个分类,你给到的标签是非此即彼,其实也算是2类,一个是正确的分类,一个是错误的分类,总概率也是1,只是我们只需要求出正确的分类的概率。而两个分类问题,如果这两类不能构成一个集合,那么这应该算是三分类的问题,但如果你从softmax来定义,那么你就默认了这两分类就是构成一个集合。所以这两分类跟一分类是一样的,都是非此即彼。我觉得你哪怕用sigmoid求都可以,因为知道一个概率后,另一个自然而然就知道了。
@yutingchang9735
@yutingchang9735 4 ай бұрын
為什麼不乾脆中間不用relu?如果relu是為了避免sigmoid/softmax梯度消失,其實relu也很像線性方程式,中間層直接不使用激活函數,最後一層再套用sigmoid/softmax是否一樣效果?
@LichengBao-to6eb
@LichengBao-to6eb Жыл бұрын
非常棒!
@masonalex3000
@masonalex3000 Жыл бұрын
对于任意x, y 式子恒为0,那么每一项都必须为0,不然就不是对于任意 x, y
@qiangqi-u6k
@qiangqi-u6k Жыл бұрын
最大墒得出softmax的形式,那这里面的eq,ep的想等的约束,和最后的误差最小,是一回事?
@weizhang5023
@weizhang5023 Жыл бұрын
👍👍👍
@hxie9881
@hxie9881 3 жыл бұрын
filter 的值怎样定义?有一定的标准码?
@weizhang5023
@weizhang5023 Жыл бұрын
文档可以分享吗
@jameshu497
@jameshu497 2 жыл бұрын
softmax为什么要使用指数,而不是平方?王老师是否有研究过?我的直觉是平方容易产生0,其次可能指数能让梯度更大,平方不利于收敛
@dediver832
@dediver832 7 ай бұрын
平方不是单调的啊
@minglee5164
@minglee5164 Жыл бұрын
42:50 处,感觉原问题才是max min吧
@逸叶之楸见微知足
@逸叶之楸见微知足 3 жыл бұрын
在你研究的科学的人工智能智商超高常人前,教会它伦理道德。
@joetsai4676
@joetsai4676 3 жыл бұрын
因为这几项不相关啊,所以只能是都为零相加才能保证为零
This Game Is Wild...
00:19
MrBeast
Рет қаралды 186 МЛН
Do you love Blackpink?🖤🩷
00:23
Karina
Рет қаралды 21 МЛН
Turn Off the Vacum And Sit Back and Laugh 🤣
00:34
SKITSFUL
Рет қаралды 7 МЛН
За кого болели?😂
00:18
МЯТНАЯ ФАНТА
Рет қаралды 3,2 МЛН
2027,人類終結 | 老高與小茉 Mr & Mrs Gao
30:03
老高與小茉 Mr & Mrs Gao
Рет қаралды 662 М.
卷积神经网络(CNN)详细介绍及其原理详解
1:25:12
【機器學習2021】Transformer (下)
1:00:34
Hung-yi Lee
Рет қаралды 162 М.
什么是卷积神经网络?卷积到底卷了啥?
15:56
妈咪说MommyTalk
Рет қаралды 78 М.
如何理解信息熵
12:25
Ele实验室
Рет қаралды 33 М.
This Game Is Wild...
00:19
MrBeast
Рет қаралды 186 МЛН