【GPU】GPU架构入门指南 | GPU内部工作原理 | 执行过程 | 如何运行kernel | GPU与CPU有什么不同 | CUDA | Warp

  Рет қаралды 17,531

Best Partners TV

Best Partners TV

Күн бұрын

Пікірлер: 15
@xiaolong174
@xiaolong174 10 ай бұрын
GPU毕竟不是专门为AI时代设计的,CUDA在支持Tensor core上也存在软件碎片化的问题,期待DSA黄金时代,有AI原生的体系架构芯片出现。
@yugao6766
@yugao6766 10 ай бұрын
都是干货,没有花里胡哨的东西😮
@JasonKuanCapillaryJ
@JasonKuanCapillaryJ 4 ай бұрын
給個建議,如果是要入門介紹,我覺得講的太深(像Warp那邊講太細) 如果是要做深入介紹,影片可以再多加一些範例來演示(例如動畫) 不然聽起來就像是念經一樣,不如英翻中官方文件自己看
@W大猫
@W大猫 10 ай бұрын
很有内涵。超水准的中文解说。
@BigBigSmile
@BigBigSmile 10 ай бұрын
期待更多gpu硬件知识
@FusionDraw9527
@FusionDraw9527 10 ай бұрын
感謝分享 雖然都聽不懂 不過真的很專業
@li-pingho1441
@li-pingho1441 10 ай бұрын
牛逼
@johnw2799
@johnw2799 10 ай бұрын
我个人理解,gpu容忍高延迟类似电路的并联,cpu单线程类似串联。gpu做的事就不是cpu的。而且线性矩阵一通优化下来,那些延迟,错误啊这些,很自然地“平均”到接近无限趋近于0。这是数学性质……
@dodomakudo1783
@dodomakudo1783 10 ай бұрын
显卡是为了加速图形计算,而图形本身就是一个矩阵,因此显卡并行处理能力很强…
@leimiles18
@leimiles18 10 ай бұрын
请问移动平台的 GPU 也可以按照这个架构来理解吗?例如 ARM 的 shader core,它的作用更像是 cuda core ,还是 sm 呢?谢谢
@maxxu8818
@maxxu8818 8 ай бұрын
应该不太一样,nv gpu把GPU做到通用计算GPGPU了,移动GPU 只要应该还是渲染目的为主,pixel shading, fragment shading etct.
@jenkinssmith9125
@jenkinssmith9125 10 ай бұрын
寄存器多就是为所欲为啊
@czxjack180
@czxjack180 4 ай бұрын
H100的SM可以处理32个线程块、64个warp(2048个线程)。为什么又是每个线程块拥有1024个线程?
@wright_chen
@wright_chen 3 ай бұрын
这里应该是如果一个SM有32个线程块,那么每个线程块处理64个线程将用使得利用率达到100%。 然后线程块包含1024个线程应该是后面的例子部分吧
@kib695690926
@kib695690926 2 ай бұрын
顯示卡給誰用!輸出的零件
VAMPIRE DESTROYED GIRL???? 😱
00:56
INO
Рет қаралды 7 МЛН
НАШЛА ДЕНЬГИ🙀@VERONIKAborsch
00:38
МишАня
Рет қаралды 2,5 МЛН
CPU vs GPU vs TPU vs DPU vs QPU
8:25
Fireship
Рет қаралды 1,8 МЛН