Dojo a 362 Petalflops 芯片

约 5,240 个结果

在新选项卡中打开链接

去年

zhihu.com
https://zhuanlan.zhihu.com
【芯片论文】Tesla超级计算机DOJO微架构 - 知乎 - 知乎专栏
它基于d1定制计算芯片，该芯片将354个独立处理器封装在一起，产生362 tflops的计算和440mb的内部静态随机存取存储器存储。在保持完全可编程性的同时，DOJO强调资源分配和极高带宽的互连，使其能够从小型系统一直扩展到 exaFLOP 超级计算机。
zhihu.com
https://zhuanlan.zhihu.com
陈巍：特斯拉Dojo芯片架构全面分析（超越GPGPU？）收录于《 …
一个特斯拉 Dojo芯片训练模组可以达到6组GPU服务器的性能，成本却少于单组GPU服务器。单台Dojo服务器算力甚至达到了54PFLOPS。只用 4 个 Dojo 机柜就能取代由 4000 颗 GPU 组成的 72 组 GPU 机架。Dojo 将通常需要几个月的AI计算（训练）工作减少到了1 周。
guancha.cn
https://user.guancha.cn › main › content
关于特斯拉Dojo芯片的一些疑问 - 观察者网风闻社区
2021年8月26日 · 这354个功能单元的全芯片可达到BF16或CFP8的362 TFlops和FP32的22.6 TFlops。它总共有645mm²和500亿个晶体管。每个芯片都有惊人的400W TDP，这意味着功率密度高于大多数配置的Nvidia A100 GPU。
eet-china.com
https://www.eet-china.com › mp
Tesla Dojo训练芯片，采用什么独特封装和技术设计？
2021年8月29日 · 在芯片上，Tesla拥有惊人的10TBps定向带宽，但这个数字在实际工作负载中意义不大。与 Tenstorrent 相比，特斯拉的一大优势是芯片之间的带宽明显更高。576 个 SerDes提供64Tb/s 或 8TB/s 的带宽。目前已知的最高外部带宽芯片是32Tb/s网络交换芯片。
bilibili.com
https://www.bilibili.com › opus
特斯拉Dojo架构大解析——道场微架构 - Hot Chips 34 - 哔哩哔哩
除了核心之外，特斯拉还通过专门为大规模部署设计Dojo芯片来节省模具区域。物理实现缩小后，道场内核在一个非常大的645毫米2模具上实现，称为D1。
xueqiu.com
https://xueqiu.com
特斯拉今天发布了 Dojo 超级计算机芯片，名为「D1」。单个芯片算力为 362 TFLOPS，25 个芯片 …
2021年8月21日 · 特斯拉今天发布了 Dojo 超级计算机芯片，名为「D1」。单个芯片算力为 362 TFLOPS，25 个芯片为一组，组成一个训练模块。算力可以达到 9 PFLOPS，接口带宽为 36 TB/s。
baidu.com
https://baijiahao.baidu.com
Dojo芯片细节发布！特斯拉ExaPOD将炼成「全球最快AI计算机」
该芯片具有 cpu 级别的计算能力和灵活性， i/o 带宽是网络芯片的2倍。处理能力达到每秒 1024 亿次。单芯片 BF16 精度下的算力高达362 TOPs，FP32算力则为22.6 TOPs。
baidu.com
https://baijiahao.baidu.com
运算性能突破360 TFLOPS，特斯拉展示全自动驾驶汽车AI训练芯片Dojo …
2021年8月30日 · 由354个训练节点所组成的D1模块芯片，其运算力更一举达到362 TFLOPS（每秒1万亿次浮点运算），若以目前市面已知的ML芯片 (TPU v3、GPU（HBM-Links互联）或其他创业公司ML芯片）性能来做比较，Tesla指出，D1算力表现还优于其他市面ML芯片，甚至比Google的TPU v3表现都还好。
qq.com
https://news.qq.com › rain
25颗芯片合一，特斯拉晶圆级Dojo处理器已投入量产_腾讯新闻
2024年5月5日 · 特斯拉设计的Dojo 超级电脑，核心在于训练模组（training tile），将25 颗D1 芯片排列为5×5 矩阵，芯片使用7 纳米制程，能容纳500 亿颗晶体管，提供 ...
tencent.com
https://cloud.tencent.com › developer › article
500亿晶体管，Dojo芯片细节发布！特斯拉ExaPOD将炼成「全球最 …
该芯片具有 cpu 级别的计算能力和灵活性， i/o 带宽是网络芯片的2倍。处理能力达到每秒 1024 亿次。单芯片 BF16 精度下的算力高达362 TOPs，FP32算力则为22.6 TOPs。
分页
- 1
- 2
- 3
- 4
- 下一页

【芯片论文】Tesla超级计算机DOJO微架构 - 知乎 - 知乎专栏

陈巍：特斯拉Dojo芯片架构全面分析（超越GPGPU？）收录于《 …

关于特斯拉Dojo芯片的一些疑问 - 观察者网风闻社区

Tesla Dojo训练芯片，采用什么独特封装和技术设计？

特斯拉Dojo架构大解析——道场微架构 - Hot Chips 34 - 哔哩哔哩

特斯拉今天发布了 Dojo 超级计算机芯片，名为「D1」。单个芯片算力为 362 TFLOPS，25 个芯片 …

Dojo芯片细节发布！特斯拉ExaPOD将炼成「全球最快AI计算机」

运算性能突破360 TFLOPS，特斯拉展示全自动驾驶汽车AI训练芯片Dojo …

25颗芯片合一，特斯拉晶圆级Dojo处理器已投入量产_腾讯新闻

500亿晶体管，Dojo芯片细节发布！特斯拉ExaPOD将炼成「全球最 …