比如,从整体执行效率来看,经过 Megatron 优化的几乎所有模型都有 30% 的吞吐量提升,并且随着模型大小的增加,可以实现更高的 GPU 利用率。在 1750 亿参数的 GPT-3 模型上,GPU 利用率可以达到 52.8%。
但是发现如此强大的配置玩不少游戏时并不比以前的老电脑快,甚至在一些较老的游戏中比老电脑还卡顿,仔细一查看才发现玩这些游戏时,GPU和CPU的占用率都很低,也就是说强力的硬件实际上都在“磨洋工”,并没有发挥出应有实力。