八旗云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 100|回复: 5

9万块的显卡A100 80G跑stable diffusion是什么体验

[复制链接]

1

主题

1

帖子

3

积分

新手上路

Rank: 1

积分
3
发表于 2023-4-14 20:55:42 | 显示全部楼层 |阅读模式
为了测试Nvidia A100 80G跑stable diffusion的速度怎么样,外国小哥Lujan在谷歌云服务器上申请了一张A100显卡进行了测试,
   A100显卡是英伟达公司生产的一款高端的计算卡,专门用于数据科学、深度学习、人工智能、高性能计算等领域。A100显卡基于英伟达的Ampere架构,拥有6912个CUDA核心,57亿个晶体管,128GB HBM2E(High Bandwidth Memory 2nd Generation)内存,256MB Infinity Cache、6个NVLink互连通道等特性,具有强大的并行计算能力,能够优化计算任务的速度和效率。此外,A100显卡还支持Tensor Cores张量核心和Volta架构中的FP64和FP16混合精度算法,可以快速完成大规模的机器学习和深度学习模型训练。
要想使用谷歌的A100,需要向谷歌说明原因并填写申请表,费用是1.15刀每小时,




通过申请后,小哥在谷歌云服务器上安装了显卡驱动并且成功部署了stable diffusion程序,


经过几轮跑图测试数据如下,跑图 步数50,在生成512512图片的时候,A100居然也要14秒,英伟达T4需要36.9秒,MacBook M1 需要138秒,在生成10241024图片的时候,苹果电脑直接爆了显存,A100花了27秒,T4 281秒,在生成1024*2048 图片的时候,苹果和T4都爆了显存,A100则花了92秒。都知道制图分辨率选择越高,成图的细节会越多,图片最后的效果也就越好。


生成 2048x2048图片时,通过nvidia-smi 命令 可以看到 A100 的一些参数情况。


但是在尝试一次性生成20张 2048X2048图片的时候,A100也爆了显存。


找到一张GPU性能排行表,可以看到H100的性能远远领先于其他显卡, 但是这张表把RTX 4090 和4080 排在了A100前面,难道9万的卡还不如1.4万的4090吗?

回复

使用道具 举报

0

主题

1

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-4-14 20:55:51 | 显示全部楼层
谁能解释下为什么呢
回复

使用道具 举报

0

主题

1

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-4-14 20:56:09 | 显示全部楼层
据说A100用的是3090一样的老架构。40系用了Ada架构后跑AI厉害了很多倍。
回复

使用道具 举报

0

主题

3

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-4-14 20:57:07 | 显示全部楼层
因为这东西吃单和半精度,游戏卡单和半精度比较高
回复

使用道具 举报

0

主题

1

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-4-14 20:57:51 | 显示全部楼层
文中附图的性能是单位美元的相对性能对比,考虑的是性价比,不是绝对性能的排名
回复

使用道具 举报

1

主题

3

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2023-4-14 20:57:59 | 显示全部楼层
这个在国内云平台租要便宜的多
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|八旗云

GMT+8, 2025-10-12 03:15 , Processed in 0.124289 second(s), 24 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表