开元周游
德国频道
查看: 2724|回复: 0
打印 上一主题 下一主题

NVIDIA®(英伟达™)Tesla C2050 / C2070 GPU计算处理器

[复制链接]
跳转到指定楼层
1#
发表于 19.3.2010 23:49:37 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 农大 于 19.3.2010 23:58 编辑

NVIDIA®(英伟达™)Tesla™ C2050 / C2070计算处理器让用户能够过渡到并行计算上来,为台式机赋予了小型集群的性能。
上市情况:Tesla C2050于2010年第二季度早期上市,Tesla C2070于2010年第三季度上市。



Tesla GPU的数量1
双精度浮点性能(峰值)520 GFlops - 630 GFlops
专用显存总容量

Tesla C2050
Tesla C2070



3GB GDDR5*
6GB GDDR5*
功耗190W (typical)



Tesla C2050 / C2070计算处理器基于代号为“Fermi”的全新CUDA GPU架构,完全专为高性能计算而设计。它支持诸多“必备”特性,能够满足技术领域与企业的需求。这些特性包括C++支持、可实现未压缩精确性以及可扩展性的ECC内存、以及相当于Tesla 10系列GPU计算产品8倍的双精度性能。Tesla 20系列计算系统带来与最新的四颗CPU比肩的性能,同时功耗为后者的1/20,搭建成本为后者的 1/10。

特性

基于大规模并行CUDA架构的GPU(图形处理器)以二十分之一的功耗以及十分之一的成本彻底改变工作站面貌,使其达到小型集群的性能。
在编程语言与API方面得到广泛支持的CUDA编程环境用户可以选择C语言、C++、OpenCL、DirectCompute或Fortran来表达应用程序的并行机制,利用“Fermi”GPU(图形处理器)的创新架构。
升级至多GPU系统,驾驭媲美小型服务器集群的性能在配备多颗GPU(图形处理器)的一台工作站上,解决大型难题的速度比小型服务器集群还要快。
IEEE 754单精度以及双精度浮点单元最高可实现600 Gigaflops双精度性能,能够更快地得出更精确的结果。
ECC支持为内存中的数据提供了保护,为应用程序增强了数据完整性与可靠性。寄存器文件、1级/2级缓存、共享内存、以及DRAM全部都在ECC保护之下。
最多6GB GDDR5计算存储器可更快地访问更大的数据集。
NVIDIA®(英伟达™)并行数据缓存(DataCache)技术能够对事先不知道数据地址的算法进行加速,例如物理解算器、光线追踪、以及稀疏矩阵乘法等等。
NVIDIA®(英伟达™)GigaThread引擎通过更快的上下文切换、同时内核执行以及改善的线程块调度功能,最大限度提升了吞吐量。
异步传输功能通过在计算的同时进行数据传输,增强了系统性能。
高速、PCI-Express Gen 2.0数据传输率在CPU与GPU(图形处理器)之间能够实现高速、高带宽通信。


Nvidia表示,C2050和C2070图形处理器的零售价分别是2499美元(约为16,999元人民币)和3999美元(约为27,199元人民币)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点信息

站点统计| 举报| Archiver| 手机版| 小黑屋

Powered by Discuz! X3.2 © 2001-2014 Comsenz Inc.

GMT+1, 28.1.2025 07:04

关于我们|Apps

() 开元网

快速回复 返回顶部 返回列表