塑胶五金网 产品 会员
1785-L80C15

1785-L80C15

发布时间:2019-03-07 16:51:14点击率:

所属行业:五金工业品-> 电子电工-> 配电装置、开关柜、照明箱
价格:¥662
规格:1785-L80C15
供货总量:65

1785-L80C15

1785-L80C15 

一种不太复杂的常用算法是FFT。使用单精度浮点实现了4096点FFT。它能够在每个时钟周期输入输出四个复数采样。每一个FFT内核运行速度超过80 GFLOP/s,大容量FPGA的资源支持实现7个这类的内核。

但是,如图1所示,这一FPGA的FFT算法GFLOP/s接近400 GFLOP/s。这是“按键式”OpenCL编译结果,不需要FPGA专业知识。使用逻辑锁定和DSE进行优化,7内核设计接近单内核设计的Fmax,将其GFLOP/s提升至500,超过了10 GFLOP/s每瓦。

这一每瓦GFLOP/s要比CPU或者GPU功效高很多。对比一下GPU,GPU在这些FFT长度上效率并不高,因此,没有进行基准测试。当FFT长度达到几十万个点时,GPU效率才比较高,能够为CPU提供有效的加速功能。

在FPGA上优化实现复数浮点计算

图1:Altera StraTIx V 5SGSD8 FPGA浮点FFT性能。

总之,实际的GFLOP/s一般只达到峰值或者理论GFLOP/s的一小部分。出于这一原因,更好的方法是采用算法来对比性能,这种算法能够合理的表示典型应用的特性。算法越复杂,典型实际应用的基准测试就越具有代表性。

并不是依靠供应商的峰值GFLOP/s指标来确定处理技术,而是使用比较复杂具有代表性的第三方评估。高性能计算理想的算法是Cholesky分解。

这一算法经常用于线性代数,高效的解出多个方程,可以实现矩阵求逆功能。这一算法非常复杂,要获得合理的结果总是要求浮点数值表示。计算需求与N3成正比,N是矩阵维度,因此,一般对处理要求很高。实际GFLOP/s取决于矩阵大小以及所要求的矩阵处理吞吐量。

表1显示了基于Nvidia GPU指标1.35TFLOP/s的基准测试结果,使用了各种库,以及Xilinx Virtex6 XC6VSX475T,其密度达到475K LC,这种FPGA针对DSP处理进行了优化。用于Cholesky基准测试时,这些器件在密度上与Altera FPGA相似。

1785-L80C15

LAPACK和MAGMA是商用库,而GPU GFLOP/s是指采用田纳西州大学开发的OpenCL实现的。对于小规模矩阵,后者更优化一些。

中等规模的Altera StraTIx V FPGA (460kLE)也进行了基准测试,使用了单精度浮点Cholesky算法。如表2所示,在StraTIx V FPGA上进行Cholesky算法的性能要比Xilinx结果高很多。

在FPGA上优化实现复数浮点计算

表2:BDTI的Altera FPGA Cholesky和QR基准测试。

应指出,矩阵大小并不相同。田纳西州大学结果是从[512×512]矩阵大小开始的。BDTI基准测试达到了[360×360]矩阵大小。原因是,矩阵规模较小时,GPU效率非常低,因此,在这些应用中,不应该使用它们来加速CPU。在规模较小的矩阵时,FPGA的工作效率非常高。

其次,BDTI基准测试是基于每个Cholesky内核的。每个可参数赋值的Cholesky内核支持选择矩阵大小,矢量大小和通道数量。矢量大小大致决定了FPGA资源。较大的[360×360]矩阵使用了较长的矢量,支持这一FPGA中实现一个内核,达到91GFLOP/s。较小的 [60×60] 矩阵使用的资源更少,因此,可以实现两个内核,总共是2×39=78GFLOP/s。 小的[30×30]矩阵支持实现三个内核,总共是 3×26=78GFLOP/s。

FPGA看起来更适合解决数据规模较小的问题。原因之一是因为计算负载随N3而增大,数据I/O随N2增大, 终,随着数据的增加,GPU的I/O 瓶颈不再是问题。另一项考虑是吞吐量。随着矩阵规模的增大,由于每个矩阵的处理量增大,矩阵每秒吞吐量会大幅度下降。在某些点,吞吐量变得非常低,以至于无法满足很多应用的要求。在很多情况下,会分解大规模矩阵,处理每个小的子矩阵,以解决由于庞大的处理负载造成的吞吐量限制问题。

对于FFT,计算负载增加N log2 N,而数据I/O随N增大而增大。对于规模较大的数据,GPU是高效的计算引擎。作为对比,数据长度很短时,FPGA是高效的计算引擎,更适合FFT长度达到数千的很多应用,对于GPU,FFT长度是数十万。

1785-L80C15

本公司秉承“顾客至上,锐意进取”的经营理念,
坚持“客户 ”的原则为广大客户提供更加优质的服务。欢迎惠顾!

从事(DCS系统)(机器人系统)(大型伺服控制系统)模块 备件销售,公司主营(优势)产品内
容为分布式控制系统(DCS) ,可编程序控制器(PLC), MOTOROLA MVME工业用模组 ,工业控制通訊
转换器(Any) ,远端输出/输入模块(RTU) ,工业电脑(IPC)、 工业用低頻萤幕(IPC) ,人机
界面SCSI(50,68,80Pin) Any(Gateway)备件销售
                 
联系人:欧工
手机:18030229050                
电话:0592-5709821
传真:0592-5917519  
QQ 3151326358
邮箱 3151326358@qq

您的选择,我们的服务 

您的信赖,我们的品质

您的满意,我们的追求 您满意的选择


联系方式
姓名:  欧工
部门:  销售部
职位:  销售
电话:  
手机:  
  
地址:  福建厦门市厦门市思明区嘉禾路293号宝达大厦1003室
点此询盘
返 回

上一个:1785-L80B
下一个:1785-L80E
免责声明:以上所展示的信息由企业自行提供,内容的真实性、准确性和合法性由发布企业负责,塑胶五金网对此不承担任何保证责任

塑胶五金网-wap版