产品名称

SC-OPS

产品类别:

OPS

OPS

SC-OPS是加速云推出新一代PCIe加速卡,采用Intel最新 14 纳米制造工艺,比上一代芯片核心性能提升了 2 倍,功耗降低多达 70%,芯片集成2753KLE和9.2T FLOPS单精度浮点处理能力;板载8个72bit 2400MHz DDR4内存控制器(ES芯片支持2133MHz),最大支持64GB内存容量,支持153.6GB/S的访问带宽;单板支持2个标准QSFP 40GE/100GE光口(H-Lite支持);可以广泛应用于深度学习、机器视觉、数字信号处理、高性能计算、边缘计算、云计算等领域。为了方便客户二次开发,我们提供支持面向OpenCL的SDK开发环境和BSP,方便客户快速开发。



主板系统框图


OPS


规格列表

1.采用Intel Stratix 10 GX2800器件,集成2753K LE和9.2T FLOPS单精度浮点处理能力和18.4TMACS处理能力

2.板载8个72bit 2400MHz DDR4内存控制器(ES芯片支持2133MHz),最大支持64GB内存容量,支持ECC,支持153.6GB/S的访问带宽

3.板卡支持2个4X serdes高速接口,单通道 serdes 速率最大支持 17.5Gbps,或配置为2个QSFP 40GE/100GE光口(H-Lite支持)

4.板卡支持PCIe 3.0 16Lane接口,单向访问带宽为128Gbps

5.支持OpenCL开发,提供完善的BSP包

6.支持AES-256/SHA-256 比特流加密/认证、物理不可克隆功能  (PUF)

7.物理尺寸:全高3/4长(112*254mm)

8.单板典型功耗120W

 

性能指标

1.单卡实现16K浮点FFT只需要0.5us,是TI 6678 60倍性能

2.单板支持10个200维双精度线性方程求解,运算时间为466us,为x86系统60~ 120倍性能

3.单卡可以实现400帧/S以上图像分类识别(采用YOLOV2卷积神经网络模型,int8)

采用Intel Stratix 10 GX2800器件,集成2753K LE和9.2T FLOPS单精度浮点处理能力和18.4TMACS处理能力

板载8个72bit 2400MHz DDR4内存控制器(ES芯片支持2133MHz),最大支持64GB内存容量,支持ECC,支持153.6GB/S的访问带宽

板卡支持2个4X serdes高速接口,单通道 serdes 速率最大支持 17.5Gbps,或配置为2个QSFP 40GE/100GE光口(H-Lite支持)

板卡支持PCIe 3.0 16Lane接口,单向访问带宽为128Gbps

支持OpenCL开发,提供完善的BSP包

支持AES-256/SHA-256 比特流加密/认证、物理不可克隆功能  (PUF)

物理尺寸:全高3/4长(112*254mm)

单板典型功耗120W

 


单卡实现16K浮点FFT只需要0.5us,是TI 6678 60倍性能

单板支持10个200维双精度线性方程求解,运算时间为466us,为x86系统60~ 120倍性能

单卡可以实现400帧/S以上图像分类识别(采用YOLOV2卷积神经网络模型,int8)



产品应用场景

OPS


SC-OPS加速卡可以可以应用于人工智能领域中的语音识别、图像分类识别、自然语言处理等领域;数字信号处理领域的雷达信号处理、雷达系统仿真、电子对抗、5G信号处理、水声信号处理等领域;高性能计算领域的基因比对、电磁兼容/力学模态等仿真系统;云计算领域的压缩解压缩、纠删码、智能网络加速等领域。

数字信号处理加速方案

1.MUSIC 算法目前在波达方向估计(DOA)的相关应用中,大多数是一些对实时性要求不太严格的应用,如对雷雨天气的研究,对慢速船舶的定位等.但在移动通信,电子侦察以及电子对抗等对实时性要求严格领域中受到限制,究其原因,主要是因为MUSIC算法包含非常大的计算量,现有系统的处理速度难以满足实际应用的需要。

2.由于整个MUSIC算法计算复杂度和灵活度都很大,同时大多的EW系统多要求浮点处理,所以国内大多采用DSP处理器,时间停留在ms量级。本方案采用Intel最新的浮点FPGA全硬件实现基于MUSIC算法的空间谱估计DOA 全部算法。相对于TI的DSP处理器,极大提升了MUSIC算法的实时性,超过10倍以上的性能改进。

3.本方案具有体积小,系统功耗低,性能高等优点。特别适用于弹上应用。(体积功耗受限的高性能处理应用)

 

OPS



相关推荐 / Recommend
2013 - 11 - 29
SC-OPM是加速云专为SBB架构的高密度刀片服务器定制的加速卡,可以插入各种高密度服务器。采用Altera最新20nm工艺的A10 660/1150 FPGA,集成 660K/1150k LE和1.5T/1.3T FLOPS单精度浮点处理能力,单板支持2个40GE电口,提供2*40GE的互联能力,板载3个DDR4,支持高带宽和大容量的存储访问;可以广泛应用于深度学习、机器视觉、数字信号...
2013 - 11 - 29
SC-OPS是加速云推出新一代PCIe加速卡,采用Intel最新 14 纳米制造工艺,比上一代芯片核心性能提升了 2 倍,功耗降低多达 70%,芯片集成2753KLE和9.2T FLOPS单精度浮点处理能力;板载8个72bit 2400MHz DDR4内存控制器(ES芯片支持2133MHz),最大支持64GB内存容量,支持153.6GB/S的访问带宽;单板支持2个标准QSFP ...
2013 - 11 - 29
SC-OPF 是加速云推出新一代加速卡,采用两颗Intel Arria10 GX660/GX1150器件,单颗芯片集成660/1150K LE和1.5T/1.3T FLOPS单精度浮点处理能力;单板支持4个40G光口或者电口,支持板间通讯以及设备间级联;板载6个DDR4通道, 支持高带宽和大容量的存储访问;可以广泛应用于深度学习、机器视觉、数字信号处理、高性能计算、边缘计算、云计算等领域。为了方便...
2018 - 10 - 17
SC-FDNN是加速云推出基于FPGA可配置深度学习网络加速引擎,为基于FPGA深度学习研究搭建了一个整体灵活高效的软硬件开发环境,极大的简化了FPGA深度学习研究的开发过程并缩短了深度学习网络FPGA实现的研发周期,降低了广大科研人员使用FPGA进行深度学习神经网络开发的技术门槛,在高性能和高灵活性之间达到了较好平衡,可灵活可配的进行FPGA深度学习网络模型搭建,同时也能获得较高的处理性能。可以...
TEL:0571-81112331 (周一至周五 9:00-18:00)
E-mail:customer@speed-clouds.com
Address:杭州市西湖区文一西路830号蒋村商务中心B1-4F
  • 二维码名称
    二维码名称
    扫一扫

Share us:

Copyright ©2018 - 2020 杭州加速云信息技术有限公司  犀牛云提供企业云服务
犀牛云提供企业云服务
X
1

QQ设置

3

SKYPE 设置

4

阿里旺旺设置

5

TEL

  • 0571-81112331
6

官方公众号

返回顶部
展开