当前产品名称

SC-OPM

  • 产品简述
  • 系统规格
  • 产品运用



SC-OPM

SC-OPM是加速云专为SBB架构的高密度刀片服务器定制的加速卡,可以插入各种高密度服务器。采用Altera最新20nm工艺的A10 660/1150 FPGA,集成 660K/1150k LE和1.5T/1.3T FLOPS单精度浮点处理能力,单板支持2个40GE电口,提供2*40GE的互联能力,板载3个DDR4,支持高带宽和大容量的存储访问;可以广泛应用于深度学习、机器视觉、数字信号处理、高性能计算、边缘计算、云计算等领域。为了方便客户二次开发,我们提供支持面向OpenCL的SDK开发环境和BSP,方便客户快速开发。



主板系统框图

SC-OPM


规格列表

1.采用Intel Arria10 GX660/GX1150器件,集成660/1150K LE和1.5T/1.3T FLOPS单精度浮点处理能力

2.板载最大支持3组DDR4 2133MHz 64bit颗粒,最大支持24GB内存容量和51.192GB/S访问带宽

3.板卡支持PCIE3.0 8Lane接口,单向访问带宽为64Gbps

4.板卡支持2个高速互联接口,速率可配置为40G/10G/1G,光电可选

5.支持OpenCL开发,提供OpenCL开发BSP库

6.物理尺寸:半高半长(56*167mm)

7.单板典型功耗40W


性能指标

1.单卡可以实现86帧/S以上图像分类识别(采用YOLOV2卷积神经网络模型,int8)

2.单卡实现1路16K浮点FFT只需要3us,是TI 6678 500倍性能

3.单板支持2个200维双精度线性方程求解,运算时间为466us,为x86系统30倍性能


产品应用场景和方案

SC-OPM

SC-OPM加速卡可以可以应用于人工智能领域中的语音识别、图像分类识别、自然语言处理等领域;数字信号处理领域的雷达信号处理、雷达系统仿真、电子对抗、5G信号处理、水声信号处理等领域;高性能计算领域的基因比对、电磁兼容/力学模态等仿真系统;云计算领域的压缩解压缩、纠删码、智能网络加速等领域;工业领域的机器视觉和工业互联网,完成图像识别、分类、缺陷检测和ETHCAT协议加速。

深度学习加速方案


SC-OPM

1.整体网络为7层,总运算量为84M,激活函数为SIGMOD/SOFTMAX

2.各层网络参数和偏移参数可配置,处理数据通道可配

3.提供标准API接口,可以快速完成上层软件对接

4.单卡处理120路语音8ms完成,功耗只有33W左右,性能功耗比为K40的5倍

5.可以广泛应用于语音识别、语义识别、图像处理等领域

6.可根据客户具体应用需求提供快速定制各种深度学习方案(DNN/CNN/RNN)

数字信号处理加速方案


SC-OPM

SC-OPM




产品应用场景和方案

SC-OPM

SC-OPM加速卡可以可以应用于人工智能领域中的语音识别、图像分类识别、自然语言处理等领域;数字信号处理领域的雷达信号处理、雷达系统仿真、电子对抗、5G信号处理、水声信号处理等领域;高性能计算领域的基因比对、电磁兼容/力学模态等仿真系统;云计算领域的压缩解压缩、纠删码、智能网络加速等领域;工业领域的机器视觉和工业互联网,完成图像识别、分类、缺陷检测和ETHCAT协议加速。

深度学习加速方案


SC-OPM

1.整体网络为7层,总运算量为84M,激活函数为SIGMOD/SOFTMAX

2.各层网络参数和偏移参数可配置,处理数据通道可配

3.提供标准API接口,可以快速完成上层软件对接

4.单卡处理120路语音8ms完成,功耗只有33W左右,性能功耗比为K40的5倍

5.可以广泛应用于语音识别、语义识别、图像处理等领域

6.可根据客户具体应用需求提供快速定制各种深度学习方案(DNN/CNN/RNN)

数字信号处理加速方案


SC-OPM

SC-OPM


文件格式:
文件大小: 1330830
日期: 2018 - 11 - 18
Copyright ©2018 - 2020 杭州加速云信息技术有限公司 犀牛云提供企业云服务