基于FPGA的图片OCR解决方案

来源:
浏览次数: 22



某电商平台每天要面对大量的客户开店和业务申请需求,需要对海量的营业执照等证件审核。随着业务的增长,传统人工审核是不可能完成;采用深度学习的图片OCR(光学字符识别)就是一个很好的解决方案。基于深度学习的图片OCR方案包括文字定位和文字识别两部分,文字定位采用4层CNN网络,文字识别采用4层双向LSTM。由于CNN部分计算量不大,主要的计算量在LSTM,因此对LSTM部分加速。一般方案采用GPU完成,但存在两个问题:1.处理延时很大,不能满足要求 2.有些图片中的文字超长,在超长文字和一般长度文字一起送入GPU处理时二者所用时间一样,这使得业务无法到达上线条件。


LSTM模型及FPGA加速方案


基于FPGA的图片OCR解决方案



系统规格


加速云采用FPGA方案实现双向LSTM的加速,满足客户要求;具体方案特性如下:

1.采用SC-OPM加速卡(半高*半长:56mm*167mm)

2.Intel®Arria10 GX660器件,集成 660k LE,具备1.5T FLOPS 单精度浮点处理能力

3.四层LSTM+1层全连接,各层网络参数可以软件配置下载

4.可以实现40000T/S的流量,延时超低,数据长度可以为混合长度

5.单卡只有33W



应用场景


该方案可应用在各种图片文字识别的场景(例如档案文件的图片转文字),如果应用在军事领域,可包含军舰舷号图像识别、飞机编号识别,敏感词涉密信息鉴别等方向,可以满足高性能的OCR识别算法加速以及超低延时的实时性要求。


基于FPGA的图片OCR解决方案



聚行业优势,创领域品牌 快速开启专属您的全屋智能方案
全国热线电话 86 0755-2955 6666 快速开启
TEL:0571-81112331 (周一至周五 9:00-18:00)
E-mail:customer@speed-clouds.com
Address:杭州市西湖区文一西路830号蒋村商务中心B1-4F
  • 二维码名称
    二维码名称
    扫一扫

Share us:

Copyright ©2018 - 2020 杭州加速云信息技术有限公司  犀牛云提供企业云服务
犀牛云提供企业云服务
X
1

QQ设置

3

SKYPE 设置

4

阿里旺旺设置

5

TEL

  • 0571-81112331
6

官方公众号

返回顶部
展开