薪火科技首页

通用表格OCR识别接口文档——薪火科技

概述: 通过程序接口,输入图片base64数据,返回json格式的识别结果,返回的json数据中包含图片文字信息、文字的坐标信息、表格结构信息,可高度还原图片上的文字结构、表格样式等,真正做到高准确率、高可用性。
通用表格OCR识别在线演示网址


接口地址: http://api.xinhuokj.com:40072/ocr

type值  : 11

token值: 请在用户中心获取token,网址xinhuokj.com/user



HTTP头字段

Content-Type: application/json

HTTP正文体

{

"image": "/9j/4AAQSkZ......./9k=", //图片文件二进制数组经过base64编码后的字符串,目前支持jpg、tif、png、bmp等多种格式

"type": "11" , 

"token": "ef9c*************dbca", //请在用户中心获取token,网址:https://www.xinhuokj.com/user

}




可用postman工具调试,结果如下图所示:


返回字段描述

字段 说明
code 返回状态码。200:正常返回; 500:服务器内部错误
message 返回对应code的状态说明
data 识别结果
+rotated_image_width 旋转后图片宽度
+rotated_image_height 旋转后图片高度
+block_array 图片区域识别结果
++type 当前区域类型(1为表格,0为非表格)
++position 当前区域的坐标(左上角起,顺时针一周四角坐标形成的集合)
++form_rows 行总数
++form_columns 列总数
++data 识别内容(若非表格部分,显示文字内容,若为表格,则为空)
++form_temps 单元格集合
+++start_row 单元格起始行(单元格在首行时,start_row为0)
+++start_column 单元格起始列(单元格在首列时,start_column为0)
+++end_row 单元格终止行
+++end_column 单元格终止列
+++data 单元格内容
+++position 单元格坐标(左上角起,顺时针一周四角坐标形成的集合)