概述:
通过程序接口,输入图片base64数据,返回json格式的识别结果,返回的json数据中包含图片文字信息、文字的坐标信息、表格结构信息,可高度还原图片上的文字结构、表格样式等,真正做到高准确率、高可用性。
通用表格OCR识别在线演示网址
接口地址: http://api.xinhuokj.com:40072/ocr
type值 : 11
token值: 请在用户中心获取token,网址xinhuokj.com/user
HTTP头字段
Content-Type: application/json
HTTP正文体
{
"image": "/9j/4AAQSkZ......./9k=", //图片文件二进制数组经过base64编码后的字符串,目前支持jpg、tif、png、bmp等多种格式
"type": "11" ,
"token": "ef9c*************dbca", //请在用户中心获取token,网址:https://www.xinhuokj.com/user
}
字段 | 说明 |
---|---|
code | 返回状态码。200:正常返回; 500:服务器内部错误 |
message | 返回对应code的状态说明 |
data | 识别结果 |
+rotated_image_width | 旋转后图片宽度 |
+rotated_image_height | 旋转后图片高度 |
+block_array | 图片区域识别结果 |
++type | 当前区域类型(1为表格,0为非表格) |
++position | 当前区域的坐标(左上角起,顺时针一周四角坐标形成的集合) |
++form_rows | 行总数 |
++form_columns | 列总数 |
++data | 识别内容(若非表格部分,显示文字内容,若为表格,则为空) |
++form_temps | 单元格集合 |
+++start_row | 单元格起始行(单元格在首行时,start_row为0) |
+++start_column | 单元格起始列(单元格在首列时,start_column为0) |
+++end_row | 单元格终止行 |
+++end_column | 单元格终止列 |
+++data | 单元格内容 |
+++position | 单元格坐标(左上角起,顺时针一周四角坐标形成的集合) |