跳到主要内容

文字识别API

接口描述

文字识别接口,支持返回位置。

请求说明

URL

https://openapi.ocr.sys303.com/api/v1/ocr/general?access_token={token}

参数

URL参数
参数
access_token通过API Key和Secret Key获取的access_token
Header参数
参数
Content-Typeapplication/x-www-form-urlencoded
Body参数
参数是否必选类型可选值范围说明
image四选一string-图像数据,base64编码后进行urlencode,大小不超过10M,最短边至少15px,最长边最大8192px,支持jpg/jpeg/png/bmp格式优先级:image > url > pdf_file > ofd_file
language_typestring0识别语言类型,默认藏文【0:藏文,1:中文】
url四选一string【开发中】图片完整url,url长度不超过1024字节,url对应的图片base64编码后大小不超过10M,最短边至少15px,最长边最大8192px,支持jpg/jpeg/png/bmp格式优先级
pdf_file四选一string【开发中】PDF文件,base64编码后进行urlencode,大小不超过10M,最短边至少15px,最长边最大8192px优先级:image > url > pdf_file > ofd_file
ofd_file四选一string【开发中】OFD文件,base64编码后进行urlencode,大小不超过10M,最短边至少15px,最长边最大8192px优先级:image > url > pdf_file > ofd_file
pdf_file_numstring【开发中】需要识别的PDF文件的对应页码,当 pdf_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页
ofd_file_numstring【开发中】需要识别的OFD文件的对应页码,当 ofd_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页
recognize_granularitystring【开发中】是否定位单字符位置,big:不定位单字符位置,默认值;small:定位单字符位置
detect_directionstring【开发中】是否检测图像朝向,默认不检测,即:false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括:- true:检测朝向- false:不检测朝向输入非正向图片时,若想要达到较好识别效果,建议将此参数设置为“true”
vertexes_locationstring【开发中】是否返回文字外接多边形顶点位置,不支持单字位置。默认为false
paragraphstring【开发中】是否输出段落信息
probabilitystring【开发中】是否返回识别结果中每一行的置信度

请求样例

curl --request POST \
--url 'https://openapi.ocr.sys303.com/api/v1/ocr/general?access_token=【替换为有效的 access_token】' \
--header 'content-type: multipart/form-data' \
--form 'image=【替换为图片路径】' --form language_type=0

返回说明

参数说明

字段是否必选类型状态说明
log_iduint64-唯一的log id,用于问题定位
words_result_numuint32-识别结果数,表示words_result的元素个数
paragraphs_result_numuint32识别结果数,表示 paragraphs_result的元素个数
words_resultarray[]-识别结果数组
+ wordsstring-识别结果字符串
+ locationstring【开发中】字符串位置信息
++ topstring【开发中】表示定位位置的长方形左上顶点的垂直坐标
++ leftstring【开发中】表示定位位置的长方形左上顶点的水平坐标
++ widthstring【开发中】表示定位位置的长方形的宽度
++ heightstring【开发中】表示定位位置的长方形的高度
+ probabilityobject【开发中】识别结果中每一行的置信度值,包含average:行置信度平均值,variance:行置信度方差,min:行置信度最小值,当 probability=true 时返回该字段
paragraphs_resultarray[]【开发中】段落检测结果,当 paragraph=true 时返回该字段
+ words_result_idxarray[]【开发中】一个段落包含的行序号,当 paragraph=true 时返回该字段
pdf_file_sizestring【开发中】传入PDF文件的总页数,当 pdf_file 参数有效时返回该字段
ofd_file_sizestring【开发中】传入OFD文件的总页数,当 ofd_file 参数有效时返回该字段
directionint32【开发中】图像方向,当 detect_direction=true 时返回该字段。- 1:未定义- 0:正向- 1:逆时针90度- 2:逆时针180度- 3:逆时针270度

返回样例

成功
{
"logId": 0,
"words_result_num": 2,
"words_result": [
{
"words": "藏文识别",
"location": {
"left": 0,
"top": 0,
"width": 0,
"height": 0
}
},
{
"words": " 晟邦科技",
"location": {
"left": 0,
"top": 0,
"width": 0,
"height": 0
}
}
]
}
失败
{
"error_code": 110,
"error_msg": "Access token invalid or no longer valid"
}