葡萄糖氯化钠注射作用是什么| 南昌有什么特产| 专案组是什么意思| 大三阳转小三阳意味着什么| 公安和警察有什么区别| 检查乳腺挂什么科| 清和是什么意思| 鹦鹉代表什么生肖| 雾化治疗的作用是什么| 皮质醇高是什么原因| 九九年属什么| 腹股沟淋巴结肿大挂什么科| 梦见吃粉条是什么预兆| 穿堂风是什么意思| 子宫直肠窝积液是什么意思| 一国两制什么时候提出的| 拉疙瘩屎是什么原因| 什么运动减肥最快| 宝姿是什么档次的牌子| 黑色皮肤适合什么颜色的衣服| 鼓上蚤是什么意思| 墙内开花墙外香是什么意思| 花木兰属什么生肖| 四川九寨沟什么时候去最好| 龋病是什么意思| 肌肉僵硬是什么原因| 血压低吃什么| 夏天容易出汗是什么原因| 大便很黄是什么原因| 咖啡与什么食物相克| 儿童回春颗粒主要治什么| 血小板计数高是什么原因| 红曲红是什么东西| 七月三十是什么星座| 什么是叠词| 什么是九宫格| 手抖是什么病| 九秩是什么意思| 哪吒妈妈叫什么名字| 一闪一闪的星星像什么| 什么是食品添加剂| 印度信仰什么教| 淋巴细胞高是什么原因| 马虎眼什么意思| 男人额头凹陷预示什么| 妇科炎症用什么药| 流产吃什么药可以堕胎| 骨髓增生活跃是什么意思| 取环挂什么科| 窦性心律不齐是什么意思| 女人小肚子疼是什么原因| 男生适合学什么专业| 血用什么能洗掉| 女性长胡子是什么原因| 妇科炎症用什么药好| 三月是什么生肖| 红细胞体积偏高是什么意思| 益是什么意思| 左手小指和无名指发麻是什么原因| 甚嚣尘上是什么意思| 人几读什么| 过火是什么意思| 猩红热是什么| 急性肠胃炎吃什么药| 声带白斑是什么病严重吗| 六月十三是什么日子| 总是嗳气是什么原因| 什么叫正盐| 黄喉是牛的什么部位| ricu病房是什么意思| 朱元璋为什么杀蓝玉| 马齿苋吃了有什么好处| 肚脐眼叫什么穴位| 什么是肛瘘| 手发抖吃什么药| 脚酸臭是什么原因| 陕西为什么叫三秦大地| 急性湿疹用什么药膏| 冰箱什么牌子的好| 4月8日是什么星座| hcv是什么意思| 女性腰疼应该挂什么科| ori是什么意思| sport是什么意思| 赏脸是什么意思| 荨麻疹要注意什么| 梦见别人买房子是什么预兆| 鹿沼土是什么土| 柏拉图式恋爱是什么意思| 节瓜煲汤放什么材料| 老人家脚肿是什么原因引起的| 红色的月亮是什么征兆| 黄瓜与什么相克| 牙疼吃什么药最好最有效| 江河日下是什么意思| 被紫外线灯照到有什么后果呀| 过度换气是什么意思| 肌肉僵硬是什么原因| 小腿痒痒越挠越痒是什么原因| 牙周炎吃什么药好| 990金是什么金| 胃不好早餐吃什么好| 早搏吃什么药最好| 疣是什么东西| 喝苦荞茶有什么好处和坏处| 做什么运动能瘦肚子| 精卫填海是什么意思| 缺钙会导致什么| 备孕吃什么药| 早晚体重一样说明什么| 市长属于什么级别| 马齿苋什么人不能吃| 孕妇白蛋白偏低是什么意思| 肺结节吃什么中成药| 蜜蜡什么样的成色最好| 烧酒是什么酒| 什么是酸性食物| 优五行属性是什么| 女人喜欢什么样的阴茎| 咽喉痛吃什么药好得快| 长期喝苦荞茶有什么好处| 流年什么意思| 幼儿牙齿黑是什么原因| 脚面麻木是什么原因| 科班出身是什么意思| 荆芥的别名叫什么| 破壁是什么意思| 一什么种子| 破壁机是干什么用的| 禁的拼音是什么| 祖坟冒青烟是什么意思| 朱棣是朱元璋的什么人| 你正在干什么用英语怎么说| 什么病不能坐飞机| 胸围98是什么罩杯| 开封有什么好玩的地方| 咳嗽吃什么食物好得快| 来褐色分泌物是什么原因| 飞机为什么怕小鸟| 元旦是什么节日| 排卵是什么| 用什么消肿最快| 女人脚抽筋是什么原因| 什么七八什么| 转氨酶高说明什么| 雨花斋靠什么盈利| 脊髓灰质炎是什么病| 牙齿打桩是什么意思| 月半是什么意思| 准妈妈是什么意思| 航五行属什么| 查肝胆胰脾肾挂什么科| 梦见打死蛇是什么意思| 北京市市长是什么级别| 小孩吃什么补脑更聪明| 肌酐偏高是什么意思| 全青皮是什么皮| 四个又念什么| 中性粒细胞偏高是什么原因| 什么是二型糖尿病| 皮肤发黄什么原因| 缺少雌激素的女性会有什么症状| 男人经常熬夜喝什么汤| 现在做什么最赚钱| 环移位了会出现什么症状| 肾阳虚是什么意思| 娘娘命是什么样的命| 466是什么意思| 香松是什么| 补体c1q偏低说明什么| 乳房里面有硬块是什么原因| 杀跌是什么意思| 均一性红细胞什么意思| 电压高是什么原因造成| 14是什么意思| 空腹喝酒有什么危害| 双相情感障碍是什么病| 古驰是什么牌子| 多春鱼为什么全是籽| 宝宝肌张力高会有什么影响| 白头翁吃什么| 同房后需要注意什么| 汤去掉三点水念什么| 福建安溪名茶是什么| 为什么会得面瘫| 痔疮可以吃什么| 经期吃什么食物比较好| 乔峰和洪七公什么关系| 颈动脉b超是检查什么| ml代表什么单位| 十月一日是什么节| 玉皇大帝和王母娘娘是什么关系| 脂肪液化是什么意思| 吃什么增强抵抗力| 血液发黑是什么原因| 公举是什么意思啊| 木芙蓉什么时候开花| 肾虚吃什么药| 三元及第是什么意思| 乌龟为什么不吃东西| 辩证思维是什么意思| 木志读什么| o型血可以接受什么血型| 喝咖啡有什么好处| 教唆什么意思| 尿检弱阳性是什么意思| 封神是什么意思| 什么是植物神经功能紊乱| 梦里见血代表什么预兆| 刮目相看是什么意思| 心肌酶高有什么症状| 出院小结是什么| 女字五行属什么| 甲亢能吃什么水果| 小丑叫什么| 渚是什么意思| 身份证最后一位代表什么| 什么的贾宝玉| 什么是1型和2型糖尿病| 耷拉是什么意思| 煲排骨汤放什么材料好| 1972年属鼠的是什么命| 肾上腺素是什么意思| 什么情况下吃奥司他韦| 左手臂发麻是什么原因| 面包虫是什么| 梦见吃老鼠肉是什么意思啊| 7月26日是什么星座| 红色加蓝色等于什么颜色| 两毛二是什么军衔| 喉部有异物感是什么病| 梦见妖魔鬼怪是什么意思| 现在钱为什么这么难挣| 黑眼圈严重是什么原因| 早上嘴苦是什么原因| 兜售是什么意思| 0r是什么意思| 杉菜是什么意思| gsp全称是什么| april是什么意思| 马克笔是什么笔| 过度纵欲的后果是什么| 吉利丁片是什么| 陈酿是什么意思| 近视手术有什么后遗症| 人活着的意义是什么| 舌苔发白吃什么药| 什么鱼蛋白质含量高| 1996年属鼠五行属什么| 手掌上的三条线分别代表什么| 蓝色小药丸是什么| 江湖是什么| 风湿和类风湿有什么区别| 腥臭味是什么妇科病| 腋臭挂什么科室| 十月十号是什么星座| 数字是什么意思| 易建联为什么不打nba| u盘什么牌子好| 蝌蚪吃什么食物| 绿色和红色混合是什么颜色| 吃什么头发能变黑| 燕窝是什么做的| 4月16什么星座| 百度
资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

微信沟通的当下 你有多久没登陆过QQ?

使用说明

本文档主要说明如何在 iOCR 通用版的可视化界面中完成模板、分类器及字段类型的自定义,同时对模板图片预处理、框选表格识别区等高级功能进行说明。视频教程请参见 iOCR通用版使用教程

自定义模板

创建自定义模板的基本流程如下图所示,仅需上传一张规范的模板图片,通过简单框选,5 分钟即可完成结构化识别模板的制作。

自定义模板流程

Step 1: 上传模板图片

iOCR通用版 - 模板管理页面 点击「自定义模板」标签页下方 「创建模板」 按钮,在弹出框中上传一张 字迹清晰且摆放端正 的模板图片(大小不超过4M,最长边不超过4096像素),并对模板进行命名。

自定义模板1

Step 2: 框选参照字段

进入模板编辑页面,右侧操作步骤中选择 「第1步:框选参照字段」 标签,左侧工具栏选择 「框选参照字段」 按钮,使用鼠标在模板图片中框选位置和内容都固定不变的文字,如下图所示 橘色矩形 框选区域。

自定义模板2

注意: 「参照字段」为相同版式的不同图片中位置和内容固定不变的字段,可做为图片的锚点,用做对后续传入的图片进行模板匹配和矫正

框选Tips:

  1. 参照字段个数需保证在4个以上(推荐8个以上),并尽量分散在四角
  2. 单个参照字段不可跨行,推荐字数在4个以内
  3. 参照字段文字内容在上下文中不会重复出现
  4. 仅支持框选中英文、数字,不可包含符号、图案

Step 3: 框选识别区

右侧操作步骤中点击 「第2步:框选识别区」 标签,左侧工具栏选择 「框选识别区」 按钮,使用鼠标在模板图片上框选业务场景需要进行识别的字段,如下图所示 蓝色矩形 框选区域;同时,填写 「字段名称」,并选择合适的 「字段类型」 以提高识别准确率。

自定义模板3

注意:「识别区」为图片中需要进行识别的字段,可通过框选及命名构建 「字段名称 : 识别区内容」 的 Key : Value 对应关系,用于对后续传入的相同版式图片的相同位置内容进行结构化识别

框选Tips:

  1. 尽量扩大识别区框选范围,保证后续传入图片的对应字段内容可被完全覆盖,但同时也需保证不框选到其他字段内容
  2. 选择合适的字段类型有助于提升字段识别效果
  3. 如需识别图片内列宽固定的表格,可点击工具栏中「插入表格」按钮框选表格识别区,可参考 表格识别区使用说明

Step 4: 试一试

参照字段和识别区全部框选完毕后,可点击页面右上角的 「试一试」 按钮进行识别效果测试,在弹出框中上传任意一张相同版式的图片即可,如下图所示。可点击图片下方「更换图片」按钮更换测试图片,如多次测试效果满意即可进行发布;如效果不满意可返回继续编辑。

自定义模板4

注意:

  1. 如试一试结果出现图片无法匹配模板的情况,需确认上传的测试图片与模板图片是否为同一版式,如确认无误可调节参照字段框选范围或更换参照字段,以提升模板匹配准确率
  2. 如试一试结果中出现识别结果错误的情况,可调整识别区框选范围或更换识别区字段类型,以提升识别准确率

Step 5: 发布模板,调用API进行使用

如测试效果满意,可点击试一试弹出框右下角的 「立即发布」 按钮或模板编辑页面右上角的 「发布」 按钮进行发布,发布成功后即可通过模板ID调用该模板,调用方式可查看 API文档

自定义模板5

注意: 只有发布后的模板才能通过线上接口进行调用,如果编辑未发布,那么仅仅是生成了一个新的版本,此时对模板的任何修改都不会影响线上调用。

自定义分类器

创建自定义分类器的基本流程如下图所示,仅需针对每个模板上传 30 张相同版式的训练集图片或填写分类关键词,即可自动训练一个能够对所选模板进行自动分类的分类器。

自定义分类器流程

Step 1: 选择模板

iOCR通用版 - 分类器管理页面 点击下方 「创建分类器」 按钮,在弹出框中填写「分类器名称」及「功能描述」,填写完毕点击 「确认」 即可进入分类器编辑页面。

在分类器编辑页面中点击 「添加预置模板」「添加自定义模板」,选择 已发布的 自定义模板或系统预置模板加入训练队列。

自定义分类器1

说明:

预置模板: 系统预置的常用卡证、票据模板,已上传100张训练集图片并已填写分类关键词信息,可直接勾选用于对应图片的自动分类和结构化识别

自定义模板: 已发布的自定义模板

Step 2: 上传训练集/填写分类关键词

点击选中的自定义模板所在行右侧的 「编辑训练集」 按钮,在弹出框中上传一个包含 30 张以上相同版式图片、不超过 200MB 的 ZIP 格式压缩包。

自定义分类器2

注意: 「图片训练集」为针对已发布的识别模板上传的相同版式的图片集合,用于训练分类器对后续上传的图片进行自动分类;为了最佳的分类效果,训练集至少包含 30 张以上不重复的、版式相同的图片;系统模版已预置 100 张训练集图片,无需上传

也可在「分类关键词」列填写对应模板图片中的关键文字内容,需保证填写的关键词在该版式图片中均有出现,且具有特异性,可根据填写的关键词唯一确定图片所属模板类别

如身份证人像面的“姓名”、“性别”、“民族”、“出生”、“公民身份号码”五个字段在每一张身份证人像面均会出现,且 5 个字段全部出现时基本可确定该图片为身份证人像面,则此 5 个字段即可作为身份证人像面的分类关键词

注意:每个模板最多可设置 5 个分类关键词,每个关键词最多包含 15 个中英文字符,不可包含其他特殊符号,关键词之间使用(中/英文)逗号进行间隔

Step 3: 训练

参与分类的模板及其训练集图片数量或分类关键词符合标准后,即可点击页面左下角的 「开始训练」 按钮进行训练,等待训练完毕后即可在分类器列表中进行查看,训练完成后的分类器有以下三种分类形式:

  • 纯图片特征分类器:如所有模板各上传了 30 张以上相同版式训练集图片,但均未填写分类关键词,则训练出的分类器将完全依据图片特征进行分类;
  • 纯文字特征分类器:如所有模板均填写了分类关键词,但部分或全部模板未上传训练集图片,则训练出的分类器将完全依据关键词的文字信息进行分类;
  • 图文协同分类器:如所有模板各上传了 30 张以上相同版式训练集图片,且部分或全部模板填写了分类关键词,则训练出的分类器将先进行关键词匹配,如匹配到相同关键词则再根据图片特征进行区分。

自定义分类器3

Step 4: 测试

在分类器管理页面的分类器列表中点击训练完毕的分类器右侧的 「测试」 按钮进行效果测试,在弹出框中上传任意一张图片即可,如下图所示,测试结果中包含分类结果及结构化识别结果。可点击图片下方「更换图片」按钮更换测试图片,如多次测试效果满意即可进行发布;如效果不满意可返回继续编辑。

自定义分类器4

Step 5: 发布

如测试效果满意,可点击测试弹出框右下角的 「立即发布」 按钮或分类器列表右侧的 「发布」 按钮进行发布,发布成功后即可通过分类器ID调用该分类器,实现图片的自动分类及结构化识别,调用方式可查看 API文档

自定义分类器5

自定义字段类型

创建自定义字段类型的基本流程如下图所示,仅需输入全部可能出现的输出值,即可创建一个自定义字段类型在制作模板时进行使用,用于字段识别结果的规范和智能纠正。

自定义字段类型流程

Step 1: 编辑字段词典

iOCR通用版 - 字段类型管理页面 点击下方 「创建字段类型」 按钮,在弹出框中填写「字段类型名称」及「词典内容」,在词典内容中列举全部可能出现的输出值内容,填写完毕点击 「立即创建」 即可完成创建;也可点击 「添加预置类型」 按钮直接添加预置的常用字段类型,无需自行编辑词典内容。

自定义字段类型1

Step 2: 开始使用

创建成功的字段类型即可在制作自定义模板选择字段类型时,点击 「我的字段类型」 进行勾选使用,使用后即可对该字段的识别结果进行规范或智能纠正。

自定义字段类型2

高级功能

模板图片预处理

为保证模板的识别效果,建议上传的模板图片 字迹清晰且摆放端正,以保证后续传入的同版式图片能被匹配、矫正并准确识别。

如您无法保证上传的模板图片摆放端正,可 在框选参照字段/识别区前 通过我们提供的模板图片预处理功能对模板图片进行 旋转/透视裁剪 操作纠正倾斜图片。

图片旋转

点击编辑区左侧工具栏中的 「图片旋转」 按钮,即可进入旋转处理页面。

在旋转处理页面,使用鼠标按住上方旋转按钮拖动图片顺时针/逆时针旋转,旋转效果满意后松开鼠标点击 「保存」 按钮即可。

图片旋转

图片透视裁剪

点击编辑区左侧工具栏中的 「透视裁剪」 按钮,即可进入裁剪处理页面。

在裁剪处理页面,使用鼠标按住四角点小圆点进行拖拽,使四边紧贴卡证或票据边缘,拖拽完毕后点击 「保存」 按钮即可。

图片裁剪

框选表格识别区

如果要识别的图片中存在行列固定的表格,可点击工具栏中的 「插入表格」 按钮添加指定列数的表格识别区,通过拖拽表格四角及列分隔线的小白点使识别区覆盖表格区域,并使各列识别区与表格各列对应,即可对表格内容进行结构化识别。

注意: 表格识别区仅需覆盖表格内容,无需将表头内容进行框选

表格识别区框选

如您在操作过程中出现上述内容未说明的问题,可参考 iOCR常见问题,或在OCR论坛发布您的问题,也可加入百度iOCR交流群(群号:570832882)与更多开发者进行交流。

上一篇
简介
下一篇
API文档
沵是什么意思 中暑吃什么药见效快 腹泻可以吃什么食物 锦州有什么大学 尿检白细胞阳性是什么意思
肌肉型肥胖是什么意思 hco3-是什么意思 唇炎属于什么科 盛世美颜是什么意思 为什么会有子宫肌瘤
雪燕是什么 宝宝流鼻血是什么原因 四月二十一是什么星座 喝金银花有什么好处 6月18日是什么节日
做梦梦到蛇是什么意思 朝鲜战争的起因是什么 早博是什么意思 脖子红是什么原因 食管反流吃什么药
反清复明是什么意思hcv8jop4ns9r.cn 菩提萨婆诃是什么意思cj623037.com 黑色碳素笔是什么笔hcv7jop9ns2r.cn 技压群雄的意思是什么hcv9jop2ns0r.cn 意味深长是什么意思hcv7jop5ns1r.cn
黄芪泡水喝有什么好处hcv9jop1ns5r.cn 什么叫桑黄hcv8jop3ns2r.cn 属马的男生和什么属相最配hcv9jop7ns2r.cn 公司董事是什么职务yanzhenzixun.com pe和pb是什么意思hcv9jop0ns4r.cn
做梦梦见水是什么意思hcv8jop0ns5r.cn 怕老婆的男人说明什么hcv8jop8ns8r.cn 乳腺发炎有什么症状hcv9jop8ns0r.cn 卖什么小吃简单挣钱inbungee.com 新生婴儿吃什么奶粉gysmod.com
胰岛素的作用是什么hcv8jop4ns5r.cn mhc是什么意思hcv8jop0ns4r.cn 过是什么结构hcv9jop2ns7r.cn 便秘有什么症状hcv8jop4ns4r.cn 法盲是什么意思hcv8jop3ns0r.cn
百度