专访 Lomin 代表 Kang Jihong
以 AI 驱动的 OCR 技术引领市场
迎来数字化转型时代,众多产业对大数据的构建与利用需求日益高涨。如今,大量数据以数字设备、媒体友好的方式被生产和保存,但在过去,长期以来数据的生产与保存主要依赖活字印刷品。因此,为了将长期积累的海量活字印刷物作为大数据加以利用,对光学字符识别(OCR)技术的需求也随之增加。OCR是将印刷文档转换为数字图像文件的技术。国内有一家利用人工智能开展OCR技术、引领市场的企业,备受关注,这就是Lomin。
Lomin代表Kang Jihong于7日接受《亚洲经济》采访时表示:“我们长期思考,如何才能让文档业务更加高效、更加自动化,由此构想出了‘文档人工智能(Document AI)’这项技术。当前正致力于打造一个让全球所有企业都能轻松实现文档业务自动化的平台,并在此基础上不断提升技术水平。”
Lomin的主力服务是“Textscope Studio”。这是一个可以自动处理和利用文档数据的平台。借助以深度学习为基础的计算机视觉(CV)、自然语言处理(NLP)等最新人工智能技术支撑的OCR,对文档进行识别和分类,并准确、快速地提取业务所需数据。它可以将各种形式的文档转换为可利用的数据形态,并以最高效的方式实现文档处理自动化。同时,还提供多种关联人工智能技术,帮助用户让转换后的数据发挥更高价值。
Textscope Studio最大优势在于识别率高。即便是低分辨率、低质量文档以及手写文档,也能以极高精度进行识别。其印刷体识别率达到98.07%,手写体检测性能为98.38%,打字体识别率为98.3%。
30日,在首尔瑞草区公司大楼内,Romin代表 Kang Jihong 正在接受《亚洲经济》采访。照片由记者 Kim Hyunmin 提供 kimhyun81@
View original imageKang代表解释称:“字符识别技术本身已经存在很久,但真正应用深度学习还没多久。自2016年以来,我们就一直专注于利用深度学习的相关技术,并持续开展研发工作。”
凭借技术实力,Lomin与国内多家一流金融企业合作,逐步建立起信任。在Kakao Bank的非面对面住房抵押贷款业务中,就应用了Lomin的技术。包括登记权利证、身份证、印鉴证明、在职证明等各类文件,都能自动识别并完成信息处理。在KB国民卡方面,不仅在客户身份证认证环节,而且在信用卡加盟商审核流程中,也都在使用Lomin的相关技术。
Kang代表表示:“金融业大量开展企业对个人(B2C)业务,在众多行业中处理的文书数量是最多的,文档业务处理自动化的需求自然非常旺盛。从成本节约角度看,也能大幅降低人工成本,因此有很多金融机构在使用我们的技术。”
Lomin也在不断提升其个人信息保护技术。近期推出了人工智能基础的个人信息过滤及去标识化解决方案“Textscope Privacy Guard”服务。作为个人信息检测与去标识化解决方案,它可以在图像文档或文本文档中的图像里准确检测出个人信息,并根据不同目的提供相应的去标识化功能。尤其是对于以图形字体或手写方式书写的个人信息,以及低分辨率图像中的个人信息,也能进行精确检测。例如,一旦识别出居民身份证号码,就会自动进行遮盖处理。
Kang代表预测称:“近期因姓名、居民登记号码、住址等未被遮挡而导致个人信息泄露的事故频繁发生。今后,不仅政府所属机构,包括大型平台企业和金融圈在内,各方对个人信息安全的重视程度都会进一步提升。”
Kang代表把进军英语国家市场列为今年的目标之一。他表示:“我们所提供服务的价值在于节省人力成本和时间。因此,在人工成本较高的英语国家,尤其是美国、欧洲等‘所谓富裕国家’,我们预期需求会非常旺盛。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。