从数据视角看OCR研究进展与未来技术挑战
发布时间:2023-10-12阅读量:

主讲人:金连文

主要内容:

光学字符识别(OCR)是一个重要的基础性的人工智能问 题,在文档数字化、图像理解、电子商务、智慧金融等许多领 域具有非常广泛的应用前景。本报告拟从数据角度出发,重新 审视光学字符识别领域的的技术现状、面临的挑战以及未解决 的问题。并介绍最近几年从数据视角应对这些挑战的一些新进 展,如大规模多样式版面数据集的构建与版面分析新方法、基 于大规模合成数据的文档图像文本篡改检测新技术、基于 PDF 与拍照文档对齐的低成本真实场景数据构建新方法等。此 外,我还将对大模型时代 OCR 技术发展趋势与方向进行讨论 和展望。

时间:2023年10月13日上午10:20

地点:计算机与信息工程学院明理1-105