主讲人:金连文
主要内容:
光学字符识别(OCR)是一个重要的基础性的人工智能问 题,在文档数字化、图像理解、电子商务、智慧金融等许多领 域具有非常广泛的应用前景。本报告拟从数据角度出发,重新 审视光学字符识别领域的的技术现状、面临的挑战以及未解决 的问题。并介绍最近几年从数据视角应对这些挑战的一些新进 展,如大规模多样式版面数据集的构建与版面分析新方法、基 于大规模合成数据的文档图像文本篡改检测新技术、基于 PDF 与拍照文档对齐的低成本真实场景数据构建新方法等。此 外,我还将对大模型时代 OCR 技术发展趋势与方向进行讨论 和展望。
时间:2023年10月13日上午10:20
地点:计算机与信息工程学院明理1-105