基于Paddle的表格结构化技术精讲:原理到实战
课时介绍
对表格识别的传统方法做一个大致介绍,分为哪些类型,都用什么实现的,有个传统方法的认识,以及有哪些缺点
课程介绍
随着各类文档的爆炸性增长,文档智能领域的研究蓬勃发展。其中,表格是各类文档中常见的页面元素,如何高效地从文档中找到表格并获取内容与结构信息即表格识别,是文档智能的一个重要领域。
本课程就是讲述文档智能领域的一个分支:表格结构化识别。这里不得不说的是目前一个非常流行的开源项目PaddleOCR(Star达到25.1k),它的一个分支PPStructure更是此开源项目的一个亮点,用于解决文档智能(版面分析、版面恢复、表格结构化、信息抽取等)领域的问题。
本课程也是在该开源项目基础上,从背景到难点、从传统方法到深度学习、从数据到训练、从模型理论到实战,全面讲解表格结构化识别技术:
1)算法模型:着重讲解LGPMA(海康威视)、TableMASTER(平安财险)、TableRec-RARE(PPstructurev1)、SLANet(PPstructurev2)模型;
2)语料构建:提供开源数据、标注工具(PPOCRLabelv2)、自动生成工具(TableGeneration)三个维度的语料构建方法
3)项目实战:讲解PPstructure表格识别的关键源码,并全流程实现项目环境安装、准备自己的数据集、修改配置文件、模型训练及评估、模型导出环节
推荐课程
信息系统项目管理师自考笔记
李明 · 537人在学
python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据
王先生 · 20816人在学
手把手搭建Java超市管理系统【附源码】(毕设)
汤小洋 · 4093人在学
Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教
黄菊华 · 734人在学
基于SSM酒店管理系统(毕设)
小尼老师 · 794人在学
java项目实战之购物商城(java毕业设计)
Long · 5110人在学
手把手搭建Java求职招聘系统【附源码】(毕设)
汤小洋 · 1469人在学
Python Django 深度学习 小程序
钟翔 · 2251人在学
城管局门前三包管理系统+微信小程序(vue+springboot)
赖国荣 · 515人在学
Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序
李杰 · 3875人在学