百度开源创新表格识别方案 :3月11日,百度AI宣布开源PP-TableMagic这一创新性的表格识别解决方案,为表格结构化信息提取领域注入新活力。在数字化浪潮下,大量非结构化表格数据处理需求迫切,传统技术在复杂场景下存在局限,而PP-TableMagic应运而生。
多模型组网提升性能 :百度飞桨团队推出的PP-TableMagic采用“表格分类+表格结构识别+单元格检测”的多模型串联组网方案。其采用双流架构,将表格分类任务细分,自研的PP-LCNet_x1_0_table_cls能高精度区分有线表和无线表;业界首个开源的RT-DETR-L_table_cell_det实现单元格精确定位;新一代表格结构识别模型SLANEXt在HTML结构解析上优势明显,通过更强视觉编码器提升准确性。
全场景定制化优势突出 :在实际应用中,PP-TableMagic凭借多模型组网架构,支持全场景高定制化的模型微调。与传统方式不同,它允许用户仅对关键模型微调,避免性能问题,减少数据标注工作量,还支持分支级调整,进一步提升整体识别能力。
助力用户快速上手 :为方便用户,PP-TableMagic提供详细安装指南和使用教程,可通过PaddleX的PythonAPi轻松调用。同时支持多种部署方式,满足不同需求。百度飞桨团队还将于3月13日举办线上课程与产业场景实战营,助力用户掌握技术与开发流程。开源地址:https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-rc/docs/pipeline_usage/tutorials/ocr_pipelines/table_recognition_v2.md
© 版权声明
文章版权归作者所有,未经允许请勿转载。