icdar2015专题

ICDAR2015文本识别相关算法最新结果(2019-07-20)

地址: Word Recognition 部分sample 识别这块算法相对检测就要少一些了,开源的论文也不多。

DBNet详解及训练ICDAR2015数据集

论文地址:https://arxiv.org/pdf/1911.08947.pdf 开源代码pytorch版本:GitHub - WenmuZhou/DBNet.pytorch: A pytorch re-implementation of Real-time Scene Text Detection with Differentiable Binarization 前言 在这篇论文之前,文

ICDAR2015 数据处理及训练

训练数据处理: 天池ICPR2018和MSRA_TD500两个数据集: 1)天池ICPR的数据集为网络图像,都是一些淘宝商家上传到淘宝的一些商品介绍图像,其标签方式参考了ICDAR2015的数据标签格式,即一个文本框用4个坐标来表示,即左上、右上、右下、左下四个坐标,共八个值,记作[x1 y1 x2 y2 x3 y3 x4 y4]  2)MSRA_TD500使微软收集的一个文本检测和识别的一个数

自建数据集系列:从labelImg格式->txt格式(YOLO格式、ICDAR2015格式)

文章目录 前言xml转YOLO格式xml转ICDAR2015格式🔰 汇总 🔰🔷1.从labelImg格式->txt格式(YOLO格式、ICDAR2015格式)2.从二值mask->labelme格式->coco格式3.从labelme格式->VOC格式+从二值mask->VOC格式4.从RGB->二值mask->coco格式5.实例分割mask->语义分割mask->扩增mask6.C