DBNet作为文本检测领域新宠,github上可以找到很多大神使用python复现的代码(PaddlePaddle文本检测模型也是基于DBNet),足见其魅(彩)力(虹)之大(屁)。因此这几天尝试采用推理引擎对手头已有DBNet模型进行推理。
不过在编码DBNet网络后处理时遇到了一个难点(没见识,很可怕):unclip()
函数的C++代码转换。最初的想法是所有的后处理操作均由opencv实现,理想很丰满,现实却啪啪打脸。unclip()
函数调用了Polygon
类,以及PyclipperOffset
类。具体实现可见如下代码:
def unclip(self, box, unclip_ratio=1.5):
poly = Polygon(box)
distance = poly.area * unclip_ratio / poly.length
offset = pyclipper.PyclipperOffset()
offset.AddPath(box, pyclipper.JT_ROUND, pyclipper.ET_CLOSEDPOLYGON)
expanded = np.array(offset.Execute(distance))
return expanded
其中 Polygon
类中求轮廓包围面积以及轮廓周长还是比较容易实现的。但PyclipperOffset
类是经过绞(求)尽(助)脑(度)汁(娘)后,真的不知道该如何实现。想着不能就此放弃,于是跳到PyclipperOffset
类的实现代码中准备一点一点死磕,不实现,不吃饭(那是不可能滴)。跳进去后才后悔应该早点进来...
这个类是封装的ClipperOffset
类,顿时感觉春天来了,绝对是我这种手残党的福音。小粘贴板赶紧准备,访问ClipperOffset
类所在网址。
完美, ClipperOffset
类源码开源。 ClipperOffset
类源码地址:http://sourceforge.net/projects/polyclipping
源码压缩包下载完成,解压:
该类的使用方法简单,选取clipper.cpp、clipper.hpp文件加入工程即可食用。其中使用
ClipperOffset
类实现轮廓缩放。代码如下(solution中包含缩放后的轮廓):
#include "clipper.hpp"
using namespace ClipperLib;
int test()
{
Path subj;
Paths solution;
int a[21][2] = { {887, 1325}, {887, 1326},{886, 1327},
{886, 1329}, {885, 1330}, {885, 1333},
{886, 1334}, {885, 1335}, {886, 1336},
{886, 1337}, {894, 1337}, {895, 1338},
{899, 1338}, {900, 1337}, {900, 1327},
{896, 1327}, {895, 1326}, {891, 1326},
{890, 1325}, {889, 1326}, {888, 1325}};
for (size_t i = 0; i < 21; i++)
{
subj << IntPoint(a[i][0],a[i][1]);
}
ClipperOffset co;
co.AddPath(subj, jtRound, etClosedPolygon);
co.Execute(solution, 6.0310309);
//draw solution ...
//DrawPolygons(solution, 0x4000FF00, 0xFF009900);
return 0;
}
至此,困扰了很久的问题得以解决,可以愉快的对DBNet进行推理了。
最后,DBNet确实比PseNet快,尽管目前还没测试具体时间,控制台一闪而过(真香)!