Press "Enter" to skip to content

MemuConvert

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

MemuConvert

 

基本上,MemuConvert是一种图像处理方法。目的是减少目标检测中的标记处理工作量。

 

我为什幺要开发这个方法?

 

我参加了一个团队的比赛,我们的任务是用无人机的数据检测汽车。我们在YOLOV3中使用它自己的数据集尝试了这个任务。然而,这是一个失败,因为数据集不充分。因此,我们理解,我们必须从头开始训练人工智能。

 

目标检测分为3个步骤:采集数据、标注数据、训练阶段。主要问题是需要大量的标注数据。有三种解决方案,与其他人工智能一起训练人工智能,使用scale.ai等网站,以及使用算法。我们没有另一个人工智能来训练,我们不想花钱,因为我们想在比赛中有所作为。因此,我们搜索了算法,但问题是一样的,过程是基于人力的。之所以会出现此问题,是因为应该为每个图像定义新的阈值。出于这个原因,我不得不限制门槛。

 

该方法

 

可以从图像、颜色和形状获取两种类型的数据。每个人都有自己的问题。例如,形状算法无法找到脸部或汽车等大多数对象,因为它们是其他元素的总和。如果车只有车身和轮胎,我们就叫它“车”。由于大多数物体都是推理结果,形状算法找不到结果。它逐一找出所有的推论。有时,它也会发现一些人造的表情,比如天际线。因此,新的方法应该基于颜色,但大多数情况下,图像在所需颜色中具有不需要的像素。

在A1中,建筑物和出租车具有相同的调色板,因此这是颜色算法的两个相同对象。因此,我应该去掉那些多余的颜色。

 

步骤

 

海绵测试

 

海绵测试是对我在图像中所做的物理描述。想象一下,一块海绵上只有一个红点。如果你挤压那块海绵,海绵上的红色就会消失。总而言之,这种物理应用提供了主色,这为用主色重建对象提供了机会。

 

Kimage:表示经过海绵测试的图像中分割出的矩形个数。

 

Kxcolor:表示特定矩形的主色。

 

在开始时,我将Kimage修复为1024,但在低质量图像中,Kimage不起作用。因此,我将Kimage固定为图像的x长度。但是,有些图像对于等长矩形并不方便。因此,一些矩形重叠在每个矩形上。因此,为了去掉这些矩形,需要对图像进行模糊处理。

所有的图像都有相同的阈值!

 

总而言之,

 

该方法为快速训练目标检测人工智能提供了机会。然而,由于算法的通用性,它并不能精确地标注所有的图像。

 

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/07/16/memuconvert/

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注