Press "Enter" to skip to content

基于ImageAI的目标检测

本文将演练计算机视觉的各个方面以及库和功能,这是一次通过较短的编程任务来检测对象的编程实践体验。随着机器学习算法和易于访问的库的兴起,计算机视觉已经成为可能。让我们来看看并体验一下本文中的示例。

 

目标检测

 

对象检测是从视觉图像或视频中检测、定位和识别对象的过程。它是一种图像处理和计算机视觉技术,主要通过机器学习和深度学习来实现。

 

OpenCV

 

OpenCV即。Open Computer Vision是一个库,它允许跨平台使用来开发具有执行实时检测功能的计算机视觉应用程序。它已被广泛用于对象检测、人脸检测以及图像处理和视频分析应用的大量其他用例。

 

块状的

 

NumPy是一个支持多种编程语言的库,包括用于数值计算的Python。它作为一个扩展提供了帮助,增加了对大型多维数组和矩阵的支持。它还包含一个大型高级数学函数库,可用于对这些数组进行操作。

 

凯拉斯

 

KERAS是一个非常强大的库,可以帮助评估和开发深度学习模型。它特别用于人工神经网络,并充当另一个库TensorFlow的接口。

 

TensorFlow

 

TensorFlow是由Google开发的开源库,旨在为机器学习提供端到端的平台,重点放在深度神经网络的推理上。

 

木星笔记本

 

Jupyter Notebook是IDE的融合,也是一种用于演示的教育工具,它被广泛使用,主要用于科学计算编程。

 

蟒蛇

 

Python是全球最简单、使用最广泛的编程语言之一,

作为初级编程语言教授给学生
清晰的语法便于理解和代码缩进
库和模块开发人员的活跃社区

蟒蛇

 

Anaconda是一个科学计算发行版,它是一个易于安装的免费包管理器和环境管理器,拥有超过720个开源包,为R和Python编程语言提供免费社区支持。它支持Windows、Linux和Mac OS,还附带Jupyter Notebook。

 

对于这种实际操作体验,使用蟒蛇环境将使后续编程变得更容易。

 

管理此实验的设置

 

首先,从官方网站安装蟒蛇环境。它提供了一个免费的个人版。 official site

 

安装完成后,打开Anaconda Prompt终端,检查是否有更新。

 

<em>conda update — all</em>

 

现在,安装TensorFlow:

 

<em>pip install tensorflow==2.4.0</em>

 

安装Kera

 

<em>pip install keras==2.4.3</em>

 

对于,图像AI依赖项

 

<em>pip numpy==1.19.3 pillow==7.0.0scipy==1.4.1 h5py==2.10.0 matplotlib==3.3.2opencv-python keras-resnet==0.2.0</em>

 

安装ImageAI

 

<em>pip install imageai</em>

 

现在,从蟒蛇激活Jupyter Notebook并打开笔记本中的Python3 Shell。

 

现在,我们导入TensorFlow并检查其版本,

 

<strong>import</strong> tensorflow as tf

 

导入、os、keras和sys,

 

<strong>import</strong> os

 

现在,我们从ImageAI导入ImageClass,

 

<strong>from</strong> imageai.Classification <strong>import</strong> ImageClassification

 

为了获取当前笔记本的执行链接,

 

executionpath = os.getcwd()

 

ResNet50

 

RESNET是残差网络的缩写,是一种广泛应用于计算机视觉任务的经典神经网络,是解决CV相关问题的骨干。RESNET-50是ResNet模型的变体之一,它有50层深卷积层,其中有1个平均Pool层和1个MaxPool层。

 

ImageClass中的变量(检测)调用来检测我们的输入图像,并且为ResNet50设置了深度学习模型类型。

 

detection = ImageClassification()

 

必须将“resnet50_ImageNet_tf.2.0.h5”从Github的源代码下载到执行路径位置。 Github

 

detection.setModelPath(executionpath + “/resnet50_imagenet_tf.2.0.h5”)

 

现在正在加载模型。

 

detection.loadModel()

 

将要分类的映像保存在执行路径位置。

 

detections, percentprobabs = detection.classifyImage(“image1.png”, result_count=5)

 

现在,执行检测。

 

<strong>for</strong> Index <strong>in</strong> range(len(detections)):

 

所使用的图像可以使用以下方式显示在笔记本上,

 

from IPython.display <strong>import</strong> display, Image

结果显示,59%的概率是跑车,22.9%是赛车手,10.057985037565231%是车轮,2.2967111319303513%是敞篷车,1.2311830185353756%是卡丁车。

在本文中,我们亲身体验了如何使用库来检测对象,并在Anaconda平台上使用jupyter笔记本用python编程。用这种最小的编程,我们可以检测到一个随机的物体。这是大量科学家和工程师多年研究和投资的结果,以创建上述文章中描述的库和软件。通过该示例,可以确定利用该对象检测示例来实验计算机视觉任务是多幺容易。

 

在我的C#角个人资料上阅读更多类似的文章:

 

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/06/27/%e5%9f%ba%e4%ba%8eimageai%e7%9a%84%e7%9b%ae%e6%a0%87%e6%a3%80%e6%b5%8b/

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注