【毕业设计选题】基于深度学习的中草药检测识别系统人工智能 python 计算机视觉 YOLO_深度学习中草药图像识别-程序员宅基地

技术标签： YOLO 毕业设计机器学习毕设深度学习人工智能毕业设计开题指导

一、课题背景与意义

二、算法理论技术

2.1 卷积神经网络

一、课题背景与意义

叶片是中草药植物的重要器官，也是区分不同植物的重要参照，大多数中草药的叶片都趋于扁平化，便于被摄录设备采集并进行数字化存储。传统的中草药叶片识别往往需要人工采集大量的原始样本，再进行人工分析和研究，需要研究者具有相当丰富的中医药知识储备和经验，整个过程耗时耗力且识别率难以得到保证。在研究中草药植物叶片分类过程中，借助人工智能算法的优势，开展基于深度神经网络的图像分类实验，进一步提高识别准确率。

二、算法理论技术

2.1 卷积神经网络

CNN（卷积神经网络）是一种多层网络模型，用于识别二维形状。它具有对平移、比例缩放、倾斜和其他形式的变形具有高度不变性的特点。CNN采用局部连接和局部感受野的结构，与传统的全连接神经网络不同。从输入层开始，每一层接收上一层的输入，一直到输出层，形成一个有向环图。CNN通过卷积运算和局部池化操作来提取特征，使得得到的特征图逐渐变得复杂。每个图由多个神经元构成，多个图构成一个层。这些图充当过滤器的作用，通过计算输入图像的卷积值并与特征匹配，得到适当的特征，并将其输入到下一层结构中。

【毕业设计选题】基于深度学习的中草药检测识别系统人工智能 python 计算机视觉 YOLO

CNN框架通过卷积和池化操作对输入的中草药叶片图像进行特征提取和分类。图像经过多层的卷积和池化操作后，最终得到分类结果。该方法利用CNN的优势，提高了中草药叶片识别的准确率和效率。

【毕业设计选题】基于深度学习的中草药检测识别系统人工智能 python 计算机视觉 YOLO

代码如下（示例）：

import torch
import torch.nn as nn

class CNN(nn.Module):
    def __init__(self, num_classes):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1)
        self.relu = nn.ReLU()
        self.maxpool = nn.MaxPool2d(kernel_size=2, stride=2)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=3, stride=1, padding=1)
        self.fc = nn.Linear(32 * 16 * 16, num_classes)

    def forward(self, x):
        x = self.conv1(x)
        x = self.relu(x)
        x = self.maxpool(x)
        x = self.conv2(x)
        x = self.relu(x)
        x = self.maxpool(x)
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return x

2.2 AlexNet模型

AlexNet是一种深度卷积神经网络模型，通过深层的卷积和池化层堆叠、非线性激活函数、局部响应归一化和Dropout正则化等创新设计，实现了对大规模图像数据集的高效分类。它在计算机视觉领域取得了重要突破，开创了深度学习在图像识别任务上的先河，并对后续网络模型的发展和应用产生了深远影响。

【毕业设计选题】基于深度学习的中草药检测识别系统人工智能 python 计算机视觉 YOLO

对原始的AlexNet模型进行了改进和优化。在第三层和第四层特征提取能力最强的基础上，为了进一步提高分类的准确度，插入了一层新的第五层。该新层与原第四层结构一致，但通过增加卷积操作来提取更多有效特征。经过多次实验和探索，改进后的模型命名为AlexNet_En，并且在分类精确度上优于原始的AlexNet模型。AlexNet_En模型的结构，其中第五层以虚线框表示。这种改进和优化有助于进一步提升模型性能和特征提取的准确度。

【毕业设计选题】基于深度学习的中草药检测识别系统人工智能 python 计算机视觉 YOLO

代码如下（示例）：

import torch
import torch.nn as nn

class AlexNet_En(nn.Module):
    def __init__(self, num_classes):
        super(AlexNet_En, self).__init__()
        self.features = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
            nn.Conv2d(64, 192, kernel_size=5, padding=2),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
            nn.Conv2d(192, 384, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(384, 384, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(384, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
        )
        self.classifier = nn.Sequential(
            nn.Dropout(),
            nn.Linear(256 * 6 * 6, 4096),
            nn.ReLU(inplace=True),
            nn.Dropout(),
            nn.Linear(4096, 4096),
            nn.ReLU(inplace=True),
            nn.Linear(4096, num_classes),
        )

    def forward(self, x):
        x = self.features(x)
        x = x.view(x.size(0), 256 * 6 * 6)
        x = self.classifier(x)
        return x

三、模型训练

3.1 数据处理

通过python爬虫算法爬取百度图片，中文关键字为“苍耳”（xanthium si biricum）、“金银花”（honeysuckle）、“薄荷”（mint）、“藿香”（patchouli）、“白花蛇舌草”（hedyotis diffusa）共5类中药植物图片，每类挑选其中600张，共3000张图片组成数据集，其中2400张作为训练集，300张作为验证集，300张作为测试集，各占总图像数量的80%、10%、10%，将该数据集命名为HERB3K。

为了解决数据集HERB3K样本数量较少可能影响训练的准确率问题，拟采用以下3种方法对数据集HERB3K进行数据增扩。关于图像增噪有许多算法可以实现，本研究采用加性零均值高斯噪声方法为图像增加相应的噪点。增噪的方式是为图像上每个点的灰度值加上一个噪声值，噪声值的产生方式是使用Box-Muller算法生成高斯噪声。

代码如下（示例）：

import numpy as np
import cv2

def add_gaussian_noise(image, mean=0, std=1):
    # 生成相应大小的随机高斯噪声
    noise = np.random.normal(mean, std, image.shape).astype(np.uint8)
    
    # 将噪声添加到原始图像上
    noisy_image = cv2.add(image, noise)
    
    return noisy_image

3.2 实验环境

实验基于Caffe平台搭建，Caffe是一款基于C++/CUDA，支持命令行、Matlab和Python接口的深度学习框架，该框架利用MKL、OpenBLAS、cuBLAS等矩阵运算库加速计算、同时支持GPU加速，具有例程脚本丰富、入门快等特点。实验软硬件环境为Mac OS操作系统、Intel Core i5 1.6 G CPU、8G内存。

3.3 结果分析

默认的AlexNet模型使用的是1000类的ImageNet数据集，而本研究只采集了5种中草药图像，因此需要修改每组实验模型参数num_output=5。此外，在训练过程中多次测试发现每组进行了300次左右迭代后准确率及损失值基本趋于平稳。

改进的AlexNet模型在数据增扩下具有更高的训练准确率。然而，相比于原始的AlexNet模型在数据增扩下所获得的准确率提高，改进的模型的提升幅度较小。基于改进的AlexNet模型的训练结果普遍优于原始模型。结合数据增扩和改进的AlexNet模型能够最大程度地提高图像分类的准确率。

通过对比和分析改进的AlexNet_En网络模型与原始AlexNet网络模型以及数据增扩后的数据集与原始数据集，展示出了较好的分类效果。然而，从损失值的角度来看，改进后的AlexNet模型的损失值普遍高于原始AlexNet模型。此外，改进后的AlexNet_En模型的训练时间也较原始AlexNet模型长，因为改进后的模型层数较多，复杂度较高，对硬件要求也更高。同时，随着数据集的增大，AlexNet_En对分类性能的提升幅度变小，而在HERB3K这样的小数据集上有较大的准确率提升，这表明存在过拟合问题。这些问题将成为未来模型改进和提升的方向。

最后

本文链接：https://blog.csdn.net/qq_37340229/article/details/135429878

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

class和struct的区别-程序员宅基地

文章浏览阅读101次。4.class可以有⽆参的构造函数，struct不可以，必须是有参的构造函数，⽽且在有参的构造函数必须初始。2.Struct适⽤于作为经常使⽤的⼀些数据组合成的新类型，表示诸如点、矩形等主要⽤来存储数据的轻量。1.Class⽐较适合⼤的和复杂的数据，表现抽象和多级别的对象层次时。2.class允许继承、被继承，struct不允许，只能继承接⼝。3.Struct有性能优势，Class有⾯向对象的扩展优势。3.class可以初始化变量，struct不可以。1.class是引⽤类型，struct是值类型。

android使用json后闪退,应用闪退问题：从json信息的解析开始就会闪退-程序员宅基地

文章浏览阅读586次。想实现的功能是点击顶部按钮之后按关键字进行搜索，已经可以从服务器收到反馈的json信息，但从json信息的解析开始就会闪退，加载listview也不知道行不行public abstract class loadlistview{public ListView plv;public String js;public int listlength;public int listvisit;public..._rton转json为什么会闪退

如何使用wordnet词典，得到英文句子的同义句_get_synonyms wordnet-程序员宅基地

文章浏览阅读219次。如何使用wordnet词典，得到英文句子的同义句_get_synonyms wordnet

系统项目报表导出功能开发_积木报表多线程-程序员宅基地

文章浏览阅读521次。系统项目报表导出导出任务队列表 + 定时扫描 + 多线程_积木报表多线程

ajax 如何从服务器上获取数据？_ajax 获取http数据-程序员宅基地

文章浏览阅读1.1k次，点赞9次，收藏9次。使用AJAX技术的好处之一是它能够提供更好的用户体验，因为它允许在不重新加载整个页面的情况下更新网页的某一部分。另外，AJAX还使得开发人员能够创建更复杂、更动态的Web应用程序，因为它们可以在后台与服务器进行通信，而不需要打断用户的浏览体验。在Web开发中，AJAX（Asynchronous JavaScript and XML）是一种常用的技术，用于在不重新加载整个页面的情况下，从服务器获取数据并更新网页的某一部分。使用AJAX，你可以创建异步请求，从而提供更快的响应和更好的用户体验。_ajax 获取http数据

Linux图形终端与字符终端-程序员宅基地

文章浏览阅读2.8k次。登录退出、修改密码、关机重启_字符终端

随便推点

Python与Arduino绘制超声波雷达扫描_超声波扫描建模 python库-程序员宅基地

文章浏览阅读3.8k次，点赞3次，收藏51次。前段时间看到一位发烧友制作的超声波雷达扫描神器，用到了Arduino和Processing，可惜啊，我不会Processing更看不懂人家的程序，咋办呢？嘿嘿，所以我就换了个思路解决，因为我会一点Python啊，那就动手吧！在做这个案例之前先要搞明白一个问题：怎么将Arduino通过超声波检测到的距离反馈到Python端？这个嘛，我首先想到了串行通信接口。没错！就是串口。只要Arduino将数据发送给COM口，然后Python能从COM口读取到这个数据就可以啦！我先写了一个测试程序试了一下，OK！搞定_超声波扫描建模 python库

凯撒加密方法介绍及实例说明-程序员宅基地

文章浏览阅读4.2k次。端—端加密指信息由发送端自动加密，并且由TCP/IP进行数据包封装，然后作为不可阅读和不可识别的数据穿过互联网，当这些信息到达目的地，将被自动重组、解密，而成为可读的数据。不可逆加密算法的特征是加密过程中不需要使用密钥，输入明文后由系统直接经过加密算法处理成密文，这种加密后的数据是无法被解密的，只有重新输入明文，并再次经过同样不可逆的加密算法处理，得到相同的加密密文并被系统重新识别后，才能真正解密。2．使用时，加密者查找明文字母表中需要加密的消息中的每一个字母所在位置，并且写下密文字母表中对应的字母。_凯撒加密

工控协议--cip--协议解析基本记录_cip协议embedded_service_error-程序员宅基地

文章浏览阅读5.7k次。CIP报文解析常用到的几个字段：普通类型服务类型:[0x00], CIP对象:[0x02 Message Router], ioi segments:[XX]PCCC（带cmd和func）服务类型:[0x00], CIP对象:[0x02 Message Router], cmd:[0x101], fnc:[0x101]..._cip协议embedded_service_error

如何在vs2019及以后版本(如vs2022)上添加添加ActiveX控件中的MFC类_vs添加mfc库-程序员宅基地

文章浏览阅读2.4k次，点赞9次，收藏13次。有时候我们在MFC项目开发过程中，需要用到一些微软已经提供的功能，如VC++使用EXCEL功能，这时候我们就能直接通过VS2019到如EXCEL.EXE方式，生成对应的OLE头文件，然后直接使用功能，那么，我们上篇文章中介绍了vs2017及以前的版本如何来添加。但由于微软某些方面考虑，这种方式已被放弃。从上图中可以看出，这一功能，在从vs2017版本15.9开始，后续版本已经删除了此功能。那么我们如果仍需要此功能，我们如何在新版本中添加呢。_vs添加mfc库

frame_size (1536) was not respected for a non-last frame_frame_size (1024) was not respected for a non-last-程序员宅基地

文章浏览阅读785次。用ac3编码，执行编码函数时报错入如下：[ac3 @ 0x7fed7800f200] frame_size (1536) was not respected for anon-last frame (avcodec_encode_audio2)用ac3编码时每次送入编码器的音频采样数应该是1536个采样，不然就会报上述错误。这个数字并非刻意固定，而是跟ac3内部的编码算法原理相关。全网找不到，国内音视频之路还有很长的路，音视频人一起加油吧～......_frame_size (1024) was not respected for a non-last frame

Android移动应用开发入门_在安卓移动应用开发中要在活动类文件中声迷你一个复选框变量-程序员宅基地

文章浏览阅读230次，点赞2次，收藏2次。创建Android应用程序一个项目里面可以有很多模块，而每一个模块就对应了一个应用程序。项目结构介绍_在安卓移动应用开发中要在活动类文件中声迷你一个复选框变量