我的班级与其他班级的功能略有不同:例如 - 此图像有扣(将其视为一个班级)https://6c819239693cc4960b69-cc9b957bf963b53239339d3141093094.ssl.cf3.rackcdn202015.rackcdn.com黑色-1000006329245-822018_01-345.jpg
但这张图片与它非常相似但没有扣:https : //sc01.alicdn.com/kf/HTB1ASpYSVXXXXbdXpXXq6xXFXXXR/latest-modern-classic-chappal-slippers-for-men.jpg
我对在这些实际学习像素到像素值的情况下使用哪种模型并不感到困惑。
任何想法都将是可观的。谢谢 !!
我已经尝试过 Inception、Resnet 等模型。
使用较少的训练数据(每个类 300-400),我们可以达到良好的召回率/精度/F1 分数。
由于数据集较小,您可能想要研究迁移学习,您可以做的是使用迁移的 ResNet 模型作为特征提取器并在其上尝试 YOLO(您只看一次)算法,查看每个窗口(看使用 ConvNets 的滑动窗口实现)以获得皮带扣,并基于此对图像进行分类。
根据我对您的数据集的理解,尽管您需要根据 YOLO 算法的要求重新注释您的数据集,但要执行上述方法。
要查看上述方法的示例,请访问https://mc.ai/implementing-yolo-using-resnet-as-feature-extractor/
编辑如果您有 XML 注释的数据集并且需要将其转换为 csv 以遵循上述示例,请使用https://github.com/datitran/raccoon_dataset
快乐建模。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句