Hobbyprojekte
Bildsegmentierung mit FCNs
Auf meiner GitHub-Seite habe ich nun eine “fully convolutional” (FCN) Version von Alexnet (siehe https://arxiv.org/abs/1411.4038) in Pytorch implementiert. Der Code in diesem Paket hat vor allem ein Ziel: Einfachheit. Erstens erkennt das Modell nur eine Art von Objekt (plus Hintergrund), zweitens sind alle Funktionen und Klassen explizit und transparent; nichts ist vortrainiert. Ziel ist es, die Grundlagen verständlich zu machen
Dieser Code wurde an dem “Penn-Fudan”-Fußgänger-Datensatz und dem COCO-Datensatz getestet (siehe Bilder). Obwohl die Trainingsdatensätze klein sind, liefert das Modell akzeptable Ergebnisse. Genauere Resultate können durch komplexere Netzwerkarchitekturen erzielt werden (z.B. transfer learning mit vortrainiertem ResNet-50).
(Bilder stammen aus dem COCO-Datensatz: https://cocodataset.org/)