MaGGIe stellt die Datensätze I-HIM50K und M-HIM2K vor, die über 180.000 synthetisierte menschliche Masken enthalten, um die Robustheit des Instance Matting zu bewerten.MaGGIe stellt die Datensätze I-HIM50K und M-HIM2K vor, die über 180.000 synthetisierte menschliche Masken enthalten, um die Robustheit des Instance Matting zu bewerten.

Synthetisierung von Multi-Instanz-Human-Matting-Daten mit MaskRCNN und BG20K

Abstrakt und 1. Einleitung

  1. Verwandte Arbeiten

  2. MaGGIe

    3.1. Effizientes maskiertes geführtes Instanz-Matting

    3.2. Feature-Matte temporale Konsistenz

  3. Instanz-Matting-Datensätze

    4.1. Bild-Instanz-Matting und 4.2. Video-Instanz-Matting

  4. Experimente

    5.1. Vortraining auf Bilddaten

    5.2. Training auf Videodaten

  5. Diskussion und Referenzen

\ Ergänzungsmaterial

  1. Architekturdetails

  2. Bild-Matting

    8.1. Datensatzgenerierung und -vorbereitung

    8.2. Trainingsdetails

    8.3. Quantitative Details

    8.4. Weitere qualitative Ergebnisse zu natürlichen Bildern

  3. Video-Matting

    9.1. Datensatzgenerierung

    9.2. Trainingsdetails

    9.3. Quantitative Details

    9.4. Weitere qualitative Ergebnisse

8. Bild-Matting

Dieser Abschnitt erweitert den Bild-Matting-Prozess und bietet zusätzliche Einblicke in die Datensatzgenerierung sowie umfassende Vergleiche mit bestehenden Methoden. Wir vertiefen uns in die Erstellung der Datensätze I-HIM50K und M-HIM2K, bieten detaillierte quantitative Analysen und präsentieren weitere qualitative Ergebnisse, um die Wirksamkeit unseres Ansatzes zu unterstreichen.

8.1. Datensatzgenerierung und -vorbereitung

Der I-HIM50K-Datensatz wurde aus dem HHM50K [50]-Datensatz synthetisiert, der für seine umfangreiche Sammlung menschlicher Bild-Mattes bekannt ist. Wir verwendeten ein MaskRCNN [14] Resnet-50 FPN 3x-Modell, trainiert auf dem COCO-Datensatz, um Einzelpersonenbilder herauszufiltern, was zu einer Teilmenge von 35.053 Bildern führte. Nach der InstMatt [49]-Methodik wurden diese Bilder gegen verschiedene Hintergründe aus dem BG20K [29]-Datensatz komponiert, wodurch Multi-Instanz-Szenarien mit 2-5 Subjekten pro Bild erstellt wurden. Die Subjekte wurden in der Größe angepasst und positioniert, um eine realistische Skalierung beizubehalten und übermäßige Überlappungen zu vermeiden, wie durch Instanz-IoUs von nicht mehr als 30% angegeben. Dieser Prozess ergab 49.737 Bilder mit durchschnittlich 2,28 Instanzen pro Bild. Während des Trainings wurden Führungsmasken durch Binarisierung der Alpha-Mattes und Anwendung zufälliger Dropout-, Dilatations- und Erosionsoperationen generiert. Beispielbilder aus I-HIM50K sind in Abb. 10 dargestellt.

\ Der M-HIM2K-Datensatz wurde entwickelt, um die Modellrobustheit gegenüber variierenden Maskenqualitäten zu testen. Er umfasst zehn Masken pro Instanz, die mit verschiedenen MaskRCNN-Modellen generiert wurden. Weitere Informationen zu den für diesen Generierungsprozess verwendeten Modellen sind in Tabelle 8 dargestellt. Die Masken wurden basierend auf dem höchsten IoU mit den Ground-Truth-Alpha-Mattes den Instanzen zugeordnet, wobei ein minimaler IoU-Schwellenwert von 70% sichergestellt wurde. Masken, die diesen Schwellenwert nicht erfüllten, wurden künstlich aus Ground Truth generiert. Dieser Prozess führte zu einem umfassenden Satz von 134.240 Masken, davon 117.660 für zusammengesetzte und 16.600 für natürliche Bilder, was einen robusten Benchmark zur Bewertung des maskierten geführten Instanz-Mattings bietet. Der vollständige Datensatz I-HIM50K und M-HIM2K wird nach Annahme dieser Arbeit veröffentlicht.

\ Abbildung 10. Beispiele des I-HIM50K-Datensatzes. (Am besten in Farbe anzusehen).

\ Tabelle 8. Zehn Modelle mit unterschiedlicher Maskenqualität werden in MHIM2K verwendet. Die MaskRCNN-Modelle stammen von detectron2, trainiert auf COCO mit verschiedenen Einstellungen.

\

:::info Autoren:

(1) Chuong Huynh, University of Maryland, College Park ([email protected]);

(2) Seoung Wug Oh, Adobe Research (seoh,[email protected]);

(3) Abhinav Shrivastava, University of Maryland, College Park ([email protected]);

(4) Joon-Young Lee, Adobe Research ([email protected]).

:::


:::info Dieses Paper ist auf arxiv verfügbar unter CC by 4.0 Deed (Attribution 4.0 International) Lizenz.

:::

\

Marktchance
Multichain Logo
Multichain Kurs(MULTI)
$0.03976
$0.03976$0.03976
+6.82%
USD
Multichain (MULTI) Echtzeit-Preis-Diagramm
Haftungsausschluss: Die auf dieser Website veröffentlichten Artikel stammen von öffentlichen Plattformen und dienen ausschließlich zu Informationszwecken. Sie spiegeln nicht unbedingt die Ansichten von MEXC wider. Alle Rechte verbleiben bei den ursprünglichen Autoren. Sollten Sie der Meinung sein, dass Inhalte die Rechte Dritter verletzen, wenden Sie sich bitte an [email protected] um die Inhalte entfernen zu lassen. MEXC übernimmt keine Garantie für die Richtigkeit, Vollständigkeit oder Aktualität der Inhalte und ist nicht verantwortlich für Maßnahmen, die aufgrund der bereitgestellten Informationen ergriffen werden. Die Inhalte stellen keine finanzielle, rechtliche oder sonstige professionelle Beratung dar und sind auch nicht als Empfehlung oder Billigung von MEXC zu verstehen.

Das könnte Ihnen auch gefallen

Warum Peter Brandt sagt, dass das US-Krypto-Gesetz kein Game-Changer sein wird

Warum Peter Brandt sagt, dass das US-Krypto-Gesetz kein Game-Changer sein wird

Der Beitrag Why Peter Brandt Says The US Crypto Bill Won't Be A Game-Changer erschien auf BitcoinEthereumNews.com. Wird ein wegweisendes US-Kryptowährung Gesetz Bitcoin in die Höhe treiben
Teilen
BitcoinEthereumNews2025/12/20 08:21
Solana-Preisanalyse: SOL erobert $125-Unterstützung zurück, während Bullen einen Anstieg in Richtung $148 anvisieren

Solana-Preisanalyse: SOL erobert $125-Unterstützung zurück, während Bullen einen Anstieg in Richtung $148 anvisieren

Nachdem ein Rebound von der $125-Unterstützungszone zu sehen war, befindet sich Solana (SOL) wieder in einer bullischen Position, nachdem ihre jüngste Tageskerze grün geschlossen hat, da Käufer zeigen
Teilen
Tronweekly2025/12/20 09:30
Fed-Zinssenkung löst keine Bitcoin-Rally aus; Options-Verfall steht bevor

Fed-Zinssenkung löst keine Bitcoin-Rally aus; Options-Verfall steht bevor

Der Beitrag "Fed-Zinssenkung schafft es nicht, Bitcoin-Rally anzukurbeln; Options-Verfall steht bevor" erschien auf BitcoinEthereumNews.com. Wichtige Punkte: Glassnode betonte, dass 95% des Bitcoin-Angebots im Gewinn sind, aber schwächere Spot-Flows und Gewinnmitnahmen erzeugen fragile Stimmung. Etwa 30.000 BTC-Optionen im Wert von 3,52 Milliarden Dollar laufen heute auf Deribit aus, mit einem bärischen Put-Call-Verhältnis. Investoren positionieren sich für die Kursrückgänge, bevor BTC seine Reise zu neuen Allzeithochs fortsetzt. Bitcoin BTC $116.873 24h Volatilität: 0,4% Marktkapitalisierung: $2,33 T Vol. 24h: $36,34 B Der Preis hat nach der 25-Basispunkte-Zinssenkung der Fed diese Woche nicht viel Bewegung gezeigt und flirtet weiterhin mit dem Niveau von $116.000. Alle Augen sind auf den heutigen Verfall von Bitcoin-Optionen im Wert von 3,5 Milliarden Dollar gerichtet, der die Bühne für die nächste Preisbewegung bereiten könnte. Analysten glauben, dass BTC noch einen weiteren Rückgang sehen könnte, bevor der nächste Abschnitt der Rally beginnt. Bitcoin-Preis stößt auf starke Ablehnung bei $117K Nach Jerome Powells geldpolitischer Wende mit Zinssenkungen in dieser Woche blieb die BTC-Volatilität gedämpft, während die Kryptowährung im Bereich von $115K-$117K flirtet. Der beliebte Krypto-Analyst Rekt Capital merkte an, dass es wichtig ist, dass der Bitcoin-Preis einen Tagesschluss über $117.200 gibt. Danach kann BTC weiter auf $120.000 steigen und die Bühne für den nächsten Teil der Rally bereiten. Ein Versäumnis, über $117.200 zu schließen, könnte jedoch zu einer scharfen BTC-Korrektur führen, bis hin zu $105K, wie im Diagramm unten dargestellt. #BTC Kann Bitcoin es schaffen? Kann Bitcoin täglich über ~$117,2k schließen, um die Rückeroberung des blau-blauen Bereichs einzuleiten? Nur noch weniger als ein paar Stunden bis zum neuen Tagesschluss $BTC #Crypto #Bitcoin https://t.co/GJ3MAPkxw7 pic.twitter.com/eOrZU9fvnQ — Rekt Capital (@rektcapital) 18.09.2025 Die Blockchain-Analysefirma Glassnode stellte fest, dass es wichtig ist, dass der Bitcoin-Preis das Niveau von $115.200 hält, um weiteren Abwärtsdruck zu verhindern. Sie bemerkte, dass 95% des aktuellen Umlaufangebots derzeit im Gewinn sind...
Teilen
BitcoinEthereumNews2025/09/19 17:54