تتفوق MaGGIe في عرض الشعر وفصل الحالات على الصور الطبيعية، متفوقة على MGM وInstMatt في السيناريوهات المعقدة متعددة الحالات.تتفوق MaGGIe في عرض الشعر وفصل الحالات على الصور الطبيعية، متفوقة على MGM وInstMatt في السيناريوهات المعقدة متعددة الحالات.

التحديد الدقيق الموجه بالأقنعة: إدارة المدخلات المشوشة وتعدد استخدامات الكائنات

نبذة مختصرة و 1. مقدمة

  1. الأعمال ذات الصلة

  2. MaGGIe

    3.1. Matting موجه بقناع فعال للحالة

    3.2. الاتساق الزمني لخصائص Matte

  3. مجموعات بيانات Instance Matting

    4.1. Image Instance Matting و 4.2. Video Instance Matting

  4. التجارب

    5.1. التدريب المسبق على بيانات الصور

    5.2. التدريب على بيانات الفيديو

  5. المناقشة والمراجع

\ مواد تكميلية

  1. تفاصيل البنية المعمارية

  2. Image matting

    8.1. توليد مجموعة البيانات والتحضير

    8.2. تفاصيل التدريب

    8.3. التفاصيل الكمية

    8.4. المزيد من النتائج النوعية على الصور الطبيعية

  3. Video matting

    9.1. توليد مجموعة البيانات

    9.2. تفاصيل التدريب

    9.3. التفاصيل الكمية

    9.4. المزيد من النتائج النوعية

8.4. المزيد من النتائج النوعية على الصور الطبيعية

يعرض الشكل 13 أداء نموذجنا في سيناريوهات صعبة، خاصة في عرض مناطق الشعر بدقة. يتفوق إطار عملنا باستمرار على MGM⋆ في الحفاظ على التفاصيل، خاصة في تفاعلات الحالات المعقدة. بالمقارنة مع InstMatt، يُظهر نموذجنا فصلاً متفوقاً للحالات ودقة في التفاصيل في المناطق الغامضة.

\ يوضح الشكل 14 والشكل 15 أداء نموذجنا والأعمال السابقة في حالات قصوى تتضمن حالات متعددة. بينما يواجه MGM⋆ صعوبة مع الضوضاء والدقة في سيناريوهات الحالات الكثيفة، يحافظ نموذجنا على دقة عالية. يُظهر InstMatt، بدون بيانات تدريب إضافية، قيوداً في هذه الإعدادات المعقدة.

\ يتم إثبات قوة نهجنا الموجه بالقناع بشكل أكبر في الشكل 16. هنا، نسلط الضوء على التحديات التي تواجهها متغيرات MGM و SparseMat في التنبؤ بالأجزاء المفقودة في مدخلات القناع، والتي يعالجها نموذجنا. ومع ذلك، من المهم ملاحظة أن نموذجنا غير مصمم كشبكة تقسيم حالات بشرية. كما هو موضح في الشكل 17، يلتزم إطار عملنا بالتوجيه المُدخَل، مما يضمن التنبؤ الدقيق لـ alpha matte حتى مع وجود حالات متعددة في نفس القناع.

\ أخيراً، يؤكد الشكل 12 والشكل 11 على قدرات التعميم لنموذجنا. يستخرج النموذج بدقة كلاً من الأشخاص والأشياء الأخرى من الخلفيات، مما يعرض تنوعه عبر سيناريوهات وأنواع كائنات مختلفة.

\ جميع الأمثلة هي صور من الإنترنت بدون بيانات أساسية حقيقية ويُستخدم القناع من r101fpn400e كتوجيه.

\ الشكل 13. ينتج نموذجنا alpha matte شديد التفصيل على الصور الطبيعية. تظهر نتائجنا أنها دقيقة وقابلة للمقارنة مع الطرق السابقة غير المدركة للحالة والمدركة للحالة دون تكاليف حسابية باهظة. تُقرب المربعات الحمراء مناطق التفاصيل لكل حالة. (يُفضل العرض بالألوان والتكبير الرقمي).

\ الشكل 14. تفصل أطر عملنا الحالات بدقة في حالة قصوى مع العديد من الحالات. بينما يتسبب MGM غالباً في التداخل بين الحالات ويحتوي MGM⋆ على ضوضاء، ينتج نموذجنا نتائج مماثلة لـ InstMatt المدرب على مجموعة البيانات الخارجية. يشير السهم الأحمر إلى الأخطاء. (يُفضل العرض بالألوان والتكبير الرقمي).

\ الشكل 15. تفصل أطر عملنا الحالات بدقة في تمريرة واحدة. يُظهر الحل المقترح نتائج قابلة للمقارنة مع InstMatt و MGM دون تشغيل التنبؤ/التحسين خمس مرات. يشير السهم الأحمر إلى الأخطاء. (يُفضل العرض بالألوان والتكبير الرقمي).

\ الشكل 16. على عكس MGM و SparseMat، نموذجنا قوي لقناع التوجيه المُدخَل. مع رأس الانتباه، ينتج نموذجنا نتائج أكثر استقراراً لمدخلات القناع دون تحسين معقد بين الحالات مثل InstMatt. يشير السهم الأحمر إلى الأخطاء. (يُفضل العرض بالألوان والتكبير الرقمي).

\ الشكل 17. يعمل حلنا بشكل صحيح مع توجيهات أقنعة متعددة الحالات. عندما توجد حالات متعددة في قناع توجيه واحد، ما زلنا ننتج alpha matte الاتحاد الصحيح لتلك الحالات. يشير السهم الأحمر إلى الأخطاء أو منطقة التكبير في المربع الأحمر. (يُفضل العرض بالألوان والتكبير الرقمي).

\ الجدول 12. تفاصيل النتائج الكمية على HIM2K+M-HIM2K (امتداد للجدول 5). يشير اللون الرمادي إلى الوزن العام بدون إعادة تدريب.

\ الجدول 12. تفاصيل النتائج الكمية على HIM2K+M-HIM2K (امتداد للجدول 5). يشير اللون الرمادي إلى الوزن العام بدون إعادة تدريب. (تابع)

\ الجدول 12. تفاصيل النتائج الكمية على HIM2K+M-HIM2K (امتداد للجدول 5). يشير اللون الرمادي إلى الوزن العام بدون إعادة تدريب. (تابع)

\ الجدول 12. تفاصيل النتائج الكمية على HIM2K+M-HIM2K (امتداد للجدول 5). يشير اللون الرمادي إلى الوزن العام بدون إعادة تدريب. (تابع)

\ الجدول 13. فعالية وحدات الاتساق الزمني المقترحة على V-HIM60 (امتداد للجدول 6). يحقق الجمع بين Conv-GRU ثنائي الاتجاه والدمج الأمامي-الخلفي أفضل أداء إجمالي على مجموعات الاختبار الثلاث. يبرز الخط العريض الأفضل لكل مستوى.

\

:::info المؤلفون:

(1) Chuong Huynh، جامعة ميريلاند، كوليدج بارك ([email protected]

(2) Seoung Wug Oh، Adobe Research (seoh,[email protected]

(3) Abhinav Shrivastava، جامعة ميريلاند، كوليدج بارك ([email protected]

(4) Joon-Young Lee، Adobe Research ([email protected]).

:::


:::info هذه الورقة متاحة على arxiv بموجب ترخيص CC by 4.0 Deed (Attribution 4.0 International).

:::

\

فرصة السوق
شعار Mask Network
Mask Network السعر(MASK)
$0.58
$0.58$0.58
+1.15%
USD
مخطط أسعار Mask Network (MASK) المباشر
إخلاء مسؤولية: المقالات المُعاد نشرها على هذا الموقع مستقاة من منصات عامة، وهي مُقدمة لأغراض إعلامية فقط. لا تُظهِر بالضرورة آراء MEXC. جميع الحقوق محفوظة لمؤلفيها الأصليين. إذا كنت تعتقد أن أي محتوى ينتهك حقوق جهات خارجية، يُرجى التواصل عبر البريد الإلكتروني [email protected] لإزالته. لا تقدم MEXC أي ضمانات بشأن دقة المحتوى أو اكتماله أو حداثته، وليست مسؤولة عن أي إجراءات تُتخذ بناءً على المعلومات المُقدمة. لا يُمثل المحتوى نصيحة مالية أو قانونية أو مهنية أخرى، ولا يُعتبر توصية أو تأييدًا من MEXC.

قد يعجبك أيضاً

مكاسب بيتكوين بنسبة 8% تجعل من سبتمبر 2025 ثاني أفضل شهر له

مكاسب بيتكوين بنسبة 8% تجعل من سبتمبر 2025 ثاني أفضل شهر له

ظهر منشور "مكاسب البيتكوين بنسبة 8% تجعل سبتمبر 2025 ثاني أفضل شهر" على BitcoinEthereumNews.com. النقاط الرئيسية: البيتكوين يكسر اتجاهات الموسمية بإضافة 8%، مما يجعل سبتمبر هذا أفضل شهر منذ 2012. سبتمبر 2025 سيحتاج إلى ارتفاع بنسبة 20% ليصبح الأقوى على الإطلاق للبيتكوين. تقلبات سعر BTC في مستويات نادرًا ما شوهدت من قبل في دورة صعودية غير عادية. حقق البيتكوين (BTC) مكاسب أكثر هذا سبتمبر من أي عام منذ 2012، وهو رقم قياسي جديد في سوق صاعدة. تؤكد بيانات الأسعار التاريخية من CoinGlass وBiTBO أنه عند 8%، فإن ارتفاع سبتمبر 2025 للبيتكوين هو ثاني أفضل ارتفاع على الإطلاق. البيتكوين يتجنب "Rektember" بمكاسب 8% سبتمبر هو تقليديًا أضعف شهر للبيتكوين، مع خسائر متوسطة تبلغ حوالي 8%. عوائد BTC/USD الشهرية (لقطة شاشة). المصدر: CoinGlass هذا العام، الرهانات عالية على موسمية سعر BTC، حيث تتطلب الأنماط التاريخية ذروة السوق الصاعدة التالية وتسجل الأصول الأخرى عالية المخاطر أعلى مستوى جديد على الإطلاق مرارًا وتكرارًا. بينما يشهد كل من الذهب ومؤشر S&P 500 اكتشافًا للأسعار، فقد التف BTC/USD طوال سبتمبر بعد تحقيق ارتفاعات جديدة خاصة به في الشهر السابق. ومع ذلك، حتى عند "مجرد" 8%، فإن أداء سبتمبر هذا يكفي حاليًا لجعله أقوى شهر للبيتكوين في 13 عامًا. المرة الوحيدة التي كان فيها الشهر التاسع من العام أكثر ربحية لمتفائلي البيتكوين كانت في 2012، عندما ربح BTC/USD حوالي 19.8%. العام الماضي، بلغ الارتفاع 7.3%. عوائد BTC/USD الشهرية. المصدر: BiTBO اختفاء تقلبات سعر BTC تؤكد الأرقام عامًا ذروة سوق صاعدة غير عادية للغاية للبيتكوين. ذو صلة: BTC 'يسعر' ما هو قادم: 5 أشياء يجب معرفتها في البيتكوين هذا الأسبوع على عكس أسواق الصعود السابقة، اختفت تقلبات سعر BTC في 2025، ضد توقعات المشاركين في السوق منذ فترة طويلة بناءً على الأداء السابق. تُظهر بيانات CoinGlass انخفاض التقلبات إلى مستويات لم تشهدها منذ أكثر من عقد، مع انخفاض حاد بشكل خاص من أبريل فصاعدًا. التقلبات التاريخية للبيتكوين (لقطة شاشة). المصدر: CoinGlass في الوقت نفسه، تسلط شركة التحليلات على السلسلة Glassnode الضوء على...
مشاركة
BitcoinEthereumNews2025/09/18 11:09
مشرعو مجلس النواب يصوغون خطة لتخفيف الضرائب على معاملات العملة المستقرة الصغيرة

مشرعو مجلس النواب يصوغون خطة لتخفيف الضرائب على معاملات العملة المستقرة الصغيرة

ظهر المقال الذي يتناول خطة المشرعين في مجلس النواب لتخفيف الضرائب على معاملات العملات المستقرة الصغيرة على موقع BitcoinEthereumNews.com. النقاط الرئيسية: يقترح المشرعون إعفاء
مشاركة
BitcoinEthereumNews2025/12/21 11:13
سعر NEAR يحافظ على الهيكل الهابط بينما يراقب المتداولون منطقة التجميع الرئيسية

سعر NEAR يحافظ على الهيكل الهابط بينما يراقب المتداولون منطقة التجميع الرئيسية

ظهر منشور سعر NEAR يحافظ على بنية هابطة بينما يراقب المتداولون منطقة التراكم الرئيسية على BitcoinEthereumNews.com. الملخص: سعر NEAR يواصل تشكيل قيعان منخفضة
مشاركة
BitcoinEthereumNews2025/12/21 11:09