MaGGIe প্রাকৃতিক ছবিতে চুল রেন্ডারিং এবং ইনস্ট্যান্স পৃথকীকরণে দক্ষতা প্রদর্শন করে, জটিল, বহু-ইনস্ট্যান্স পরিস্থিতিতে MGM এবং InstMatt-কে ছাড়িয়ে যায়।MaGGIe প্রাকৃতিক ছবিতে চুল রেন্ডারিং এবং ইনস্ট্যান্স পৃথকীকরণে দক্ষতা প্রদর্শন করে, জটিল, বহু-ইনস্ট্যান্স পরিস্থিতিতে MGM এবং InstMatt-কে ছাড়িয়ে যায়।

শক্তিশালী মাস্ক-গাইডেড ম্যাটিং: নয়েজি ইনপুট এবং অবজেক্ট বহুমুখিতা পরিচালনা

2025/12/21 02:00
2 মিনিটে পড়া যাবে
এই বিষয়বস্তু সম্পর্কে মতামত বা উদ্বেগ জানাতে, অনুগ্রহ করে আমাদের সাথে [email protected] ঠিকানায় যোগাযোগ করুন

সারসংক্ষেপ এবং ১. ভূমিকা

  1. সম্পর্কিত কাজসমূহ

  2. MaGGIe

    ৩.১. দক্ষ মাস্কড গাইডেড ইনস্ট্যান্স ম্যাটিং

    ৩.২. ফিচার-ম্যাট টেম্পোরাল কনসিস্টেন্সি

  3. ইনস্ট্যান্স ম্যাটিং ডেটাসেট

    ৪.১. ইমেজ ইনস্ট্যান্স ম্যাটিং এবং ৪.২. ভিডিও ইনস্ট্যান্স ম্যাটিং

  4. পরীক্ষা-নিরীক্ষা

    ৫.১. ইমেজ ডেটার উপর প্রি-ট্রেনিং

    ৫.২. ভিডিও ডেটার উপর ট্রেনিং

  5. আলোচনা এবং তথ্যসূত্র

\ সম্পূরক উপাদান

  1. আর্কিটেকচারের বিস্তারিত

  2. ইমেজ ম্যাটিং

    ৮.১. ডেটাসেট তৈরি এবং প্রস্তুতি

    ৮.২. ট্রেনিং বিস্তারিত

    ৮.৩. পরিমাণগত বিস্তারিত

    ৮.৪. প্রাকৃতিক ছবিতে আরো গুণগত ফলাফল

  3. ভিডিও ম্যাটিং

    ৯.১. ডেটাসেট তৈরি

    ৯.২. ট্রেনিং বিস্তারিত

    ৯.৩. পরিমাণগত বিস্তারিত

    ৯.৪. আরো গুণগত ফলাফল

৮.৪. প্রাকৃতিক ছবিতে আরো গুণগত ফলাফল

চিত্র ১৩ চ্যালেঞ্জিং পরিস্থিতিতে আমাদের মডেলের কর্মক্ষমতা প্রদর্শন করে, বিশেষত চুলের অঞ্চলগুলি সঠিকভাবে রেন্ডার করায়। আমাদের ফ্রেমওয়ার্ক ধারাবাহিকভাবে বিস্তারিত সংরক্ষণে MGM⋆ কে ছাড়িয়ে যায়, বিশেষত জটিল ইনস্ট্যান্স ইন্টারঅ্যাকশনে। InstMatt এর সাথে তুলনায়, আমাদের মডেল অস্পষ্ট অঞ্চলে উন্নত ইনস্ট্যান্স বিচ্ছেদ এবং বিস্তারিত নির্ভুলতা প্রদর্শন করে।

\ চিত্র ১৪ এবং চিত্র ১৫ একাধিক ইনস্ট্যান্স জড়িত চরম ক্ষেত্রে আমাদের মডেল এবং পূর্ববর্তী কাজের কর্মক্ষমতা চিত্রিত করে। যদিও MGM⋆ ঘন ইনস্ট্যান্স পরিস্থিতিতে শব্দ এবং নির্ভুলতার সাথে লড়াই করে, আমাদের মডেল উচ্চ নির্ভুলতা বজায় রাখে। InstMatt, অতিরিক্ত ট্রেনিং ডেটা ছাড়াই, এই জটিল সেটিংসে সীমাবদ্ধতা দেখায়।

\ আমাদের মাস্ক-গাইডেড পদ্ধতির দৃঢ়তা চিত্র ১৬ তে আরও প্রদর্শিত হয়েছে। এখানে, আমরা MGM ভ্যারিয়েন্ট এবং SparseMat মাস্ক ইনপুটে অনুপস্থিত অংশগুলি পূর্বাভাসে যে চ্যালেঞ্জগুলির সম্মুখীন হয় তা তুলে ধরি, যা আমাদের মডেল সমাধান করে। তবে, এটি লক্ষ করা গুরুত্বপূর্ণ যে আমাদের মডেল একটি হিউম্যান ইনস্ট্যান্স সেগমেন্টেশন নেটওয়ার্ক হিসাবে ডিজাইন করা হয়নি। চিত্র ১৭ তে দেখানো হয়েছে, আমাদের ফ্রেমওয়ার্ক ইনপুট গাইডেন্স মেনে চলে, একই মাস্কে একাধিক ইনস্ট্যান্স থাকলেও সুনির্দিষ্ট আলফা ম্যাট পূর্বাভাস নিশ্চিত করে।

\ পরিশেষে, চিত্র ১২ এবং চিত্র ১১ আমাদের মডেলের সাধারণীকরণ ক্ষমতার উপর জোর দেয়। মডেলটি পটভূমি থেকে মানব বিষয় এবং অন্যান্য বস্তু উভয়ই সঠিকভাবে নিষ্কাশন করে, বিভিন্ন পরিস্থিতি এবং অবজেক্ট টাইপ জুড়ে এর বহুমুখিতা প্রদর্শন করে।

\ সমস্ত উদাহরণ হল ইন্টারনেট ছবি গ্রাউন্ড-ট্রুথ ছাড়া এবং r101fpn400e থেকে মাস্ক গাইডেন্স হিসাবে ব্যবহার করা হয়েছে।

\ চিত্র ১৩. আমাদের মডেল প্রাকৃতিক ছবিতে অত্যন্ত বিস্তারিত আলফা ম্যাট তৈরি করে। আমাদের ফলাফল দেখায় যে এটি ব্যয়বহুল কম্পিউটেশনাল খরচ ছাড়াই পূর্ববর্তী ইনস্ট্যান্স-অজ্ঞেয়বাদী এবং ইনস্ট্যান্স-সচেতনতা পদ্ধতিগুলির সাথে সঠিক এবং তুলনীয়। লাল বর্গ প্রতিটি ইনস্ট্যান্সের জন্য বিস্তারিত অঞ্চলগুলি জুম করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৪. আমাদের ফ্রেমওয়ার্ক অনেক ইনস্ট্যান্স সহ চরম ক্ষেত্রে সুনির্দিষ্টভাবে ইনস্ট্যান্সগুলি আলাদা করে। যদিও MGM প্রায়ই ইনস্ট্যান্সগুলির মধ্যে ওভারল্যাপিং ঘটায় এবং MGM⋆ শব্দ ধারণ করে, আমাদের বাহ্যিক ডেটাসেটে প্রশিক্ষিত InstMatt এর সাথে সমান ফলাফল তৈরি করে। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৫. আমাদের ফ্রেমওয়ার্ক একক পাসে সুনির্দিষ্টভাবে ইনস্ট্যান্সগুলি আলাদা করে। প্রস্তাবিত সমাধান পূর্বাভাস/পরিমার্জন পাঁচবার চালানো ছাড়াই InstMatt এবং MGM এর সাথে তুলনীয় ফলাফল দেখায়। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৬. MGM এবং SparseMat থেকে ভিন্ন, আমাদের মডেল ইনপুট গাইডেন্স মাস্কে দৃঢ়। অ্যাটেনশন হেড সহ, আমাদের মডেল InstMatt এর মতো ইনস্ট্যান্সগুলির মধ্যে জটিল পরিমার্জন ছাড়াই মাস্ক ইনপুটগুলিতে আরও স্থিতিশীল ফলাফল তৈরি করে। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৭. আমাদের সমাধান মাল্টি-ইনস্ট্যান্স মাস্ক গাইডেন্সের সাথে সঠিকভাবে কাজ করে। যখন একটি গাইডেন্স মাস্কে একাধিক ইনস্ট্যান্স বিদ্যমান থাকে, আমরা এখনও সেই ইনস্ট্যান্সগুলির জন্য সঠিক ইউনিয়ন আলফা ম্যাট তৈরি করি। লাল তীর ত্রুটি বা লাল বক্সে জুম-ইন অঞ্চল নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে।

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১৩. V-HIM60 এ প্রস্তাবিত টেম্পোরাল কনসিস্টেন্সি মডিউলের কার্যকারিতা (সারণি ৬ এর সম্প্রসারণ)। দ্বি-দিকীয় Conv-GRU এবং ফরওয়ার্ড-ব্যাকওয়ার্ড ফিউশনের সংমিশ্রণ তিনটি টেস্ট সেটে সর্বোত্তম সামগ্রিক কর্মক্ষমতা অর্জন করে। বোল্ড প্রতিটি স্তরের জন্য সেরা হাইলাইট করে।

\

:::info লেখকগণ:

(১) চুয়ং হুইন, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক ([email protected]);

(২) সেউং উগ ও, অ্যাডোব রিসার্চ (seoh,[email protected]);

(৩) অভিনব শ্রীবাস্তব, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক ([email protected]);

(৪) জুন-ইয়াং লি, অ্যাডোব রিসার্চ ([email protected])।

:::


:::info এই গবেষণাপত্রটি CC by 4.0 Deed (Attribution 4.0 International) লাইসেন্সের অধীনে arxiv এ উপলব্ধ

:::

\

মার্কেটের সুযোগ
Mask Network লোগো
Mask Network প্রাইস(MASK)
$0.3748
$0.3748$0.3748
-3.22%
USD
Mask Network (MASK) লাইভ প্রাইস চার্ট

World Cup Combo: Aim for 200x

World Cup Combo: Aim for 200xWorld Cup Combo: Aim for 200x

Combine up to 20 World Cup matches in one order

ডিসক্লেইমার: এই সাইটে পুনঃপ্রকাশিত নিবন্ধগুলো সর্বসাধারণের জন্য উন্মুক্ত প্ল্যাটফর্ম থেকে সংগ্রহ করা হয়েছে এবং শুধুমাত্র তথ্যের উদ্দেশ্যে প্রদান করা হয়েছে। এগুলো আবশ্যিকভাবে MEXC-এর মতামতকে প্রতিফলিত করে না। সমস্ত অধিকার মূল লেখকদের কাছে সংরক্ষিত রয়েছে। আপনি যদি মনে করেন কোনো কনটেন্ট তৃতীয় পক্ষের অধিকার লঙ্ঘন করেছে, তাহলে অনুগ্রহ করে অপসারণের জন্য [email protected] এ যোগাযোগ করুন। MEXC কনটেন্টের সঠিকতা, সম্পূর্ণতা বা সময়োপযোগিতা সম্পর্কে কোনো গ্যারান্টি দেয় না এবং প্রদত্ত তথ্যের ভিত্তিতে নেওয়া কোনো পদক্ষেপের জন্য দায়ী নয়। এই কনটেন্ট কোনো আর্থিক, আইনগত বা অন্যান্য পেশাদার পরামর্শ নয় এবং এটি MEXC-এর সুপারিশ বা সমর্থন হিসেবে গণ্য করা উচিত নয়।

আপনি আরও পছন্দ করতে পারেন

হ্যামস্টার কমব্যাট ডেইলি কম্বো আজ ১৬ জুন, ২০২৬ দ্রুত ৫ মিলিয়ন বিনামূল্যে কয়েন আয় করুন

হ্যামস্টার কমব্যাট ডেইলি কম্বো আজ ১৬ জুন, ২০২৬ দ্রুত ৫ মিলিয়ন বিনামূল্যে কয়েন আয় করুন

হ্যামস্টার কমব্যাট ডেইলি কম্বো ১৬ জুন, ২০২৬ লাইভ হয়েছে কারণ খেলোয়াড়রা ইন-গেম পুরস্কারে লক্ষ লক্ষ পাওয়ার চেষ্টা করছে হ্যামস্টার কমব্যাট কমিউনিটি আবারও D-এর দিকে মনোযোগ দিচ্ছে
শেয়ার করুন
Hokanews2026/06/16 02:56
বেলটোন মিউচুয়াল ফান্ড মিসরের ডিজিটাল বিনিয়োগকারীদের কাছে পৌঁছে দিতে ফিনটেক টেলডাকে বেছে নিয়েছে

বেলটোন মিউচুয়াল ফান্ড মিসরের ডিজিটাল বিনিয়োগকারীদের কাছে পৌঁছে দিতে ফিনটেক টেলডাকে বেছে নিয়েছে

এই চুক্তিটি হলো সর্বশেষ লক্ষণ যে মিশরের সম্পদ ব্যবস্থাপকরা ক্রমবর্ধমানভাবে খুচরা বিনিয়োগকারীদের কাছে পৌঁছাতে ফিনটেক প্ল্যাটফর্মের দিকে ঝুঁকছেন।
শেয়ার করুন
Techcabal2026/06/16 02:02
সুপার মাইক্রো কম্পিউটার (SMCI) স্টক পতন হয়েছে কারণ সহ-প্রতিষ্ঠাতা চিপ চোরাচালানের অভিযোগে দোষ স্বীকার করেননি

সুপার মাইক্রো কম্পিউটার (SMCI) স্টক পতন হয়েছে কারণ সহ-প্রতিষ্ঠাতা চিপ চোরাচালানের অভিযোগে দোষ স্বীকার করেননি

TLDR SMCI সহ-প্রতিষ্ঠাতা Yih-Shyan "Wally" Liaw চীনে Nvidia-চালিত সার্ভার অবৈধভাবে স্থানান্তরের অভিযোগে দোষ স্বীকার করেননি প্রসিকিউটররা $2.5 বিলিয়ন এর অভিযোগ করেছেন
শেয়ার করুন
Coincentral2026/04/02 18:25

Score Your Share of 50K USDT

Score Your Share of 50K USDTScore Your Share of 50K USDT

Complete DEX+ tasks to unlock the Champion Wheel