Détaille le pipeline O3D-SIM pour la VLN. Il extrait des informations sémantiques d'instances en open-set (masques, caractéristiques CLIP/DINO) à partir d'images RGB-DDétaille le pipeline O3D-SIM pour la VLN. Il extrait des informations sémantiques d'instances en open-set (masques, caractéristiques CLIP/DINO) à partir d'images RGB-D

Extraction d'instances sémantiques : caractéristiques CLIP et DINO pour la cartographie 3D

2025/12/11 03:00

Résumé et 1 Introduction

  1. Travaux connexes

    2.1. Navigation Vision-Langage

    2.2. Compréhension sémantique de scène et segmentation d'instance

    2.3. Reconstruction de scène 3D

  2. Méthodologie

    3.1. Collecte de données

    3.2. Informations sémantiques en ensemble ouvert à partir d'images

    3.3. Création de la représentation 3D en ensemble ouvert

    3.4. Navigation guidée par le langage

  3. Expériences

    4.1. Évaluation quantitative

    4.2. Résultats qualitatifs

  4. Conclusion et travaux futurs, Déclaration de divulgation et Références

3. Méthodologie

Dans cette section, nous discutons du pipeline de notre méthode de Navigation Vision-Langage (VLN), qui utilise O3D-SIM. Nous commençons par un aperçu de notre pipeline proposé, puis présentons une analyse approfondie de ses étapes constitutives. La phase initiale de notre méthodologie implique la collecte de données, comprenant un ensemble d'images RGB-D et des paramètres de caméra extrinsèques et intrinsèques, qui sont d'abord décrits. Par la suite, nous passons à la création de la Carte d'Instance Sémantique 3D en ensemble ouvert. Ce processus est divisé en deux étapes principales : initialement, nous extrayons des informations d'instance sémantique en ensemble ouvert à partir des images ; ensuite, nous utilisons les informations en ensemble ouvert recueillies pour organiser le nuage de points 3D en une carte d'instance sémantique 3D en ensemble ouvert. La dernière partie de notre discussion se concentre sur le module VLN, où nous parlons de son implémentation et de sa fonctionnalité.

\ Le pipeline de création de l'O3D-SIM est représenté dans la Fig.2. La première étape de la création de l'O3D-SIM, présentée dans la Section 3.2, est l'extraction des informations d'instance sémantique en ensemble ouvert à partir de la séquence RGB d'images d'entrée. Ces informations comprennent, pour chaque instance d'objet, les informations de masque et les caractéristiques sémantiques représentées par les caractéristiques d'intégration CLIP [9] et DINO [10]. La deuxième étape, présentée dans la Section 3.3, utilise ces informations d'instance sémantique en ensemble ouvert pour regrouper le nuage de points 3D d'entrée en une carte d'objets sémantiques 3D en ensemble ouvert, voir Figures 2 et 3. L'opération est améliorée de manière incrémentale en appliquant la séquence d'images RGB-D au fil du temps.

\

:::info Auteurs:

(1) Laksh Nanwani, Institut International de Technologie de l'Information, Hyderabad, Inde; cet auteur a contribué de manière égale à ce travail;

(2) Kumaraditya Gupta, Institut International de Technologie de l'Information, Hyderabad, Inde;

(3) Aditya Mathur, Institut International de Technologie de l'Information, Hyderabad, Inde; cet auteur a contribué de manière égale à ce travail;

(4) Swayam Agrawal, Institut International de Technologie de l'Information, Hyderabad, Inde;

(5) A.H. Abdul Hafez, Université Hasan Kalyoncu, Sahinbey, Gaziantep, Turquie;

(6) K. Madhava Krishna, Institut International de Technologie de l'Information, Hyderabad, Inde.

:::


:::info Cet article est disponible sur arxiv sous licence CC by-SA 4.0 Deed (Attribution-Partage dans les mêmes conditions 4.0 International).

:::

\

Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter [email protected] pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.

Vous aimerez peut-être aussi

Une Autre Entreprise Cotée au Nasdaq Annonce un Achat Massif de Bitcoin (BTC) ! Devient la 14e Plus Grande Entreprise ! – Ils Investiront Également dans une Altcoin Liée à Trump !

Une Autre Entreprise Cotée au Nasdaq Annonce un Achat Massif de Bitcoin (BTC) ! Devient la 14e Plus Grande Entreprise ! – Ils Investiront Également dans une Altcoin Liée à Trump !

L'article Une autre entreprise cotée au Nasdaq annonce un achat massif de Bitcoin (BTC) ! Devient la 14e plus grande entreprise ! - Ils investiront également dans une altcoin liée à Trump ! est apparu sur BitcoinEthereumNews.com. Alors que le nombre d'entreprises détenant des réserves de Bitcoin (BTC) continue d'augmenter jour après jour, une autre entreprise cotée au Nasdaq a annoncé son achat de BTC. En conséquence, la société de diffusion en direct et de commerce électronique GD Culture Group a annoncé un accord d'achat de Bitcoin de 787,5 millions de dollars. Selon le communiqué officiel, GD Culture Group a annoncé avoir conclu un accord d'actions pour acquérir des actifs d'une valeur de 875 millions de dollars, comprenant 7 500 Bitcoins, auprès de Pallas Capital Holding, une société enregistrée dans les îles Vierges britanniques. GD Culture émettra environ 39,2 millions d'actions ordinaires en échange de tous les actifs de Pallas Capital, y compris 875,4 millions de dollars de Bitcoin. Le PDG de GD Culture, Xiaojian Wang, a déclaré que l'accord d'acquisition soutiendra directement le plan de l'entreprise visant à constituer une réserve d'actifs cryptographiques solide et diversifiée tout en capitalisant sur l'acceptation institutionnelle croissante du Bitcoin comme actif de réserve et réserve de valeur. Avec cette acquisition, GD Culture devrait devenir la 14e plus grande entreprise cotée en bourse détenant du Bitcoin. Le nombre d'entreprises adoptant des stratégies de trésorerie Bitcoin a considérablement augmenté, dépassant 190 d'ici 2025. Immédiatement après l'annonce de l'accord, les actions de GD Culture ont chuté de 28,16 % à 6,99 $, leur plus forte baisse en un an. Comme vous vous en souvenez peut-être également, GD Culture a annoncé en mai qu'elle créerait une réserve de cryptomonnaies. À ce stade, l'entreprise a annoncé qu'elle prévoyait d'investir dans Bitcoin et dans le meme coin officiel du président Donald Trump, le token TRUMP, par le biais de l'émission d'actions pouvant atteindre 300 millions de dollars. *Ceci n'est pas un conseil en investissement. Suivez maintenant notre compte Telegram et Twitter pour des nouvelles exclusives, des analyses et des données on-chain ! Source : https://en.bitcoinsistemi.com/another-nasdaq-listed-company-announces-massive-bitcoin-btc-purchase-becomes-14th-largest-company-theyll-also-invest-in-trump-linked-altcoin/
Partager
BitcoinEthereumNews2025/09/18 04:06