Utilizamos conjuntos de dados tabulares originalmente do OpenML e compilados num conjunto de conjuntos de dados de referência da equipa Inria-Soda no HuggingFace. Treinamos com 28.855 amostras de treino e testamos nas restantes 9.619 amostras. Todos os MLPs são treinados com um tamanho de lote de 64, 64, e 0,0005, e estudamos 3 camadas de 100 neurónios cada. Definimos aqui as seis principais métricas utilizadas no nosso trabalho.Utilizamos conjuntos de dados tabulares originalmente do OpenML e compilados num conjunto de conjuntos de dados de referência da equipa Inria-Soda no HuggingFace. Treinamos com 28.855 amostras de treino e testamos nas restantes 9.619 amostras. Todos os MLPs são treinados com um tamanho de lote de 64, 64, e 0,0005, e estudamos 3 camadas de 100 neurónios cada. Definimos aqui as seis principais métricas utilizadas no nosso trabalho.

O Guia do Geek para Experimentação em ML

2025/09/21 13:47

Abstrato e 1. Introdução

1.1 Explicação Post Hoc

1.2 O Problema da Discordância

1.3 Incentivando o Consenso de Explicação

  1. Trabalhos Relacionados

  2. Pear: Regularizador de Concordância de Explicador Post HOC

  3. A Eficácia do Treinamento de Consenso

    4.1 Métricas de Concordância

    4.2 Melhorando as Métricas de Consenso

    [4.3 Consistência a Que Custo?]()

    4.4 As Explicações Ainda São Valiosas?

    4.5 Consenso e Linearidade

    4.6 Dois Termos de Perda

  4. Discussão

    5.1 Trabalhos Futuros

    5.2 Conclusão, Agradecimentos e Referências

Apêndice

A APÊNDICE

A.1 Conjuntos de Dados

Nos nossos experimentos, utilizamos conjuntos de dados tabulares originalmente do OpenML e compilados num conjunto de conjuntos de dados de referência da equipa Inria-Soda no HuggingFace [11]. Fornecemos alguns detalhes sobre cada conjunto de dados:

\ Bank Marketing Este é um conjunto de dados de classificação binária com seis características de entrada e é aproximadamente equilibrado em termos de classe. Treinamos com 7.933 amostras de treino e testamos nas restantes 2.645 amostras.

\ California Housing Este é um conjunto de dados de classificação binária com sete características de entrada e é aproximadamente equilibrado em termos de classe. Treinamos com 15.475 amostras de treino e testamos nas restantes 5.159 amostras.

\ Electricity Este é um conjunto de dados de classificação binária com sete características de entrada e é aproximadamente equilibrado em termos de classe. Treinamos com 28.855 amostras de treino e testamos nas restantes 9.619 amostras.

A.2 Hiperparâmetros

Muitos dos nossos hiperparâmetros são constantes em todas as nossas experiências. Por exemplo, todos os MLPs são treinados com um tamanho de lote de 64 e uma taxa de aprendizagem inicial de 0,0005. Além disso, todos os MLPs que estudamos têm 3 camadas ocultas de 100 neurónios cada. Utilizamos sempre o otimizador AdamW [19]. O número de épocas varia de caso para caso. Para os três conjuntos de dados, treinamos durante 30 épocas quando 𝜆 ∈ {0,0, 0,25} e 50 épocas nos outros casos. Ao treinar modelos lineares, utilizamos 10 épocas e uma taxa de aprendizagem inicial de 0,1.

A.3 Métricas de Discordância

Definimos aqui cada uma das seis métricas de concordância utilizadas no nosso trabalho.

\ As primeiras quatro métricas dependem das características mais importantes top-𝑘 em cada explicação. Seja 𝑡𝑜𝑝_𝑓 𝑒𝑎𝑡𝑢𝑟𝑒𝑠(𝐸, 𝑘) representando as características mais importantes top-𝑘 numa explicação 𝐸, seja 𝑟𝑎𝑛𝑘 (𝐸, 𝑠) a classificação de importância da característica 𝑠 dentro da explicação 𝐸, e seja 𝑠𝑖𝑔𝑛(𝐸, 𝑠) o sinal (positivo, negativo ou zero) da pontuação de importância da característica 𝑠 na explicação 𝐸.

\

\ As próximas duas métricas de concordância dependem de todas as características dentro de cada explicação, não apenas do top-𝑘. Seja 𝑅 uma função que calcula a classificação das características dentro de uma explicação por importância.

\

\ (Nota: Krishna et al. [15] especificam no seu artigo que 𝐹 deve ser um conjunto de características especificado por um utilizador final, mas nas nossas experiências utilizamos todas as características com esta métrica).

A.4 Resultados da Experiência com Características Inúteis

Quando adicionamos características aleatórias para a experiência na Secção 4.4, duplicamos o número de características. Fazemos isto para verificar se a nossa perda de consenso prejudica a qualidade da explicação, colocando características irrelevantes no top-𝐾 com mais frequência do que modelos treinados naturalmente. Na Tabela 1, relatamos a percentagem de vezes que cada explicador incluiu uma das características aleatórias nas 5 características mais importantes. Observamos que, em geral, não vemos um aumento sistemático dessas percentagens entre 𝜆 = 0,0 (um MLP de referência sem a nossa perda de consenso) e 𝜆 = 0,5 (um MLP treinado com a nossa perda de consenso)

\ Tabela 1: Frequência de características inúteis obtendo classificações top-5, medida em percentagem.

A.5 Mais Matrizes de Discordância

Figura 9: Matrizes de discordância para todas as métricas consideradas neste artigo sobre dados de Bank Marketing.

\ Figura 10: Matrizes de discordância para todas as métricas consideradas neste artigo sobre dados de California Housing.

\ Figura 11: Matrizes de discordância para todas as métricas consideradas neste artigo sobre dados de Electricity.

A.6 Resultados Estendidos

Tabela 2: Precisão média de teste para os modelos que treinamos. Esta tabela está organizada por conjunto de dados, modelo, os hiperparâmetros na perda e o coeficiente de decaimento de peso (WD). As médias são sobre várias tentativas e relatamos as médias ± um erro padrão.

A.7 Gráficos Adicionais

Figura 12: As superfícies logit para MLPs, cada uma treinada com um valor lambda diferente, em 10 planos de três pontos construídos aleatoriamente do conjunto de dados Bank Marketing.

\ Figura 13: As superfícies logit para MLPs, cada uma treinada com um valor lambda diferente, em 10 planos de três pontos construídos aleatoriamente do conjunto de dados California Housing.

\ Figura 14: As superfícies logit para MLPs, cada uma treinada com um valor lambda diferente, em 10 planos de três pontos construídos aleatoriamente do conjunto de dados Electricity.

\ Figura 15: Gráficos adicionais de curvas de trade-off para todos os conjuntos de dados e métricas.

\

:::info Autores:

(1) Avi Schwarzschild, Universidade de Maryland, College Park, Maryland, EUA e Trabalho concluído enquanto trabalhava na Arthur (avi1umd.edu);

(2) Max Cembalest, Arthur, Nova Iorque, Nova Iorque, EUA;

(3) Karthik Rao, Arthur, Nova Iorque, Nova Iorque, EUA;

(4) Keegan Hines, Arthur, Nova Iorque, Nova Iorque, EUA;

(5) John Dickerson†, Arthur, Nova Iorque, Nova Iorque, EUA ([email protected]).

:::


:::info Este artigo está disponível no arxiv sob licença CC BY 4.0 DEED.

:::

\

Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail [email protected] para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.

Você também pode gostar

Outra empresa cotada na Nasdaq anuncia compra massiva de Bitcoin (BTC)! Torna-se a 14ª maior empresa! – Também vão investir em altcoin ligada a Trump!

Outra empresa cotada na Nasdaq anuncia compra massiva de Bitcoin (BTC)! Torna-se a 14ª maior empresa! – Também vão investir em altcoin ligada a Trump!

A publicação "Outra Empresa Listada na Nasdaq Anuncia Compra Massiva de Bitcoin (BTC)! Torna-se a 14ª Maior Empresa! – Também Investirão em Altcoin Ligada a Trump!" apareceu no BitcoinEthereumNews.com. Enquanto o número de empresas com tesouraria em Bitcoin (BTC) continua a aumentar dia após dia, outra empresa listada na Nasdaq anunciou sua compra de BTC. De acordo com isso, a empresa de transmissão ao vivo e e-commerce GD Culture Group anunciou um acordo de compra de Bitcoin no valor de $787,5 milhões. Segundo o comunicado oficial, o GD Culture Group anunciou que firmou um acordo de capital para adquirir ativos no valor de $875 milhões, incluindo 7.500 Bitcoins, da Pallas Capital Holding, uma empresa registrada nas Ilhas Virgens Britânicas. A GD Culture emitirá aproximadamente 39,2 milhões de ações ordinárias em troca de todos os ativos da Pallas Capital, incluindo Bitcoin no valor de $875,4 milhões. O CEO da GD Culture, Xiaojian Wang, disse que o acordo de aquisição apoiará diretamente o plano da empresa de construir uma reserva de ativos cripto forte e diversificada, aproveitando a crescente aceitação institucional do Bitcoin como ativo de reserva e reserva de valor. Com esta aquisição, espera-se que a GD Culture se torne a 14ª maior empresa de holding de Bitcoin negociada publicamente. O número de empresas que adotam estratégias de tesouraria em Bitcoin aumentou significativamente, excedendo 190 até 2025. Imediatamente após o anúncio do acordo, as ações da GD Culture caíram 28,16% para $6,99, sua maior queda em um ano. Como você também deve se lembrar, a GD Culture anunciou em maio que criaria uma reserva de criptomoedas. Neste ponto, a empresa anunciou que planeja investir em Bitcoin e na meme coin oficial do Presidente Donald Trump, o token TRUMP, através da emissão de até $300 milhões em ações. *Isto não é aconselhamento de investimento. Siga nossa conta do Telegram e Twitter agora para notícias exclusivas, análises e dados on-chain! Fonte: https://en.bitcoinsistemi.com/another-nasdaq-listed-company-announces-massive-bitcoin-btc-purchase-becomes-14th-largest-company-theyll-also-invest-in-trump-linked-altcoin/
Compartilhar
BitcoinEthereumNews2025/09/18 04:06