Jul 30 – 31, 2018
Instituto de Física da Universidade de São Paulo
America/Sao_Paulo timezone
Evento comemorativo dos 10 anos da Rede Nacional de Física de Altas Energias

Detecção de elétrons baseada na fatoração de matrizes não-negativas

Not scheduled
4h
Instituto de Física da Universidade de São Paulo

Instituto de Física da Universidade de São Paulo

Rua do Matão, 1371, São Paulo-SP, Brasil
Instrumentação Instrumentação

Speaker

Julio De Castro Vargas Fernandes (Federal University of of Rio de Janeiro (BR))

Description

O algoritmo Ringer atua no segundo nível de Trigger do detector ATLAS e visa explorar a geometria cônica das formas do chuveiro de elétrons (sinal) e jatos (background), usando as células do calorímetro ATLAS para construir anéis concêntricos de deposição de energia em torno da célula de deposição máxima de energia. Este processo preserva a informação lateral e longitudinal da forma do chuveiro e, portanto, a interpretação da física, ao mesmo tempo em que reduz a quantidade de informação em relação ao uso de todas as células de uma Região de Interesse (ROI). A soma das energias das células no anel sobre a soma das energias das células em todos os anéis (normalização por energia total) formam um vetor de quantidades discriminantes que pode ser apresentado a etapa seguinte que realiza um teste de hipóteses, de modo a determinar se o evento deve ser mantido para análise offline ou descartado. No caso do Ringer, um conjunto de redes neurais realiza esta etapa, atuando em setores determinados pela peseudorapidez e pela energia transversa. Note que este approach caracteriza uma técnica de ensemble de redes neurais, neste caso um ensemble geográfico já que cada rede fica responsável por um bin no espaço de fase $\eta$ x $E_t$. O algoritmo Ringer é o algoritmo utilizado pela colaboração na etapa rápida do Trigger e começou a atuar em 2017.

A inovação neste trabalho é a utilização de uma técnica de extração cega de fontes (BSS - Blind Source Separation) para a extração de uma base de componentes físicas, que seja capaz de descrever a estrutura das interações eletromagnéticas do sinal e as interações hadrônicas do background. Deste modo o que está sendo proposto é a obtenção de dois codebooks, um para o sinal e outro para o background, que representem as fontes físicas que componham os eventos (sinal e background). Para extrair tais codebooks primeiro filtramos os dados disponíveis com um critério tight (Offline) para o sinal, de modo que os eventos escolhidos sejam uma amostra pura de elétrons, enquanto que o background é escolhido de tal forma que não passe nem no veryloose (Offline), sendo realmente eventos muito hadrônicos e subsequentemente aplicamos a técnica de BSS em cada conjunto separadamente visando encontrar um codebook para o sinal e outro para o background .

A fatoração de matrizes não-negativa (NMF) tornou-se uma ferramenta amplamente utilizada para a análise de dados de alta dimensão, pois extrai automaticamente características significativas (positivas) de um conjunto de vetores de dados não negativos. Além disso, as técnicas de separação cega de fontes tem sido muito aplicadas em problemas de classificação como pré-processamento. Entre essas técnicas a NMF tem se destacado, sendo um dos principais motivos para tal que as fontes extraídas da NMF serem positivas, o que permite uma interpretação física das mesmas. Como neste trabalho, usamos a energia de deposição do evento em uma estrutura anelada a NMF se mostra como uma escolha natural como pré-processamento (já que não existe energia negativa) e pode ainda prover insights sobre a física do problema através do estudo das fontes extraídas.

Uma vez extraídas as fontes de sinal e background, montamos uma base estendida, compondo as fontes da base de sinal com as de background, de modo a projetarmos os sinais de calorimetria referentes às colisões nesta base estendida (ou seja, a NMF é utilizada como um pré-processamento) e depois apresentarmos os dados resultantes à rede neural. A ideia de extrair duas NMF’s, uma para o sinal e outra para o background parte do conhecimento de domínio do problema já que sabemos que o perfil energético depositados nos anéis destas duas classes é distinto e, assim sendo, espera-se que a projeção do sinal na base de sinal seja mais forte do que na base do background e vice-versa deste modo melhorando a eficiência de classificação de eventos.

A rede neural utilizada neste trabalho possui uma camada escondida com neurônios com função de ativação do tipo tangente hiperbólica. A camada de saída possui um nêuronio também com função de ativação do tipo tangente hiperbólica e a função objetivo é o erro médio quadrático. Para o treinamento da rede neural, foi utilizado um processo de validação cruzada com 10 Folds. Os resultados apresentados foram obtidos utilizando dados de colisão coletados em 2017 pelo ATLAS.

Primary authors

Jose Seixas (Federal University of of Rio de Janeiro (BR)) Julio De Castro Vargas Fernandes (Federal University of of Rio de Janeiro (BR))

Presentation materials

There are no materials yet.