Próximas defesas e eventos
| Titulo | Autor/Organizador | Tipo | Data | Horário | Local |
|---|---|---|---|---|---|
| Uma Análise Quantitativa de Estratégias de Representação em Modelos de Visão e Linguagem | Pietro Guarinello Cariola | Defesa de Mestrado | 16/03/2026 | 14:00 | Auditório Jacy Monteiro |
|
Pietro Guarinello Cariola
Roberto Hirata Junior
Ciência da Computação
Auditório Jacy Monteiro
Não informado
Banca
Roberto Hirata Junior (P) USP
Roberto de Alencar Lotufo (P) UNICAMP
Thiago Alexandre Salgueiro Pardo (P) USP
Roberto Marcondes Cesar Junior
Norton Trevisan Roman Mateus Espadoto
Dissertação
Uma Análise Quantitativa de Estratégias de Representação em Modelos de Visão e Linguagem
Este estudo investiga o comportamento dos módulos de projeção em modelos multimodais de visão e linguagem por meio de uma análise quantitativa das representações pré e pós-projeção em cenários sem treinamento específico. Com foco em dois modelos proeminentes, LLaVA e InstructBLIP, e avaliando-os em dois conjuntos de dados de domínio específicos, nas áreas de agricultura e dermatologia, a pesquisa explora como as representações visuais são transformadas pelo projetor antes de serem processadas pelo modelo de linguagem. Para avaliar a riqueza dessas representações, classificadores auxiliares de dois tipos, um perceptron multicamada (MLP) e um modelo baseado em transformer, são treinados para realizar tarefas de classificação diretamente sobre as representações antes e depois da projeção. Todos os experimentos são conduzidos em um cenário sem treinamento específico, garantindo que os modelos nunca tenham sido treinados com os conjuntos de dados utilizados nos testes. Os resultados revelam que o projetor não necessariamente degrada o conteúdo semântico das representações, mas pode reorganizar sua estrutura de maneira a se alinhar mais efetivamente com uma determinada arquitetura. Além disso, os experimentos mostram que o tipo de classificador auxiliar desempenha um papel significativo na forma como os efeitos da projeção são percebidos, sugerindo que fatores arquiteturais devem ser considerados no momento de projetar e avaliar sistemas multimodais. Este trabalho contribui para o campo crescente da interpretabilidade em aprendizado profundo, oferecendo evidências empíricas sobre o papel do módulo projetor além de mais familiaridade com as representações internas dos modelos.
Interpretabilidade, Visão Computacional, Modelos de Linguagem Multimodal
|
|||||
| Análise e Aplicações do Método KIOPS na Integração Exponencial e em Equações Diferenciais | Luciano Rodrigues Danninger | Defesa de Mestrado | 17/03/2026 | 09:00 | Online |
|
Luciano Rodrigues Danninger
Pedro da Silva Peixoto
Matemática Aplicada
Online
https://stream.meet.google.com/stream/4d9a67b6-466a-4b10-8ea8-cdab9ad7bfbf
Banca
Pedro da Silva Peixoto USP
Hermes Senger USP
Rodrigo Vidonscky Pinto IFSP
Bruno Souza Carmo
João Guilherme Caldas Steinstraesser Martin Schreiber
Dissertação
Análise e Aplicações do Método KIOPS na Integração Exponencial e em Equações Diferenciais
O cálculo eficiente da ação da exponencial de matriz é fundamental para a solução numérica de sistemas lineares e semilineares provenientes da discretização de Equações Diferenciais Ordinárias e Parciais.
Integradores exponenciais oferecem vantagens significativas para problemas rígidos e de alta dimensão,mas sua eficácia prática depende de algoritmos capazes de avaliar combinações da ação da exponencial de matriz e de funções associadas sobre vetores de maneira estável e escalável.
Este trabalho tem como objetivo analisar, implementar e avaliar o desempenho do método
KIOPS, proposto em Stéphane Gaudreault et al., 2018, destacando seus fundamentos
teóricos, formulação computacional e eficiência em cenários que envolvem matrizes de
grande porte e operadores diferenciais. A discussão teórica inclui o arcabouço geral dos
integradores exponenciais, introduzindo a representação por variação das constantes e o
papel das funções , que surgem naturalmente na discretização temporal e permitem
expressar a ação da exponencial de matriz e de seus termos associados sobre vetores,
seguida de um exame de métodos exponenciais anteriores utilizados para aproximar essa
ação via subespaços de Krylov.
Em seguida, o método KIOPS é apresentado como uma extensão dessas abordagens,
incorporando estratégias adaptativas para seleção da dimensão do subespaço, técnicas
reduzidas de ortogonalização e estimadores de erro derivados da própria estrutura de Krylov.
Foram realizados experimentos numéricos com matrizes densas que exibem características espectrais distintas, representando diferentes regimes dinâmicos
encontrados em aplicações práticas. Esses experimentos permitem uma avaliação robusta do desempenho do KIOPS em comparação tanto com uma abordagem densa clássica para o
cálculo da exponencial de matriz.
Aplicações às equações de onda unidimensional e bidimensional também foram investigadas, onde o operador resultante da discretização espacial é ideal para analisar os benefícios do método KIOPS. Os resultados mostram que o KIOPS alcança ganhos substanciais de desempenho em tempo de execução, particularmente em problemas que envolvem matrizes grandes ou espectros que exigem forte amortecimento ou alta resolução temporal. Observou-se que o método mantém a precisão dentro de uma tolerância prescrita, ao mesmo tempo em que reduz significativamente os custos de ortogonalização por meio do uso combinado de mecanismos adaptativos e projeções em subespaços menores.
Em aplicações envolvendo a equação de onda bidimensional, o KIOPS permitiu passos de
tempo consideravelmente maiores do que aqueles viáveis com métodos tradicionais sob os mesmos requisitos de precisão, demonstrando sua robustez em problemas rígidos e mal condicionados. O estudo conclui que o KIOPS representa uma alternativa eficiente, escalável e numericamente confiável para integração exponencial, oferecendo melhorias significativas em relação às abordagens convencionais quando aplicado a problemas
de alta dimensão.
exponencial de matriz, métodos de Krylov, integradores exponenciais, KIOPS, Equações diferenciais parciais
|
|||||
| Mitigando desvios em Sistemas de Aprendizado de Máquina por meio de monitoramento contínuo das entradas: uma proposta arquitetural e avaliação empírica de métodos de detecção | Lucas Helfstein Rocha dos Santos | Defesa de Mestrado | 17/03/2026 | 14:00 | Auditório Jacy Monteiro |
|
Lucas Helfstein Rocha dos Santos
Kelly Rosa Braghetto
Ciência da Computação
Auditório Jacy Monteiro
Não informado
Banca
Kelly Rosa Braghetto (P) USP
Carla Silva Rocha Aguiar (P) UNB
Eduardo Soares Ogasawara (P) CEFET/RJ
Caetano Traina Junior
Fabio Kon Daniel Cardoso Moraes de Oliveira
Dissertação
Mitigando desvios em Sistemas de Aprendizado de Máquina por meio de monitoramento contínuo das entradas: uma proposta arquitetural e avaliação empírica de métodos de detecção
A engenharia de sistemas de aprendizado de máquina (AM) representa uma mudança de
paradigma em relação à engenharia de software convencional. Enquanto sistemas tradicionais
são governados por lógica determinística, os sistemas de AM são fundamentalmente
moldados pelos dados, fazendo com que sua robustez não resida apenas na qualidade do
código, mas na estabilidade da relação entre os dados de treinamento e os dados de
produção. Essa relação, no entanto, é inerentemente frágil. Flutuações, tendências sazonais
ou mudanças no ambiente operacional podem levar a desvios de dados (data drifts) e de
conceito (concept drifts), erodindo de forma silenciosa e contínua o desempenho dos modelos
de AM. Portanto, garantir a robustez e a confiabilidade de sistemas de AM em produção é um
desafio que transcende a manutenção de código, exigindo uma vigilância contínua sobre seu
componente mais volátil: os dados.
A adoção de sistemas de aprendizado de máquina em grande escala avançou mais
rapidamente do que o desenvolvimento de arcabouços arquiteturais formais para orientar seu
projeto, governança e manutenção de longo prazo. Esta dissertação aborda essa lacuna ao
propor uma arquitetura conceitual baseada em componentes que operacionaliza práticas
robustas de MLOps. A arquitetura aprimora a rastreabilidade e a adaptabilidade ao organizar o
sistema em subsistemas claramente definidos, responsáveis por gerenciar todo o ciclo de vida
do aprendizado de máquina. Ela é apoiada por um modelo de dados abrangente que garante
que todos os artefatos, desde dados brutos até modelos implantados, sejam localizáveis,
acessíveis, interoperáveis e reutilizáveis, possibilitando ciclos de feedback eficazes e
monitoramento contínuo das entradas.
O princípio central da arquitetura é que o monitoramento contínuo dos dados de entrada é
essencial para manter o desempenho dos modelos em ambientes dinâmicos. Para validar
esse princípio, foi conduzida uma série de experimentos empíricos com conjuntos de dados
que apresentam tanto desvio de conceito quanto desvio de dados, simulando os desafios de
cenários reais de produção. O método Hellinger Distance Drift Detection foi utilizado como
técnica principal de detecção, complementado por uma variante proposta baseada na
divergência de Jensen–Shannon e por uma análise comparativa com o teste de Kolmogorov–
Smirnov.
Os resultados demonstram que o retreinamento oportuno de modelos de AM, acionado pelo
monitoramento das entradas, gera ganhos substanciais de desempenho em todos os tipos de
desvio. Embora o teste de Kolmogorov–Smirnov tenha apresentado alta sensibilidade, a
abordagem baseada em Jensen–Shannon apresentou ganhos significativos de eficiência
computacional em relação à distância de Hellinger. Esses achados confirmam o papel crítico
do monitoramento das entradas e fornecem validação empírica para a arquitetura proposta,
apontando um caminho concreto para a construção de sistemas de aprendizado de máquina
mais robustos, adaptativos e sustentáveis.
Sistemas de Aprendizado de Máquina, MLOps, Arquitetura de Software, Desvio de Dados, Desvio de Conceito
|
|||||
| Propriedades de sobrevivência e cobertura no modelo de sapos | Gustavo Oshiro de Carvalho | Defesa de Doutorado | 18/03/2026 | 14:00 | Sala 249 Bloco A |
|
Gustavo Oshiro de Carvalho
Fabio Prates Machado
Probabilidade e Estatística
Sala 249 Bloco A
Não informado
Banca
Fabio Prates Machado (P) USP
Élcio Lebensztayn (P) UNICAMP
Nancy Lopes Garcia (P) UNICAMP Alexsandro Giacomo Grimbert Gallo (P) UFSCAR Pablo Almeida Gomes (P) USP
Luiz Renato Goncalves Fontes
Anatoli Iambartsev Pablo Martin Rodriguez Valdivino Vargas Junior Alejandro Roldan Correa
Tese
Propriedades de sobrevivência e cobertura no modelo de sapos
Estudamos um sistema de passeios aleatórios conhecido como modelo de sapos. Inicialmente, partículas estão dispostas nos vértices de um grafo G=(V,E), sendo todas elas consideradas inativas, com exceção das partículas presentes em um vértice pré determinado chamado de origem, que são consideradas ativas. Cada partícula ativa realiza um passeio aleatório simples sobre o grafo e tem probabilidade 1-p de morrer antes de cada passo. Partículas inativas se tornam ativas no momento em que seu vértice é visitado por uma partícula ativa. Neste texto, serão abordados diferentes resultados do modelo de sapos em dois grafos: em Z e em K_n, o grafo completo com n vértices. No grafo completo, consideramos que p=p_n varia com n para mostrar quais velocidades de crescimento para p_n fazem todos os vértices serem visitados com alta probabilidade ou não. Em Z, mostramos que, ao contrário do que já se sabe ocorrer para qualquer p em (0,1) fixo, fazer o parâmetro p de cada partícula ser retirado de variáveis aleatórias i.i.d. pode resultar em uma probabilidade maior que zero do modelo sobreviver infinitamente; além disso, também mostramos que o modelo é recorrente sempre que tem probabilidade positiva de sobreviver.
modelo de sapos, passeios aleatórios, sobrevivência, cobertura
|
|||||
| Métodos Multigrid Matrix-Free para Assimilação Variacional de Dados | Arthur Alves Rios Campos | Defesa de Doutorado | 23/03/2026 | 14:00 | Remota |
|
Arthur Alves Rios Campos
Pedro da Silva Peixoto
Matemática Aplicada
Remota
Não informado
Banca
Pedro da Silva Peixoto (P) USP
Haroldo Fraga de Campos Velho (P) INPE
Antoine Laurain (P) USP Yuri Dumaresq Sobral (P) UNB Arthur Vidard (P) INRIA
Pedro Leite da Silva Dias
Nelson Mugayar Kuhl Bruno Souza Carmo Martin Schreiber Juliana Aparecida Anochi
Tese
Métodos Multigrid Matrix-Free para Assimilação Variacional de Dados
A assimilação variacional de dados (4D-Var) desempenha um papel essencial em sistemas de previsão geofisica de alta resolução, mas seu custo computacional é dominado pela solução repetida de grandes sistemas lineares mal condicionados na formulação incremental. Esses sistemas são definidos de forma matrix-free, por meio de produtos Hessiana–vetor que envolvem operadores de covariância de erro de fundo, modelos tangente-lineares e adjuntos. Esta tese desenvolve e analisa métodos multigrid matrix-free adaptados especificamente à Hessiana do 4D-Var incremental. Utilizando um modelo de covariância baseado em difusão implícita, derivamos símbolos de Fourier explícitos e demonstramos—via Análise de Fourier Local—que a Hessiana é dominada, em altas frequências, pelo termo de erro de fundo. Isso motiva o uso de suavizadores espectrais compatíveis com operações matrix-free, como Richardson otimamente amortecido e iterações de Chebyshev de baixa ordem. Provamos que, sob hipóteses gerais, um método de dois níveis obtém taxas de convergência determinadas apenas pela capacidade de amortecimento em altas frequências do suavizador. Esses resultados teóricos são validados por um problema modelo não linear baseado na equação de Burgers viscosa, para o qual construímos modelos tangente-linear e adjunto consistentes usando uma discretização via Strang splitting. Experimentos numéricos confirmam que a abordagem multigrid proposta apresenta propriedades robustas de suavização e convergência independente da malha, oferecendo um caminho escalável para acelerar a assimilação variacional de dados em resoluções cada vez maiores.
Assimilação de Dados, 4D-Var Incremental, Métodos Multigrid, Análise de Fourier Local
|
|||||
| Funções preservando algumas identidades em estruturas algébricas não-associativas | Douglas de Araujo Smigly | Defesa de Doutorado | 27/03/2026 | 14:00 | Sala 249 Bloco A |
|
Douglas de Araujo Smigly
Henrique Guzzo Junior
Bruno Leonardo Macedo Ferreira
Matemática
Sala 249 Bloco A
Não informado
Banca
Henrique Guzzo Junior (P) USP
Juan Carlos Gutierrez Fernandez (P) USP
Tanise Carnieri Pierin (P) UFPR Fernando Araujo Borges (P) UFPR Alberto Carlos Elduque Palomo (P) UNIZAR
Bruno Tadeu Costa
Dylene Agda Souza de Barros Bruno Leonardo Macedo Ferreira Alicia Carmen Labra Jeldres Ma Isabel Hernandez
Tese
Funções preservando algumas identidades em estruturas algébricas não-associativas
Nesta tese, apresentaremos os resultados obtidos a partir do estudo de quatro linhas
de investigação relacionadas a funções definidas em estruturas algébricas associativas e não-associativas.
A primeira delas tem como objetivo descrever algumas funções aditivas satisfazendo certas identidades em estruturas não associativas, como anéis ou álgebras alternativas. Em
particular, com o auxílio de uma versão da identidade de Hua para anéis com divisão alternativos, mostramos uma versão do Teorema de Artin para esta classe de anéis, provando que toda função aditiva e bijetiva φ: A → A que satisfaz certas condições é um automorfismo ou um antiautomorfismo.
Na segunda parte, analisamos algumas classes de funções na álgebra dos octônios, estabelecendo um análogo do teorema de Hua para esta álgebra. Em particular, como resultado principal provamos que uma função linear contínua, bijetiva e unitária φ: O → O que preserva ∗-invertibilidade generalizada e satisfaz uma condição técnica é um ∗-isomorfismo ou um ∗ -anti-isomorfismo, onde O é a álgebra dos octônios.
Além disso, a terceira parte consiste no estudo da caracterização de certas aplicações que
satisfazem o chamado problema de preservação linear com certas estruturas adicionais, como a invertibilidade generalizada. Também verificamos esta questão no contexto da Álgebra dos Octônios.
Por fim, a última parte consistiu em analisar a aditividade de derivações e isomorfismos
em álgebras axiais. Em outras palavras, determinando sob quais condições uma derivação
multiplicativa ou um isomorfismo multiplicativo é aditivo em tais álgebras. Nos focamos principalmente em dois tipos de álgebras axiais, as do tipo Jordan J (α) e as do tipo Monstro M(α, β), estabelecendo os resultados com auxílio de condições nomeadas do tipo Martindale.
Álgebras Não-Associativas, Álgebras Axiais, Funções que preservam produtos, Aditividade de Funções
|
|||||
| Modelo heterocedástico Sazonal Autoregressivo Integrado de Médias Móveis: SARIMAH | Patrick Parente Nasser | Defesa de Mestrado | 27/03/2026 | 08:00 | Auditório Antonio Gilioli |
|
Patrick Parente Nasser
Airlane Pereira Alencar
Probabilidade e Estatística
Auditório Antonio Gilioli
Não informado
Banca
Airlane Pereira Alencar USP
Marcelo de Souza Lauretto EACH-USP
Tatiane Fontana Ribeiro UFPR
Chang Chiann
Thelma Sáfadi Moizés da Silva Melo
Dissertação
Modelo heterocedástico Sazonal Autoregressivo Integrado de Médias Móveis: SARIMAH
O principal objetivo desse trabalho é propor, estimar e avaliar o modelo SARIMA com variância dos erros variando ao longo do tempo dependendo de covariáveis, considerando a variância como função exponencial de variáveis explicativas. Diferentemente dos modelos usuais de heterocedasticidade condicional, há situações com dados reais em que a variância do erro nitidamente depende de variáveis explicativas, como quando essa variância apresenta tendência. Obtemos a verossimilhança condicional, a função escore e obtemos a variância assintótica dos estimadores e a variância e intervalos de previsão. O modelo foi ajustado para a produção mensal brasileira de cimento de 1970 a 2024 e a variância do erro aumenta com o tempo.
Modelo SARIMA, Heterocedasticidade, Análise de series temporais
|
|||||
| Impacto de morfemas na segmentação de grandes modelos de linguagem para o português brasileiro | Guilherme Lamartine de Mello | Defesa de Mestrado | 02/04/2026 | 10:00 | Remota |
|
Guilherme Lamartine de Mello
Marcelo Finger
Ciência da Computação
Remota
Não informado
Banca
Marcelo Finger (P) USP
Thiago Alexandre Salgueiro Pardo (P) USP
Paulo Rodrigo Cavalin (P) IBM
Fabio Gagliardi Cozman
Denis Deratani Mauá Tiago Agostinho de Almeida
Dissertação
Impacto de morfemas na segmentação de grandes modelos de linguagem para o português brasileiro
Modelos de segmentação em nível de sub-palavras como Byte Pair Encoding (Sennrich et al., 2016), Unigram (Kudo, 2018) e WordPiece (Schuster e Nakajima, 2012), permitem o tratamento de problemas de vocabulário aberto utilizando um conjunto relativamente pequeno de tokens. Embora esses algoritmos sejam fáceis de utilizar e escalar, por serem abordagens baseadas exclusivamente em dados, acabam deixando de lado características morfológicas durante a construção do vocabulário e no processo de segmentação de textos. Bostrom e Durrett, 2020 e Hofmann et al., 2021 mostram que a presença de morfemas impacta positivamente a performance de grandes modelos de linguagem para o inglês. Desta forma, este trabalho explora a hipótese de que um maior alinhamento do processo de segmentação como uma sequência de morfemas pode melhorar a capacidade de generalização de LLMs para o português. Para medir a capacidade de produzir segmentos semânticos, inicialmente, é proposta uma avaliação que busca incorporar conceitos psicolinguísticos de processamento morfológico utilizando como base os dados de morfemas disponíveis na MorphyNet (Batsuren et al., 2021). Em seguida, diferentes algoritmos de segmentação são utilizados para no pré-treinamento de novos modelos de linguagem a fim de verificar a performance em tarefas subsequentes. Os resultados obtidos mostram que o Unigram é um modelo mais eficiente que o Byte Pair Encoding na capacidade de gerar segmentações mais próximas de morfemas. Porém, essa vantagem não se traduz em uma melhor performance nas diferentes tarefas.
Processamento de Linguagem Natural, Segmentação, Português Brasileiro, Transformers
|
|||||
| Resolubilidade de espaços topológicos Tychonoff pseudocompactos | Allen Cristhian Romero Leiva | Defesa de Mestrado | 23/04/2026 | 15:00 | Remota |
|
Allen Cristhian Romero Leiva
Artur Hideyuki Tomita
Matemática
Remota
Não informado
Banca
Artur Hideyuki Tomita (P) USP
Gabriel Zanetti Nunes Fernandes (P) USP
Victor dos Santos Ronchim (P) UNESP
Irene Castro Pereira
Ana Carolina Boero Vinicius de Oliveira Rodrigues
Dissertação
Resolubilidade de espaços topológicos Tychonoff pseudocompactos
A propriedade da celularidade est\'a relacionada \`a resolubilidade de espacos topol\'ogicos pseudocompactos. Esses conceitos e sua inter-rela\c c\~ao s\~ao abordadas e discutidas por W. W. Comfort, Jean Van Mill, Yasser F. Ortiz e Artur H. Tomita em [4], [7] e [8]. O objetivo desta disserta\c c\~ao \'e apresentar detalhadamente os resultados obtidos em [7] e [8]. Se mostrara a resolubilidade de um espa\c co Tychonoff pseudocompacto sem pontos isolados, mediante a constru\c c\~ao de uma \'arvore de subconjuntos abertos. Isto sera feito em dos casos, quando a celularidade do espa\c co \'e infinita enumer\'avel mostraremos $\mathfrak{c}$- resolubilidade e quando a celularidade \'e $\mathfrak{c}$, 2-resolubilidade ser\'a demonstrada. \'E crucial destacar que a constru\c c\~ao da \'arvore em ambos casos at\'e um n\'ivel com cofinalidade enumer\'avel ser\'a feita gra\c cas \`a pseudocompacidade do espa\c co.
Resolubilidade, Pseudocompacidade, Celularidade, Árvore
|
|||||
| GFBST para teste de homogeneidade com uso de hipóteses pragmáticas | Gabriela Massoni | Defesa de Doutorado | 05/05/2026 | 14:00 | Sala 249 Bloco A |
|
Gabriela Massoni
Luís Gustavo Esteves
Probabilidade e Estatística
Sala 249 Bloco A
Não informado
Banca
Luís Gustavo Esteves (P) USP
Jesús Enrique García (P) UNICAMP
Rafael Bassi Stern (P) USP Rafael Izbicki (P) UFSCAR Verónica Andrea González-lópez (P) UNICAMP
Julio Michael Stern
Paulo Cilas Marques Filho Victor Fossaluza Andressa Cerqueira Daiane Aparecida Zuanetti
Tese
GFBST para teste de homogeneidade com
uso de hipóteses pragmáticas
Os testes agnósticos são uma abordagem utilizada em testes de hipóteses estatísticas, com três decisões:
aceitar a hipótese de interesse, rejeitar a hipótese de interesse ou ficar agnóstico. O teste Generalized Full
Bayesian Significance Test (GFBST) é considerado um bom teste agnóstico, pois mantém propriedades lógicas
e características estatísticas desejáveis. No entanto, sob certas condições, o GFBST, nunca aceita uma hipótese
nula precisa, o que limita seu uso. Para contornar essa limitação, são consideradas as hipóteses pragmáticas,
que são hipóteses não precisas construídas de forma suficientemente próxima das hipóteses precisas originais
e útil para contornar este problema. Os testes com hipóteses pragmáticas permitem a aceitação da hipótese
nula em casos adequados, tornando-os uma alternativa viável para lidar com hipóteses precisas em pesquisas
científicas. Neste trabalho, encontraremos soluções para testes de hipóteses pragmáticas para problemas
envolvendo dados categorizados em testes de homogeneidade e apresentaremos simulações a aplicação a
dados reais que ilustrem a metodologia desenvolvida
Hipóteses pragmáticas, Teste agnóstico, FBST, GFBST, Teste de homogeneidade.
|
|||||