Ciclo de Palestras – Primeiro Semestre de 2018

As palestras ocorrerem no Auditório do Laboratório de Sistemas Estocásticos (LSE), sala I-044b, as 15:30 h, a menos de algumas exceções devidamente indicadas.

Lista completa (palestras previstas para datas futuras podem sofrer alterações)

Adsorção cooperativa de gases por estruturas porosas, que permite absorção e remoção mais eficiente do que a adsorção usual não cooperativa (do tipo Langmuir), normalmente é resultado de uma transição de fase da estrutura. Mostramos como a cooperatividade numa classe de estruturas organo-metálicas na ausência de uma transição de fase. Nosso estudo é baseado em um modelo mecânico-estatístico de polimerização de equilíbrio em uma dimensão, cuja solução pode ser obtida por meio de uma matriz de transferência. Os parâmetros desse modelo são determinados por cálculos de DFT. Os resultados levam a uma compreensão da origem microscópica de características da adsorção cooperativa, incluindo a posição, inclinação e altura do degrau na isoterma, indicando como otimizar armazenamento e separação de gases nessas estruturas. (artigo em https://arxiv.org/pdf/1712.05061.pdf).

Tipicamente, o conhecimento da geologia de um meio poroso é muito menos detalhado do que o necessário para predizer deterministicamente as propriedades do escoamento, o que leva à necessidade de se fazer uma caracterização estatística das propriedades dos solos e rochas, dando um caráter estocástico ao problema. Como consequência, modelos realistas que descrevem escoamentos multifásicos em formações heterogêneas devem incorporar esta noção de incerteza. Com o intuito de aumentar a acurácia das previsões de tais modelos, técnicas de inferência Bayesiana e, por exemplo, Métodos de Monte Carlo via cadeias de Markov (MCMC) podem ser utilizados para incorporar dados de campo, dinamicamente, nas simulações.

We address the question of statistical model selection for a class of stochastic models of biological neural nets. Models in this class are systems of interacting chains with memory of variable length. Each chain describes the activity of a single neuron, indicating whether it spikes or not at a given time. The spiking probability of a given neuron depends on the time evolution of its presynaptic neurons since its last spike time. When a neuron spikes, its potential is reset to a resting level and postsynaptic current pulses are generated, modifying the membrane potential of all its postsynaptic neurons. The relationship between a neuron and its pre- and postsynaptic neurons defines an oriented graph, the interaction graph of the model. The goal of this paper is to estimate this graph based on the observation of the spike activity of a finite set of neurons over a finite time. We provide explicit exponential upper bounds for the probabilities of under- and overestimating the interaction graph restricted to the observed set and obtain the strong consistency of the estimator. Our result does not require stationarity nor uniqueness of the invariant measure of the process. This is a joint work with A.Duarte, A. Galves and E. Löcherbach.

Vivemos numa era em que a disponibilidade e acessibilidade a dados não tem precedentes. Apesar disso, lacunas substanciais persistem. Além disso, nem todos os dados disponíveis têm a qualidade necessária para seu uso seguro em muitas aplicações. Metodologia estatística fornece a orientação essencial necessária para obter dados atuais, relevantes, precisos e custo-efetivos. Ela também guia a arte e a ciência de extração de conhecimento dos dados para apoiar a tomada de decisões com base em evidências. Vou rever as principais maneiras em que os métodos estatísticos são usados para obter, combinar, processar, analisar e disseminar dados no campo das estatísticas públicas e oficiais. Vou também discutir como os métodos estatísticos são usados para medir qualidade e para alcançar níveis especificados de precisão ao estimar quantidades de interesse.

I review recent work focussing on whether thermodynamics can be extended to nonequilibrium steady states (NESS). The possibility of defining temperature $T$ and chemical potential $mu$ for systems in NESS is analyzed using simple, far-from-equilibrium lattice models with stochastic dynamics. For spatially uniform NESS, coexistence with a reservoir yields consistent definitions of $T$ and $mu$ for a particular choice of the rates used in exchanges between systems. Remarkably, the associated entropy function is not the Shannon entropy of the stationary probability distribution on
configuration space. Consistent definitions of intensive parameters are not possible for nonuniform NESS. Investigation of simple far-from-equilibrium systems exhibiting phase separation leads to the conclusion that phase coexistence is not well defined in this context.

 

As estatísticas oficiais são indispensáveis para uma sociedade democrática. Os Institutos Nacionais de Estatística e agências produtoras de estatísticas públicas enfrentam o desafio de produzir estatísticas relevantes e com rapidez, num ambiente de crescente restrição orçamentária e na era da sociedade da informação. A pressão para reduzir os tamanhos de amostra de suas pesquisas, e o ônus dos entrevistados, tornam necessário o desenvolvimento de métodos que utilizem uma combinação de fontes de dados.

Os procedimentos de estimação em pequenas áreas abrangem vários métodos estatísticos desenvolvidos para obter estimativas para áreas geográficas ou domínios de estudo nos quais os tamanhos de amostra são demasiado pequenos para fornecer estimativas diretas confiáveis. Os métodos tem como base modelos de regressão que relacionam as estimativas amostrais com variáveis auxiliares disponíveis para os domínios.

O seminário tem como foco a apresentação de métodos estatísticos de estimação em pequenas áreas e de sua aplicação em trabalhos realizados com dados provenientes de pesquisas amostrais brasileiras.

Structural identity is a concept of symmetry in which network nodes are identified according to the network structure and their relationship to other nodes. Structural identity has been studied in theory and practice over the past decades, but only recently has it been addressed with representational learning techniques.

This talk presents struc2vec, a novel and flexible framework for learning latent representations for the structural identity of nodes. struc2vec uses a hierarchy to measure node similarity at different scales, and constructs a multilayer graph to encode structural similarities and generate context for nodes. Numerical experiments indicate that in comparison to state-of-the art techniques, struc2vec exhibits superior performance in learning representations that reflect structural identity, overcoming limitations of prior approaches. As a consequence, struc2vec improves performance on classification tasks that depend more on structural identity, as illustrated by the airport network.

Last, to provide context for struc2vec, we also briefly present node2vec, a state-of-the-art technique for learning node representations, but one not targeted at structural identity.

No estudo das infecções sexualmente transmissíveis (ISTs) existem subpopulações que desempenham papel chave no controle ou agravo de uma epidemia. Essas subpopulações geralmente pertececem a populações de difícil acesso tais como usuários de drogas, profissionais do sexo, homens que fazem sexo com outros homens (HSH), etc. Nessa apresentação serão apresentados dois métodos para extrair informação desses grupos. O primeiro método é usado para estimar o tamanho dessas subpopulações, chamado de NSUM (Network scale-up method) que é baseado em informações da rede de contatos de cada participantes selecionado a partir representativa da população geral. O segundo método recruta participantes nessas subpopulações, é um procedimento amostragem não probabilistico baseado em redes chamado RDS (Respondent-driven sampling). Serão apresentadas nessa palestra algumas dificuldades metodológicas sob o ponto de vista estatístico, e alguns resultados parciais de projetos com populações de difícil acesso realizados no Brasil.

 


Universal Algebra meets Actuarial Science: Generalized Metrics for Actuaries
Thorsten Pfeiffer (CERA, Suiça)

In this talk we will have a look at classical actuarial work from a lattice theoretical perspective. Usually, (credit) ratings are totally ordered. In order to compare different ratings from different rating entities, we first develop a generalized directed metric to measure how progressive or conservative these totally ordered ratings are. We then propose an algorithmic solution for rating targets which are still totally ordered but different in size.

Reaching beyond totally ordered sets as rating targets, we eventually characterize suitable rating targets which are only partially ordered. The huge class of lattices which allow for a (finite) Jordan-Dedekind chain condition together with a supermodular rank function will work very well as generalized rating targets. In particular, distributive and modular lattices of finite length have modular rank functions and provide an extended framework for rating targets.

Choosing the number of components in mixture models remains a central but elusive challenge. Traditional model selection criteria can be either overly liberal or conservative when enforcing parsimony. They may also result in poorly separated components of limited practical use. Non-local priors (NLPs) are a family of distributions that encourage parsimony by enforcing a separation between the models under consideration. We formalize NLPs in the context of mixtures and show how they lead to well-separated components that have non-negligible weight, hence interpretable as distinct subpopulations. We derive tractable expressions and suggest default prior settings aimed at detecting multi-modal densities. We also give a theoretical characterization of the sparsity induced by NLPs and propose easily implementable algorithms to obtain the integrated likelihood and parameter estimates. Although the framework is generic we fully develop the multivariate Normal mixture case based on a novel family of exchangeable moment priors. Our results show a serious lack of sensitivity of the Bayesian information criterion (BIC) and insufficient parsimony of the AIC and local prior counterparts to our formulation.