Ciclo de Palestras – Segundo Semestre de 2008
As palestras são realizadas na sala C-116 do Centro Tecnológico as 15:30 h, a menos que ocorra aviso em contrário.
Validating Gaussian process emulators
Leonardo S. Bastos (Sheffield)
In this talk, I am going to give a brief introduction of complex Computer models, also known as simulators, that are widely used in all areas of science and technology to represent complex real-world phenomena. Simulators are often sufficiently complex that they take appreciable amounts of computer time or other resources to run. In this context, a methodology has been developed based on building a statistical representation of the simulator, known as an emulator. The principal approach to building emulators uses Gaussian processes. I am going to present a set of diagnostics to validate and assess the adequacy of a Gaussian process emulator as surrogate for the simulator. These diagnostics are based on comparisons between simulator outputs and Gaussian process emulator outputs for some test data, known as validation data, defined by a sample of simulator runs not used to build the emulator. Our diagnostics take care to account for correlation between the validation data.
Nongaussian spatiotemporal modeling
Thais C. O. Fonseca (Warwick)
In this work, we develop and study nongaussian models for processes that vary continuously in space and time. The main goal is to consider heavy tailed processes that can accommodate both aberrant observations and clustered regions with larger observational variability. These situations are quite common in meteorological applications where outliers are associated with severe weather events such as tornados and hurricanes. In this context, the idea of scale mixing a gaussian process as proposed in Palacios and Steel (JASA, 2006) is extended and the properties of the resulting process are discussed. The model is very flexible and it is able to capture variability across time that differs according to spatial locations and variability across space that differs in time. This is illustrated by an application to maximum temperature data in the Spanish Basque Country. The model allows for prediction in space-time since we can easily predict the mixing process and conditional on the latter the finite dimensional distributions are gaussian. The predictive ability is measured through proper scoring rules such as log predictive scores and interval scores. In addition, we explore the performance of the proposed model under departures from gaussianity in a simulated study where data sets were contaminated by outliers in several ways; overall, the nongaussian models recover the covariance structure well whereas the covariance structure estimated by the gaussian model is very influenced by the contamination.
Inferencia, probabilidade e entropia
Nestor Caticha (IF/USP)
Este colóquio trata de inferência indutiva, ou seja, o problema de lidar de forma racional com casos em que há informação incompleta. Como quantificar que uma asserção é mais plausível que outra?Como evitar algumas inconsistências de raciocínio?A tentativa de extensão da lógica Aristotélica para situações em que não há informação completa levou Cox nos anos 40a se perguntar qual seria a estrutura matemática adequada para lidar de forma racional com estes casos. Não é uma surpresa que a estrutura matemática adequada seja a teoria de probabilidades. A surpresa está em que isso possa ser deduzido. Inferência se reduz agora ao problema de atribuir probabilidades com base na informação e às mudanças decorrentes da aquisição de nova informação. Existe uma forma geral de realizar inferência que satisfaça certos requisitos básicos? A imposição do resultado em alguns casos simples leva ao método geral de máxima entropia. Inferência pode ser interpretada de um ponto de vista geométrico. Após a apresentação simplificada dos resultados acima serão mostradas algumas aplicações a problemas de aprendizado e análise de dados.
O transporte mediado por motores moleculares e os processos de exclusao assimetricos
Carla Goldman (IF/USP)
Motores moleculares, em particular as kinesinas e dineínas, são proteínas capazes de realizar transporte ativo de objetos como organelas, vesículas, vírus, etc em ambiente celular, ao longo de micro-túbulos ou filamentos, onde as forças viscosas têm papel predominante e, portanto, determinam o caráter estocástico do processo nas escalas microscópicas. O “modelo padrão” proposto no início dos anos 90 por Adjari, Astumian, Prost e Magnhasco, prevê propriedades do movimento executado por estas proteínas nestas escalas, que vão de encontro aos dados experimentais da época, obtidos a partir da observação de um único motor. Surpreendentemente, experimentos mais recentes, obtidos de sistemas in vivo, indicam que o movimento das partículas transportadas, referidas como “carga” – não acompanha, necessariamente, o movimento previsto e observado dos motores, quando analisados individualmente. Em particular, observa-se que a “carga” muda de sentido diversas vezes antes de atingir seu destino final, em um movimento não-difusivo, denominado bidirecional, que pode ser caracterizado na melhor das hipóteses, por grandes flutuações de sentido. Desde então, diversas possibilidades tem sido apontadas para as causas deste movimento bidirecional. Há consenso, no entanto, em torno da idéia de que seja devido a um efeito coletivo dos motores. O que ainda necessita resposta é a natureza deste tipo de efeito e como identificá-lo por meio a uma descrição mais analítica destes sistemas. Neste colóquio, faremos uma breve revisão do “modelo padrão” e das discussões existentes na literatura a respeito da caracterização de tal efeito coletivo. Em seguida, mostraremos como é possível a descrição de propriedades destes sistemas, vistos como sistemas de partículas, por meio de um da análise de um modelo que descreve um processo de exclusão assimétrico (ASEP). Este modelo foi proposto por nós recentemente para incluir as partículas motoras em interação com partículas “escravas”, identificadas como a “carga”. O modelo apresenta uma transição de fase do tipo condensação que, como mostraremos, pode ser explorada como alternativa para a compreensão do movimento bidirecional mencionado.
Nearly unbiased inference under heteroskedasticity of unknown form
Francisco Cribari (UFPE)
The linear regression model is commonly used by practitioners to model the relationship between the variable of interest and a set of explanatory variables. The assumption that all error variances are the same, known as homoskedasticity, is oftentimes violated when cross sectional data are used. Consistent standard errors for the ordinary least squares estimators of the regression parameters can be computed following the approach proposed by White (1980). Such standard errors, however, are considerably biased in samples of typical sizes. An improved covariance matrix estimator was proposed by Qian and Wang (2001). We improve upon the Qian-Wang estimator by defining a sequence of bias adjusted estimators with increasing accuracy. The numerical results reveal that the Qian-Wang estimator is typically much less biased than the estimator proposed by Halbert White and that our correction to the former can be quite effective in small samples. Finally, we show that the Qian-Wang estimator can be generalized into a broad class of heteroskedasticity-consistent covariance matrix estimators, and our results can be easily extended to such a class of estimators.
Inferência Bayesiana em modelos assimétricos
Marcia D. Branco (USP)
Nos últimos anos novas classes de distribuições de probabilidade multivariadas e não simétricas tem sido propostas na literatura. O principal interesse é fornecer uma alternativa à suposição de normalidade usualmente considerada na modelagem estatística. Essa alternativa deve acomodar diferentes assimetrias, curtoses e eventualmente multimodalidade. Além disso, essas distribuições de probabilidade devem possibilitar algum tipo de tratamento analítico de modo a facilitar a inferência estatística. As distribuições assimétricas induzidas por processos de seleção, discutidas em Arellano, Branco e Genton (2006) têm as características descritas anteriormente. Nesta apresentação discutiremos algumas dessas distribuições de probabilidades, tais como, normal-assimétrica e t-assimétrica. Aplicações envolvendo modelos lineares mistos e modelos binários serão apresentadas. A abordagem de inferência considerada para todas as aplicações será a bayesiana, com destaque para o uso de distribuições a priori objetivas.
This is joint work with Simone Di Zio.
Filtro de Kalman: Introdução e Aplicações em Sistemas de Navegação
Elder M. Hemerly (ITA)
Sistemas de navegação baseados em integração de múltiplos sensores (inercial, GPS, odômetro, dentre outros) objetivam explorar as boas características de cada sensor. Um caso típico se refere à fusão IMU/GPS: o primeiro assegura elevadas taxas de amostragem e é imune a interferências, enquanto o segundo proporciona leituras de posição sem derivas. Embora diversas abordagens possam ser utilizadas para se realizar a integração, o uso do Filtro de Kalman é particularmente eficiente, pois sistematiza o projeto decompondo-o em duas fases: a) modelagem dos erros e b) sintonização dos parâmetros de projeto. Os principais aspectos teóricos e práticos envolvidos no desenvolvimento de sistemas de navegação usando múltiplos sensores, via Filtro de Kalman, serão abordados nesta palestra. Exemplos típicos de aplicação serão apresentados e discutidos.
Filtros de Partículas e suas Aplicações em Processamento de Sinais
Marcelo G. S. Bruno (ITA)
Sistemas de navegação baseados em integração de múltiplos sensores (inercial, GPS, odômetro, dentre outros) objetivam explorar as boas características de cada sensor. Um caso típico se refere à fusão IMU/GPS: o primeiro assegura elevadas taxas de amostragem e é imune a interferências, enquanto o segundo proporciona leituras de posição sem derivas. Embora diversas abordagens possam ser utilizadas para se realizar a integração, o uso do Filtro de Kalman é particularmente eficiente, pois sistematiza o projeto decompondo-o em duas fases: a) modelagem dos erros e b) sintonização dos parâmetros de projeto. Os principais aspectos teóricos e práticos envolvidos no desenvolvimento de sistemas de navegação usando múltiplos sensores, via Filtro de Kalman, serão abordados nesta palestra. Exemplos típicos de aplicação serão apresentados e discutidos.
13:30 Palestrante: Patricia Lusie Coelho Velozo
Título: Modelos para Dados Categóricos com Estrutura Temporal
14:00 Palestrante: Josiane da Silva Cordeiro
Título: Estimação de Parâmetros que definem Modelos Determinísticos
14:30 Palestrante: Mariana Albi de Oliveira Souza
Título: Algoritmos para Maximização da Utilidade Esperada
15:30 Palestrante: Nícia Custódio Hansen
Título: Modelos com Coeficientes Dinâmicos Variando no Espaço: Uma Aplicação para Dados de Contagem
16:00 Palestrante: Vera Lúcia Filgueira dos Santos
Título: Teoria de Resposta ao Item: uma abordagem generalizada das Curvas Características dos Itens
16:30 Palestrante: Denise Reis Costa
Título: Metodologia estatística para construção de testes adaptativos informatizados
* Cada apresentação terá duração de 20 minutos seguida de 10 minutos de arguição. Elas ficarão divididas em 2 blocos com intervalo de 15:00 às 15:30 hs entre eles.
Referências:
Beskos, A; Papaspiliopoulos, O. e Roberts, G. O. (2006). Retrospective exact simulation of diffusion sample paths with applications. Bernoulli, 12 (6), 1077-1098.
Beskos, A., Papaspiliopoulos, O., Roberts, G. O., e Fearnhead, P. (2006), Exact and computationally efficient likelihood-based inference for discretely observed diffusion processes (with discussion), J. R. Stat. Soc. B 68(3), 33-382.
Joint work with Adelmo Bertolde and Scott Holan.
Joint work with Carlos M. Carvalho, Michael Johannes and Nicholas Polson.
* O Prof. Hedibert ministrará um tutorial introdutório sobre Monte Carlo sequencial de 13 as 15 horas.