Ciclo de Palestras – Segundo Semestre de 2006
As palestras são realizadas na sala C-116 do Centro Tecnológico as 15:30 h, a menos que ocorra aviso em contrário.
Soma de variáveis aleatórias independentes: aplicações em atuária e finanças
Gilmar Jorge de Oliveira Jr.
A teoria do risco tradicional assume que os riscos individuais de uma carteira de seguro sejam independentes. A determinação da função distribuição dos sinistros agregados é obtida através de recursões de Panjer ou de De Pril, convoluções ou aproximação por momentos. A tendência moderna em atuaria é modelar conjuntamente os riscos atuárial e finaceiro, gerando, como veremos, somas de variáveis aleatórias dependentes. Grande esforço tem sido desenvolvido, na literatura recente, para determinar limites superior e inferior para a distribuição do sinistro agregado. Nesta apresentação ilustraremos esses principios e nossa proposta futura é fazer a inferência nesses modelos, sobretudo do ponto de vista Bayesiano.
Modelagem Conjunta de Média e Variância: Uma Aplicação ao Problema de Estimação em Pequenos Domínios
Joaquim Henriques Vianna Neto
O termo pequenos domínios (ou pequenas áreas) é freqüentemente utilizado para denominar áreas geográficas pequenas, tais como municípios, distritos e bairros. Num sentido mais amplo, é utilizado também para descrever um pequeno subconjunto da população, podendo ser, inclusive, resultado da classificação cruzada de duas ou mais variáveis. As informações para pequenas áreas podem ser obtidas a partir de censos e enumerações populacionais, com a população sendo inteiramente investigada, ou através de pesquisas por amostragem. Pesquisas por amostragem geralmente têm como principal característica um tamanho de amostra reduzido nas pequenas áreas; ou até mesmo a ausência de unidades amostrais em algumas áreas. Dessa forma, não é possível obter estimativas com boa precisão a partir de estimadores diretos, baseados unicamente no desenho da amostra. Uma alternativa é utilizar uma abordagem que considere também as estimações de regiões vizinhas no espaço e no tempo. Para isso, são utilizados aqui, modelos dinâmicos bayesianos de crescimento exponencial com componentes que variam espacialmente segundo um processo gaussiano. Particularmente, apresentamos uma aplicação à dados do Censo Demográfico Brasileiro e da Pesquisa Nacional por Amostra de Domicílios (PNAD), ambos divulgados pelo Instituto Brasileiro de Geografia e Estatística (IBGE). O objetivo é obter as estimativas dos tamanhos populacionais dos municípios incluídos na amostra da PNAD, combinando os dados da pesquisa com aqueles dos censos. Ao utilizar dados de pesquisas com diferentes variabilidades e tipos de erros, é preciso considerar de modo diferenciado as precisões das informações levantadas. Neste trabalho, propomos uma modelagem conjunta de média e variância para identificar a quantidade de informação de um estimador a partir da estimativa de sua variância.
In a recent statistical literature, several concepts of a median of a multidimensional data set or a distribution have been introduced. The idea is always to select one determining property of the median of a real valued random variable and then try to generalize it in more dimensions. However, properties that are equivalent in one dimension are not necessarily equivalent in higher dimensions, and this is the reason why none of approachesmakes a definitive solution to defining what is also known as a center of multidimensional data set or a multivariate distribution. The talk is about yetanother approach, where we start with a novel equivalent definition of a median in a univariate case, extend it to multivariate, and then show a numberof interesting results in theory and applications. We discuss some properties of Type D depth functions introduced by Zuo and Serfling, Ann. Statistics 28 (2000), 461–482, and we show that the only reasonably well behaved depth function of this type is the halfspace depth.
Análise Bayesiana da Teoria de Resposta ao Item: uma Abordagem Generalizada
Flavio B. Gonçalves
Nesta dissertação é feito um estudo generalizado da Teoria de Resposta ao Item (TRI) através de propostas que permitam a modelagem do funcionamento diferencial do item – DIF (Differential Item Functioning) no contexto da TRI usando uma abordagem bayesiana. Primeiramente, é proposto um modelo de TRI que considera a existência de DIF(na discriminação e na dificuldade), porém, assumindo-se a hipótese de que os itens com DIF são conhecidos. São feitos estudos de simulação para analisar a eficiência do modelo e da metodologia utilizada para se fazer a inferência. Além disso, o modelo é aplicado para a análise de um conjunto de dados reais referente ao Programa Nova Escola do Estado do Rio de Janeiro. Posteriormente, é proposto um modelo que engloba a detecção de itens com DIF, ou seja, que não necessite da hipótese de se conhecer quais itens possuem funcionamento diferencial. Novamente, são feitos estudos de simulação com tal modelo e também a análise do mesmo conjunto de dados reais.
Aspectos computacionais de modelos espaciais
Vinicius D. Mayrink
Nos últimos tempos vem crescendo o número de aplicações práticas realizando análises de dados espacialmente distribuídos em uma área. Diferentes modelagens podem ser determinadas dependendo do tipo de problema que se deseja estudar. A modelagem considerada neste trabalho leva em conta a divisão desta área em n regiões. Para cada região a variável de interesse é observada sendo o conjunto completo de observações.A estrutura de vizinhança que estabelece a relação de dependência entre as observações é um aspecto importante a ser considerado. O estudo de uma série de dados observados objetiva modelar e analisar esta dependência. A estrutura espacial mais simples é configurada da seguinte forma: A i-ésima observação, , apresenta dois vizinhos que são e . Perceba que esta particular estrutura representa também uma série temporal com n observações, que está na classe dos Modelos Dinâmicos Lineares (MDL’s). Estruturas de vizinhanças mais complexas podem ser consideradas, isto é, uma observação qualquer apresenta três ou mais vizinhos. Neste caso devem ser utilizados modelos espaciais com estrutura de vizinhança mais geral. Levando em consideração as diferentes possibilidades de especificação de uma estrutura espacial surge a seguinte reflexão: Quando uma área dividida em n regiões é analisada pode-se ter estruturas de vizinhanças mais simples, onde a maioria das regiões apresenta no máximo dois vizinhos, ou estruturas mais gerais onde o número de vizinhos é grande. Existiria influência da quantidade de vizinhos sobre o desempenho do modelo espacial utilizado? Que tipo de alterações observam-se nos resultados fornecidos ou nos algoritmos utilizados por estes modelos conforme o número de vizinhos é aumentado? A busca pela resposta destas questões tornou-se o principal objetivo que motivou o desenvolvimento deste trabalho. A análise bayesiana é empregada aqui e três esquemas, propostos na literatura, serão utilizados para a amostragem da distribuição a posteriori dos parâmetros do modelo. Estes esquemas diferem-se basicamente na estrutura de blocagem dos parâmetros que podem ser amostrados separadamente ou conjuntamente. É por meio deles que será estudado o desempenho dos modelos espaciais e dos algoritmos MCMC por eles utilizados perante diferentes quantidades de vizinhos.Iniciando pela aplicação de um modelo espacial simples este trabalho desempenha também uma extensão estudando o modelo espacial com componente de regressão múltipla. Diferentes aspectos são considerados para análise, entre eles estão resultados de inferência, verificação de convergência e análise da estrutura de autocorrelação das cadeias obtidas.