Please use this identifier to cite or link to this item: https://app.uff.br/riuff/handle/1/5801
Title: Aplicação de técnicas de mineração de dados para prevenção de erros na geração de árvores filogenéticas
Authors: Ramalho, Rafael Ferreira
metadata.dc.contributor.advisor: Oliveira, Daniel Cardoso Moraes de
metadata.dc.contributor.advisorco: Carvalho, Aline Marins Paes
metadata.dc.contributor.members: Viterbo Filho, José
Ocanã, Kary Ann del Carmen Soriano
Issue Date: 20-Feb-2018
Abstract: As árvores filogenéticas apresentam a relação evolutiva entre organismos segundo a teoria da evolução de Darwin e apoia o desenvolvimento e a escolha de fármacos para tratar uma determinada doença nos dias atuais. Infelizmente, o processo que leva a geração de tais árvores (workflow) é computacionalmente intensivo, e, dependendo dos parâmetros escolhidos, existe uma alta taxa de falha em tais processos. Pensando na prevenção dos casos de erro de execução de workflows científicos na área de filogenia, foram utilizadas algumas técnicas de mineração de dados, tendo como base dados de execuções anteriores, de forma a criar um modelo preditivo para tais casos. Criando padrões com estas execuções extrai-se informações importantes que podem ser utilizadas para prever se futuras execuções vão ter resultado esperado ou não vão agregar nenhum valor. O objetivo deste estudo é exatamente criar esses padrões para que possam ser identificados conjuntos de parâmetros que geram resultado indesejado. Para isto utiliza-se os dados de proveniência do Sistema de Gerência de Workflows Científicos SciCumulus [1] e o WEKA [2] como ferramenta de mineração de dados.
metadata.dc.description.abstractother: Phylogenetic trees present the evolutionary relationship between organisms accor- ding to Darwin’s theory of evolution and support the development and choice of drugs to treat a particular disease today. Unfortunately, the process that leads to the generation of such workflows is computationally intensive, and, depending on the parameters chosen, there is a high failure rate in such processes. Considering the prevention of error cases in the execution of scientific workflows in the field of phylogeny, some techniques of data mining were used, based on data from previous executions, in order to create a predictive model for such cases. Creating standards with these executions extrat important infor- mation that can be used to predict whether future executions will have expected result or will not agregate any value. The purpose of this study is to create these patterns so that they can be identified the sets of parameters that generate undesired results. For this, was use the provenance data from the SciCumulus Scientific Workflows Management System [1] and the WEKA [2] as data mining tool.
URI: https://app.uff.br/riuff/handle/1/5801
Appears in Collections:TGI - Trabalhos de Conclusão de Curso

Files in This Item:
File Description SizeFormat 
meu_projeto__Rafael_Ramalho_revisao_posApresentação vFinal.pdf725.38 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.