Please use this identifier to cite or link to this item: https://app.uff.br/riuff/handle/1/5741
Title: Using protein-protein interactions data to improve predictions of the effect of aging-related genes on the longevity of model organisms
Authors: Miranda, Igor Martire de
metadata.dc.contributor.advisor: Carvalho, Alexandre Plastino de
metadata.dc.contributor.advisorco: Silva, Pablo Nascimento da
metadata.dc.contributor.members: Carvalho, Aline Marins Paes
Carvalho, Jonathan dos Santos
Issue Date: 7-Feb-2018
Abstract: Este trabalho foca em melhorar a performance preditiva na tarefa de classifica ̧c ̃ao do efeito de genes relacionados ao envelhecimento na longevidade de organismos-modelo. Normalmente, bases de dados contru ́ıdas para este problema usam atributos da ontolo- gia de genes. N ́os demonstramos que, ao introduzirmos um novo conjunto de atributos baseados em intera ̧c ̃oes prote ́ına-prote ́ına, conseguimos melhorar a classifica ̧c ̃ao de forma estatisticamente significativa. Embora ben ́efica, a introdu ̧c ̃ao desses atributos geram um novo problema: realizar a tarefa de classifica ̧c ̃ao usando dados incertos. Isso ocorre porque os valores desses novos atributos representam apenas um grau de certeza da existˆencia de uma intera ̧c ̃ao entre duas prote ́ınas. Para lidar com esse problema, propomos um novo coeficiente de similaridade, baseado no coeficiente de Jaccard, e mostramos que, ao us ́a- lo, podemos nos beneficiar desses dados incertos introduzidos nas bases sem aumentar demasiadamente a complexidade da solu ̧c ̃ao de classifica ̧c ̃ao. Por fim, n ́os demonstramos como obter resultados ainda melhores atrav ́es da aplica ̧c ̃ao de uma t ́ecnica de sele ̧c ̃ao de atributos.
metadata.dc.description.abstractother: This work focuses on improving the predictive performance on the task of clas- sifying the e↵ect of aging-related genes on the longevity of model organisms. Usually, datasets for this problem are built using gene ontology features. We show that, by intro- ducing a new set of features based on protein-protein interactions, we can improve the classification in a statistically significant way. Although beneficial, the introduction of these features brings a new problem for this task: performing classification based on un- certain information. This happens because the values of the new features only represent how certain we can be that an interaction exists between two proteins. To cope with this problem, we propose a novel similarity coe cient, based on the Jaccard index, and show that, by using it, we can benefit from the introduced uncertain data without adding too much complexity to the classification solution. Finally, we demonstrate how to achieve even better results on this task by performing a feature selection procedure.
URI: https://app.uff.br/riuff/handle/1/5741
Appears in Collections:TGI - Trabalhos de Conclusão de Curso - Niterói

Files in This Item:
File Description SizeFormat 
Monografia_IgorMartireDeMiranda.pdf623.47 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.