Please use this identifier to cite or link to this item:
https://app.uff.br/riuff/handle/1/5741
Title: | Using protein-protein interactions data to improve predictions of the effect of aging-related genes on the longevity of model organisms |
Authors: | Miranda, Igor Martire de |
metadata.dc.contributor.advisor: | Carvalho, Alexandre Plastino de |
metadata.dc.contributor.advisorco: | Silva, Pablo Nascimento da |
metadata.dc.contributor.members: | Carvalho, Aline Marins Paes Carvalho, Jonathan dos Santos |
Issue Date: | 7-Feb-2018 |
Abstract: | Este trabalho foca em melhorar a performance preditiva na tarefa de classifica ̧c ̃ao do efeito de genes relacionados ao envelhecimento na longevidade de organismos-modelo. Normalmente, bases de dados contru ́ıdas para este problema usam atributos da ontolo- gia de genes. N ́os demonstramos que, ao introduzirmos um novo conjunto de atributos baseados em intera ̧c ̃oes prote ́ına-prote ́ına, conseguimos melhorar a classifica ̧c ̃ao de forma estatisticamente significativa. Embora ben ́efica, a introdu ̧c ̃ao desses atributos geram um novo problema: realizar a tarefa de classifica ̧c ̃ao usando dados incertos. Isso ocorre porque os valores desses novos atributos representam apenas um grau de certeza da existˆencia de uma intera ̧c ̃ao entre duas prote ́ınas. Para lidar com esse problema, propomos um novo coeficiente de similaridade, baseado no coeficiente de Jaccard, e mostramos que, ao us ́a- lo, podemos nos beneficiar desses dados incertos introduzidos nas bases sem aumentar demasiadamente a complexidade da solu ̧c ̃ao de classifica ̧c ̃ao. Por fim, n ́os demonstramos como obter resultados ainda melhores atrav ́es da aplica ̧c ̃ao de uma t ́ecnica de sele ̧c ̃ao de atributos. |
metadata.dc.description.abstractother: | This work focuses on improving the predictive performance on the task of clas- sifying the e↵ect of aging-related genes on the longevity of model organisms. Usually, datasets for this problem are built using gene ontology features. We show that, by intro- ducing a new set of features based on protein-protein interactions, we can improve the classification in a statistically significant way. Although beneficial, the introduction of these features brings a new problem for this task: performing classification based on un- certain information. This happens because the values of the new features only represent how certain we can be that an interaction exists between two proteins. To cope with this problem, we propose a novel similarity coe cient, based on the Jaccard index, and show that, by using it, we can benefit from the introduced uncertain data without adding too much complexity to the classification solution. Finally, we demonstrate how to achieve even better results on this task by performing a feature selection procedure. |
URI: | https://app.uff.br/riuff/handle/1/5741 |
Appears in Collections: | TGI - Trabalhos de Conclusão de Curso - Niterói |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Monografia_IgorMartireDeMiranda.pdf | 623.47 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.