Unicamp
Jornal da Unicamp
Baixar versão em PDF Campinas, 08 de setembro de 2014 a 12 de setembro de 2014 – ANO 2014 – Nº 605Mapeamento busca causas da resistência a quimioterápicos
Metodologia seleciona potenciais alvos terapêuticos em casos de leucemiaA resistência às drogas da quimioterapia é uma das principais causas de fracasso no tratamento do câncer, o que faz com que identificar e entender as distinções entre células resistentes e células suscetíveis seja um importante objetivo da pesquisa biomédica. Tese de doutorado defendida no Instituto de Biologia (IB) da Unicamp apresenta uma metodologia que permite filtrar, dentre milhares de diferenças constatadas experimentalmente, as que têm mais chance de participar do processo de resistência e que poderão, no futuro, ser alvo de intervenção terapêutica.
Em seu trabalho, o pesquisador Renato Milani partiu de um conjunto de mais de quatro mil proteínas, definido por meio de espectrometria de massa no Instituto Max Planck de Bioquímica da Alemanha, que apresentam características diversas em células de leucemia comuns e em células resistentes, e reduziu a lista a cerca de 150. “Tínhamos uma lista com milhares de proteínas e precisávamos identificar quais tinham maior probabilidade de estarem relacionadas ao processo de resistência”, disse Milani, em entrevista ao Jornal da Unicamp. “É possível que algumas das alterações identificadas no conjunto não tenham relação direta com o processo de resistência”. A tese de Milani foi orientada pelo professor Eduardo Galenbeck, com coorientação de Carmen Veríssima Ferreira-Halder.
O pesquisador acredita que “o maior mérito do trabalho é o desenvolvimento de uma metodologia capaz de mapear, nessa lista de proteínas alteradas, quais têm maior probabilidade de ter relação com o processo de resistência”. Da centena de proteínas da relação final, Milani conseguiu caracterizar cerca de 30 em laboratório, confirmando o envolvimento de 60% a 70% delas na resistência à quimioterapia, uma taxa de validação superior à obtida com o uso de critérios menos sofisticados, como a mera seleção das moléculas que se apresentam mais alteradas.
Aprendizado de máquina
A pesquisa de Milani envolveu ferramentas de bioinformática, incluindo algoritmos de aprendizado de máquina. Na Unicamp, foi desenvolvido um software específico para minerar bancos de dados internacionais, em busca de informações pré-existentes sobre as proteínas estudadas.
“A metodologia envolveu dois parâmetros principais: o computacional e o experimental. Neste último, usamos informação proveniente do proteoma e do fosfoproteoma dessas linhagens, com o objetivo de identificar diferenças significativas na expressão e fosforilação das proteínas”, disse ele, explicando que “proteoma” é o conjunto de proteínas presentes numa célula num dado momento, enquanto o “fosfoproteoma” é o conjunto de proteínas modificadas por um processo chamado fosforilação, capaz de alterar a atividade da molécula. “Criamos, então, um subconjunto a partir dos dados experimentais, o que comumente é feito e não depende de nenhuma abordagem computacional, mas que já se sabia não ser uma abordagem bem-sucedida na validação em laboratório”, afirmou. “Para contornarmos o problema, cruzamos esse subconjunto experimental com um conjunto obtido de forma completamente independente: de forma computacional”.
O software foi alimentado com duas listas iniciais de proteínas, levantadas na literatura – as que sabidamente estão relacionadas à resistência à quimioterapia em leucemia e as que sabidamente não estão envolvidas nesse processo. “Esse algoritmo é capaz de identificar algumas características presentes nas proteínas desses dois conjuntos”, disse Milani. “Então, definidos os parâmetros de cada conjunto, é possível classificar uma determinada proteína como pertencente a um deles, de acordo com suas próprias características”. A partir dos parâmetros das proteínas conhecidas, o sistema classifica as que ainda se encontram sob análise.
“A partir daí, o sistema estabeleceu um ranking de probabilidades”, explicou Milani. “Obtivemos uma lista de proteínas com maior probabilidade de ter relação com o processo de resistência, de forma completamente independente do conjunto de dados inicial”.
Em seguida, o pesquisador cruzou as moléculas que estavam no topo do ranking de probabilidades com o conjunto de proteínas suspeitas, obtido por critério experimental. “E foi aí que surgiram aquelas aproximadamente 100 proteínas que levamos para validação em laboratório”, disse. “Acabei conseguindo validar uma fração delas, e várias mostraram resultados satisfatórios em experimentos no laboratório, apresentando variação significativa na célula resistente em relação à não resistente”.
Redes
Depois da filtragem da relação inicial de mais de quatro mil proteínas e do cruzamento das moléculas selecionadas pelo computador com a lista de proteínas obtida experimentalmente, o pesquisador buscou levantar as interações entre as proteínas identificadas. “Surgiu a seguinte questão: as proteínas identificadas são capazes de agir no processo de resistência de forma independente umas das outras, ou estão relacionadas de algum modo?”
Um software foi utilizado para desenhar as redes de interação das mais de cem proteínas selecionadas. “Era possível conhecer, por exemplo, a rede de interações de uma proteína A e a rede de uma proteína B. E, se fosse o caso, que A está na rede de B, e vice-versa. Também pude pesquisar as redes em um nível superior: verificar se havia alguma proteína C, fora da lista de proteínas selecionadas, capaz de interagir tanto com A quanto com B”.
Mineração online
Para levantar o que já se sabia, na literatura científica, sobre as proteínas investigadas, foi criado um programa para buscar essas informações em bancos de dados. “Esse software, que foi desenvolvido durante o trabalho, faz uma mineração na literatura”, explicou Milani. “Há informações, em diversos bancos de dados, sobre o efeito que a fosforilação tem numa determinada proteína. A incorporação dessas informações para todas as proteínas do conjunto permitiria identificar rapidamente o efeito que a fosforilação tem em uma determinada proteína presente no fosfoproteoma. É algo que acaba chamando a atenção para essa proteína nos estudos subsequentes”.
Milani destacou que houve uma preocupação em levar em conta a qualidade e a confiabilidade da informação levantada pelo software nos bancos de dados internacionais. “Basicamente, nos bancos de dados disponíveis para pesquisadores, há dois tipos de dado: os que foram obtidos a partir de validações experimentais, referenciadas na literatura, e informações obtidas por meio de simulações computacionais”, disse.
“Por exemplo, existe hoje uma quantidade muito grande de proteínas cuja função é inferida através de similaridade com outras proteínas: para uma proteína com função desconhecida, é possível avaliar computacionalmente que ela possui 70% de similaridade com outra cuja função é conhecida. Dependendo da região da proteína onde ocorre maior similaridade, é possível supor que tenham funções semelhantes”. Nos bancos de dados mais sérios, disse ele, a distinção entre os dois métodos é feita de forma clara, e isso foi levado em conta na tese, com a preferência pelos dados referenciados.
Milani destaca a importância do uso de ferramentas computacionais na pesquisa biológica. “A bioinformática tenta facilitar o estudo de grandes quantidades de dados biológicos. Acho que esse é o maior mérito dessa ciência multidisciplinar, já que envolve biologia, matemática, física, estatística e computação. São diversas disciplinas interagindo para gerar um conhecimento que só tende a facilitar a vida, por exemplo, do biólogo de bancada”, disse. “Acabei desempenhando os dois papéis: estava lá no computador e fui para a bancada. E senti na pele a dificuldade de trabalhar com uma grande quantidade de dados: mesmo com um direcionamento, ao invés de quatro mil proteínas para testar agora são pouco mais de cem, ainda assim não é um estudo trivial. Mas, com certeza, foi facilitado pelas ferramentas de bioinformática”.
O pesquisador adverte, no entanto, que sempre é preciso contar com um cientista humano para interpretar os resultados da informática. “Tive a oportunidade de ministrar alguns minicursos para as disciplinas de graduação do curso de Ciências Biológicas do IB, com o objetivo de trazer ferramentas de bioinformática para que os alunos tivessem contato e soubessem não só como utilizar as ferramentas, mas também como interpretar os resultados”, disse. “Sempre digo: o computador sempre retorna alguma informação, mas cabe ao pesquisador, ao biólogo, que está avaliando esses dados, ser capaz de investigar e determinar se a informação é correta ou não, e por quê”.
“Sempre tento incutir isso neles”, acrescentou o pesquisador. “Porque já vi muita gente usando o software de maneira indiscriminada, falando: ‘a solução está lá, basta colocar os dados que o software dá a resposta’. Não é bem assim. Sempre digo que o lado biológico é muito importante. O computador é um facilitador, mas não é a solução de todos os nossos problemas”. A bioinformática, disse ele, ajuda muito a definir o foco da pesquisa, mas não dispensa o trabalho de laboratório.
Futuro
A seleção de proteínas feita pelo sistema usado na tese de Milani aponta caminhos para a pesquisa da resistência a quimioterápicos em casos de leucemia, mas ainda é cedo para falar em novos fármacos ou estratégias terapêuticas derivados do estudo. “Este trabalho é um primeiro passo na compreensão do mecanismo de resistência”, disse ele. “Ainda é cedo para falar, por exemplo, em novos fármacos, mas a pesquisa precisa começar em algum lugar. É como se estivéssemos no escuro, tateando sem saber direito para onde seguir. Com o auxílio das ferramentas de bioinformática, fomos capazes de apontar uma pequena luz lá no fundo, indicando um caminho. Agora, é preciso perseguir o caminho para ver se essa luz aumenta”.
Publicação
Tese: “Mapeamento de vias de sinalização envolvidas na resistência a quimioterápicos em células leucêmicas: uma abordagem computacional”
Autor: Renato Milani
Orientador: Eduardo Galembeck
Coorientadora: Carmen Veríssima Ferreira-Halder
Unidade: Instituto de Biologia (IB)