Cenapad-SP: 15 anos
apoiando a pesquisa nacional
Edison Zacarias da Silva
A computação
de alto desempenho - a missão do Centro Nacional
de Processamento de Alto Desempenho em São Paulo
(Cenapad-SP) - tem uma história interessante, que
teve início na metade do século passado com
o advento dos primeiros computadores. Métodos usados
em física computacional surgiram junto com os primeiros
computadores e foram usados no Projeto Manhattan, primeiro
grande programa que precisou de computação
de alto desempenho para seu desenvolvimento.
Nas décadas de 50 e 60 surgiram então os
primeiros computadores que foram usados para estudos que
antes eram impossíveis de serem feitos com papel
e lápis. Tinha início uma nova área
de investigação - a simulação
computacional. Problemas difíceis e que precisam
de uma grande capacidade computacional - a previsão
do tempo, as pesquisas espaciais e as pesquisas de artefatos
nucleares, entre outros exemplos -, que hoje só podem
ser estudados usando simulações, sempre usaram
centros de computação dedicados para estes
fins.
Aos poucos, os computadores começaram a entrar em
todas as áreas de atividades, da simulação
de novos aviões ao uso pelo sistema financeiro e
pelas bolsas de valores. Todo este serviço era feito
usando computadores de memória central, os chamados
main frames.
Quando Seymour Cray projetou o primeiro supercomputador,
na década de 1970, o objetivo era ter várias
instruções de um programa sendo executadas
praticamente ao mesmo tempo e, com isso, mais velocidade
de processamento. Os programas mais adequados para este
tipo de computador eram aqueles cujas instruções
eram independentes umas das outras - processamento paralelo
- ou poderiam ser executadas em várias unidades de
processamento ao mesmo tempo - processamento vetorial. Os
computadores evoluíram e os problemas possíveis
de serem tratados, cresceram.
Na década de 80, uma mudança de paradigma
aconteceu: os microprocessadores iniciaram uma nova fase
em ciência computacional, permitindo, com a miniaturização,
o advento das estações de trabalho, computadores
de porte médio que eram unidades independentes e
cabiam em cima de uma mesa. Um pesquisador podia agora ter
seu próprio sistema computacional e ficar independente
dos centros de computação, onde anteriormente
levava seus trabalhos para serem processados. Surgiram também
os computadores pessoais, os PCs e a internet.
Parecia que para muitas das aplicações os
centros de computação haviam se tornado obsoletos.
Isto era, de fato, uma visão equivocada. É
verdade que hoje alguns pesquisadores e algumas empresas
têm seus sistemas computacionais autônomos e,
às vezes, é possível um grupo montar
um sistema a partir de vários computadores pessoais
em rede, fazendo um cluster ou até com o uso
de processadores de videogames. Porém, muitos problemas
ainda demandam mais capacidade computacional que estas soluções
caseiras.
De fato, no mundo hoje a computação de alto
desempenho está mais forte do que nunca. Ela permeia
quase todas as áreas de atuação do
homem. Além das áreas de previsão de
tempo, uma das primeiras a usar um supercomputador Cray,
e as outras já mencionadas, dois exemplos são
a tecnologia dos carros de Fórmula 1, que evolui
semanalmente, entre uma corrida e outra, devido ao projeto
virtual no qual novos modelos e aperfeiçoamentos
aos projetos são simulados em supercomputadores e
posteriormente feitos e testados nos carros ao longo de
um campeonato; o outro exemplo é a indústria
farmacêutica, que utiliza o projeto virtual de fármacos,
que ajuda a melhorar os produtos encurtando o tempo de desenvolvimento
de um novo fármaco a partir de simulações
feitas em supercomputadores.
Apesar de todo esse desenvolvimento nos últimos
50 anos, a demanda por Processamento de Alto Desempenho
(PAD ou, em inglês, High Performance Computing
- HPC) cresce proporcionalmente à inovação
na construção dos computadores. Em outras
palavras, mesmo com tanta evolução, os programas
continuam precisando de mais memória e mais poder
de processamento para tentar realizar cálculos cada
vez mais complexos.
Por isso, uma das estratégias para atender tais
demandas é o agrupamento de computadores em clusters.
Neles, os vários computadores que os compõem
são ligados por uma rede local de alta velocidade
e trabalham juntos como se fossem um único computador
com capacidade bem superior. Visto que cada componente tem
sua própria memória e seu processador, o cluster
pode atender programas com maiores demandas por memória
e poder de processamento.
Conhecendo a importância da tecnologia de processamento
de alto desempenho para a competitividade do país
e para o seu desenvolvimento econômico, o Ministério
da Ciência e Tecnologia (MCT), por meio da Financiadora
de Estudos e Projetos (Finep), implementou o Sistema Nacional
de Processamento de Alto Desempenho (Sinapad), para tornar
mais fácil o aproveitamento pelo país das
oportunidades oferecidas por esta tecnologia.
O Sinapad foi concebido como um sistema cooperativo e geograficamente
distribuído com cobertura nacional, hoje composto
de oito centros, sendo o Cenapad-SP um deles.
Nestes 15 anos, o Cenapad-SP vem cumprindo sua missão
de apoiar as atividades de P&D nas áreas de Ciência
e Tecnologia do país, disponibilizando um ambiente
de alto desempenho.
No período de 1994 a 2002, o parque computacional
foi crescendo por meio da instalação de equipamentos
IBM e, a partir de 2005, com os equipamentos da SGI.
O Cenapad-SP iniciou suas atividades com um IBM 9076 SP1
com 8 nós interligados pelo High Performance Switch
- cada nó com 256 MB de RAM e disco de 2 GB e um
cluster de 8 IBM RISC6000/560, sendo cada estação
com 128 MB de RAM e 1,7 GB de disco.
Em julho de 2002, instalamos uma máquina IBM 7040-671
conhecida como Regatta, com 4 processadores Risc/power4
e 4 GBytes de memória, que impulsionou a pesquisa
por oferecer 22GFlops teóricos de desempenho.
Em dezembro de 2005, instalamos os primeiros equipamentos
SGI/Altix 1350 adquiridos com recursos da Fapesp, e quintuplicamos
o poder computacional teórico do parque computacional
do Cenapad-SP, acrescentando 420GFlops aos 105GFlops dos
equipamentos já existentes. Nesta mesma data, a capacidade
de armazenamento em disco foi acrescida de 7.56 TB. Foram
instalados 4 nós, cada um deles com 16 processadores
Itanium2, 64GB de memória e desempenho teórico
de 96Gflops, além de dois outros nós que,
juntos, totalizam 36GFlops.
Em fevereiro de 2008, instalamos o equipamento SGI/Altix
450, adquirido com recursos do Sinapad através da
RNP (Rede Nacional de Pesquisa), com processadores Itanium2,
composto de 104 processadores (208 cores) e 592 GB de memória
RAM, totalizando uma capacidade de processamento teórica
em torno de 1.1 TFLOPs, além de 36 TB de disco externo.
É importante realçar que servidores mais
robustos e com uma melhor relação memória/processador
podem resolver de maneira mais eficiente os grandes problemas
e desafios computacionais, típicos em um ambiente
de alto desempenho. Isso é um diferencial imprescindível
para um centro como o Cenapad-SP, que se firmou no cenário
brasileiro como referência em processamento científico
de alto desempenho nos últimos anos.
O Cenapad-SP é responsável por uma produção
científica de alta qualidade. Os serviços
oferecidos pelo centro se convertem em resultados que podem
ser medidos pela produção científica
de seus usuários, representada por 689 artigos em
revistas internacionais indexadas, 244 participações
em conferências internacionais, entre outros indicadores.
Hoje são 122 projetos de pesquisa e 306 usuários
utilizando o Cenapad-SP. São projetos de várias
áreas de conhecimento e de diversas instituições
do país.
Além destes indicadores, devemos enfatizar que alguns
dos trabalhos mais importantes feitos neste início
de milênio em nanociência foram desenvolvidos
usando recursos do Cenapad-SP. Nos últimos anos foram
publicados 14 artigos na prestigiosa Physical Review
Letters, dos quais dois têm um destaque adicional.
O artigo How do Au-nanowires break?, autores E.
Z. da Silva, A.J.R. da Silva and A. Fazzio, Physical Review
Letters, 87, 256102 (2001) foi matéria da capa do
fascículo 18. Esta foi a primeira vez que um artigo
de autores brasileiros foi capa desta importante revista.
Isto deu ao artigo uma grande visibilidade internacional
e, no cenário nacional, foi matéria de artigo
de meia página na Folha Ciência, e matéria
de capa da revista Pesquisa Fapesp em fevereiro de
2002.
O segundo trabalho brasileiro que foi matéria de
capa no Physical Review Letters também usou
o parque do Cenapad-SP: Molecular-Dynamics Simulations
of Carbon Nanotubes as Gigahertz Oscillators, Physical Review
Letters, 90, 55504-1 (2003).S. B. Legoas, V. R. Coluci,
S. F. Braga, P. Z. Coura, S. O. Dantas, e D. S. Galvão.
Sendo um centro nacional, o Cenapad-SP atende a usuários
de diversas instituições do país, como
podemos ver no mapa abaixo, que apresenta a distribuição
de uso por estado.
A produção científica associada à
pesquisa desenvolvida pelos nossos usuários é
apresentada na tabela abaixo:
Ao longo dos anos, o uso do parque computacional foi sempre
crescente como mostra o gráfico abaixo, o que evidencia
a demanda nacional existente. Neste gráfico, o uso
de CPU apresentado corresponde ao uso total da capacidade
instalada evoluindo juntamente com ela.
Ao longo destes 15 anos, o uso por instituição
variou, tendo sempre a Unicamp e a USP como nossas maiores
usuárias.
Quando olhamos o uso do sistema computacional do Cenapad-SP
por área do conhecimento, vemos que a física
e a química são nossos maiores usuários.
Porém o Centro atende várias outras áreas,
como por exemplo a biologia, que está usando cada
vez mais o sistema.
Concluímos que o Cenapad-SP está contribuindo
de modo significativo para o avanço do uso da tecnologia
de processamento de alto desempenho no país. O Centro
é um grande responsável pelo apoio às
principais publicações brasileiras que usam
PAD.
Edison Zacarias da Silva é
coordenador do Cenapad-SP e professor do Instituto de Física
"Gleb Wataghin" (IFGW)