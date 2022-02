Washington Segundo, coordenador da Área de Tratamento, Análise e Disseminação da Informação Científica do Ibict, fala sobre o uso das tecnologias de inteligência artificial e blockchain na gestão de dados de pesquisas científicas

As tecnologias de inteligência artificial (IA) e blockchain estão sendo aplicadas a vários cenários digitais. O Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict) tem pesquisado soluções tecnológicas que utilizam essas tecnologias aplicadas a sistemas de informação científica e técnica.

Washington Segundo, coordenador da Área de Tratamento, Análise e Disseminação da Informação Científica do Ibict, avalia que uma das áreas mais promissoras é a gestão de dados de pesquisa científica no âmbito da Ciência Aberta.

“Inteligência artificial é um termo guarda-chuva que designa qualquer máquina que simule o comportamento inteligente humano”, explica Washington Segundo. De acordo com o especialista, a inteligência artificial já está presente e vem sendo aplicada em diversos projetos do Ibict, especialmente no tratamento de grandes volumes de dados, na otimização de processos e em soluções de interoperabilidade entre sistemas.

O ecossistema da Ciência Aberta possui diversos agentes que participam de um amplo fluxo de informação como bibliotecas universitárias, instituições de pesquisa, financiadores, revistas científicas e plataformas de acesso aberto. Nesse cenário, o Ibict desenvolve plataformas de dados abertos que interoperam com a vasta e crescente rede de repositórios e sistemas de ciência no Brasil.

Um exemplo é o Oasisbr, mecanismo de busca multidisciplinar desenvolvido pelo Ibict que reúne a produção científica nacional em acesso aberto. Para isso, o Oasisbr coleta registros e agrega documentos de um grande volume de fontes de informação científica como repositórios digitais, teses e dissertações e periódicos científicos eletrônicos.

Outros projetos do Ibict são o Lattes Data, plataforma de armazenamento de dados científicos oriundos dos projetos fomentados pelo CNPq, e o Sistema BrCris, que tem por objetivo estabelecer um modelo único de organização da informação científica de todo o ecossistema da pesquisa brasileira.O BrCris, por exemplo, agrega e armazena registros coletados de distintas fontes abertas nacionais, como a Plataforma Lattes e a Plataforma Sucupira, além de cruzamento com bases internacionais.

De acordo com Washington Segundo, o principal caso de aplicação de IA nesses projetos é no tratamento e conciliação automática de registros provenientes de diferentes bases. “Por exemplo, uma máquina tem que ser capaz de identificar se um dado artigo publicado em uma revista científica possui uma versão depositada em um repositório. Este tipo de análise é realizada com base nos metadados deste artigo, que são título, ano de publicação, autores, entre outras informações relevantes, para se chegar à conclusão que se trata do mesmo objeto presente em diferentes fontes”, explica.

CONTINUA DEPOIS DA PUBLICIDADE

O Ibict também estuda técnicas de machine learning no uso de algoritmos que “aprendem” a partir dos dados. O Ibict já desenvolveu algoritmos inteligentes que buscam identificar padrões existentes em conjuntos de dados (clusters ou agrupamentos) para a identificação de especialistas e de redes de colaboração de pesquisas. O instituto também realiza estudos para a aplicação de IA na otimização da recuperação da informação em sistemas de informação bibliográfica, que constituem um volume expressivo de informação.

A blockchain é uma tecnologia emergente e inovadora. Blockchain pode ser definido como uma tecnologia de registro de transações entre computadores, de forma distribuída. “As informações a respeito destas transações não são armazenadas num único servidor, mas diluídas em blocos de códigos que se organizam em cadeias, que por sua vez se replicam em fragmentos alocados em diversos computadores”, pontua Washington Segundo. A tecnologia foi popularizada a partir de 2008, quando surgiu o bitcoin. Mas as criptomoedas são apenas uma das muitas possíveis aplicações de blockchain.

Recentemente, o Ibict passou a pesquisar a tecnologia para o desenvolvimento de bases de dados com registros distribuídos. O coordenador explica que o Ibict busca construir uma rede de blockchain distribuída no ecossistema de pesquisa, na qual cada participante possa armazenar com segurança informações e dados científicos e os pesquisadores possam acessar, validar, compartilhar e verificar de forma eficiente os dados na rede. O uso da blockchain também oferece potencial de maior segurança na abertura de dados de pesquisa.

“Entendemos que blockchain pode ser uma ferramenta útil na geração de identificadores persistentes para objetos digitais. Retornando ao exemplo do artigo científico que ocorre em duas bases distintas, uma vez que identificamos esta dupla ocorrência, podemos atribuir uma identificação permanente a este artigo, uma espécie de RG deste objeto, fazendo com que quaisquer outras réplicas que ele possa vir a ter sejam facilmente detectadas por meio do identificador. Acreditamos que blockchain é uma tecnologia promissora para ser aplicada a este problema”, completa o pesquisador. Potencialmente, cada uma destas fontes de informação científica poderia ser adaptada como um nó da rede de atribuição de identificadores persistentes, baseada na tecnologia blockchain.

CONTINUA DEPOIS DA PUBLICIDADE

Washington Segundo acredita que o uso dessas tecnologias é promissor em organizações governamentais e da ciência. Ele sinaliza que a tendência é a existência de redes distribuídas, em oposição aos tradicionais bancos de dados centralizados. “Ao mesmo tempo, processamento paralelo e colaborativo têm sido uma característica marcante de qualquer aplicação de sucesso na web. Por isso acredito que os sistemas de informação do Ibict deverão seguir este caminho, como muitos deles já o fazem, na direção de constituir redes e ecossistemas que interoperam entre si, nacional e internacionalmente, em oposição a bases centralizadas de alimentação também centralizada”, conta ele.