Connect with us

Ciência e Saúde

O poder da colaboração: Como o open source transformou iniciativas individuais em progresso científico global

Published

on

"A graphic of a green code symbol () on a blue background with the repeating text "Open Source"" by The People's Internet via Wikimedia Commons (CC0 1.0 Universal Public Domain Dedication)

A generosidade e o comportamento pro bono, tal como as relações interpessoais, têm-se complexificado com a transição da humanidade caçadora-coletora para o indivíduo digital. Hoje, o open source é um marco da capacidade colaborativa humana na era tecnológica.

De um ponto de vista evolutivo e antropológico, o ser humano sempre beneficiou da colaboração. A espécie humana não é a mais rápida ou forte, mas uma das que mais fortemente se caracterizam pela cooperação. Milhares de anos mais tarde, o poder da colaboração humana tem por bases a partilha de conhecimento digital e o desenvolvimento de ferramentas universais, transformando o código aberto no sucessor tecnológico das antigas estratégias de sobrevivência da nossa espécie.

Os primórdios do open source na tecnologia e a sua definição

Para contentamento dos defensores das iniciativas open source, a noção de partilhar informação tecnológica antecede os próprios computadores. Tal já acontecia na indústria automóvel com a eventual criação da Motor Vehicle Manufacturers Association, que garantia a partilha de patentes entre fabricantes, apesar de cada empresa manter a responsabilidade de impulsionar a sua própria tecnologia.

Contemporaneamente, a definição de open source tem os mesmos princípios de partilha de informação. Um software open source é aquele que tenha um código que qualquer um possa inspecionar, modificar e melhorar.

O berço da ciência computacional: os pilares do open source

A história do software livre ganha um novo fôlego em 1983 quando Richard Stallman, do MIT, lançou o Projeto GNU, com o objetivo de criar um sistema operativo totalmente aberto. Stallman introduziu a Licença Pública Geral garantindo que o código permanecesse acessível e pudesse ser estudado ou modificado por qualquer pessoa sem restrições proprietárias. Este movimento estabeleceu a base ética e legal que permitiu aos cientistas e programadores colaborar de forma global, protegendo o conhecimento como um bem comum da humanidade.

Anos mais tarde, em 1991, inspirado pelas ideias e ferramentas de Richard Stallman, o estudante Linus Torvalds decidiu criar o kernel Linux como um projeto universitário pessoal que rapidamente se transformou no motor da computação mundial. Ao permitir que milhares de colaboradores anónimos contribuíssem para o seu desenvolvimento, o Linux tornou-se a base da infraestrutura de computadores pessoais usados em contexto científico, supercomputadores, do sistema operativo Android, software automóvel e aparelhos smart como frigoríficos, etc.

O Projeto GNU e o Kernel Linux surgiram como os alicerces fundamentais para a criação de qualquer programação científica em áreas fora da ciência de computadores. Estes projetos forneceram os compiladores e o sistema operativo necessários para que qualquer investigador pudesse escrever código científico sem pagar fortunas por licenças da Unix ou da Microsoft.

“Logos of some GNU/Linux distros” por Antinumdo via Wikimedia Commons (CC BY 4.0)

A influência inegável do software aberto na propulsão da I&D

Posteriormente, surgiu em 1995 o software VMD, desenvolvido nos laboratórios da Universidade de Illinois como uma resposta direta à necessidade de visualizar simulações complexas de dinâmica molecular que ocorriam em sistemas biológicos, em condições químicas específicas, ou até mesmo em exercícios de pensamento científico.

Pouco depois, em 1998, Warren DeLano criou o PyMOL utilizando a linguagem de programação Python (sendo esta também um projeto de código aberto) como base para a renderização de proteínas com qualidade cinematográfica.

Visualização de um complexo proteico, utilizando o software PyMOL (via https://bionerdnotes.wordpress.com/2018/11/13/working-with-pymol/)

Ambos os programas foram desenvolvidos utilizando as bibliotecas e ferramentas de programação criadas anteriormente pelo movimento GNU. Estes exemplos demonstram que a ciência aplicada é na verdade uma nova camada construída sobre a infraestrutura existente da computação, conseguida através da colaboração.

Em nome da brevidade, existem inúmeras bibliotecas de código aberto vitais para a ciência, como as stacks de Python que incluem o NumPy para cálculos numéricos e o Matplotlib para visualização de dados. Estas ferramentas serviram de base para o desenvolvimento do BioPython, que foca especificamente na análise de sequências biológicas e biologia molecular.

Da mesma forma, a linguagem aberta R também se consolidou na investigação através de bibliotecas como o Bioconductor, um ecossistema essencial para a análise de dados genómicos de larga escala.

Para além destas, o SciPy expandiu as capacidades de computação científica em áreas como a integração e otimização, enquanto bibliotecas como o Pandas revolucionaram a manipulação e análise de tabelas de dados complexas. No campo da inteligência artificial aplicada à ciência de dados, o Scikit-learn e o TensorFlow tornaram-se os novos padrões para a criação de modelos preditivos. Num contexto de ciência de dados e aprendizado de máquina, torna-se particularmente importante a reprodutibilidade e partilha das metodologias das análises, de forma a evitar procedimentos de “caixa-preta” difíceis de entender.

“Principais bibliotecas da linguagem de programação Python” colagem por João F. Moutinho. Logos via Wikimedia Commons (Public Domain / CC BY-SA 4.0).

A importância económica do software aberto na I&D

A influência deste movimento foi especialmente importante na I&D (investigação e desenvolvimento), uma área principalmente dependente de financiamento governamental e de instituições académicas.

É intuitivo entender que há uma maior necessidade por parte desta área de existirem ferramentas de livre uso, que sejam escaláveis e livremente modificáveis conforme a necessidade específica do investigador, e que permitam gratuitamente validar a investigação de colegas (peer-review).

O incentivo à manutenção e à criação de ferramentas de código aberto na formação base dos jovens cientistas é vital para o avanço da ciência, seja por questões de financiamento e validação científica, seja pela garantia de liberdade ao investigador. Ao integrar o ecossistema open source na educação, assegura-se que a próxima geração de especialistas possua autonomia tecnológica, permitindo que o progresso científico não fique refém de licenças proprietárias ou de algoritmos de caixa-preta que impedem a plena reprodutibilidade dos resultados.

A sobrevivência da nossa espécie dependeu, outrora, da partilha de estratégias de caça; hoje, a sobrevivência da nossa ciência depende da partilha de cada linha de código que escrevemos.

Artigo redigido por João Fernandes Moutinho. Revisto por Isabel Santos de Sousa.

Continue Reading
Click to comment

Leave a Reply

O seu endereço de email não será publicado. Campos obrigatórios marcados com *