sábado, março 27, 2010

Biodiversity4all (II)

Pouco mais de uma semana depois de ter colocado aqui um post sobre este projecto, resolvi dar uma volta mais alargada pelo site.
O site ainda não tem (mas um dia terá) o que mais me motiva: a possibilidade de escolher uma espécie e imediatamente produzir um mapa com todas as observações da espécie. Ou a possibilidade de escolher uma área e imediatamente saber todas as observações feitas para esse área (esta funcionalidade já existe parcialmente). É natural, é um site em desenvolvimento com base em trabalho voluntário das pessoas nele envolvidas.
Penso que o acesso público ao site terá quinze dias, pouco mais ou menos.
Apesar disso o site tem já mais de 2000 observações (deve haver um problema das estatísticas ou no tratamento elementar que lhes fiz porque a soma de algumas partes dá mais que o todo, mas isso são os problemas normais de um site novo deste tipo, a seu tempo se corrigirão à medida que forem sendo detectados).
As observações não dizem respeito a estes quinze dias, dizem respeito a registos experimentais da equipa do site, mas acima de tudo integram as observações de um site holandês, cuja estrutura é usada por este, e que tem observações de holandeses feitas em Portugal.
Todos os observadores com mais registos são, por agora, holandeses.
Nestes quinze dias, pelo que percebi, três ou quatro observações diárias têm vindo a enriquecer o site. É possível que este número tenha grandes variações (por exemplo, os bioeventos preveêm um evento para o dia 22 de Maio, dia internacional da biodiversidade, e este site será o site de referência para o registo de observações) mas é razoável admitir cinco observações diárias em média.
Isso significará quase dez mil observações registadas em cinco anos.
Não se pode dizer que seja muito, é natural que haja observações históricas que venham a engrossar muito este número (a ATN, por exemplo, tem um acordo com o site e contribuirá com certeza de forma consistente, incluindo as observações que já tem na Faia Brava), mas o relevante é que o volume de observações será com certeza útil a muita gente.
Eu gosto desta lógica de ir acumulando registos pelo simples gosto de o fazer. E gosto de saber que cada novo registo, se mantido, bem referenciado e integrado no conjunto, mesmo que seja um registo de sobreiros e cegonhas brancas, contribui para melhorar o que as pessoas comuns sabem sobre a nossa biodiversidade.
henrique pereira dos santos

14 comentários:

Anónimo disse...

Parece um projecto interessante que levante no entanto alguns problemas clássicos relacionados com a validação da informação e também com os potenciais equívocos que a mistura de informação recolhida sem métodos estandardizados pode gerar.

Alexandre Vaz

Henrique Pereira dos Santos disse...

Alexandre,
Pensei que no teu comentário ias dizer que à medida das tuas possibilidades ias contribuir para resolver esses problemas clássicos vertendo para a base de dados as tuas observações de vinte anos de trabalho no Alentejo.
Infelizmente enganei-me.
henrique pereira dos santos

Henk Feith disse...

Henrique,

Não sabes se te enganaste, porque o Alexandre não disse que não contribuía. Certo?

Alexandre: tens razão no que diz respeito à validação dos dados. Estas base de dados levam a uma mudança de paradigma. As informação nelas armazenadas não devem ser vistas como valores certas. A visão clássica da ciência sobre dados não é válida aqui e se deve aprender a conviver com incertezas sobre a informação disponível. Quando vejo o registo de um corvo em Ferreira do Zêzere no dia 23 de março, é legítimo ter as minhas dúvidas sabendo a habitual troca de gralhas-pretas com corvos por pessoas pouco treinadas na identificação de aves. No entanto, isto não deve ser motivo para rejeitar o registo ou, pior ainda, rejeitar a filosofia de base de dados on-line.
O que se passou com a Wkipédia é um bom exemplo do percurso que a Internet está a ter. Seguramente, o futuro da informação e conhecimento passa por uma partilha generalizada de grandes quantidades de informação, que terão uma percentagem de informação incorreta, com a qual teremos de saber viver. O valor estará na tendência dos dados, e não no seu valor absoluto.

Henk Feith

Henrique Pereira dos Santos disse...

Henk,
Sei que não me enganei no comentário do Alexandre, que pensei que fosse no sentido de reforçar o projecto e não no sentido de o diminuir.
Eu não disse nada sobre as possibilidades de colaboração futura o Alexandre, que espero que seja profícua.
"Não confiai às pessoas tarefas que elas não são capazes de realizar" é um dos comentários ao que diz sun tzu "Um comandante do exército qualificado escolhe os seus homens que, por sua vez, tiram partido da situação" no clássico a Arte da Guerra.
Mutatis mutandis, é evidente que não se pode pedir a uma base de dados que serve para resgistar e acumular dados o que só pode ser produzido por outros mecanismos: a validação e a consistência de métodos.
Só que a questão não é contrapôr estas duas formas complementares de fixar informação, a questão é ajudar a resolver a falta de dados e a falta de possibilidades de observadores qualificados coligirem dados de base de forma metodologicamente consistente ao ritmo a que centenas de pessoas conseguem registar observações.
É por isso que a propósito de bases de dados deste tipo, que vivem do volume de dados, enfatizar as suas diferenças em relação aos métodos científicos, desvalorizando-as por isso, é uma atitude que não compreendo, sobretudo no contexto de um simples post como este.
henrique pereira dos santos

Anónimo disse...

Henk, o paralelismo que estabeleces com a wikipedia é pertinente, mas esta situação é bastante diversa. Se eu escrever na wikipedia um grande disparate, alguém mais tarde ou mais cedo irá dar com ele. Neste caso, ninguém poderá atestar ou negar a validade de dados que sejam introduzidos na base de dados.
Perante este cenário parece-me legítimo questionar em que âmbito este tipo de informação poderá ser realmente útil. Ainda assim, e porque não tenho à partida o desejo de sistematicamente procurar o confronto, perante o entusiasmado texto do Henrique, limitei-me sumariamente a apontar alguns factos que me parecem inegáveis.

Henrique, o teu apriorismo é bastante previsível. O único juízo que fiz foi positivo, quanto ao resto parece-me que me limitei a comentar objectivamente uma das limitações duma iniciativa deste género. Mas como sempre tu recorreste à mais elementar retórica de pacotilha para tentar transformar um comentário construtivo numa crítica primária.
Estou certo que as pessoas que lerem estes comentários saberão tirar as suas conclusões.
Quanto à informação que ao longo dos anos tenho recolhido no campo, está na sua esmagadora maioria disponível para consulta em relatórios técnicos ou científicos.

Alexandre Vaz

Henk Feith disse...

"enfatizar as suas diferenças em relação aos métodos científicos, desvalorizando-as por isso"

Não concordo que enfatizar diferenças equivale desvalorizar. Acho que o Alexandre mencionou o que preocupa muita gente que trabalha com essas ferramentas. Uma coisa é assinalar pontos fracos, outra é rejeitá-las por isso. Não me parece que o Alexandre fez isso, ele que começou a mencionar que é um projeto interessante.

O assunto da validade da informação e da forma possível de o fazer é relevante. Por algum motivo o próprio biodiversity4all tem um campo para a validação dos registos. A aderência das pessoas com maior volume de informação ao projeto dependerá muito da forma como este aspeto é tratado e explicado. Ainda há um caminho longo a percorrer para muitas pessoas ultrapassar esta barreira de conviver com incertezas sobre o rigor da informação.

Por fim, penso que a tua frase final no comentário "Infelizmente enganei-me" não contribuirá para a aderência do Alexandre ao projeto. Se tivesses ficado pela primeira parte, era passível de ser encarado como um desafio, agora já parece mais uma rejeição.

Henk Feith

Paulo Barros disse...

Fiz hoje login e adicionei o meu primeiro registo, para mim a falta de tempo disponível para introduzir todas as espécies que vejo diariamente (com excepção daquela que vejo no âmbito do meu trabalho) é o maior entrave, a maior parte dos dias que vou para o campo posso ter um listagem de dezenas de espécie e introduzir 50 ou 100 (desde borboletas a mamíferos) observações diariamente (nos dias que vou para o campo) pode ser complicado.
Isto só para dizer que a amplitude e a vastidão de um projecto pode ser um entrave para a participação geral. Caso houvesse um projecto do género apenas para mamíferos, Herpetofauna, avifauna, etc… separadamente talvez fosse mais eficaz, eu pelo menos participaria mais. Aparte disso pretendo contribuir com as minhas observações em função da minha disponibilidade de as introduzir.

Uma achega, no campo Número e Sexo deveria existir uma opção com Casal, pois hoje vi um casal de Falco tinnunculus e tive de introduzir essa informação nas obesrvações.

Paulo Barros

Henk Feith disse...

Paulo,

Tocas num aspeto importante. No meu entender, estas ferramentas deviam funcionar em rede e procurar parcerias/colaborações com entidades/pessoas que recolham grandes quantidades de informação por um lado, e por outro lado promover a partilha de informação de sistemas congéneras.

Se já é pedir muito introduzir regularmente dezenas de registos, podes imaginar quando tens três ou quatro sítios na net para o fazer.

Se vi hoje um cuco, podia (devia?) enviar o registo para SpringAlive, para PortugalAves, para Chegadas e para Biodiversity4all. Como podes imaginar, o mais provável é que alguém tem um site favorito e manda para lá, deixando de fora os outros. Isto leva a desperdício de informação e penso que todos teriam a ganhar se partilham mutuamente a sua informação.

Acontece que registos ou dados são geralmente visto como "propriedade" de pessoa/projeto/instituição A, B ou C, e não devem ser partilhados (ou pelo menos sem contrapartidas).

Propus hoje à equipa do Biodiversity4all partilha de dados entre Biodiversity4all e Chegadas. É um passo que espero que tenha outros a seguir. Cá da minha parte promoverei o que estiver ao meu alcance.

Henk Feith

Henrique Pereira dos Santos disse...

Alexandre,
O facto da informação estar em relatórios técnicos e científicos torna-a muito pouco acessível e, consequentemente, pouco útil.
Henk,
Tenho anos de discussão acesa sobre o problema da validação dsa informação. Eu não tenho nenhuma esperança de conseguir explicar o que quer seja nessa matéria. Felizmente o biodiversity4all não sou eu (nem sequer é um projecto meu, é de terceiros e eu limito-me a dar-lhe apoio independentemente de achar isto ou aquilo em aspectos mais ou menos marginais porque estou de acordo com a essência do projecto) e o projecto acredita mais que eu na possibilidade de convencer quem não quer ser convencido das vantagens da democratização da informação.
Paulo,
Não tenho dúvidas de que há problemas de disponibilidade mas isso resolve-se: vai-se registando à medida que se quer.
Já tinha dado por esse problema dos casais quando fiz a minha úncia observação (que se transformou em três por isso) para experimentar. Como sabes eu sou muito mau nas identificações portanto dificilmente terei muitos registos.
henrique pereira dos santos

Henk Feith disse...

Alexandre,

"Quanto à informação que ao longo dos anos tenho recolhido no campo, está na sua esmagadora maioria disponível para consulta em relatórios técnicos ou científicos.
"
Esse é o argumento habitualmente utilizado por quem não quer partilhar de facto. Normalmente nem é verdade: é raríssimo o relatório que contém dados, normalmente tem conclusões e discussões sobre dados.

Por fim é a atitude mais fácil: se quiserem os meus dados, vão à procura dos meus relatórios e desenrascam-se. De facto evita-se a chatice de ter de os introduzir ou enviar...

Henk

Anónimo disse...

Henk, é verdade que os relatórios nem sempre são de fácil acesso, ainda assim, são um passo em frente relativamente à colossal informação de naturalistas amadores que nunca chega sequer a sair dos seus cadernos de campo... Ainda assim, para além da informação recolhida por mim que consta dos tais relatórios, alguma também pode ser encontrada em publicações, artigos ou actas de congressos e reuniões (de fácil acesso). Apenas referi isto para responder ao apelo do Henrique em partilhar a informação que tenho recolhido ao longo dos anos. Mas neste capítulo eu sou realmente um péssimo exemplo, já que não sou nada organizado. Ao longo dos anos aquilo que me habituei a fazer foi por um lado a coligir estritamente a informação no âmbito da tarefa que estava a cumprir e por outro a comunicar de imediato às pessoas que conheço e que desenvolvem trabalho na área as informações que me pareçam relevantes. Ou seja: se há três anos encontrei um ninho de Águia de Bonelli, hoje já não sei a data nem os locais exactos, mas telefonei nesse mesmo dia a quem trabalha com a espécie.
Eu não iria fazer nada com a informação, mas eles sim.
Por último, todos os dias vejo espécies animais em liberdade, como o Paulo referiu não é exequível introduzir registos para tudo o que vemos. Cada um vai ter de seleccionar as suas áreas de interesse, e daqui vai nascer mais um factor de enviesamento.
Um exemplo: admito que muitas pessoas acharão desnecessário introduzir registo de Pardal-do-telhado. No limite esta espécie ficará provavelmente mal representada na base de dados...

Alexandre Vaz

Henrique Pereira dos Santos disse...

Alexandre,
É claro que uma base de dados deste tipo será sempre enviesada, não só pelos interesses das pessoas envolvidas, como pela própria natureza das espécies (há espécies que quase só se conseguem detectar com procura dirigida e técnicas nem sempre ao alcance de qualquer pessoa).
Só que a virtude destes repositórios de dados não está na interpretação (que está fora do seu âmbito) mas no registo puro e duro, isto é, na capacidade dos tais cadernos de campo de milhares de naturalistas serem resgatados ao esquecimento.
Dito de outro modo, se alguém pensa que uma base de dados deste tipo dispensa o trabalho técnico e científico necessário para fazer, por exemplo, um Atlas, está muito enganado. O que estas bases de dados permitem é fazer o scoping desse trabalho, isto é, levantar questões.
E permitem a centenas de utilizadores não cientistas o acesso a informação que lhes permite uma relação mais estreita com a biodiversidade.
Repito, não se pode pedir às bases de dados o que elas não podem dar. Mas é evidentemente preferível ter mais dados que menos. E quantos mais dados forem, mais úteis e fiáveis se tornam.
Repara, se fores agora ao site vez um monte de observações sobre flora do Luís Jordão, todas do mesmo dia. Provavelmente foi dar um passeio, que se esgota no passeio e cujas observações não seriam registadas a não ser para si próprio, e com esta base passam a estar disponiveis para quem quiser. Quer a informação em si, quer a informação de que o Luís Jordão tem informação sobre aquela área.
No Sábado a ATN e o Fapas fizeram um passeio botânico à Faia Brava. Registaram sessenta espécies de plantas e vinte de musgos. A informação seria sempre registada nas bases da ATN sobre a Faia Brava. Com o acordo com a biodiversity4all pode transferir-se essa informação em bloco para esta base, chegando a muito mais gente.
É isto que é relevante, a capacidade de acumular e disponibilizar informação, mesmo frgamentária, enviesada e etc.
Os investigadores lá estarão para enquadrar a informação e lhe dar consistência nos seus estudos, evidentemente não usando a informação da base em bruto, mas usando a informação da base como mais uma das fontes de informação disponiveis e facilmente acessiveis.
henrique pereira dos santos

Henrique Pereira dos Santos disse...

"vês" em vez de "vez", claro

Anónimo disse...

Esta discussão interessante podia ser um bom ponto de partida para uma discussão mais ampla sobre a sociedade da informação, a acumulação de dados e a sua digestão.
Em tempos trabalhei num projecto, em que se recolheram tantos dados, sobre tanta coisa que no final havia um monte disforme de informação que ninguém foi capaz de espremer capazmente. A informação em bruto é sempre uma matéria prima interessante, mas por si só com pouco valor.
Faz-me lembrar uma coisa que um amigo costuma dizer: "o dinheiro não é de quem o tem, mas de quem o gasta". Com a informação é mais ou menos a mesma coisa.

Alexandre Vaz