No início de 2020, o MyHeritage passou a oferecer um serviço complementar de colorização de fotografias antigas. Entretanto, devido às restrições à mobilidade impostas no contexto do combate à pandemia de COVID-19, o MyHeritage optou por tornar esse serviço temporariamente gratuito. Fomos testá-lo e deixamos aqui a apreciação, assim como alguns comentários adicionais e dicas sobre a colorização de fotos antigas. Em primeiro lugar, refira-se que a colorização de fotografias antigas não é um tema novo e que já há vários anos existem na Internet diversas aplicações com esse fim, algumas das quais gratuitas: em versão de teste, até um certo número de imagens, ou então sem limite de imagens mas com aposição de marca de água e/ou redução da resolução. Ora, a aplicação para colorir imagens disponibilizada pelo MyHeritage é, em geral, melhor do que outras que estão disponíveis. Na comparação que mostramos acima, pode ver-se como a aplicação do MyHeritage consegue perceber com maior facilidade onde está a vegetação, para a colocar em tons de verde, e ao mesmo tempo uniformiza melhor o fundo e separa melhor as cores. Monda do arroz em Coruche há cerca de cem anos atrás e respectiva versão colorizada (fotografia publicada em SOUSA, Fernando de / QUEIROZ, Francisco / SERÉN, Maria do Carmo et al. – Espólio Fotográfico Português / Portuguese Photographic Heritage. Porto, CEPESE, 2008, URL: http://www.franciscoqueiroz.com/Espolio_Fotografico_Portugues.pdf) Uma vez que a aplicação do MyHeritage em muitos casos é capaz de detectar a vegetação, fornece geralmente boas colorizações em fotografias de exterior, sobretudo se o que é verde tem uma incidência de luz mais ou menos uniforme, como nesta fotografia que mostramos de mulheres a mondar o arroz em Coruche. Contudo, os testes que fizemos à aplicação do MyHeritage permitem também concluir que a cor das roupas é geralmente problemática. Por vezes, surgem todas as vestimentas em tons muito ténues e com cores mais ou menos aleatórias, como se fosse assumida pela aplicação a incapacidade em detectar a cor autêntica mas, ao mesmo tempo, fosse criado algum tipo de coloração, para que o todo da imagem pareça realmente uma fotografia a cores. A fotografia também aqui mostrada de vários desportistas no Oporto Cricket Club em finais da década de 1920 permite deduzir este problema facilmente, pois os vários uniformes eram necessariamente todos iguais entre si, e as listas eram forçosamente da mesma cor de alto a baixo. Ora, a aplicação do MyHeritage (assim como outras aplicações semelhantes) dá como resultado colorações diferentes, às vezes até dentro da mesma lista de um dos uniformes, sendo que, na prática, os vários uniformes surgem com tonalidades desmaiadas e muito parecidas, quando na realidade seriam cores fortes para melhor se distinguirem as equipas. Um conjunto de quatro retratos em formato carte-de-visite que pertenceu ao espólio de uma família da Póvoa de Varzim também evidencia esta incapacidade do software de colorização, visto que se trata de uma só sessão fotográfica e, mesmo tendo sido a imagem carregada já em montagem, a aplicação não conseguiu reconhecer que a faixa na cintura da menina é a mesma em todas as fotos, surgindo por vezes acastanhada e outras vezes preta/azulada. Desportistas no Oporto Cricket Club há cerca de cem anos atrás (versão colorizada de uma fotografia publicada em SOUSA, Fernando de / QUEIROZ, Francisco / SERÉN, Maria do Carmo et al. – Espólio Fotográfico Português / Portuguese Photographic Heritage. Porto, CEPESE, 2008, URL: http://www.franciscoqueiroz.com/Espolio_Fotografico_Portugues.pdf) Sessão fotográfica com membros da família Sousa Calheiros da Póvoa de Varzim, possivelmente durante uma viagem que fizeram, atendendo ao timbre do fotógrafo (versão colorizada de uma ilustração publicada em QUEIROZ, Francisco / MOSCATEL, Cristina - Descubra as suas origens. Manual de Genealogia e História da Família. Lisboa, A Esfera dos Livros, 2016, https://genealogiasemsegredos.weebly.com/manual.html) Apesar de a fotografia colorizada com vários desportistas no Oporto Cricket Club apresentar dois deles com mãos de cores diferentes: uma da cor da pele e outra acinzentada, um dos pontos fortes da aplicação do MyHeritage é conseguir detectar não só os rostos como também as mãos, e mesmo as pernas. Este retrato de uma pastora da Serra do Caramulo tirado há cerca de um século evidencia bem essa capacidade. Aliás, a mencionada aplicação consegue fazer essa detecção mesmo em gravuras ou litografias, portanto em imagens não reais. Pastora do Caramulo há cerca de cem anos atrás e respectiva versão colorizada (fotografia publicada em SOUSA, Fernando de / QUEIROZ, Francisco / SERÉN, Maria do Carmo et al. – Espólio Fotográfico Português / Portuguese Photographic Heritage. Porto, CEPESE, 2008, URL: http://www.franciscoqueiroz.com/Espolio_Fotografico_Portugues.pdf) A aplicação do MyHeritage consegue também colorizar razoavelmente fotografias que não mostrem pessoas, quer vistas urbanas, quer vistas de campo - como a que apresentamos, do sítio de Porto Moniz nos arredores de Leiria (hoje parte integrante da cidade). Também neste género de imagens sem pessoas, a aplicação do MyHeritage consegue colorizar razoavelmente até as litografias, como a que mostramos abaixo, referente a Lisboa. Tal como sucede frequentemente com fotografias de pessoas, nomeadamente ao nível das roupas, também com as fotografias de paisagens a aplicação do MyHeritage tende a não assumir cores fortes, talvez para que, em caso de inverosimilhança, não se note tanto o erro. Porém, se as cores resultantes do processo de colorização não forem incorrectas face à realidade, esta característica da aplicação em análise facilmente pode ser contornada. Damos como exemplo uma fotografia antiga da fachada da Igreja dos Clérigos, no Porto. A aplicação do MyHeritage consegue clarear e azular partes do céu, e ainda distinguir uma árvore ao fundo. Ora, para obtermos uma imagem com cores mais aproximadas da realidade basta-nos utilizar depois um programa simples de edição de imagem e saturar mais as cores - o que é feito num só passo e, em muitos programas de edição de imagem pode até ser feito automaticamente se pedirmos ao software simplesmente para melhorar a imagem. Não poderíamos seguir este passo se a imagem não tivesse sido previamente colorizada. É importante referir que a aplicação do MyHeritage, além de colorizar, corrige os níveis do histograma da imagem, conferindo contraste se a imagem estiver baça. Porém, imagens muito baças à partida frequentemente dão maus resultados de colorização, mesmo tratando-se de retratos. Significa isto que um dos pontos fortes da aplicação em análise - o reconhecimento dos rostos - tende a não funcionar nas muito comuns fotografias da segunda metade do século XIX que estão bastante esbatidas, sobretudo se não forem retratos de corpo inteiro. Apresentamos aqui dois exemplos. Em ambos os casos, mostramos o resultado da colorização a partir da imagem original e o resultado da colorização após tratamento prévio à imagem original para lhe dar maior contraste. Pode verificar-se que, no caso da fotografia feminina em "close up", a aplicação confere alguma cor mas não distingue bem que se trata de um rosto. No caso da fotografia de tipo cartão-de-visita, a aplicação limita-se a alterar ligeiramente o tom sépia, mas não introduz qualquer cor, nem mesmo depois de conferirmos maior contraste à fotografia original. Para todos nós é óbvio que se trata de rostos, mas tudo indica que as aplicações de colorização, em geral, ainda têm bastante margem para evoluir, neste e noutros aspectos. Em alguns casos, os resultados já são muito interessantes e, no caso de retratos, conquanto tenham à partida bom contraste e o fundo seja neutro ou menos nítido que o que está em primeiro plano, de modo a ressaltar as silhuetas humanas, há fotografias antigas que literalmente ganham vida com a colorização, como a de três raparigas beirãs com o tradicional penteado "de martelo", fotografadas há cerca de cem anos atrás (ver abaixo). Portanto, nada como experimentar! Retrato feminino e versão colorizada, estando em baixo à esquerda uma versão com mais contraste e respectivo resultado da colorização (fotografia pertencente ao espólio da família do último governador de Moçambique e publicada em PORTELA, Ana Margarida / QUEIROZ, Francisco - A Casa de Tralhariz e a Capela do Bom Jesus. Porto, Instituto de Genealogia e Heráldica da Universidade Lusófona do Porto / GEHVID – Grupo de Estudos de História da Viticultura Duriense e do Vinho do Porto, 2008) Retrato de um homem de relevo na história da Ourém, estando em baixo à esquerda uma versão com mais contraste e respectivo resultado da colorização (fotografia publicada em QUEIROZ, José Francisco Ferreira - A Casa do Terreiro. História da Família Ataíde em Leiria. Volume III: Do Século XIX à Actualidade. Leiria, Fundação Caixa Agrícola de Leiria / Jorlis – Edições e Publicidade, Lda., 2018) Raparigas de Malpica do Tejo há cerca de cem anos atrás (versão colorizada de uma fotografia publicada em SOUSA, Fernando de / QUEIROZ, Francisco / SERÉN, Maria do Carmo et al. – Espólio Fotográfico Português / Portuguese Photographic Heritage. Porto, CEPESE, 2008, URL: http://www.franciscoqueiroz.com/Espolio_Fotografico_Portugues.pdf) Uma dica final e um conselho: Para evitar a marca de água que, no caso da aplicação do MyHeritage, é gerada no canto inferior esquerdo de cada foto, caso ainda não tenha digitalizado as fotografias que pretende colorizar, ao digitalizá-las não recorte as fotografias pelos limites mas deixe sempre uma margem em branco no rodapé. Depois é só recortar esse rodapé quando estiver colorizada e já não terá qualquer marca de água a atrapalhar. Também pode criar rodapé nas fotografias estando estas já digitalizadas, usando qualquer software simples de edição de imagem e ampliando a moldura para baixo. Não se esqueça que a colorização é um processo sem garantia de autenticidade nas cores, mesmo nos casos em que ela parece mais bem sucedida. Aliás, se pegar numa fotografia a cores e a gravar num ficheiro de imagem em escala de cinzas para depois a carregar na aplicação do MyHeritage (ou noutra qualquer aplicação para colorizar), é muito provável que algumas cores, sobretudo nas roupas, não batam certo com as cores que aparecem na fotografia a cores original. Por conseguinte, a bem do rigor, se pretende usar fotografias colorizadas em livros de família, por exemplo, não se esqueça de mencionar na legenda que a fotografia foi colorizada. Boas colorizações! Francisco Queiroz (projecto "Genealogia sem segredos")
0 Comments
No final de Julho de 2019 revelámos aqui uma nova base de dados desenvolvida pelo CEPESE, chamada "DIGIGOV - Diário do Governo Digital (1820-1910)". Já em outro texto demonstrámos como esta base de dados é muito importante para a pesquisa genealógica, em alguns casos contendo informação que não podemos encontrar em outras fontes. Como prometido, neste texto iremos dar algumas dicas para pesquisar na referida base de dados, no sentido de se obter a maior quantidade possível de dados que nos interessem. Não iremos aqui explicar quais os cuidados a ter e quais as estratégias a seguir na pesquisa em bases de dados "online", pois isso levar-nos-ia muito longe. É um tema importantíssimo no panorama actual da pesquisa genealógica e até objecto de abordagem na formação "Genealogia sem segredos", mesmo assim apenas de forma resumida, pois muito há a dizer sobre o assunto. Aliás, estamos a trabalhar para que, brevemente, seja possível a realização de workshops práticos que colmatem as muitas falhas notadas na pesquisa genealógica "online". É que, em geral, quem pesquisa na Internet os seus antepassados não faz sequer ideia de que as informações encontradas frequentemente são apenas uma pequena parte das informações que estão disponíveis. Também na base de dados "DIGIGOV - Diário do Governo Digital (1820-1910)", se não soubermos como pesquisar de modo eficiente, muita da informação que nos interessa não a iremos encontrar. Portanto, neste texto vamos apenas dar dicas especificamente relacionadas com o modo como foi construída a base de dados "DIGIGOV". No próprio interface de pesquisa, existem já algumas instruções. Porém, vamos aqui explicar o porquê dessas instruções e ainda como dar a volta a alguns problemas de compatibilidade entre a semântica inerente à pesquisa e aquilo que podemos querer encontrar. Em primeiro lugar, e como é referido no final do menu do lado direito do interface de pesquisa, deve-se pesquisar com a grafia da época: por exemplo, "parochia" em vez de "paróquia", "Emigdio" em vez de Emídio", "Jacintho" em vez de "Jacinto", etc.. Porém, e sobretudo no caso de nomes próprios e apelidos, convém pesquisar com as duas variantes, pois muitas vezes havia mais do que uma forma possível de os escrever. Assim, se na base de dados "DIGIGOV" procura um antepassado com o nome "Emídio", pesquise não só "Emigdio", como também "Emídio", e ainda "Emygdio". No caso de "Jacinto", pesquise com a grafia antiga "Jacintho" e também com a grafia actual. Irá encontrar resultados pesquisando de uma maneira que não encontrará pesquisando de outra maneira. Em segundo lugar, as muitas experiências que já fizemos com esta base de dados permitiram perceber que, além das normais deficiências do reconhecimento óptico de caracteres (vulgarmente designado como OCR) em jornais antigos - deficiências essas que não iremos aqui abordar em geral, por serem um tema à parte - há uma em concreto que se nota bastante na base de dados "DIGIGOV" e que podemos contornar no sentido de obtermos maior número de resultados que nos interessem. Referimo-nos ao facto de o OCR frequentemente ter assumido que, entre uma inicial maiúscula e um bloco de letras minúsculas, existia um espaço. Por exemplo: se pesquisarmos "Xavier Pereira" e depois "X avier Pereira", os resultados da segunda pesquisa, embora muito menos numerosos, não surgem necessariamente na primeira pesquisa e, quando surgem, é porque a mesma expressão composta repete-se nessa página: uma vez com um OCR deficiente e outra(s) vez(es) com um OCR eficiente. Isto significa que, se pesquisarmos "Jacintho" e "Jacinto" devemos também pesquisar "J acintho" e "J acinto", pois iremos recuperar resultados que não surgem sem introduzirmos o espaço entre a inicial maiúscula e o resto do nome. Em suma, e passando para expressões compostas, se quisermos procurar no "DIGIGOV", por exemplo, um antepassado chamado "Francisco Eleutério", devemos pesquisar, cumulativamente: - com a grafia antiga "Francisco Eleutherio", - com a grafia actual "Francisco Eleutério", - com a grafia antiga mas com espaços entre as iniciais e o resto do nome, primeiro "F rancisco Eleutherio", depois "Francisco E leutherio", e ainda "F rancisco E leutherio", - com a grafia actual mas com espaços entre as iniciais e o resto do nome, primeiro "F rancisco Eleutério", depois "Francisco E leutério", e ainda "F rancisco E leutério". Note-se que, ao pesquisarmos "Francisco E leutherio", "F rancisco E leutherio", "Francisco E leutério" e "F rancisco E leutério", se não colocarmos toda a expressão entre aspas a base de dados pode interpretar esse "E" como operador de pesquisa, equivalente ao sinal "+" e, em vez do que desejamos procurar, vai-nos dar resultados em que surjam as palavras "Francisco" ou "F rancisco" em conjunto com "leutério" ou "leutherio", consoante os casos. Quando o conjunto de palavras ou expressão composta que estamos a pesquisar não contém nenhuma palavra que funcione na base de dados como operador de pesquisa - nomeadamente "E", "OU" e "SEM", conforme é explicado nas instruções contidas no próprio interface de pesquisa - então podemos não usar sequer as aspas, pois a base de dados assume a priori que queremos encontrar resultados para uma expressão composta. Portanto, e pegando agora na lista de operadores de pesquisa constante do próprio interface de pesquisa do "DIGIGOV": - As aspas usam-se para pesquisarmos uma expressão exacta, ainda que a não colocação de aspas tenha o mesmo efeito, desde que na expressão que queiramos pesquisar não surjam pelo meio palavras que a base de dados possa interpretar como operadores de pesquisa (os já referidos "E", "OU" e "SEM"). À partida, em Genealogia, pesquisar expressões compostas parece ser a forma mais indicada para pesquisar, mas não pode ser a única, sobretudo quando a expressão que queremos encontrar tem mais do que duas palavras. É que a probabilidade de haver deficiências de OCR aumenta quanto maior for o número de palavras. Ora, se pesquisarmos, por exemplo, "José Estevão Coelho de Magalhães", basta que o OCR, em algumas das ocorrências, tenha lido um dos "h" como "b" ou um dos "e" como "c" e não iremos encontrar esse resultado na base de dados "DIGIGOV" se pesquisarmos o nome inteiro tal e qual ele deve ser escrito. Portanto, ao pesquisarmos nomes completos compostos por várias palavras devemos começar sempre com a conjugação das duas palavras menos vulgares e, só no caso de surgirem demasiados resultados, então sim devemos acrescentar mais uma das palavras do nome, e assim sucessivamente - se for mesmo necessário para evitar que nos resultados surjam muitos nomes similares que não nos interessam. - O operador de pesquisa "E" usa-se para obtermos ocorrências simultâneas de duas palavras na mesma página, mesmo que elas estejam afastadas uma da outra e mesmo que uma das palavras surja, por hipótese, 40 vezes na página e a outra surja apenas uma vez. Pesquisando "Francisco E Eleutério" (mas sem colocar as aspas, ou o sistema interpretará que queremos obter ocorrências dessa expressão exacta), surgirão todas as páginas em que, além da palavra "Francisco" também surja a palavra "Eleutério", mesmo que não na mesma linha ou no mesmo parágrafo. Este operador não é muito relevante para pesquisa genealógica, sobretudo porque pode ser substituído por um outro, mais complexo mas com a vantagem de ser ajustável em termos de distância entre palavras, como adiante indicaremos. - O operador de pesquisa "OU" usa-se para obtermos ocorrências de uma só palavra ou de duas palavras numa mesma página e, portanto, é menos relevante ainda do que o operador "E", sobretudo quando as palavras são comuns, pois poderão surgir demasiados resultados que não nos interessam. - O operador de pesquisa "SEM" (quase equivalente ao sinal "-" na semântica da Internet) usa-se para obtermos ocorrências de uma palavra em que não haja outra palavra numa mesma página. Trata-se de um operador que, em certos casos, tem utilidade para evitar perdas de tempo, quando as palavras que queremos pesquisar são muito comuns. Por exemplo, se quisermos pesquisar um antepassado sobre o qual apenas sabemos que era conhecido como o "Capitão", mas sabemos também que não era militar de carreira nem integrava as ordenanças, usando este operador de pesquisa podemos obter apenas resultados para a palavra "Capitão" em que, na mesma página, não surjam palavras que lhe estão habitualmente associadas, como "Ordenanças", "Regimento", "Infantaria", ou "Cavalaria". Note-se que os operadores de pesquisa "E", "OU" e "SEM" devem ser usados sem aspas. Inversamente, se quisermos, por exemplo, encontrar referências ao célebre "Geraldo sem pavor" temos de usar aspas para conseguir encontrar algum resultado pois, se não as usarmos, apenas iremos recuperar a palavra "Geraldo" quando a palavra "pavor" não se encontre na página, pois o "sem" do nome "Geraldo sem pavor" é lido pelo sistema como o operador de pesquisa "SEM". Note-se ainda que todos os operadores de pesquisa acima mencionados podem ainda ser usados com recurso a parêntesis para incluir ou excluir expressões compostas. Esta funcionalidade é mais interessante para a pesquisa genealógica do que usar apenas duas palavras separadas por um operador de pesquisa. Retomando o exemplo do tal antepassado sobre quem sabemos não ter sido militar nem membro das ordenanças mas era conhecido como o "Capitão": se pesquisarmos desta forma - (Capitão OU Capitam) SEM "de Ordenanças" - podemos simultaneamente recuperar resultados com duas grafias diferentes para a palavra que nos interessa e ainda por cima evitar uma das expressões que não nos interessa, filtrando os resultados. Outro aspecto importante a considerar no "DIGIGOV" tem a ver com a acentuação e as cedilhas. Devemos evitar pesquisar com acentos, tiles ou cedilhas. A base de dados consegue recuperar o que queremos, pesquisando de uma forma ou da outra. Porém, na prática torna-se mais lento procurar nos resultados se, ao pesquisarmos, colocarmos na palavra que nos interessa os acentos, tiles ou cedilhas, consoante os casos. A título de exemplo, ao pesquisarmos por "Cândido" surgem-nos todos os "Cândido" e "Candido" que o sistema consegue recuperar. Porém, ao abrirmos, um por um, os respectivos ficheiros pdf com as ocorrências, é nos ficheiros pdf que abrimos depois de termos pesquisado "Candido" - palavra que surge sem acento na caixa superior de pesquisa na página - que mais provavelmente iremos recuperar de imediato o que queremos na dita página. Façamos uma experiência simples para demonstrar como a pesquisa sem acentuação permite chegar mais rapidamente à palavra ou expressão que nos interessa dentro do ficheiro pdf: se pesquisarmos "Capitães" vamos obter 18705 resultados no "DIGIGOV". O mesmo número de resultados vai surgir se pesquisarmos "Capitaes". Porém, ao clicarmos logo no primeiro resultado, depois de termos feito esta pesquisa com a palavra "Capitães", o sistema não consegue assinalar no ficheiro pdf a palavra que pesquisámos. Em vez disso mostra-nos o topo da página onde a ocorrência se encontra e, a vermelho, em cima, o campo com a palavra que usámos para a pesquisa. Neste caso, para que o sistema nos indique em que lugar da página está a palavra que queremos, basta simplesmente ir à caixa assinalada a vermelho e... retirar o til! Porém, se começássemoss logo por pesquisar "Capitaes", portanto sem o til, ao clicarmos na primeira ocorrência o sistema apontaria de imediato para a parte da página que continha a palavra. Note-se que, por vezes, mesmo sem usarmos acentuação, sobretudo no caso de pesquisarmos palavras grandes ou expressões compostas, a base de dados recupera ocorrências mas, abrindo-se uma delas ao acaso, o sistema pode insistir em mostrar-nos apenas o topo da página, ficando a vermelho o campo que mostra a palavra ou expressão usada nessa pesquisa, portanto sem surgir sombreada na página a dita palavra ou expressão pesquisada. Nesse caso, é possível que o problema seja de espaçamento entre letras ou palavras. Para que a base de dados nos mostre então o que queremos no meio do texto da página, no campo a vermelho devemos eliminar uma palavra (no caso de expressões compostas) ou, no caso de termos pesquisado uma só palavra, devemos eliminar a última ou a primeira letra e, se a palavra for grande, mais algumas letras ainda, até que esse campo deixe de ficar vermelho e a base de dados nos diga que há um ou mais resultados na página para vermos. Nessa altura, clicamos sucessivamente na seta para a direita, situada logo ao lado direito do campo com a palavra pesquisada, até encontrarmos o resultado que realmente nos interessa. De qualquer modo, se não conseguirmos perceber como alterar a palavra ou expressão pesquisada no campo a vermelho, de modo a esse campo deixar de ficar vermelho e podermos ver a palavra, ou expressão, assinalada no próprio texto do pdf, temos sempre a hipótese de ler o conteúdo da página na diagonal, pois acabaremos por encontrar o que queremos.
Outra advertência parece-nos ser importante no que diz respeito ao "DIGIGOV". Quando fazemos uma pesquisa, a lista de resultados surge com caracteres a negro e a palavra ou expressão pesquisada aparece sombreada a amarelo. Contudo, várias pesquisas podem gerar resultados sem palavra ou expressão alguma sombreada a amarelo e com todos os caracteres a cinza. Ao clicarmos em algum desses resultados apresentados em caracteres cinza, possivelmente vai-nos surgir a vermelho o campo com a palavra ou expressão pesquisada. Para localizarmos a palavra ou expressão na respectiva página do ficheiro pdf devemos então seguir os mesmos procedimentos indicados acima. Em suma, devemos consultar mesmo aqueles resultados que na lista de resultados surjam a cinza e sem estar realçada a amarelo a palavra ou expressão que pesquisámos. É que os resultados apresentados a cinza não são necessariamente falsos positivos, podendo surgir assim por termos usado na pesquisa acentos ou algum caractere que o sistema não reconheça ao tentar recuperar no pdf a localização exacta. Deixamos aqui outra dica importante: se, ao pesquisar uma palavra ou expressão no "DIGIGOV", não surgir lista de resultados, verifique sempre no rodapé se o número de resultados é mesmo zero, pois, por vezes, a base de dados consegue encontrar alguns resultados mas não apresenta qualquer lista. Nesse caso, refrescar a página e voltar a fazer a pesquisa geralmente resolve o problema. Deixamos para o final deste texto com dicas sobre o "DIGIGOV" duas expressões de pesquisa particularmente úteis e que raramente surgem em outras bases de dados. São expressões de pesquisa complexas e, para ambas, o mais fácil é copiar as mesmas a partir do menu do lado direito do interface de pesquisa e colá-las no campo de pesquisa, substituindo depois as palavras que constam na dita expressão a título de exemplo por aquelas palavras que nos interessam pesquisar. Assim evitamos digitar mal a expressão, o que invariavelmente terá como consequência não obtermos os resultados esperados. Uma destas duas expressões de pesquisa é a [APROXIMADO("Termo1")], a qual permite pesquisar também palavras parecidas com aquela que colocamos no campo de pesquisa, incluindo a palavra no plural, o mesmo verbo mas noutros tempos verbais - se a palavra pesquisada for um verbo, e até variações de género. Por exemplo, se pesquisarmos no "DIGIGOV" com [APROXIMADO("Paterna")] são devolvidos resultados com a palavra "Paterna" mas também com palavras como "Paternal", "Paterno", "Paternas", etc. É claro que esta expressão de pesquisa tende a devolver muitos falsos positivos, mas pode ser bastante útil, por exemplo, quando não sabemos a grafia exacta de um nome ou de uma localidade que nos interessa. A outra expressão de pesquisa que deixamos para o final é a [PROXIMO((Termo1,Termo2),distância)]. Trata-se da mais complexa de todas, mas, nos casos mais complicados de pesquisa, também pode ser a mais útil. De facto, permite filtrar resultados que não nos interessam quando pesquisamos palavras muito comuns na imprensa da época - o que não é possível com os operadores de pesquisa já mencionados acima. Por outro lado, com esta expressão de pesquisa podemos filtrar sem que resultados que eventualmente nos interessem deixem de aparecer. Tem também a vantagem de ser uma expressão de pesquisa configurável, pois podemos definir a distância máxima entre as palavras que queremos pesquisar e ainda permite-nos combinar uma palavra isolada com uma expressão composta, definindo a distância entre ambas, ou até mesmo combinar duas expressões! Alguns exemplos: - Se pesquisarmos [PROXIMO((Maria,Carneiro),10)] vamos recuperar todos os conjuntos de palavras em que surge o nome "Maria" e, menos de dez palavras mais à frente, também a palavra "Carneiro". Entre os resultados que surgem contam-se, por exemplo: "Maria Romana, 40 forçuras de carneiro", "Maria Rita Theodora da Conceição Pereira, D. Helena Barbara Carneiro", ou "Maria Nunes Tavares (Viuva Carneiro)". Como se pode verificar, em apenas dois destes três casos estamos perante uma mulher com o primeiro nome "Maria" e o apelido "Carneiro". Porém, se com o modo como configuramos esta expressão de pesquisa surgirem demasiados resultados e se aquilo que queremos pesquisar for o nome de uma pessoa que foi conhecida como Maria Carneiro, Maria de Sousa Carneiro, ou Maria Rita Carneiro, mas sem termos a certeza destes nomes; uma vez que em todas estas hipóteses o "Carneiro" nunca se situa a mais de 3 palavras de "Maria", na expressão de pesquisa podemos substituir o "10" por "4", por exemplo, e com isso diminuímos o número de resultados que não interessam. É que, ao passarmos de 10 para 4, deixam de surgir os mencionados resultados "Maria Romana, 40 forçuras de carneiro" e "Maria Rita Theodora da Conceição Pereira, D. Helena Barbara Carneiro", pois a distância entre "Maria" e "Carneiro" é, nestes dois casos, superior a 4 palavras. Inversamente, se colocarmos um número baixo na expressão de pesquisa e surgirem depois muito poucos resultados, convém colocar um número maior, para abarcar maior número de possibilidades. - Se pesquisarmos [PROXIMO(("Francisco Xavier",Falcao),20)] isso permitirá recuperar eventuais referências a um homem que nos interessa e que sabemos ter-se chamado "Francisco Xavier" e pertencer a uma família "Falcão" mas não sabemos o seu nome completo. Note-se que, nesta expressão de pesquisa, as expressões compostas devem estar entre aspas dentro dos parêntesis. Note-se ainda que esta expressão de pesquisa só consegue recuperar os resultados em que a palavra ou expressão que colocamos em primeiro lugar dentro dos parêntesis também surja em primeiro lugar na página. Por exemplo, se pesquisarmos [PROXIMO((António,Carrapito),5)], vamos encontrar a referência a um hipotético "António Manuel de Sousa Carrapito", mas não encontraremos referência a um hipotético "Manuel Carrapito, filho de António Manuel de Sousa", que pode ser importante para a nossa pesquisa, pois talvez seja da mesma família. Portanto, convém pesquisar com esta expressão invertendo também a ordem das palavras ou das expressões compostas entre os parêntesis. Em suma, além de a base de dados "DIGIGOV - Diário do Governo Digital" ser muito importante por aquilo que contém, apresenta um interface de pesquisa com muitas possibilidades, concebido para permitir extrair o máximo de informação que nos interessa. Os operadores de pesquisa e, sobretudo, as expressões de pesquisa mais complexas constantes do menu do lado direito, parecem à primeira vista complicados. Porém, assim que os assimilamos sem dúvida que nos serão muito úteis. Além de tudo isto, a base de dados "DIGIGOV" tem como outro ponto forte o modo prático como são apresentados os resultados. É gerada uma lista numerada e ordenada cronologicamente com menção ao exemplar do jornal e página, lista essa composta por excertos do texto contendo os resultados e as ligações para os ficheiros pdf, fazendo com que os resultados não demorem a carregar e sejam facimente guardados num ficheiro word, o qual pode ser depois visto com calma, pois clicando nos resultados que nos interessam, um a um, não é necessário voltar à base de dados. Além disso, ao clicarmos nas ligações elas ganham outra cor e isso permite-nos perceber de imediato, numa pesquisa sobre termos semelhantes, se a ligação em causa já foi por nós consultada antes ou não. Outro aspecto bastante interessante da base de dados "DIGIGOV" é o modo como são apresentados os resultados quando existe mais do que um no mesmo número do jornal e/ou na mesma página, pois todos os resultados surgem dentro de um excerto de texto, para melhor enquadramento. Por outro lado, se pesquisarmos, por exemplo, "Montalegre" e, num mesmo número do "Diário do Governo", surgirem dois anúncios ou notícias sobre Montalegre em páginas diferentes, a busca recupera dois resultados nesse número do jornal mas atribui-lhe um único número sequencial. Outro aspecto muito positivo do "DIGIGOV" é o de abrir por defeito uma janela à parte quando clicamos nas ligações, o que permite pesquisas mais intituitivas e rápidas, até porque as janelas que apresentam os pdfs permitem arrastar, seleccionar texto, descarregar em pdf ou em imagem, e até optar por visualizar uma versão com maior resolução. Porém, a funcionalidade que consideramos mais interessante no modo de apresentar os resultados desta base de dados é aquela que nos permite configurar o número de caracteres que deve surgir em cada resultado, até um máximo de 800 caracteres, ficando o termo pesquisado sensivelmente a meio do número de caracteres que escolhemos, quando os resultados são apresentados. Esta funcionalidade é extremamente útil pois, por a distância ser sempre igual numa lista de resultados, permite-nos com facilidade despistar casos de referências repetidas. Por outro lado, um grande número de caracteres para cada resultado permite perceber melhor o contexto em que surgem as palavras pesquisadas e desde logo apurar se determinados resultados interessam ou não, na maior parte das vezes sem termos de ir verificar o contexto no próprio número do jornal onde constam. Aconselhamos, pois, a que a pesquisa seja sempre configurada para apresentar os resultados no meio de excertos de texto com 800 caracteres. No caso de pesquisas com a expressão [PROXIMO((Termo1,Termo2),distância)] em que a distância colocada é superior a 20, convém mesmo que se opte por resultados até 800 caracteres, pois de outro modo alguns resultados podem não surgir na lista de resultados com qualquer texto sombreado a amarelo, o que obriga a abrir a página do jornal para verificar se estamos, ou não, perante um resultado que nos interessa. Os únicos aspectos menos conseguidos no "DIGIGOV", no meio de tantas virtualidades desta importantíssima base de dados, são: - O termos de usar expressões complexas, em vez de formulários com botões que as substituam. - O não serem geralmente recuperados resultados quando, nos jornais, as palavras que nos interessam estão translineadas. Por exemplo, se pesquisarmos "Montalegre" e num dos jornais metade dessa palavra está no fim de uma coluna e a outra metade no início da coluna seguinte, ficando a palavra separada por hífen, muito dificilmente conseguiremos recuperar esse resultado. - O de o sistema não conseguir processar correctamente buscas por palavras adicionadas de pontuação, o que nos pode impedir de pesquisar, por exemplo, abreviaturas ou monogramas. - O de o sistema não conseguir processar correctamente buscas que incluam o "&" comercial. Por exemplo, se quisermos encontrar uma sociedade formada por membros da família Colares, ao colocarmos simplesmente "Collares" surgem muitos falsos positivos, pois há outros "Collares" que não interessam e bastantes referências à freguesia com este nome. Porém, se pesquisarmos "Collares &" para restringirmos a pesquisa, o sistema não consegue recuperar apenas os resultados que incluam também o "&". Aliás, se pesquisarmos apenas com "&" para, por exemplo, encontramos todas as sociedades comerciais mencionadas numa determinada época, o sistema não recupera quaisquer resultados, embora o "Diário do Governo" esteja repleto de referências com o "&" comercial. - O de o sistema não conseguir diferenciar maiúsculas e minúsculas. Esta é, talvez, a maior fraqueza da base de dados. Por exemplo, se pesquisarmos por "Lícia" - nome próprio de uma senhora que viveu em Portugal no século XIX - surgem inúmeros resultados em que a palavra que consta no jornal é "Polícia" ou "Milícia" mas onde o OCR leu um espaço entre "Po" e "lícia" ou entre "Mi" e "lícia". Em praticamente todos estes casos, o "l" é minúsculo, mas, como a base de dados não distingue maiúsculas de minúsculas, torna-se extenuante procurar o que nos interessa, pois há que encontrar o nome próprio "Lícia" no meio de 2391 resultados do "DIGIGOV"! Um outro exemplo: se estamos a estudar um tema portuário e colocamos "porto" na pesquisa, vão surgir milhares e milhares de resultados que não dizem respeito a portos mas sim à cidade do Porto em geral. Chegou a ser testada uma caixa de verificação que permitia diferenciar maiúsculas e minúsculas na pesquisa, mas, por dificuldades técnicas, não veio a ser implementada. Porém, esperamos que no futuro esse problema seja resolvido e a base de dados "DIGIGOV" venha a ter ainda mais funcionalidades úteis, além daquelas que já tem. E agora que já sabe melhor como funciona esta incontornável base de dados, o melhor conselho que podemos dar é experimentá-la, ou então voltar a pesquisar o que já nela pesquisou antes, mas agora com as funcionalidades que aqui indicámos e observando as dicas que demos. É provável que venha a ter agradáveis surpresas. Boas pesquisas! A partir de hoje, passa a estar disponível ao público a base de dados "DIGIGOV - Diário do Governo Digital (1820-1910)", concebida e concretizada pelo CEPESE - Centro de Estudos da População, Economia e Sociedade (Universidade do Porto).
Não poderíamos deixar de o anunciar com pompa, não só por termos modestamente colaborado com algumas dicas para o melhoramento do interface de pesquisa, mas sobretudo por acreditarmos que esta nova base de dados é uma das mais importantes em língua portuguesa. Efectivamente, ela abrange a imprensa diária oficial de Portugal ao longo de noventa anos ininterruptos, sendo a mais completa que - por agora - existe baseada na imprensa portuguesa. São quase 30 mil edições do jornal oficial do Estado Português, o qual conheceu várias designações mas foi sobretudo publicado como "Diário do Governo". Se considerarmos que cada edição estendeu-se ao longo de várias páginas, e que as edições mais tardias tinham, por vezes, bem mais do que dez páginas cada uma; se considerarmos que esta base de dados inclui ainda os suplementos, os apêndices e as edições extraordinárias; conclui-se que estamos, efectivamente, perante uma fonte histórica de grande abrangência cronológica. Poder-se-á pensar que esta base de dados, por ser referente a um jornal oficial, mesmo com a aludida grande abrangência cronológica não será muito relevante para pesquisas genealógicas. Nada mais falso. Na base de dados DIGIGOV podemos encontrar inúmeras referências com interesse genealógico, algumas das quais não podem sequer ser encontradas noutras fontes. Por outro lado, o facto de abranger 90 anos, dia após dia, significa que é elevadíssima a probabilidade de encontrarmos referências a antepassados nossos. Mais importante ainda: esta base de dados pode ser extremamente útil para desenvencilharmos difíceis nós genealógicos, sobretudo os que foram causados por efeito de migrações. Aliás, com base em testes que fomos fazendo ao longo dos últimos dois meses, podemos mesmo afirmar que a base de dados "DIGIGOV" é uma fonte alternativa muito interessante para quem quer começar uma pesquisa genealógica e não tem mais do que dois ou três nomes de antepassados presumivelmente portugueses nascidos em finais do século XIX, sem qualquer referência a datas ou localidades concretas. Nesse sentido, esta base de dados pode ser crucial para muitos brasileiros (e ainda canadianos, norteamericanos e havaianos) que procuram as suas origens em Portugal. Entre muitos motivos que nos permitem encontrar referências a antepassados nas páginas da imprensa oficial portuguesa, estão - obviamente - a participação na vida política nacional, regional e local (mesmo que esporadicamente, como no caso da subscrição de petições ou abaixo-assinados), a obtenção de ordens honoríficas e de mercês régias (nomeações e licenças dadas ao que hoje conhecemos como o "funcionalismo público", o que inclui desde juizes a engenheiros de obras públicas, de professores de liceu e mestres-escola a tabeliães, entre muitos outros profissionais). Entre os motivos estão também a participação na constituição ou alteração de sociedades ou o registo de patentes e marcas comerciais - o que significa que as páginas da imprensa oficial portuguesa estão igualmente repletas de menções a negociantes. Mas, mais importante do que isto, ao longo dos primeiros 90 anos de imprensa diária oficial em Portugal, ficaram registados no papel anúncios e avisos vários, incluindo incontáveis editais derivados de processos judiciais. Estes anúncios e editais podem incluir informações fundamentais para o processo de pesquisa genealógica. Damos vários exemplos, alguns dos quais ilustramos neste texto: o casamento de estrangeiros em Portugal; os avisos a parentes moradores em parte incerta (nomeadamente no Brasil) quando havia habilitações de herdeiros ou inventários orfanológicos a decorrer; os avisos referentes a processos de falência ou a demandas judiciais sobre dívidas; os anúncios referentes à mudança de titular, por falecimento do titular anterior de títulos do Montepio; os anúncios referentes a mudanças de nome (tema sobre o qual estamos a preparar um estudo); ou os anúncios e editais feitos na sequência de processos de separação de pessoas e bens (vulgarmente designados como "de divórcio"). Sobre esta última tipologia de avisos e editais contamos muito em breve trazer aqui exemplos concretos, os quais são particularmente interessantes para a pesquisa genealógica. Também muito em breve traremos aqui algumas dicas sobre como pesquisar na base de dados "DIGIGOV" aproveitando ao máximo todas as suas funcionalidades. Por agora, convidamos a que naveguem na base de dados, pois, muito provavelmente, irão já encontrar vários resultados interessantes e - talvez - inesperados. Parabéns ao CEPESE por mais esta ferramenta de grande utilidade pública e boas pesquisas! Ligação para a base de dados: https://digigov.cepese.pt Uma fonte documental portuguesa geralmente negligenciada por genealogistas, sejam estes amadores ou profissionais, são os pedidos de bilhete de identidade. Entre os vários motivos que poderão explicar uma certa indiferença face a esta fonte, destacamos dois: 1. Até há bem poucos anos, esta fonte era de difícil acesso e, também por isso, era desconhecida de muitos genealogistas. 2. Trata-se de uma fonte para o século XX, após a Implantação da República, sugerindo a quem pesquisa que só terá interesse para indivíduos ainda vivos ou que faleceram nos últimos cinquenta anos. Em suma, subsiste ainda a crença generalizada de que esta fonte não é muito relevante para recuar no tempo e para preencher a árvore genealógica. Mas será mesmo assim? Muitos dos pedidos de bilhete identidade em Portugal poderão ter sido destruídos e, entre os que seguramente não o foram, haverá muitos por catalogar. Mesmo os pedidos de bilhete de identidade que estão já catalogados nem sempre ficam suficientemente "visíveis" quando pesquisamos, sobretudo se os livros não estiverem "online". Porém, progressivamente estes pedidos de bilhete de identidade vão sendo catalogados pelos arquivos públicos e alguns dos mais antigos até já estão indexados, de modo que podemos pesquisar com um nome que nos interessa e termos uma agradável surpresa. Ainda assim, há um certo desconhecimento sobre as virtualidades desta fonte documental e, por isso, decidimos levantar um pouco do véu, explicando algumas das suas grandes vantagens. Aquele retrato que falta Em Portugal, os pedidos de bilhete de identidade começam a ser processados em 1914 pelos Governos Civis dos distritos. Nessa altura, a fotografia estava generalizada no país e mesmo pessoas de mais modestos recursos guardariam meia dúzia de retratos em casa. Porém, há quem tenha o azar de pertencer a uma família em que essas fotos foram destruídas ou passaram a outros ramos com os quais não têm contacto. Assim, os pedidos de bilhete de identidade podem conter aquele retrato que nos falta do nosso bisavô, trisavô, em alguns casos tetravô - se considerarmos que vários destes pedidos de bilhete de identidade estão em nome de pessoas que nasceram em 1870s, em 1860s, ou até antes. Encontrámos já o caso de uma nascida em 1833 que foi retratada em 1914. Retratos da família Muitos dos pedidos de bilhete de identidade eram feitos em conjunto, sendo comum encontrarmos pedidos de marido e mulher. No caso de crianças, é habitual que haja logo à frente o pedido de bilhete de identidade de um irmão ou de um dos progenitores. Ou seja, encontrarmos o pedido de bilhete de identidade de um antepassado pode dar-nos acesso imediato a outros antepassados, ou colaterais, e vice-versa. Um útil ponto de partida Os pedidos de bilhete de identidade podem ser um ponto de partida interessante para quem esteja com dificuldade em saber qual a paróquia onde começar a pesquisar baptismos anteriores a 1911. Isto porque cada pedido regista a filiação, a naturalidade, a idade, e a data de nascimento. O tempo que perdermos a pesquisar os pedidos de bilhete de identidade pode compensar o tempo que pouparemos em buscas infrutíferas quando não sabemos onde e/ou para quando pesquisar os registos de baptismo. Outras vantagens Os pedidos de bilhete de identidade contêm informações que não estão disponíveis em outras fontes, algumas das quais de grande interesse. Referimo-nos sobretudo aos dados biométricos. As impressões digitais de todos os dedos podem ser, talvez, uma mera curiosidade. Contudo, a altura, a cor dos olhos e do cabelo, o tom de pele, a descrição de eventuais sinais no corpo (como sardas, verrugas, cicatrizes, e onde se situavam), outras indicações como o estrabismo; tudo isto são já informações interessantes que permitem conhecer melhor os nossos antepassados. Acresce que os pedidos de bilhete de identidade mais antigos (de 1914 e dos anos seguintes) contêm fotos de frente e de perfil. Ora, fotos de perfil dessa época geralmente não se encontram em espólios familiares e dão-nos uma perspectiva mais exacta de como eram os nossos antepassados. Fotos tiradas de frente por vezes não nos dizem como era a pessoa de perfil e até nos podem induzir em erro. Se com o retrato de um antepassado nosso tirado de frente podemos concluir que se parece bastante com um certo tio ainda vivo, tendo o retrato desse mesmo antepassado tirado de perfil podemos encontrar semelhanças ainda mais inusitadas com outros familiares nossos. Os contras Os mais antigos pedidos de bilhete de identidade, de 1914 e dos anos seguintes, eram geralmente feitos por quem ia viajar. Abrangem pessoas de todos os estratos sociais, pois incluem os muito abastados, mas também os muito humildes que pensavam, por exemplo, em emigrar. Porém, para essa época os pedidos de bilhete de identidade não são uma fonte generalizada e, como eram processados ao nível distrital, podem misturar indivíduos de vários concelhos num livro só. Se os arquivos que detêm esta fonte documental não os indexarem um por um, a busca pode ser longa e infrutífera. Já os pedidos de bilhete de identidade da década de 1930, apesar de serem menos interessantes em termos de dados biométricos (não contendo, por exemplo, fotos de perfil), têm a vantagem de estarem organizados por concelhos, correspondendo às respectivas conservatórias de registo civil. É claro que, mesmo num determinado concelho, é muito difícil sabermos de antemão em que ano é que alguém pediu bilhete de identidade. Podem ser encontrados pedidos de bilhete de identidade em todos os arquivos distritais e regionais, e ainda na Torre do Tombo. Uma progressiva indexação desta fonte documental torná-la-á cada vez mais útil, abrindo novas portas para a pesquisa genealógica. E os bilhetes de identidade propriamente ditos, onde estão? Uma coisa é o pedido de bilhete de identidade; outra é o bilhete de identidade em si. Ora, os pedidos de bilhete de identidade estão ordenados em conjuntos documentais coerentes e incluem mais informação do que os bilhetes de identidade em si. Por outro lado, os bilhetes de identidade eram usados durante o período de validade e depois poderiam ter destinos muito diferentes, tornando mais difícil encontrá-los hoje em dia: uns podem estar simplesmente perdidos numa gaveta lá de casa; outros foram há muito destruídos, quer pelos próprios portadores (acidentalmente ou não), quer aquando de um novo pedido de bilhete de identidade. O tribunal foi outro destino habitual dos bilhetes de identidade caducados: vários acabaram por ficar anexados a processos relacionados com heranças, nomeadamente nos casos em que foram suscitadas dúvidas sobre alguma assinatura do falecido. Algumas dicas
Nota originalmente publicada na página do Facebook do "Genealogia sem segredos" em 16 de Abril de 2017 No livro "Descubra as suas origens" está sumariamente explicado qual o interesse genealógico da pesquisa nos prazos, e como se deve pesquisar.
Ao contrário do que geralmente se pensa, não são os livros de prazos que dão maior quantidade de informação genealógica: estes devem ser usados, sim, como ponto de partida para outras séries documentais que, em alguns casos, existem em abundância, mas, noutros não. No que diz respeito a prazos, é preciso termos a sorte de encontrar um ponto de referência: um antepassado que, comprovadamente, era foreiro de uma determinada instituição cujo fundo documental exista hoje em algum arquivo público. Poderá ser um mosteiro, o Rei, uma mitra diocesana, ou outra instituição. Havendo a certeza de que um antepassado nosso foi mesmo foreiro dessa instituição, devemos procurar os tombos dessa instituição referentes à região que nos interessa, começando do mais recente para o mais antigo (salvo se tivermos a sorte de possuir um ponto de referência que já inclua datas e até indicação de um livro de tombo concreto). Visto que uns remetem para os outros, indicando mesmo o livro e a folha, é muito fácil pesquisar os livros de tombo. Aliás, este tipo de livros geralmente são dos que têm a caligrafia mais cuidada, visto serem redigidos com certa solenidade e preocupação de clareza. Aquando da pesquisa nos tombos, convém estar atento às notas marginais, no prazo que nos interessar, e consultar tudo - literalmente tudo - o que diga respeito a esse prazo e esteja mencionado à margem, desde processos judiciais, a apegações (ou louvações), passando pelas declarações de reconhecimento (feitas nomeadamente quando os enfiteutas não estavam a cumprir as obrigações de pagamento, alegando dúvida ou desencaminhamento do título de aforamento, e o dono do prazo obrigava judicialmente o reconhecimento da obrigação). No caso das apegações ou louvações, e também no dos processos judiciais relativos a prazos (embora estes sejam mais raros em arquivos públicos), pode ser encontrada informação genealógica muito útil. Em suma, nos fundos documentais de instituições das quais sabemos que existiram antepassados nossos como foreiros, não devemos entrar de rompante nas séries documentais com maior interesse genealógico sem termos pontos de referência, ou dificilmente encontraremos o que queremos. Além disso, há muitos fundos destas instituições que são lacunares na documentação. Os tombos de prazos são, quase sempre, a melhor solução para termos esses pontos de referência. Boas pesquisas. |
Genealogia sem segredos
Para uma Genealogia mais rigorosa, mais transparente e mais acessível a todos. Histórico
Dezembro 2021
Categorias
|