Skip to content

Releases: scieloorg/processing

v1.32.12

Choose a tag to compare

@rondinelisaad rondinelisaad released this 03 Jul 15:29
74aacaf

Correções

  • Aplicado o conteúdo do PR #98, incluindo ajustes no arquivo KBART e atualização da dependência xylose.
  • Adicionada fila persistente para reprocessamento de coleções que falham durante a execução do run.sh.

Detalhes

Quando uma coleção falha após as tentativas configuradas, seu acrônimo passa a ser registrado em failed_collections.queue no diretório de logs. Na próxima execução, essas coleções pendentes são processadas antes da lista normal e removidas da fila quando concluídas com sucesso.

Essa mudança reduz o risco de coleções ficarem sem processamento após falhas transitórias de comunicação com serviços externos, como o ArticleMeta thriftserver.

Testes

  • Validada a sintaxe do run.sh com bash -n.
  • Validado o diff com git diff --check.

v1.32.11

Choose a tag to compare

@rondinelisaad rondinelisaad released this 29 Apr 20:07
Add Argo CronWorkflow for scheduled processing

v1.32.10

Choose a tag to compare

@rondinelisaad rondinelisaad released this 29 Apr 19:53
Keep service endpoints out of repository config

v1.32.9

Choose a tag to compare

@rondinelisaad rondinelisaad released this 29 Apr 19:22

Esta release migra o projeto de Python 2.7 para Python 3.14.4 e adiciona uma rotina de execução Docker para processamento com persistência de arquivos e notificações no Slack.

Principais mudanças
Código refatorado para compatibilidade com Python 3.
Imagem Docker baseada em python:3.14-slim.
Novo docker-compose.yaml com serviços separados para:
processing: execução real do processamento.
tests: execução da suíte de testes.
Novo run.sh como entrypoint operacional.
Suporte a notificações via SLACK_WEBHOOK_URL.
Persistência de logs em var/log/processing.
Persistência dos ZIPs gerados em var/tabs.
Configuração por variáveis de ambiente, sem necessidade obrigatória de config.ini.
Timeout do publicationstats configurável por PUBLICATIONSTATS_TIMEOUT_MS.
Compatibilidade com libs legadas que importam thriftpy, usando shim para thriftpy2.
Tratamento defensivo para metadados incompletos em coleções com registros inconsistentes.

Variáveis de ambiente úteis
ARTICLEMETA_THRIFTSERVER=articlemeta.scielo.org:11621
RATCHET_THRIFTSERVER=ratchet.scielo.org:11649
PUBLICATIONSTATS_THRIFTSERVER=publication.scielo.org:11620
PUBLICATIONSTATS_TIMEOUT_MS=120000
SLACK_WEBHOOK_URL=https://hooks.slack.com/services/...

Como executar
PUBLICATIONSTATS_TIMEOUT_MS=120000 docker compose run --rm processing "bol-BO"

Com Slack:
SLACK_WEBHOOK_URL="https://hooks.slack.com/services/..."
PUBLICATIONSTATS_TIMEOUT_MS=120000
docker compose run --rm processing "dom-DO"

Validação
A suíte foi validada em Docker com Python 3.14.4:
docker compose run --rm tests

Resultado:
Ran 28 tests ... OK

v1.32.8

Choose a tag to compare

@rondinelisaad rondinelisaad released this 29 Apr 19:19

Esta release migra o projeto de Python 2.7 para Python 3.14.4 e adiciona uma rotina de execução Docker para processamento com persistência de arquivos e notificações no Slack.

Principais mudanças
Código refatorado para compatibilidade com Python 3.
Imagem Docker baseada em python:3.14-slim.
Novo docker-compose.yaml com serviços separados para:
processing: execução real do processamento.
tests: execução da suíte de testes.
Novo run.sh como entrypoint operacional.
Suporte a notificações via SLACK_WEBHOOK_URL.
Persistência de logs em var/log/processing.
Persistência dos ZIPs gerados em var/tabs.
Configuração por variáveis de ambiente, sem necessidade obrigatória de config.ini.
Timeout do publicationstats configurável por PUBLICATIONSTATS_TIMEOUT_MS.
Compatibilidade com libs legadas que importam thriftpy, usando shim para thriftpy2.
Tratamento defensivo para metadados incompletos em coleções com registros inconsistentes.

Variáveis de ambiente úteis
ARTICLEMETA_THRIFTSERVER=articlemeta.scielo.org:11621
RATCHET_THRIFTSERVER=ratchet.scielo.org:11649
PUBLICATIONSTATS_THRIFTSERVER=publication.scielo.org:11620
PUBLICATIONSTATS_TIMEOUT_MS=120000
SLACK_WEBHOOK_URL=https://hooks.slack.com/services/...

Como executar
PUBLICATIONSTATS_TIMEOUT_MS=120000 docker compose run --rm processing "bol-BO"

Com Slack:
SLACK_WEBHOOK_URL="https://hooks.slack.com/services/..."
PUBLICATIONSTATS_TIMEOUT_MS=120000
docker compose run --rm processing "dom-DO"

Validação
A suíte foi validada em Docker com Python 3.14.4:
docker compose run --rm tests

Resultado:
Ran 28 tests ... OK

1.32.7

Choose a tag to compare

@robertatakenaka robertatakenaka released this 25 Feb 18:50
11817c7

What's Changed

  • Aplica correções de ISSN na integração com DOAJ by @gustavofonseca in #47
  • fix: corrige dados de coleções (VEN, RVE, RVO) e atualiza tipos de documentos citáveis by @robertatakenaka in #82
  • Filter non-active journals from KBART export by @Copilot in #80
  • Populate coverage_depth field with "fulltext" in KBART export by @Copilot in #78
  • Remove Portuguese translations from KBART headers by @Copilot in #79
  • Fix KBART URL for Revista española de sanidad penitenciaria using ISSN redirect by @Copilot in #84

New Contributors

  • @Copilot made their first contribution in #80

Full Changelog: 1.32.6...1.32.7

1.32.6

Choose a tag to compare

@gustavofonseca gustavofonseca released this 27 Feb 12:50

Resolve as dependências de forma a eliminar conflitos.

1.32.5

Choose a tag to compare

@robertatakenaka robertatakenaka released this 17 Feb 18:57
ac900c2

Corrige o relatório, os conteúdo das colunas "document publishing year" (data de publicação do documento, com dia), "document published at" (data do fascículo )?

1.32.4

Choose a tag to compare

@robertatakenaka robertatakenaka released this 13 Feb 14:29
f5e90f5

xylose 1.35.8

1.32.2

Choose a tag to compare

@fabiobatalha fabiobatalha released this 22 Dec 12:37

Corrige testes.