Skip to content

Pubmed XML: corrigir Author vazio e implementar GroupList/Group/IndividualName para autoria em grupo #1237

Description

@Rossi-Luciano

Descrição da tarefa

Parte de #1226. Depende de #1236 (Suffix/CollectiveName na mesma função).

Para artigos com autoria em grupo, o SPS 1.10 usa o padrão:

<contrib-group>
   <contrib contrib-type="author" id="collab">
     <collab>The SciELO Group</collab>
   </contrib>
</contrib-group>
<contrib-group content-type="collab-list">
    <contrib contrib-type="author" rid="collab">
      <name><surname>Esteves</surname><given-names>Felipe</given-names></name>
      ...
    </contrib>
    ...
</contrib-group>

Hoje xml_pubmed_author_list não filtra por contrib-group-type (já exposto pelo model article_contribs.TextContribs.main_contribs). Resultado: o contrib puramente <collab> (sem <name>) vira um <Author></Author> vazio em AuthorList, e os membros do collab-list ficam achatados como Author comuns em vez de aparecerem em GroupList/IndividualName, conforme a doc oficial do PubMed (NBK3828).

Subtarefas

  • Filtrar xml_pubmed_author_list para excluir da AuthorList os contribs com contrib-group-type == "collab-list" e o contrib puramente-<collab> sem <name> (corrige o <Author/> vazio)
  • Implementar xml_pubmed_group_list: para cada contrib-group sem content-type que tenha um <collab>, montar Group/GroupName (texto do <collab>) e localizar o contrib-group[@content-type="collab-list"] correspondente (via id/rid) para montar IndividualName (FirstName/LastName/Suffix/AffiliationInfo) de cada membro
  • Adicionar testes cobrindo: artigo sem grupo (comportamento atual preservado), artigo só com grupo, artigo com autores individuais + grupo

Considerações e notas

Bug real encontrado durante levantamento de contexto da #1226. Não implementar MiddleName (decisão já tomada — JATS não separa nome do meio de given-names).

Metadata

Metadata

Assignees

Labels

Type

No type

Fields

No fields configured for issues without a type.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions