Issue #309

0 up
0 down
Closed
softwarepublico/softwarepublico#309
Created by Rodrigo Souto (Edited )

Importar as notícias wiki do portal

As notícias da capa do portal spb antigo são publicadas usando formularios wiki. Portanto ficam em outras tabelas. Fiz uma rapida consulta na tabela de objetos e consegui chegar aos objetos do tipo "::xowiki::FormPage" filtrando pelo package_id do subsite principal do Portal que armazena essas notícias. Por enquanto a consulta abaixo só traz o codigo do objeto e o título da notícia. Quando você for fazer essa atividade refino a pesquisa pra trazer o restante das informações:

select * from acs_objects where object_type like '::xowiki::FormPage' and package_id=4345 order by creation_date desc;

A aplicação xowiki armazena as revisões das paginas, e temos que pegar a revisão ativa, lembrando de checar também se o status "publicado" está ativo.

Assignee: Marcos Pereira
Milestone: Extras
13 participants
  • A8ff67a0e69e7cfaeb1299e02082c339?s=40&d=identicon
    Arthur Esposte @arthurmde

    @diguliu ainda vamos fazer algo a respeito disso?

    A princípio to mapeamento para a próxima release!

    Choose File ...   File name...
    Cancel
  • A8ff67a0e69e7cfaeb1299e02082c339?s=40&d=identicon
    Arthur Esposte @arthurmde

    Milestone removed

    Choose File ...   File name...
    Cancel
  • C8b72d0556872a2aea21e8fed0a72001?s=40&d=identicon
    Melissa Wen @melissawen

    Milestone changed to Prioridades - Encerramento

    Choose File ...   File name...
    Cancel
  • C8b72d0556872a2aea21e8fed0a72001?s=40&d=identicon
    Melissa Wen @melissawen

    @diguliu depois anota aqui sua definição com a @marisa sobre migração. Se será atacado ou não

    Choose File ...   File name...
    Cancel
  • 2fb770603e9880964ce0f8ac999d516f?s=40&d=identicon
    Rodrigo Souto @diguliu

    Após reunião com @marisa, ficamos de finalizar as issues #450, #452 e #453. Nas duas últimas issues, caso necessário, removeremos as comunidades e refaremos a migração.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Essa issue é sobre o que especificamente @diguliu ? Não lembro.

    Choose File ...   File name...
    Cancel
  • 2fb770603e9880964ce0f8ac999d516f?s=40&d=identicon
    Rodrigo Souto @diguliu

    @marisa, se eu não me engano, tínhamos o plano de tentar migrar as páginas wiki do portal antigo caso tivéssemos tempo. Deixamos ela de fora da migração porque estava fora do escopo planejado.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Ahh ok. Obrigada Rodrigo.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Ahh Rodrigo, acho que essa foram as notícias da capa do portal que não foram migradas. Se olharmos nas notícias só temos as geradas no novo portal (https://softwarepublico.gov.br/social/spb/noticias) porém tem uma pasta que chamada https://softwarepublico.gov.br/social/spb/blog que contém uma série de notícias que eu não sei de onde vieram, você saberia dizer? Essas são as principais notícias do SPB que ficaram para trás. Agora mesmo eu estava procurando uma notícia antiga e não encontrei na busca do noosfero e nem na busca global. Isso é algo bem importante.Teremos como concluir isso? @obsneto @lmatos para conhecimento.

    Choose File ...   File name...
    Cancel
  • 2fb770603e9880964ce0f8ac999d516f?s=40&d=identicon
    Rodrigo Souto @diguliu

    Oi @marisa, se for para mover as notícias do https://softwarepublico.gov.br/social/spb/blog para https://softwarepublico.gov.br/social/spb/noticias, dá para fazermos. Mas se for para implementar a migração do conteúdo wiki do portal antigo, não dará tempo. Você pode confirmar qual dos dois seria?

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Oi @diguliu Seria a segunda opção mas não seria migração da wiki, propriamente dita mas temos umas 450 notícias que estão postadas na capa do portal antigo que não foram migradas, acho que elasestão nesse formato.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Tenho uma sugestão: Se te passarmos todos os dados numa planilha fica mais fácil para importar? @lmatos para conhecimento.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    @paulormm conforme combinamos na reunião de ontem estamos preparando um csv com os seguintes campos: data, título e conteúdo da notícia. Até sexta disponibilizaremos por aqui. Obrigada.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa (Edited )

    Segue em anexo o csv com 427 notícia a serem migradas na comunidade spb https://softwarepublico.gov.br/social/spb/ no blog chamado Notícias. Aí constam os seguintes campos: data, título e conteúdo da notícia. Se precisarem de apoio ou do script é só falar.

    Choose File ...   File name...
    Cancel
  • B4c7afc2cdffea95a8c2d0387acedc6b?s=40&d=identicon
    Paulo Meireles @paulormm

    Conversarei com o @diguliu e a equipe do Noosfero para vermos isso.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Ok @paulormm . Estamos no aguardo. Ahhh peço que, se puderem, disponibilizem em algum lugar scripts que estão sendo utilizados na migração para que possamos ver uma forma de internamente fazermos isso, caso não dẽ tempo ou caso esqueçamos algo após o termo de cooperação com vocês. Obrigada.

    Choose File ...   File name...
    Cancel
  • B4c7afc2cdffea95a8c2d0387acedc6b?s=40&d=identicon
    Paulo Meireles @paulormm (Edited )
    Choose File ...   File name...
    Cancel
  • 2fb770603e9880964ce0f8ac999d516f?s=40&d=identicon
    Rodrigo Souto @diguliu

    Olá @marisa, desculpe a demora na resposta.

    Com a planilha facilita, mas o maior problema é a limitação de tempo mesmo. Terminei hoje de implementar a correção relativa à issue #450 e ainda falta a #452 e #453 que sei que irá estourar pra além de abril. Minha bolsa termina agora nesse mês, mas assumi o compromisso de terminar essas correções e irei entregá-las. Porém não posso me comprometer com essa outra demanda. Fazer essa importação de conteúdo exige além do script de conversão, teste e revisão do resultado, o que consome uma quantidade razoável de tempo. Verei a possibilidade de algum outro bolsista do projeto que irá continuar até maio fazer essa importação, até porque com a planilha, não é necessário ter conhecimento do esquema de migração.

    Em relação aos scripts para migração, toda a informação do que foi utilizado e de como utilizar está nesse repositório ou referenciado nele: https://softwarepublico.gov.br/gitlab/softwarepublico/migration

    Choose File ...   File name...
    Cancel
  • B4c7afc2cdffea95a8c2d0387acedc6b?s=40&d=identicon
    Paulo Meireles @paulormm

    Isso mesmo @diguliu : veremos contigo para dar o caminho das pedras e tentarmos que algum outro bolsista faça essa tarefa. Na próxima semana, vemos isso com a equipe, mas será algo extra mesmo, além do que está previsto para 06 de maio, fim da última sprint.

    Choose File ...   File name...
    Cancel
  • B4c7afc2cdffea95a8c2d0387acedc6b?s=40&d=identicon
    Paulo Meireles @paulormm

    Milestone changed to Extras

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    ok @diguliu obrigada pelo feedback.

    Choose File ...   File name...
    Cancel
  • B5782cb554a4b36d12017ee18d1b6e9d?s=40&d=identicon
    Simiao Carvalho @simiaosimis

    @marcosronaldo ver com @diguliu para parear com @gabrielssilva

    Choose File ...   File name...
    Cancel
  • B5782cb554a4b36d12017ee18d1b6e9d?s=40&d=identicon
    Simiao Carvalho @simiaosimis

    Reassigned to @marcosronaldo

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    As notícias importadas do portal antigo contém links com domínio softwarepublico.gov.br e path do domínio antigo (que agora está em antigo.softwarepublico.gov.br). Consequentemente esses links estão quebrados. Uma solução boa seria fazer o download e importação automática de todos os arquivos linkados do portal antigo para o portal novo, e em seguida corrigir os links no corpo de cada notícia. Isso é inviável devido ao tempo curto para implementação dessa solução, então solução escolhida foi a correção do domínio dos links para o portal antigo. Isso quer dizer que as imagens e arquivos linkados nessas notícias ainda estão hospedados no antigo portal. Embora esteja tudo acessível atualmente, caso o portal antigo saia do ar, todos esses links irão falhar. @marisa @paulormm @diguliu

    Choose File ...   File name...
    Cancel
  • B4c7afc2cdffea95a8c2d0387acedc6b?s=40&d=identicon
    Paulo Meireles @paulormm

    @marcosronaldo : pode seguir dessa forma. A depender da quantidade de ajustes depois da nossa entrega, avaliamos em melhor isso. De qualquer forma, os conteúdos estão sendo migrados e as imagens mapeadas para uma troca manual pelos estagiários da DeGSI, se for o caso.

    @marisa e @lmatos : em voz discutimos isso, para um melhor entendimento com vocês.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa (Edited )

    Oi Pessoal, Já estávamos ciente deste problema desde a primeira migração...Já tínhamos decidido que não migraríamos imagens e nem colocaremos elas manualmente hehehe vejam como o @diguliu fez isso nas outras migrações de notícias: https://softwarepublico.gov.br/social/e-cidade/blog/nova-versao-disponivel-2.3.19.. dessa forma atende. Obrigada.

    Choose File ...   File name...
    Cancel
  • B4c7afc2cdffea95a8c2d0387acedc6b?s=40&d=identicon
    Paulo Meireles @paulormm

    Perfeito, @marisa .

    @marcosronaldo : como definido com @diguliu , já faz a migração sem importar as imagens mesmo.

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    Task de migração feita e testada localmente. Na próxima atualização será executada para homologação. @kanashiro para conhecimento

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    Status changed to closed

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa (Edited )

    Oi Marcos, Além de desejarmos que as migrações fossem feitas no spb/noticias e não spb/blog algumas datas estão com a data incorreta. Vou postar aqui alguns casos para vermos se foi problema no csv ou na migração.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Status changed to reopened

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    @marisa, estou fazendo a alteração para importar no blog correto, entretanto as notícias não serão importadas em produção nessa atualização de hoje, faremos isso após sua confirmação de que está tudo OK. Sobre as datas, todas as notícias são importadas da mesma forma automaticamente, então se apenas algumas estão com data incorreta, os erros podem estar no arquivo csv.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Oi @marcosronaldo acabei de achar um caso aqui: https://dev.softwarepublico.gov.br/social/spb/blog/a-solucao-invesalius-sera-disponibilizada-no-inicio-de-novembro.No arquivo consta a data 16/01/2009 às 16:19 e ela foi migrada em 01/01/2007 14:31. Temos alguns casos assim.

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    @marisa Após um tempo investigando o problema, conclui que a importação está funcionando como esperado, importando todas as datas de forma correta. Esses exemplos de datas incorretas são de artigos que já existiam, e portanto não são importados novamente, para não duplicar/alterar informações já existentes, que podem ter sido alteradas de forma manual. Como pode ser observado em produção, esse artigo que foi usado como exemplo já existia com a data "incorreta" (2007). Em suma, a única alteração necessária em relação a essa issue é importar para o blog "noticias" em vez de "blog".

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Realmente você está certo. Vamos proceder conforme sua orientação. Obrigada @marcosronaldo

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    @marisa rodamos a importação em dev, já pode conferir =)

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Oi @marcosronaldo em dev mesmo? continua do mesmo jeito, não está em spb/noticias e sim spb/blog

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    @marisa as notícias que já existiam não foram alteradas de forma alguma, isso quer dizer que se algumas delas estavam dentro de "blog", elas continuaram lá. As notícias que não existiam no portal foram importadas para notícias. Quando importadas em produção, todas elas poderão ser encontradas na busca normalmente.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Oi @marcosronaldo o estranho é que o nosso blog atual de produção não consta nada, está vazio, nesse caso deve continuar dessa forma, todas nossas notícias devem ir para spb/noticias. Não entendemos porque o dev não está refletindo isso. Se puder me passa um telefone que te ligo e conversamos.

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    @marisa algumas notícias antigas estavam em "notícias" mas com o path errado, e portanto eram acessadas apenas em spb/blog. Alteramos a importação para também corrigir o path das notícias que já existiam. Assim que rodar em dev te aviso para homologar mais uma vez =)

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Beleza. Vou dar uma olhada porque não estou entendendo heheh temos dois blogs na comunidade spb: um chamado notícias que fica indexado na capa do portal e outro chamado blog que não usamos para nada. Tem que dar uma olhada direitinho porque pretendemos continuar com o blog "notíticas" mesmo pq o bloco de noticias da capa do portal e indexado por ele.

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    Tinham notícias que na url ficavam com "/spb/blog/". Corrigimos esse problema, colocando na url "/spb/noticias/". Vão ficar todas as notícias no blog "Notícias", e podemos assim apagar o blog padrão de nome "Blog", já que não é utilizado. Ficou mais claro?

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    entendi. Obrigada

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    @marisa pode dar uma olhada em dev mais uma vez?

    Choose File ...   File name...
    Cancel
  • 71c7041f7667454f3d6bf8f889e2d598?s=40&d=identicon
    Luiz Matos @lmatos (Edited )

    Eu dei uma olhada aqui, existem 45 páginas de notícias (x 13 da produção), o que me pareceu certo.

    Esperar pela validação da @marisa

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Quado clicamos na notícia dá erro:

    Esta página não existe: /social/spb/noticias/encontro-tecnico-do-software-publico-brasileiro-debate-desenvolvimento-seguro-de-software-nesta-sexta

    Você pode ter clicado em um link expirado ou em um endereço digitado errado. Se você clicou em um link que estava em outro site ou que foi passado a você por outra pessoa, seria legal que você avisasse que este link não é mais válido.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    @ioneoliveira para acompanhamento

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    Ahh acho que é pq ele direcionou paraprodução. coloquei dev na frente e foi. amanhã faço uma validação melhor . Obrigada

    Choose File ...   File name...
    Cancel
  • 0857617ca13d090825c8eb4228efb6ae?s=40&d=identicon
    Marcos Pereira @marcosronaldo

    O ambiente dev estava com domínio de produção, então todo os links do ambiente estavam com domínio errado. Já foi corrigido.

    Choose File ...   File name...
    Cancel
  • B4c7afc2cdffea95a8c2d0387acedc6b?s=40&d=identicon
    Paulo Meireles @paulormm
    Choose File ...   File name...
    Cancel
  • B4c7afc2cdffea95a8c2d0387acedc6b?s=40&d=identicon
    Paulo Meireles @paulormm

    Status changed to closed

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    homologada em dev.

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    ainda não está em produção

    Choose File ...   File name...
    Cancel
  • 6214277e5f2d178a062cd19c44dfeb01?s=40&d=identicon
    Alessandro Beltrão @alessandrocb

    Já está em produção :)

    Choose File ...   File name...
    Cancel
  • 4f4b696adc8e8769f43b5c837b3ea23b?s=40&d=identicon
    Marisa Souza dos Santos @marisa

    homologado.

    Choose File ...   File name...
    Cancel