# Banco de Dados A base de dados do SEI deve ser vista a partir da união do banco de dados e dos arquivos anexos que ficam em filesystem. Neste documento vamos denominar: - bd: banco de dados do SEI em mysql - arquivos anexos: arquivos de conteúdo diverso, binário ou não, que o SEI permite que seja feito o upload por seus usuários - base de dados: união entre bd e arquivos anexos O BD possui diversas informações estruturais e funcionais do sistema SEI, enquanto os arquivos anexos são documentos diversos que são subidos até a aplicação via upload. ## Requisitos Tanto o banco de dados quanto o filesystem com os arquivos anexos possuem os seguintes requisitos: - não é permitido, em caso de crash ou problemas, a perda de informações - a principal ação deve estar na guarda e backup dos dados e logs binários do banco e arquivos anexos para garantir perda zero de informação - a segunda principal ação deve estar relacionada a disponibilidade do serviço - velocidade aceitável de leitura e escrita para a carga requerida do Ministério do Planejamento * 300 transações / segundo * 1.4 GB de crescimento / dia do BD * 11 GB / dia de crescimento da base de dados - deve-se permitir, em caso de necessidade, recuperar os dados na forma point in time recovery, podendo voltar até 1 ano atrás da posição atual - portanto os logs binários devem ser mantidos pelo período de pelo menos 1 ano ## Profissional Necessário O profissional necessário para manter a solução deverá ter os conhecimentos em mysql server 5.7. Dentre as suas competências deverão constar, no mínimo: - instalação / sustentação de mysql server 5.7 em ambiente produtivo - implementação de réplica em log binário (master/slave) - tuning da base de dados de acordo com o ambiente e expectativas do cliente - recuperação de desastres do mysql server - point in time recovery de base de dados - geração e otimização de dumps - análise de logs com relatórios objetivos apontando gargalos e melhorias na infraestrutura - médio conhecimento em linux ## Necessidades Específicas para a Base do SEI O profissional responsável pela base deverá constantemente: - garantir que a réplica esteja há menos de 5 segundos do master - garantir que a rotina de rsync dos arquivos anexos esteja a menos de 3 minutos dos arquivos de produção - garantir a disponibilidade de 99% da base de dados master (considerando dias úteis) - informar a DTI sobre qualquer erro ou situação que possa comprometer o ambiente - informar imediatamente a DTI sobre qualquer indisponibilidade ou lentidão ## Tecnologias Atualmente o banco de dados é mysql 5.7 com uma réplica também em mysql 5.7. Para os arquivos anexos, estamos usando Storage - EMC, com NFS ativado para leitura e escrita dos dados ## Arquitetura - Arquivos Anexos: * 192.x.x.x * diretório NFS: /SEI_PROD_xx - Mysql Master * 192.x.x.x * servidor físico com 24 cores e 64GB * servidor compartilhado com o PDCMP * data do mysql: /dados_banco/mysql/data * logs binários do mysql: /dados_banco/mysql/binlog - Mysql Slave - Virtual * 192.x.x.x * servidor virtual 8 cores e 11GB * data do mysql: /dados_banco/mysql/data * logs binários do mysql: /dados_banco/mysql/binlog - Mysql Slave - Física * 192.x.x.x * servidor físico 8 cores e 32GB * data do mysql: /replica_bd/mysql/data * logs binários do mysql: /replica_bd/mysql/binlog * diretório para backup - dumps: /replica_bd/backup/dumps (aponta para Storage VNX) * diretório para backup - logs binários: /replica_bd/backup/logbinarios (aponta para Storage VNX) ## Rotinas Para garantir a guarda das informações, inclusive a reconstrução da base de dados em caso de crash, foram implementadas as seguintes ações: - réplica nativa do mysql usando um master e um slave - logs binários independentes do master e slave - para os arquivos anexos há quatro rsync rodando, replicando todo o filesystem do diretório de origem para o diretório de backup - toda terça e sábado roda um crontab que tira o dump da réplica e salva no diretório de backup ### Rotina dos arquivos anexos - crontab agendado no root * crontab que roda de 5 em 5 segundos copiando todos os arquivos anexos do diretório de prododução para os diretórios de backup (note o flock para impedir a execução ao mesmo tempo de várias instâncias da rotina) ``` 0 0,7,21 * * * flock -n lock_file_prod -c "/root/scripts/copia_prod_replica.sh" 0 1,8,22 * * * flock -n lock_file_prod_to_ibm -c "/root/scripts/copia_prod_to_ibm.sh" * * * * * flock -n lock_file_prod_dodia -c "/root/scripts/copia_prod_replica_dodia.sh" * * * * * flock -n lock_file_prod_to_ibm_dodia -c "/root/scripts/copia_prod_to_ibm_dodia.sh" * * * * * flock -n lock_file_replica_dodia -c "/root/scripts/copia_replica_sei_anexos_dodia.sh" 0 1,8,22 * * * flock -n lock_file_replica -c "/root/scripts/copia_replica_sei_anexos.sh" 19 9,12,16,21,22,23 * * * flock -n lock_file_bin -c "/copia_sei/scripts/sei_bkp_binlogs.sh" ``` * conteúdo do copia_prod_replica_dodia.sh ``` #!/bin/bash #pegar ano mês e dia PATTERN=$(date +%Y/%m/%d) for i in $(seq 1 10) do if [ -d "/SEI_PROD/sei_anexos/$PATTERN" ]; then if [ ! -d "/SEI_REPLICA/sei_anexos/$PATTERN" ]; then mkdir -p /SEI_REPLICA/sei_anexos/$PATTERN #echo "criei /tmp/dst/$PATTERN" fi #echo $PATTERN rsync -a /SEI_PROD/sei_anexos/$PATTERN/* /SEI_REPLICA/sei_anexos/$PATTERN/ fi sleep 5 done ``` ### Rotina do Dump da Base - crontab ``` 0 0 * * 3,6 /copia_sei/scripts/sei_bkp_bd.sh ``` - arquivo sei_bkp_bd.sh ``` #!/bin/bash #vUSER="USERNAME" vPASS="<>" DATA=$(date +%Y-%m-%d-%H.%M.%S) echo "" >> /copia_sei/scripts/result.log echo "Parando Réplica: $DATA" >> /copia_sei/scripts/result.log mysqladmin stop-slave -u$vUSER -p$vPASS echo "Réplica parada. Iniciando Dump" >> /copia_sei/scripts/result.log mysqldump -u$vUSER -p$vPASS --master-data=2 --max_allowed_packet=500M --databases sei sip > /copia_sei/dumps_base/dmp_$DATA.dump echo "Dump feito. Restartando Slave" >> /copia_sei/scripts/result.log mysqladmin start-slave -u$vUSER -p$vPASS echo "Slave Restartado. $(date +%Y-%m-%d-%H.%M.%S)" >> /copia_sei/scripts/result.log ``` ## Rotacionamento dos dumps e Logs O rotacionamento dos logs binários ainda não foi implementado. É feito manualmente. Deve-se tomar o cuidado de rotacionar apenas o que já foi armazenado pelo netbackup e teve a guarda armazenada em fita. Poderá, no futuro, implementar rotina automática para rotacionamento.