PDFGREP Buscando texto em vários arquivos PDF

Olá a todos!!!

Um amigo no trabalho estava precisando buscar(“grepar“) em vários arquivos PDF para incrementar um script que estava fazendo. Pasmem, não é que ele achou o pdfgrep, isso mesmo uma versão de grep para arquivos PDF com suporte a expressões regulares PERL ao alcance de um APT-GET.

  1. Instalando o pdfgrep: Primeiramente atualize sua lista de pacotes com o comando apt update em seguida você deve instalar o pacote.
    apt update
    apt install pdfgrep
    
  2. Exemplo de utilização:

Bem eu criei três arquivos PDF respectivamente bomdia.pdf, boatarde.pdf e boanoite.pdf. No exemplo abaixo vou buscar pela palavra “boa”, ignorando maiúsculas e minúsculas, em todos os arquivos pdf no diretório ~/tmp/pdf.

$ pdfgrep -i boa *pdf