Importar dados PDF
Moderador: Moderadores
-
carlos_dornelas
- Usuário Nível 3

- Mensagens: 400
- Registrado em: 25 Ago 2004 21:54
Importar dados PDF
Amigos, alguém sabe se é possível importar dados de um arquivo PDF diretamente pelo harbour?
Antonio Carlos
Curitiba PR
Antonio Carlos
Curitiba PR
- Pablo César
- Usuário Nível 7

- Mensagens: 5312
- Registrado em: 31 Mai 2006 10:22
- Localização: Curitiba - Paraná
Importar dados PDF
Teve uma vez que eu tive que fazer um módulo para extrair dados de arquivos pdf para confirmar o envio de dados de um sistema. Não é acoisa mais elegante nem segura de se fazer mas eu tive que apelar a transformar o arquivo pdf em arquivo texto e aí foi moleza. O problema foi quando na outra ponta decidiram criar o pdf em outra versão e não sei ao certo se foi por causa disso ou porque o pdf estaria protegido. Daí não pudemos mais continuar fazendo a conversão. O aplicativo que converte pdf para texto, coloquei em anexo.Executando na linha de comando você veráa sintaxe, é muito simples.
- Anexos
-
PDF2TXT.rar- (242.44 KiB) Baixado 434 vezes
Um clip-abraço !
Pablo César Arrascaeta
Compartilhe suas dúvidas e soluções com todos os colegas aqui do fórum.
Evite enviar as dúvidas técnicas por MPs ou eMails, assim todos iremos beneficiar-nos.
Pablo César Arrascaeta
Compartilhe suas dúvidas e soluções com todos os colegas aqui do fórum.
Evite enviar as dúvidas técnicas por MPs ou eMails, assim todos iremos beneficiar-nos.
-
carlos_dornelas
- Usuário Nível 3

- Mensagens: 400
- Registrado em: 25 Ago 2004 21:54
Importar dados PDF
Pablo, eu preciso encontrar uma forma de fazer a extração de dados direto com o harbour que poderia ser a conversão do pdf para texto. Não sei se você se equivocou, mas acho que o arquivo que você anexou é para fazer o contrário, ou seja, de txt para pdf, não?
Antonio Carlos
Antonio Carlos
- Pablo César
- Usuário Nível 7

- Mensagens: 5312
- Registrado em: 31 Mai 2006 10:22
- Localização: Curitiba - Paraná
Importar dados PDF
ihhh tem razão, desculpe equivoquei-me. Já mudei o arquivo na mensagem anterior.Não sei se você se equivocou, mas acho que o arquivo que você anexou é para fazer o contrário, ou seja, de txt para pdf, não?
Seria interessante achar algo que possa ser usado em Harbour. Pelo que entendí em outro fórum C++ que utiliza-se através da ZLIB para localizar as seções entre "stream" e "endstream" onde supostamente estariam cada string. Só não sei se os pdfs de atuais versões mantém essa característica, como eu disse na mensagem anterior que em certos pdf conseguia mas depois não. Se interessar saber (mesmo fugindo da linguagem mas que talvez possa servir de referência paraadaptar em C e poder usar em Harbour) fica aqui como referência:
http://www.codeproject.com/kb/cpp/ExtractPDFText.aspx
http://www.codeproject.com/KB/string/pdf2text.aspx
http://forums.adobe.com/message/2603426 (em VB, fórum do ADOBE)
Em HMG, tendo instalado o Adobe, fica fácil ler o PDF, mas fica em objeto desta forma:
Win1.Test.Object:src := curdrive() + ':\' + curdir() + '\' + 'readme.pdf'
Pesquisei em Minigui e não achei. Outra função que parece extrair texto em C++ é PDFTextStripper() agora se existe algo para Harbour, eu desconheço até o momento.
Um clip-abraço !
Pablo César Arrascaeta
Compartilhe suas dúvidas e soluções com todos os colegas aqui do fórum.
Evite enviar as dúvidas técnicas por MPs ou eMails, assim todos iremos beneficiar-nos.
Pablo César Arrascaeta
Compartilhe suas dúvidas e soluções com todos os colegas aqui do fórum.
Evite enviar as dúvidas técnicas por MPs ou eMails, assim todos iremos beneficiar-nos.
- Pablo César
- Usuário Nível 7

- Mensagens: 5312
- Registrado em: 31 Mai 2006 10:22
- Localização: Curitiba - Paraná
Importar dados PDF
Só para complementar informação. Adobe Developer FAQ menciona funções como TextExtraction:
Através da API, você pode extrair o texto ASCII de um arquivo PDF usando o Acrobat e um plug-in desenvolvido em C ou C + +. A funções TextExtraction e WordFinder podem ser usados como pontos de partida para o seu próprio plug-in. Métodos AVConversion também pode ser usado para salvar PDF como texto ou rich text. Além disso, a amostra SDKTextExtraction no primeiro nível do diretório SaveAsXML fornece um bom ponto de partida para a criação de tabelas mais ricos de extração. Para mais informações, consulte o Guia de Amostras Para SDK.
Um clip-abraço !
Pablo César Arrascaeta
Compartilhe suas dúvidas e soluções com todos os colegas aqui do fórum.
Evite enviar as dúvidas técnicas por MPs ou eMails, assim todos iremos beneficiar-nos.
Pablo César Arrascaeta
Compartilhe suas dúvidas e soluções com todos os colegas aqui do fórum.
Evite enviar as dúvidas técnicas por MPs ou eMails, assim todos iremos beneficiar-nos.
-
carlos_dornelas
- Usuário Nível 3

- Mensagens: 400
- Registrado em: 25 Ago 2004 21:54
Importar dados PDF
Obrigado Pablo pelas suas dicas. Infelizmente não entendo nada de C, então acho que ainda vou ter que continuar utilizando o método de copiar do PDF e colar no TXT.
[]s
Antonio Carlos
[]s
Antonio Carlos
- Pablo César
- Usuário Nível 7

- Mensagens: 5312
- Registrado em: 31 Mai 2006 10:22
- Localização: Curitiba - Paraná
Importar dados PDF
C não é meu forte, mas enquanto não é superado as funções em C, por quê não tenta com o utilitário externo para transformar em arquivo texto de dentro da sua aplicação Harbour (não é muito canônico... mas funcionaria).
Também estive vendo que se abrisse o arquivo em baixo nível em modo binário, você poderia pesquisar pelas seções "stream" e "endstream" que contém o texto do pdf. O problema que está compactado por alguma função do ZLIB e eu não descobrí qual seria. Pois o que conheço descompacta arquivos e não variáveis. Talvez algum colega leia o tópico e possa contribuir com algo mais. Mas eu tentaria o utilizário PDF2TXT.EXE que anexei na minha primeira mensagem.
Também estive vendo que se abrisse o arquivo em baixo nível em modo binário, você poderia pesquisar pelas seções "stream" e "endstream" que contém o texto do pdf. O problema que está compactado por alguma função do ZLIB e eu não descobrí qual seria. Pois o que conheço descompacta arquivos e não variáveis. Talvez algum colega leia o tópico e possa contribuir com algo mais. Mas eu tentaria o utilizário PDF2TXT.EXE que anexei na minha primeira mensagem.
Um clip-abraço !
Pablo César Arrascaeta
Compartilhe suas dúvidas e soluções com todos os colegas aqui do fórum.
Evite enviar as dúvidas técnicas por MPs ou eMails, assim todos iremos beneficiar-nos.
Pablo César Arrascaeta
Compartilhe suas dúvidas e soluções com todos os colegas aqui do fórum.
Evite enviar as dúvidas técnicas por MPs ou eMails, assim todos iremos beneficiar-nos.
- Mario Mesquita
- Usuário Nível 4

- Mensagens: 613
- Registrado em: 08 Dez 2009 13:47
- Localização: Rio de Janeiro
Importar dados PDF
Boa tarde, pessoal.
Atualmente, temos algo que possa ler e extrair dados de um PDF? Tentei o Pdf2Txt, mas não sei se o PDF por estar no modo paisagem, deu ruim. Veio tudo desconfigurado ao invés das linha e colunas de modo aproveitável.
Se tiverem alguma dica, desde já agradeço.
Saudações,
Mario.
Atualmente, temos algo que possa ler e extrair dados de um PDF? Tentei o Pdf2Txt, mas não sei se o PDF por estar no modo paisagem, deu ruim. Veio tudo desconfigurado ao invés das linha e colunas de modo aproveitável.
Se tiverem alguma dica, desde já agradeço.
Saudações,
Mario.
-
Kapiaba
- Colaborador

- Mensagens: 1908
- Registrado em: 07 Dez 2012 16:14
- Localização: São Paulo
- Contato:
Importar dados PDF
Talvez:
https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/
Baixe o manual. Não tenho certeza se vai funcionar. É possível chama-lo via código.
Abs.
https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/
Baixe o manual. Não tenho certeza se vai funcionar. É possível chama-lo via código.
Abs.
-
carlos_dornelas
- Usuário Nível 3

- Mensagens: 400
- Registrado em: 25 Ago 2004 21:54
Importar dados PDF
Eu utilizei com sucesso o pdftotext.exe que nem lembro mais de onde baixei... renomeie o anexo para .exe
Antonio Carlos
Antonio Carlos
- Anexos
-
pdf2txt.zip- (648 KiB) Baixado 263 vezes
- Itamar M. Lins Jr.
- Administrador

- Mensagens: 7928
- Registrado em: 30 Mai 2007 11:31
- Localização: Ilheus Bahia
- Curtiu: 1 vez
Importar dados PDF
Olá!
Saudações,
Itamar M. Lins Jr.
É para:formato do arquivo .ZIP, está DANIFICADO.
Fez a leitura correta ?. renomeie o anexo para .exe
Saudações,
Itamar M. Lins Jr.
Saudações,
Itamar M. Lins Jr.
Itamar M. Lins Jr.
- Mario Mesquita
- Usuário Nível 4

- Mensagens: 613
- Registrado em: 08 Dez 2009 13:47
- Localização: Rio de Janeiro
Importar dados PDF
Bom dia a todos.
Pessoal, pra agilizar, eu usei o site da Adobe e converti pra Excel. Ficou 90%, mais por conta do relatório em si, que não foi todo pensado pra ser como uma planilha.
Mas se houvesse algo que pudesse ser feito no Harbour, seria bem melhor. Mas se tiver um .EXE externo que converta pra algo que possa ser lido, tb não de todo ruim.
Sds,
Mario.
Pessoal, pra agilizar, eu usei o site da Adobe e converti pra Excel. Ficou 90%, mais por conta do relatório em si, que não foi todo pensado pra ser como uma planilha.
Mas se houvesse algo que pudesse ser feito no Harbour, seria bem melhor. Mas se tiver um .EXE externo que converta pra algo que possa ser lido, tb não de todo ruim.
Sds,
Mario.