|
|
|
|
|
- Conversion du PDF vers texte
- Cas particuliers
PDFVersTexte (Fonction) En anglais : PDFToText Extrait le texte contenu dans un document PDF. MaChaîne est une chaîne
MaChaîne = PDFVersTexte("C:\Temp\MonDocument.pdf")
SAI_SaisieTexteMulti = MaChaîne
Syntaxe
Extraire le contenu d'un fichier PDF identifié par son chemin Masquer les détails
<Résultat> = PDFVersTexte(<Fichier PDF> [, <Pages à  extraire> [, <Mot de passe> [, <Options>]]])
<Résultat> : Chaîne de caractères Texte du fichier PDF. <Fichier PDF> : Chaîne de caractères Nom et chemin du fichier PDF à analyser. <Pages à extraire> : Chaîne de caractères optionnelle Plage de pages dont le texte doit être extrait. Le format utilisé est identique à celui utilisé dans les boîtes d'impression standard : numéros individuels de pages ou étendue de pages séparés par des points-virgules. Par exemple "1;3;4;6-10;12" signifie que le texte des pages 1, 3, 4, 6 à 10, et 12 sera extrait.Si ce paramètre n'est pas spécifié ou correspond à une chaîne vide (""), toutes les pages sont extraites. <Mot de passe> : Chaîne de caractères optionnelle Si le fichier PDF est protégé en ouverture, mot de passe nécessaire pour ouvrir le fichier. <Options> : Constante de type Entier Mode de découpage du texte : | | pvtCompatible | Découpage du texte du PDF en utilisant l'algorithme des versions 24 et précédentes. | pvtDéfaut (Valeur par défaut) | Découpage du texte du PDF en utilisant un algorithme optimisé. Ce découpage peut être différent de celui effectué avec les versions précédentes. |
Remarques Conversion du PDF vers texte - La conversion du PDF vers du texte est réalisée sans conserver le formatage du document.
- Le texte est extrait dans l'ordre d'apparition des commandes PDF et écrit séquentiellement dans la chaîne résultat. L'organisation du texte en paragraphes et en blocs est conservée (ainsi que les retours chariot).
- Les caractères Unicode ne sont pas renvoyés.
- Les données d'un formulaire PDF ne sont pas extraites (ces données ne sont pas stockées dans le fichier PDF).
Cas particuliers - La fonction PDFEstProtégé permet de savoir si un mot de passe est nécessaire pour l'ouverture d'un fichier PDF.
- La fonction PDFNombreDePages permet de connaître le nombre total de pages d'un fichier PDF.
- A partir de la version 28, si la constante pvtCompatible n'est pas utilisée, cette fonction n'est pas supportée par les processeurs ARM 32 bits. En effet, les nouveautés en matière de gestion des PDF imposent une exécution en 64 bits.
Si une application doit être exécutée sur une flotte existante d'appareils ARM 32 bits, la génération de cette application doit être effectuée avec la version 27 de WINDEV Mobile.
Classification Métier / UI : Code métier Composante : wd300wdpdf.dll
Documentation également disponible pour…
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|