PC SOFT

DOCUMENTATION EN LIGNE
DE WINDEVWEBDEV ET WINDEV MOBILE


  • Règles de conversion utilisées
  • Balises gérées
  • Gestion de l'alphabet
WINDEV
WindowsLinuxUniversal Windows 10 AppJavaEtats et RequêtesCode Utilisateur (MCU)
WEBDEV
WindowsLinuxPHPWEBDEV - Code Navigateur
WINDEV Mobile
AndroidWidget AndroidiPhone/iPadWidget iOSApple WatchCatalystUniversal Windows 10 AppWindows Mobile
Autres
Procédures stockées
Convertit une chaîne HTML ou un buffer HTML en chaîne au format RTF. Pendant la conversion, les opérations suivantes sont effectuées :
  • Suppression des balises HTML,
  • Conversion des caractères spéciaux HTML,
  • Conversion des Retours Chariots (RC) en espaces,
  • Conversion des espaces multiples en espaces uniques.
Le formatage est conservé "au mieux".
Versions 19 et supérieures
WINDEVLinux Cette fonction est désormais disponible pour les applications WINDEV sous Linux.
WEBDEV - Code ServeurLinux Cette fonction est désormais disponible pour les sites WEBDEV sous Linux.
Nouveauté 19
WINDEVLinux Cette fonction est désormais disponible pour les applications WINDEV sous Linux.
WEBDEV - Code ServeurLinux Cette fonction est désormais disponible pour les sites WEBDEV sous Linux.
WINDEVLinux Cette fonction est désormais disponible pour les applications WINDEV sous Linux.
WEBDEV - Code ServeurLinux Cette fonction est désormais disponible pour les sites WEBDEV sous Linux.
Versions 21 et supérieures
iPhone/iPad Cette fonction est désormais disponible pour les applications iPhone/iPad.
Universal Windows 10 App Cette fonction est désormais disponible en mode Universal Windows 10 App.
Nouveauté 21
iPhone/iPad Cette fonction est désormais disponible pour les applications iPhone/iPad.
Universal Windows 10 App Cette fonction est désormais disponible en mode Universal Windows 10 App.
iPhone/iPad Cette fonction est désormais disponible pour les applications iPhone/iPad.
Universal Windows 10 App Cette fonction est désormais disponible en mode Universal Windows 10 App.
Exemple
MonTexteHTML est une chaîne = "<!--test--><b><i>&quote;Bonjour !&quote;</i>"
Texte est une chaîne = HTMLVersRTF(MonTexteHTML)
// Texte vaut : "Bonjour" !
WINDEVWEBDEV - Code ServeurEtats et RequêtesCode Utilisateur (MCU)
// Si le document HTML vaut:
//<HTML>
// <HEAD>
//  <TITLE>Ceci est un essai de page Web</TITLE>
//  <META http-equiv="content-type" content="text/html; charset=UTF-8">
// </HEAD>
//<BODY>
// <H2>Ceci est      une page HTML   en Français</H2>
//  <A href="http://www.pcsoft.fr">Ceci est un lien</A>
// </BODY>
//</HTML>

Texte = HTMLVersRTF(MonTexteHTML)
// Texte contiendra le code RTF correspondant au texte suivant :
// Ceci est     une page HTML   en Français.
//
// Ceci est un lien
Syntaxe
<Résultat> = HTMLVersRTF(<Texte au format HTML> [, <Alphabet utilisé>])
<Résultat> : Chaîne de caractères
Texte RTF correspondant au résultat de la conversion HTML. L'encodage des caractères utilisé est celui de l'alphabet courant de WINDEV ou WEBDEV.
<Texte au format HTML> : Chaîne de caractères ou buffer (avec guillemets)
Texte à convertir.
<Alphabet utilisé> : Constante de type Entier optionnelle
Constante identifiant l'alphabet utilisé pour l'écriture du <Texte au format HTML>. Par défaut, l'alphabet en cours de WINDEV/WEBDEV est utilisé (constante alphabetCourant). Si des informations sur l'alphabet utilisé sont trouvées dans le <Texte au format HTML>, ces informations sont prioritaires sur ce paramètre.
Pour plus de détails sur ces constantes, consultez Correspondance entre les langues, les sous-langues, les alphabets et les nations.
Remarques

Règles de conversion utilisées

  • Les balises HTML sont analysées afin de conserver au mieux la mise en forme dans le texte de sortie (les Retours Chariots, les espaces, les tabulations). Le formatage est conservé au mieux : gras, italique, couleurs, ...
  • N'apparaissent pas dans la sortie RTF :
    • les balises HTML
    • le contenu du "header" (informations contenues dans la balise <HEAD>)
    • les commentaires
    • les textes de contrôles
    • les scripts
    • les définitions SSL
    • les styles CSS (sauf les attributs "color")
  • Gestion des Retours Chariots
    • 2 Retours Chariots sont insérés pour remplacer des balises <P>, <H1> à <H6>, <TABLE>, <UL> ou <OL>
    • 1 Retour Chariot est inséré pour remplacer les balises <BR>, <TR>, <LI>, <DD> ou <DIV>
    • 1 seul Retour Chariot est inséré si plusieurs balises identiques (<TR>, <LI>, <DD> ou <DIV>) se suivent (sauf pour les balises <BR>)
  • Gestion des tableaux
    • Pour chaque ligne d'un tableau (balise <TR>), un Retour Chariot est inséré.
    • Pour chaque colonne d'un tableau (balise <TD>), une tabulation est insérée.
  • Gestion des caractères spéciaux
    Un caractère spécial est un caractère défini dans la norme HTML. Par exemple, un espace peut s'écrire " " et le caractère "é" peut s'écrire "é,". Cette norme est automatiquement utilisée.

Balises gérées

Les balises non gérées sont ignorées : leur contenu est pris en compte comme du texte.
Les balises gérées sont les suivantes :
  • <PRE>
  • <UL> : Saut de ligne + tabulation
  • <OL> : Saut de ligne + tabulation
  • <LI> : Tabulation
  • <H1> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
  • <H2> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
  • <H3> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
  • <H4> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
  • <H5> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
  • <H6> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
  • <P> : Saut de ligne avant et saut de ligne après
  • <BR> : Saut de ligne
  • <B> : Gras
  • <STRONG> : Gras
  • <I> : Italique
  • <EM> : Italique
  • <FONT> : Taille et couleur
  • <A HREF> : Lien hypertexte
  • <SPAN> : Style : Couleur
  • <DL> : Saut de ligne
  • <DT> : Saut de ligne
  • <DD> : Tabulation et saut de ligne
  • <TABLE> : Saut de ligne
  • <TR> : Saut de ligne
  • <TD> : Eléments séparés par une tabulation
  • <HEAD> : Contenu ignoré, sauf les paramètres de l'alphabet
  • <STYLE> : Contenu ignoré
  • <SCRIPT> : Contenu ignoré
  • <!-- --> : Commentaires ignorés

Gestion de l'alphabet

Pour connaître l'alphabet utilisé dans le texte HTML, la fonction HTMLVersRTF utilise l'information contenue dans l'attribut CONTENT d'une balise <META>.
Si cette balise n'est pas présente, il est nécessaire de spécifier l'alphabet utilisé pour écrire le texte HTML avec le paramètre <Alphabet utilisé>.
En effet, si le contenu HTML utilise un alphabet arabe et si WINDEV/WEBDEV utilisent par défaut un alphabet français, le texte de sortie utilisera des caractères invalides.
Remarques :
  • Si le texte de sortie contient de nombreux caractères "?", cela signifie que le caractère de l'alphabet du document HTML n'a pas pu être exprimé avec un caractère de la langue en cours.
  • L'alphabet UTF8 est le plus couramment utilisé pour l'encodage des pages Web.
Liste des exemples associés :
Les fonctions HTMLVers Exemples unitaires (WEBDEV) : Les fonctions HTMLVers
[ + ] Utilisation des fonctions WLangage HTMLVersRTF et HTMLVersTexte.
Composante : wd250rtf.dll
Version minimum requise
  • Version 12
Documentation également disponible pour…
Commentaires
Cliquez sur [Ajouter] pour publier un commentaire