|
|
|
|
|
- Règles de conversion utilisées
- Balises gérées
- Gestion de l'alphabet
HTMLVersRTF (Fonction) En anglais : HTMLToRTF Convertit une chaîne HTML ou un buffer HTML en chaîne au format RTF. Pendant la conversion, les opérations suivantes sont effectuées : - Suppression des balises HTML,
- Conversion des caractères spéciaux HTML,
- Conversion des Retours Chariots (RC) en espaces,
- Conversion des espaces multiples en espaces uniques.
Le formatage est conservé "au mieux".
MonTexteHTML est une chaîne = "<!--test--><b><i>"e;Bonjour !"e;</i>" Texte est une chaîne = HTMLVersRTF(MonTexteHTML) // Texte vaut : "Bonjour" ! Syntaxe
<Résultat> = HTMLVersRTF(<Texte au format HTML> [, <Alphabet utilisé>])
<Résultat> : Chaîne de caractères Texte RTF correspondant au résultat de la conversion HTML. L'encodage des caractères utilisé est celui de l'alphabet courant de WINDEV ou WEBDEV. <Texte au format HTML> : Chaîne de caractères ou buffer Texte à convertir. <Alphabet utilisé> : Constante de type Entier optionnelle Constante identifiant l'alphabet utilisé pour l'écriture du <Texte au format HTML>. Par défaut, l'alphabet en cours de WINDEV/WEBDEV est utilisé (constante alphabetCourant). Si des informations sur l'alphabet utilisé sont trouvées dans le <Texte au format HTML>, ces informations sont prioritaires sur ce paramètre. Pour plus de détails sur ces constantes, consultez Correspondance entre les langues, les sous-langues, les alphabets et les nations. Remarques Règles de conversion utilisées - Les balises HTML sont analysées afin de conserver au mieux la mise en forme dans le texte de sortie (les Retours Chariots, les espaces, les tabulations). Le formatage est conservé au mieux : gras, italique, couleurs, ...
- N'apparaissent pas dans la sortie RTF :
- les balises HTML
- le contenu du "header" (informations contenues dans la balise <HEAD>)
- les commentaires
- les textes de contrôles
- les scripts
- les définitions SSL
- les styles CSS (sauf les attributs "color")
- Gestion des Retours Chariots
- 2 Retours Chariots sont insérés pour remplacer des balises <P>, <H1> à <H6>, <TABLE>, <UL> ou <OL>
- 1 Retour Chariot est inséré pour remplacer les balises <BR>, <TR>, <LI>, <DD> ou <DIV>
- 1 seul Retour Chariot est inséré si plusieurs balises identiques (<TR>, <LI>, <DD> ou <DIV>) se suivent (sauf pour les balises <BR>)
- Gestion des tableaux
- Pour chaque ligne d'un tableau (balise <TR>), un Retour Chariot est inséré.
- Pour chaque colonne d'un tableau (balise <TD>), une tabulation est insérée.
- Gestion des caractères spéciaux
Un caractère spécial est un caractère défini dans la norme HTML. Par exemple, un espace peut s'écrire " " et le caractère "é" peut s'écrire "é,". Cette norme est automatiquement utilisée.
Les balises non gérées sont ignorées : leur contenu est pris en compte comme du texte. Les balises gérées sont les suivantes : - <PRE>
- <UL> : Saut de ligne + tabulation
- <OL> : Saut de ligne + tabulation
- <LI> : Tabulation
- <H1> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
- <H2> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
- <H3> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
- <H4> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
- <H5> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
- <H6> : Saut de ligne avant et saut de ligne après, gras et taille de la fonte appliqués
- <P> : Saut de ligne avant et saut de ligne après
- <BR> : Saut de ligne
- <B> : Gras
- <STRONG> : Gras
- <I> : Italique
- <EM> : Italique
- <FONT> : Taille et couleur
- <A HREF> : Lien hypertexte
- <SPAN> : Style : Couleur
- <DL> : Saut de ligne
- <DT> : Saut de ligne
- <DD> : Tabulation et saut de ligne
- <TABLE> : Saut de ligne
- <TR> : Saut de ligne
- <TD> : Eléments séparés par une tabulation
- <HEAD> : Contenu ignoré, sauf les paramètres de l'alphabet
- <STYLE> : Contenu ignoré
- <SCRIPT> : Contenu ignoré
- <!-- --> : Commentaires ignorés
Pour connaître l'alphabet utilisé dans le texte HTML, la fonction HTMLVersRTF utilise l'information contenue dans l'attribut CONTENT d'une balise <META>. Si cette balise n'est pas présente, il est nécessaire de spécifier l'alphabet utilisé pour écrire le texte HTML avec le paramètre <Alphabet utilisé>. En effet, si le contenu HTML utilise un alphabet arabe et si WINDEV/WEBDEV utilisent par défaut un alphabet français, le texte de sortie utilisera des caractères invalides. Remarques : - Si le texte de sortie contient de nombreux caractères "?", cela signifie que le caractère de l'alphabet du document HTML n'a pas pu être exprimé avec un caractère de la langue en cours.
- L'alphabet UTF8 est le plus couramment utilisé pour l'encodage des pages Web.
Liste des exemples associés :
|
Exemples unitaires (WEBDEV) : Les fonctions HTMLVers
[ + ] Utilisation des fonctions WLangage HTMLVersRTF et HTMLVersTexte.
|
Composante : wd300rtf.dll
Documentation également disponible pour…
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|