|
|
|
|
|
- Règles de conversion utilisées
- Balises gérées
- Gestion de l'alphabet
HTMLVersTexte (Fonction) En anglais : HTMLToText Convertit une chaîne HTML ou un buffer HTML en chaîne texte. Pendant la conversion, les opérations suivantes sont effectuées : - Suppression des balises HTML,
- Conversion des caractères spéciaux HTML,
- Conversion des Retours Chariots (RC) en espaces,
- Conversion des espaces multiples en espaces uniques.
MonTexteHtml est une chaîne MonTexteHtml = "<!--test--><b><i>"Bonjour !"</i></b>" Texte est une chaîne = HTMLVersTexte(MonTexteHtml) // Texte vaut : "Bonjour" ! Syntaxe
<Résultat> = HTMLVersTexte(<Texte au format HTML> [, <Alphabet utilisé>])
<Résultat> : Chaîne de caractères Texte correspondant au résultat de la conversion HTML. L'encodage des caractères utilisé est celui de l'alphabet courant de WINDEV ou WEBDEV. <Texte au format HTML> : Chaîne de caractères ou buffer Texte à convertir. <Alphabet utilisé> : Constante optionnelle de type Entier Constante identifiant l'alphabet utilisé pour l'écriture du <Texte au format HTML>. Pour plus de détails sur ces constantes, consultez Correspondance entre les langues, les sous-langues, les alphabets et les nations.
- Si des informations sur l'alphabet utilisé sont trouvées dans le <Texte au format HTML>, ces informations sont prioritaires sur la constante spécifiée.
- Si ce paramètre n'est pas spécifié ou si le paramètre <Texte au format HTML> ne contient aucune information sur l'alphabet, l'alphabet en cours de WINDEV/WEBDEV est utilisé (constante alphabetCourant).
Remarques Règles de conversion utilisées - Les balises HTML sont analysées afin de conserver au mieux la mise en forme dans le texte de sortie (les Retours Chariots, les espaces, les tabulations). Le formatage n'est pas conservé : gras, italique, couleurs, ...
- N'apparaissent pas dans la sortie texte :
- les balises HTML
- le contenu du "header" (informations contenues dans la balise <HEAD>)
- les commentaires
- les textes de contrôle
- les scripts
- les définitions SSL
- les styles CSS (sauf color)
- les éléments de formulaire
- Gestion des Retours Chariots
- 2 Retours Chariots sont insérés pour remplacer des balises <P>, <H1> à <H6>, <TABLE>, <UL> ou <OL>
- 1 Retour Chariot est inséré pour remplacer les balises <BR>, <TR>, <LI>, <DD> ou <DIV>
- 1 seul Retour Chariot est inséré si plusieurs balises identiques (<TR>, <LI>, <DD> ou <DIV>) se suivent (sauf pour les balises <BR>)
- Gestion des tableaux
- Pour chaque ligne d'un tableau (balise <TR>), un Retour Chariot est inséré.
- Pour chaque colonne d'un tableau (balise <TD>), une tabulation est insérée.
- Gestion des caractères spéciaux
Un caractère spécial est un caractère défini dans la norme HTML. Par exemple, un espace peut s'écrire " " et le caractère "é" peut s'écrire "é,". Cette norme est automatiquement utilisée.
Balises gérées Les balises non gérées sont ignorées : leur contenu est pris en compte comme du texte. Les balises gérées sont les suivantes : - <PRE>
- <UL> : Saut de ligne + tabulation
- <OL> : Saut de ligne + tabulation
- <LI> : Tabulation
- <H1> : Saut de ligne avant et saut de ligne après
- <H2> : Saut de ligne avant et saut de ligne après
- <H3> : Saut de ligne avant et saut de ligne après
- <H4> : Saut de ligne avant et saut de ligne après
- <H5> : Saut de ligne avant et saut de ligne après
- <H6> : Saut de ligne avant et saut de ligne après
- <P> : Saut de ligne avant et saut de ligne après
- <BR> : Saut de ligne
- <DL> : Saut de ligne
- <DT> : Saut de ligne
- <DD> : Tabulation et saut de ligne
- <TABLE> : Saut de ligne
- <TR> : Saut de ligne
- <TD> : Eléments séparés par une tabulation
- <HEAD> : Contenu ignoré, sauf les paramètres de l'alphabet
- <STYLE> : Contenu ignoré
- <SCRIPT> : Contenu ignoré
- <!-- --> : Commentaires ignorés
Gestion de l'alphabet Pour connaître l'alphabet utilisé dans le texte HTML, la fonction HTMLVersTexte utilise l'information contenue dans l'attribut CONTENT d'une balise <META>. Si cette balise n'est pas présente, il est nécessaire de spécifier l'alphabet utilisé pour écrire le texte HTML avec le paramètre <Alphabet utilisé>. En effet, si le contenu HTML utilise un alphabet arabe, et si WINDEV/WEBDEV utilisent par défaut un alphabet français, le texte de sortie utilisera des caractères invalides. Remarques : - Si le texte de sortie contient de nombreux caractères "?", cela signifie que le caractère de l'alphabet du document HTML n'a pas pu être exprimé avec un caractère de la langue en cours.
- L'alphabet UTF8 est le plus couramment utilisé pour l'encodage des pages Web.
Liste des exemples associés :
|
Exemples unitaires (WEBDEV) : Les fonctions HTMLVers
[ + ] Utilisation des fonctions WLangage HTMLVersRTF et HTMLVersTexte.
|
|
Exemples unitaires (WINDEV) : Passage du format RTF au format HTML
[ + ] Utilisation des fonctions RTFVersHTML et RTFVersTexte.
|
|
Exemples complets (WINDEV) : WD Mail
[ + ] Cette application est un client mail complet développé en WINDEV. Il s'appuie sur les objets Email. Ce client mail permet de récupérer et d'envoyer des emails en utilisant les protocoles POP, IMAP et SMTP. Il est possible d'appliquer des filtres sur le courrier entrant. L'écriture d'un email s'appuie sur le champ Editeur HTML. L'affichage des emails utilise le champ Affichage HTML. L'application permet de gérer plusieurs comptes emails différents.
|
|
Exemples unitaires (WINDEV) : Le Type HTMLDocument
[ + ] Cet exemple permet de montrer comment utiliser le Type WLangage HTMLDocument.
|
Composante : wd300rtf.dll
Documentation également disponible pour…
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|