Spring naar bijdragen

Aanbevolen berichten

Geplaatst

Dagelijks krijg ik verse GPX files van geocaching.com. Ik gebruik ze voor mijn gps en PDA. Ik ben bekend met XML, parsers, enz en filter de "foute" tekens er daarom zelf uit voordat ik de GPX file gebruik. Is dus verder geen probleem.

 

Maar kan iemand mij nu eens uitleggen waarom die foute tekens erin zitten? Het zijn zover ik weet accenten en/of symbolen. XML kan toch verschillende encodings aan? Met een zetje de goede richting in, of een linkje naar een uitleg (zelf niets gevonden) hoop ik dit nu eens te snappen.

 

Alvast bedankt, Jessy

Geplaatst
Dagelijks krijg ik verse GPX files van geocaching.com. Ik gebruik ze voor mijn gps en PDA. Ik ben bekend met XML, parsers, enz en filter de "foute" tekens er daarom zelf uit voordat ik de GPX file gebruik. Is dus verder geen probleem.

 

Maar kan iemand mij nu eens uitleggen waarom die foute tekens erin zitten? Het zijn zover ik weet accenten en/of symbolen. XML kan toch verschillende encodings aan? Met een zetje de goede richting in, of een linkje naar een uitleg (zelf niets gevonden) hoop ik dit nu eens te snappen.

 

Alvast bedankt, Jessy

Tsja, wat noem je fout...

Het zou kunnen komen door de UTF8 encoding, of door het gebruik van een andere codepage...

 

Geef even een paar voorbeelden, dat maak het een stuk makkelijker.

Geplaatst

Onderaan deze post staan een aantal tekens die ik vervang in GPX file van gc.com. Mijn oplossing gebruikt 'reguliere expressies'. Voor de niet-techneuten onder ons, de betekenis is als volgt:

 

s/te vervangen teken/vervangend teken/g

 

Merk op dat ik niet letterlijk vervang, maar codes gebruik. Hierdoor weet ik zeker dat de HTML pagina de tekens wel goed weergeeft. Ik begrijp dus niet dat ik 'é' ontvang van gc.com terwijl 'é' gewoon is toegestaan in XML.

 

Duidelijker zo? :)

 

s/º/°/g;
s/°/°/g;
s/–/-/g;
s/÷/\//g;
s/â€[™˜]/´/g;
s/â€[œ]/¨/g;
s/ö/ö/g;
s/ë/ë/g;
s/é/é/g;

Geplaatst
Onderaan deze post staan een aantal tekens die ik vervang in GPX file van gc.com. Mijn oplossing gebruikt 'reguliere expressies'. Voor de niet-techneuten onder ons, de betekenis is als volgt:

 

s/te vervangen teken/vervangend teken/g

 

Merk op dat ik niet letterlijk vervang, maar codes gebruik. Hierdoor weet ik zeker dat de HTML pagina de tekens wel goed weergeeft. Ik begrijp dus niet dat ik 'é' ontvang  van gc.com terwijl 'é' gewoon is toegestaan in XML.

 

Duidelijker zo? :)

 

s/º/°/g;
s/°/°/g;
s/–/-/g;
s/÷/\//g;
s/â€[™˜]/´/g;
s/â€[œ]/¨/g;
s/ö/ö/g;
s/ë/ë/g;
s/é/é/g;

Ja, heel duidelijk.

Wat je ziet is de UTF8 encoding, die zul je dus eerst 'ongedaan' moeten maken. Zelf converteer je nu de 'escape'codes van UTF8 naar HTML, waarschijnlijk bevat je programmeeromgevind ook een routine die dit netjes voor je doet.

(ook in de header van de pagina staat dat wat je ontvangt gecodeerd is in UTF8 [:D])

  • Onlangs hier   0 leden

    • Er kijken geen geregistreerde gebruikers naar deze pagina.
×
×
  • Nieuwe aanmaken...