Jessy Geplaatst 1 juni 2006 Geplaatst 1 juni 2006 Dagelijks krijg ik verse GPX files van geocaching.com. Ik gebruik ze voor mijn gps en PDA. Ik ben bekend met XML, parsers, enz en filter de "foute" tekens er daarom zelf uit voordat ik de GPX file gebruik. Is dus verder geen probleem. Maar kan iemand mij nu eens uitleggen waarom die foute tekens erin zitten? Het zijn zover ik weet accenten en/of symbolen. XML kan toch verschillende encodings aan? Met een zetje de goede richting in, of een linkje naar een uitleg (zelf niets gevonden) hoop ik dit nu eens te snappen. Alvast bedankt, Jessy
kalkendotters Geplaatst 2 juni 2006 Geplaatst 2 juni 2006 Dagelijks krijg ik verse GPX files van geocaching.com. Ik gebruik ze voor mijn gps en PDA. Ik ben bekend met XML, parsers, enz en filter de "foute" tekens er daarom zelf uit voordat ik de GPX file gebruik. Is dus verder geen probleem. Maar kan iemand mij nu eens uitleggen waarom die foute tekens erin zitten? Het zijn zover ik weet accenten en/of symbolen. XML kan toch verschillende encodings aan? Met een zetje de goede richting in, of een linkje naar een uitleg (zelf niets gevonden) hoop ik dit nu eens te snappen. Alvast bedankt, Jessy <{POST_SNAPBACK}> Tsja, wat noem je fout... Het zou kunnen komen door de UTF8 encoding, of door het gebruik van een andere codepage... Geef even een paar voorbeelden, dat maak het een stuk makkelijker.
Jessy Geplaatst 2 juni 2006 Auteur Geplaatst 2 juni 2006 Onderaan deze post staan een aantal tekens die ik vervang in GPX file van gc.com. Mijn oplossing gebruikt 'reguliere expressies'. Voor de niet-techneuten onder ons, de betekenis is als volgt: s/te vervangen teken/vervangend teken/g Merk op dat ik niet letterlijk vervang, maar codes gebruik. Hierdoor weet ik zeker dat de HTML pagina de tekens wel goed weergeeft. Ik begrijp dus niet dat ik 'é' ontvang van gc.com terwijl 'é' gewoon is toegestaan in XML. Duidelijker zo? s/º/°/g; s/°/°/g; s/–/-/g; s/÷/\//g; s/â€[™˜]/´/g; s/â€[œ]/¨/g; s/ö/ö/g; s/ë/ë/g; s/é/é/g;
kalkendotters Geplaatst 2 juni 2006 Geplaatst 2 juni 2006 Onderaan deze post staan een aantal tekens die ik vervang in GPX file van gc.com. Mijn oplossing gebruikt 'reguliere expressies'. Voor de niet-techneuten onder ons, de betekenis is als volgt: s/te vervangen teken/vervangend teken/g Merk op dat ik niet letterlijk vervang, maar codes gebruik. Hierdoor weet ik zeker dat de HTML pagina de tekens wel goed weergeeft. Ik begrijp dus niet dat ik 'é' ontvang van gc.com terwijl 'é' gewoon is toegestaan in XML. Duidelijker zo? s/º/°/g; s/°/°/g; s/–/-/g; s/÷/\//g; s/â€[™˜]/´/g; s/â€[œ]/¨/g; s/ö/ö/g; s/ë/ë/g; s/é/é/g; <{POST_SNAPBACK}> Ja, heel duidelijk. Wat je ziet is de UTF8 encoding, die zul je dus eerst 'ongedaan' moeten maken. Zelf converteer je nu de 'escape'codes van UTF8 naar HTML, waarschijnlijk bevat je programmeeromgevind ook een routine die dit netjes voor je doet. (ook in de header van de pagina staat dat wat je ontvangt gecodeerd is in UTF8 [])
Aanbevolen berichten