Quantcast
Channel: Active questions tagged utf-8 - Stack Overflow
Viewing all articles
Browse latest Browse all 1060

html character in json file not supported by Basex

$
0
0

I'm trying to parse a json file with Basex107 thanks to the json;parse module.

My file presents some values with html character, for example like this in "text" value :

"order": 2,"page_id": 27,"text": "<p><strong>Présentation générale</strong></p>\r\n<p>L’ambon également nommé<em>pulpitium</em> (estrade) est une sorte de tribune élevée d’où sont proclamés les textes saints. Il est placé dans le chœur de l’église, généralement, du côté gauche.</p>\r\n<p>Dès la fin du IV<sup>e</sup> siècle, ce type de tribune, appelé<em>analogium</em>...<em>Bernard Berthod</em></h4>"

But before I even try to parse my file, when I open it in Basex, I can see in the output window that some characters (ex : <) have been replaced by their encoding sign (becomes &lt;).

<order type="number">2</order><page__id type="number">27</page__id><text>&lt;p&gt;&lt;strong&gt;Présentation générale&lt;/strong&gt;&lt;/p&gt;&#xD;&lt;p&gt;L’ambon également nommé&lt;em&gt;pulpitium&lt;/em&gt; (estrade) est une sorte de tribune élevée d’où sont proclamés les textes saints. Il est placé dans le chœur de l’église, généralement, du côté gauche.&lt;/p&gt;&#xD;..>

I suppose that I have to tell Basex to accept html character ?

I tried to play with the parser options (json and html), but nothing changed...

If someone have an idea,

Thanks !


Viewing all articles
Browse latest Browse all 1060

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>