DATAtourisme

Caractères Spéciaux dans les descriptions


#1

Bonjour,

L’URI suivante https://data.datatourisme.gouv.fr/8b394837-9bf0-31f6-85de-cdd6f8e8732b présente des caractères spéciaux qui ne semblent pas plairent à l’API.
(affichés �� dans le browser)

La requête :
{ poi(filters: [{dc_identifier: {_eq: "4ee391b8-dd49-428b-a61a-14a23a68de32"}}]) { total results { hasDescription { dc_description { value } } } } }
graphiql retourne ‘""’
alors que l’API retourne une chaîne avec des caractères � .


#2

Bonjour,

Nous avons aussi des problemes avec le contenu des descriptions.

Est-il precise quelque part quel doit etre l’encodage des chaines de caracteres?

A priori, cela semble etre UTF-8/Unicode mais il y a des caractere illegaux dans certaines descriptions qui font penser a Windows-1252 or Latin-1.

Est-ce que cette question peut etre resolue rapidement?

Cela conditionne tout un traitement supplementaire sur toutes les strings.

Merci


#3

Bonjour,
idem avec
dc_identifier: FMAAQU040V50MXNH"
_uri: https://data.datatourisme.gouv.fr/fa3a5f9d-9c14-34ce-be5d-ae41ce87c2cb

+++


#4

Bonjour
Avez vous toujours ces problèmes d’encodage ?
Pourriez vous nous fournir l’URI (ou+) d’un POI concerné, vos anciennes références sont obsolètes.
Merci


#5

Bonjour,

Nous avons mis des functions de filtrage et de re-encodage, donc je ne peux pas savoir a/pour l’instant. Je mettrai une entree dans les logs pour ca quand le daily import sera en route.

C’est un peu le probleme, on decouvre des problemes pour des entrees qui n’existent plus dans les fichiers plus recents, donc on rajoute des checks/filtres qui devraient etre a la source, au cas ou cela se reproduit, peut-etre pour rien.

On a aussi une entree de latitude ou longitude qui est invalide, pas de point decimal si je me souviens bien.

On a eu un header content-disposition vide dans la reponse de flux, aussi il y a quelques jours, nous n’avions jamais rencontre ca, au lieu d’avoir le nom du fichier. Apparemment cela etait temporaire. A mon avis c’est un glitch quand le nouveau fichier est switche dans le flux, my 2 cents…

Headers[Content-Disposition] = []
au lieu de value:
[form-data; name=“flux-3867-201903180643.csv”; filename=“flux-3867-201903180643.csv”]

Merci


#6

Bonjour,

FMACHA0080019268
POI: https://data.datatourisme.gouv.fr/42/93553b5d-c5ae-3ef5-b904-06945ce7741a
Description: https://data.datatourisme.gouv.fr/78caab96-3011-3316-af80-954abe13f50d

Il sera obsolète le 09 septembre.

Merci.


#7

Bonjour
Merci, nous avons demandé au producteur de le modiier
Bonne fin de journée