Reported by @rama on Twitter.
Additional notes on IRC:
Rama wrote in French on Freenode tasacora IRC channel:Ok les gens j'ai plein d'idées
déjà il faudrait que je réecrive le code qui fait les cartes avec un vrai parseur XML, pas le truc que j'ai bricolé à la va-vite
mais sinon, Wikidata
une bonne partie de Tasacora, c'est ni de lire les valeurs des données ni de colorier la carte, mais de faire les correspondances entre les labels qu'il y a dans les données et ceux qu'il y a dans la carte
genre, la carte va avoir une zone nommée "London" et les données auront "Londres", ce genre de truc
du coup je me dis que Wikidata c'est le Bien, parce que
- ça nous file des foutraquées de données
- ça nous donne un pivot : je compare les labels de la carte avec ceux de Wikidata, je compare les labels des données (hors celles de Wikidata) avec ceux de Wikidata.
ça permettrait d'augmenter le recall (probabilité de récupérer un vrai positif) sans trop diminuer la précision (prob d'exclure les vrais négatifs), vu que les labels de Wikidata sont ciselés avec amour par des humains