WikiTrends

Photo : WikiTrends

Wikipedia à la sauce big-data ? Et pourquoi pas ?

Hop, aujourd'hui, c'est le lancement de WikiTrends ! Une ingénieuse application qui m'a permis d'apprendre que la préoccupation du jour des français serait la Fête de la Saint-Patrick selon leurs consultations wikipédiennes. Le camarade Nicolas Maquestiaux a bien voulu m'en dire plus sur cet étonnant projet qui capte les données au cœur même de l'encyclopédie numérique la plus populaire des Internets ...

Il y a un moteur qui recherche en langage naturel parmi toutes les données de Wikipedia que vous avez en copie ?

WikiTrends peut effectivement être associé à un moteur de recherche. Tu as le choix de saisir un ou plusieurs termes (en les séparant par des virgules) dans la barre de recherche. A chaque terme correspond une page Wikipédia, dont nous stockons et traitons les flux d’informations qui y sont liés dans notre infrastructure. Ces flux d’informations étant délivrés chaque heure par Wikipédia (cela prend donc en compte les mise à jour des pages, le nombre de fois qu’une page a été visitées, etc..).

Ainsi grâce à la récupération de ces informations émanant de Wikipédia, WikiTrends va être capable en fonction des termes que tu saisiras dans la barre de recherche, de te remonter des courbes d'évolutions liées aux nombre de fois que ces pages (termes) auront été consultées par les internautes.

Il te sera ensuite possible de faire varier le laps de temps sur lequel tu veux observer l’évolution d’un ou plusieurs termes.

A titre d’exemple, on pourrait comparer les termes Nicolas Sarkozy et Francois Hollande sur l’année de campagne présidentielle 2012 et observer les pics de recherches éventuels liées aux pages de ces deux personnalités afin de les confronter par exemple avec l’évolution de leurs côtes de popularité retranscrites par les médias au cours de cette année-là.

En définitive, le postulat de WikiTrends part du principe que Wikipédia fait partie des 5 plus gros sites visités au monde et que très souvent lors d’une recherche dans Google, une page Wikipédia remonte dans les premiers résultats. De plus, de nombreux utilisateurs semble avoir le réflexe d’interroger Wikipédia pour avoir d’avantage d’informations sur une thématique, une personne, un fait historique, etc.

Il y a donc ici selon nous des sources d’informations inexploitées, liées aux habitudes d’utilisation de l’encyclopédie Wikipédia par les internautes et au trafic accueilli par les différentes pages.

L’enjeu technique comme je l’expliquais, est de pouvoir grâce aux technologies Big Data de re-exploiter ces informations de manière fluide et en temps réel au travers d’une application web.

Sur quelles données s'appuie votre application ?

Notre base données comprends effectivement le stockage de toutes les modifications (et mise à jour) des pages stockées dans notre infrastructure. Concernant l’historique, nous avons pour le moment 2,5 ans d’archives Wikipédia stockés dans notre infrastructure. Concernant les langues : il sera possible d’effectuer des recherches sur Wikipédia France, Angleterre, Espagne, Hollande, Allemagne et sur l’ensemble de ces 5 zone réunies. Les requêtes devront être bien sûr tapées dans la langue native pour pouvoir voir s’afficher des résultats.

Traduction : le site Wikitrends est traduit en Français et Anglais.

Dernier point : La fonctionnalité « TOP 50 » Cette fonctionnalité permettra de visualiser les 50 pages les plus visitées dans l’heure passée, par ordre décroissant et pour chacune des zones géographiques évoquées ci-dessus. Cela permet, dans un instantané, d’observer les « actus » du moment et dans l'heure qui vient de s’écouler.

Voilà pour le principe de cet édifiant travail de collecte initié par les laboratoires Ingensi : une démonstration de leur savoir-faire au service du faire-savoir ! :)

Propulsez cette page sur vos réseaux :
Pinterest
Auteur : Simon Tripnaux

Blogueur lifestyle - Content manager & expert SEO. Mon job, rendre visible et lisible vos projets par les mots. Adepte de l'écriture depuis 1978.

Twitter Facebook LinkedIn

Blogueur ? Auteur ? Rejoignez la rédaction !


Et aussi ...

L'info ou l'infaux ?

WikiTrust
WikiTrust c'est le nom du label qualité imaginé par Wikipédia pour tester et contrôler la qualité de son contenu ... il était temps ! On a en effet déjà assisté à pas mal de bourdes générées par une confiance aveugle allouée aux...

Jurons en direct sur Twitter !
Cursebird.com vous permet de lire les messages les plus vulgaires postés sur Twitter en temps réel ! Une application indispensable ! Hop ! http://cursebird.com. Voir aussi c'est quoi donc Twitter.

Carnet pour plaire

Soixante5
Des objets, oui : avec de l'âme en rab, s'il vous plaît ! Et si la douceur d'une belle texture était aussi une aventure ? Vous le savez, ils le savent très bien eux aussi, et d'ailleurs nous le savons tous : ici, dans ces pages...

Ajoutez votre avis !

8 avis forts intéressants

Film Streami 

D'abord merci pour cet article ! sinon je pense que wikitrends va bien avancer ca fait longtemps que beaucoup de gens l'attends ;)

Justine 

Un splendide commentaire pour un splendide récit, une bien utile info que tu décrit ici dessus
J'ai l'impression que cette application va avoir beaucoup d'utilisateur en un rien de temps
Moi en premier !

Aquario 

Je suis désolé mais je ne vois pas où est l'innovation et je relativise complètement l'intérêt de wikitrend. googletrend ça suffit pour mesurer les tendances et les recherches y sont bien plus nombreuses...

Stephane Ric 

WikiTrends est l'air d'être une application de grosse envergure, elle intéressera énormément de personnes! Merci d'avoir écrit un article sur le sujet, c'est un sujet qui m'intéresse beaucoup.

Debouchage 

D'abord merci pour cet article ! sinon je pense que wikitrends va bien avancer ca fait longtemps que beaucoup de gens l'attends ;)

Open Cloud 

Le WikiTrends peut effectivement apporter des informations intéressantes sur les phénomènes les plus populaires sur Wikipédia! C'est un beau projet, j'espère que vous saurez le faire évoluer dans l'ère du temps.
Merci pour cette découverte.

Voyance à Ro 

Merci pour cet article et ce superbe partage cela va nous permettre de découvrir les sujets les plus populaires de wikipedia.

Http://www.a 

j'espère que vous saurez le faire évoluer dans l'ère du temps.

Autres trucs à lire :

– #Areuh #ReReRe L'arnaque du Re:
– Typo ergo sum HandmadeFont
– #miam #box #test Gourmibox
– Le blog Barbichette par Victor

NEWSLETTER FOR EVER !

©2006-2024 JeudiPhoto.net le blog lifestyle de Simon Tripnaux Content Manager, créateur du hashtag #JeudiPhoto et soutien de #CotedAzurFrance

ex Consultant SEO à Nice - Cannes - Monaco - Photographe - Responsable Com' #COMTERR Beaulieu-sur-Mer - 06 32 64 61 33