Pas Tout A Fait

Aller au contenu | Aller au menu | Aller à la recherche

UN.CO.VER ou la détecton de contenus similaires sur le Web

Dernière mise à jour le 30 août 2011

UN.CO.VER, pour "UNique COntent VERifier", est un petit logiciel écrit en java, donc disponible sous GNU/LInux, Windows et Mac, qui permet de vérifier la présence de contenus identiques sur le Web. C'est un équivalent au service, payant, proposé par le site CopyScape.

uncover-logo.png


Présentation de UN.CO.VER

UN.CO.VER permet de rechercher sur le web les contenus similaires à un texte ou une page web complète. Les résultat sont consultables directement dans le logiciel, et exportables au format PDF. Il est également possible de spécifier l'adresse d'un proxy à utiliser pour réaliser les tests.

Les informations obtenues sont :

  • Le nombre de mots similaires
  • Le pourcentage de texte identique
  • Un aperçu du texte qui est commun aux deux pages/textes

Ce type d'analyse est efficace, mais devient peu concluant sur des sujets populaires. La répétition de mots identiques peut en effet ne pas être un plagiat.

UN.CO.VER utilise Yahoo! Search BOSS pour rechercher les contenus similaires.


Installation de UN.CO.VER

Vous pouvez télécharger UN.CO.VER sur le site officiel de l'éditeur.

Une fois l'archive décompressée, le lancement se fait en ligne de commande avec :

java -jar /chemin/vers/uncover.jar

Utilisation de UN.CO.VER

UN.CO.VER peut vérifier plusieurs types de contenu :

Une unique URL

Grâce à l'onglet "check domain", vous pouvez indiquer une URL et rechercher sur le web les pages ayant beaucoup de mots en commun.

Il faut indiquer l'URL à vérifier dans le champ... URL du logiciel, puis simplement cliquer sur "Check now" et attendre l'arrivée du résultat.

uncover-checkdomain-1.png

Dans la capture ci-dessus, on découvre que sur le site congoforum.org se trouve une page, dont l'adresse est indiquée, comprenant 1665 mots similaires à la page testée, pour une similitude de 71 %. Et en effet, cette page est une copie de l'original.

Un texte ou un extrait de texte copié/collé

L'onglet "check text" permet de copier un morceau de texte quelconque et de rechercher un contenu similaire sur le web.

uncover-checktext-1.png

Au-delà du fait de pouvoir vérifier un texte même si la source n'est pas disponible en ligne, cette possibilité présente également l'avantage de ne pas polluer la recherche avec les à-côtés de la page à tester (morceau d'autres articles, texte d'accueil ou publicités).

La totalité d'un site Web, incluant les éventuels sous-domaines

Une fonction utile est disponible sous l'onglet "check websites". Elle consiste à indiquer l'adresse de la page d'accueil d'un site, puis de laisser UN.CO.VER créer le sitemap. Vous disposerez alors de la liste des pages du site, et de la possibilité de réaliser une vérification des pages de votre choix, avec conservation du résultat.

Un petit guide permet de vous aider à entrer l'URL de base du site à vérifier et à construire le sitemap.

uncover-checkwebsites-1.png

Vous disposerez ensuite de la liste des pages du site, et de la possibilité de vérifier celles de votre choix.

uncover-checkwebsites-2.png

Il est possible de sauvegarder vos projets.

Voilà donc un petit logiciel facile à utiliser, et qui malgré les limites de la méthode de comparaison par mots, peut être utile pour trouver les copies d'articles de votre site.

Matthieu Patout

Auteur: Matthieu Patout

Restez au courant de l'actualité et abonnez-vous au Flux RSS

Soyez le premier à réagir sur cet article

Ajouter un commentaire Fil des commentaires de ce billet

aucune annexe



Voir Aussi

zen-coding-logo.png

Activer ZenCoding dans Geany sous Debian Squeeze

Zen Coding est une extension existante pour les principaux éditeurs de textes et IDE, qui vise à...

Lire la suite

awstats_logo4.png

Installation et configuration de AwStats sur Debian Squeeze

AWStats est un analyseur de log web, ftp et mail, écrit en Perl et disponible sous licence GPL. Il...

Lire la suite


Découvrez le Nouveau « Pack Liberté »