Ressources pour le spinning

Il existe de nombreux outils de content spinning, sous forme d’exécutables, de scripts on line ou internes. Tous ne se valent pas. Le but ici n’est pas de les comparer pour en sortir un classement quelconque, mais de fournir un inventaire simple avec de courtes descriptions.

Certains sont gratuits, d’autres payants, à chacun d’évaluer ses besoins et de faire ses tests.

***

Mise à jour février 2012. Depuis la création de cette page, de nouveaux outils sont à disposition sur le marché. Il était temps de les intégrer. J’ai volontairement écarté certains outils auparavant présents mais dépassés ou non mis à jour.

Tendances, améliorations et limites

L’année 2011 a révélé une vraie prise de conscience du besoin d’avoir des outils spécifiques à la langue française pour le content spinning. De nombreux outils sont apparus pour permettre une autonomie véritable, autant sur l’assistance à la proposition d’alternatives qu’à la génération de textes et surtout son optimisation.

L’offre se structure et se professionnalise. Exit les fantasmes de générer des textes automatiquement, la tendance est à l’assistant manuel, afin de conserver jusqu’au bout un arbitrage humain. La demande en textes étant croissante et structurelle, on peut s’attendre à voir apparaitre des outils bien plus poussés en 2012.

De larges progrès ont été faits en matière d’interface et d’utilisabilité. On peut dire aujourd’hui qu’il existe des solutions complètes pour gérer ses missions de spinning. Cela étant, on bute toujours sur les mêmes limites.

  • Synonyme et mot à mot. Ce qui ne représente qu’un petit niveau de la phase de substitution des termes conserve une place prépondérante. La plupart des assistants ne propose pas l’étape suivante consistant à fournir des alternatives par groupes de mots. La barrière est réelle et ceux qui ont tenté de la franchir n’ont pas convaincu jusque là.
  • Le traitement normatif a connu un réel progrès. La prise en compte des aspects grammaticaux, (comme le genre, le nombre, etc.) a fait une apparition remarquée.
  • La généralisation de la permutation de paragraphes. Ce second niveau de complexité particulièrement intéressant implique cependant de lourdes contraintes à l’écriture du texte original pour sa cohérence générale.
  • L’optimisation de la génération de textes. Quelques soient les critères, ont tendrait vers la fin de la génération aléatoire ou du tirage one shot. Cette pratique n’offrant aucune maîtrise des tirages et de la distance entre les textes, elle est obsolète.
  • Le calcul de similarité. On reste dans le flou de par l’opacité de Google. Ni ses technologies (les brevets ne suffisent pas) ni ses seuils de tolérance sont réellement connus. Implacablement, l’approche demeure aussi floue qu’empirique et les innombrables manières d’aborder le problème ne sont pas des solutions satisfaisantes.
  • Enfin la jonction entre content spinning et Traitement Automatique du Langage n’est toujours pas faite. La première offre, réellement valable et mature, ne se fera pas sans cette jonction.

Les scripts

Le spinneur de Black Beret

   Il n’est pas fréquent qu’un seo partage son propre code source. La vénalité l’emporte souvent sur l’esprit de partage, c’est assez important pour le souligner.

@percub propose un outil assez complet puisqu’il s’agit d’un assistant (proposition d’alternatives) doublé d’un moteur de génération de textes.

Attention cependant. Il vous faudra une bonne DB, par exemple celle que propose @cdillat et son dictionnaire de synonymes amélioré, puisqu’il propose un début d’analyse morphosyntaxique.

Le partage de cet outil et surtout des moyens de l’enrichir et de l’améliorer était une vraie bonne nouvelle sur un marché où certains ne voient que la monétisation de la première ligne de code venue.

Ultimate spin

Pour 30 € vous pourrez acquérir ce script en php. Efficace, rustique, il fonctionne bien. Bémol, le BBCode. @512banque vous permet également de tester cet outil en ligne.

On peut obtenir une remise de 10 € en étant inscrit sur le forum Code Seo. Ce serait l’occasion d’agrémenter l’intérêt de Uspin avec un script qui permet d’améliorer l’interface.

Cet assistant pratique dans l’aide à la génération d’alternatives reste cependant à compléter par un bon générateur de textes pour être optimal.

.

Services en ligne

« The Text Spiner » de Cdillat

Cdillat est un programmeur chevronné. Et quand il code, c’est du sérieux, ce qui vaut d’être souligné à l’heure actuelle.

Cet outil gratuit est à la fois un bon assistant pour les alternatives et un générateur de textes. On peut lui reprocher au début une prise en main peu intuitive mais c’est au bénéfice de l’efficacité.

Il a l’avantage d’annoncer clairement ce qu’il fait et ne fait pas. L’assistant fait quelques pas vers le traitement normatif des alternatives (cf. discussion entre Cdillat et Lemoussel) tout en proposant des statistiques intéressantes et un générateur de texte plus évolué que la plupart des « payants ».

C’est sans conteste un des outils en ligne les plus intéressants en matière de content spinning et il est gratuit. Que demander de plus ?

Le spinner de Rudy

Il y a environ 3 mois, Rudy proposait en test son propre assistant développé en interne, présenté dans cette vidéo.

Depuis l’accès est fermé, mais l’outil pourrait bien refaire parler de lui courant 2012.

Entre autre mérite, cet outil s’attaquait au traitement normatif du spinning, la partie la plus complexe pour arriver à des résultats vraiment satisfaisants.

Il est délicat de parler d’un outil devenu inaccessible, considérant que cela ne sert à rien, mais il fallait souligner le travail.

Révolusyn

30.94 € HT / mois, (371.28 € HT / an), c’est ce qu’il vous en coutera pour utiliser ce que les auteurs présentent comme étant « Le programme qui révolutionne la rédaction de contenus« .

Je n’ai pas jugé utile de dépenser une telle somme pour tester un outil affichant de telles prétentions.

Resté volontairement à la porte de cette « révolution » auto-proclamée du spinning français, je n’ai aucun avis à partager.

Spin Editor

Cet outil original proposé par @martin1975 est assez unique en son genre. Il permet une vision synoptique d’un masterspin au fur et à mesure de sa construction.

Cette vision globale du metatexte  affiche une grande clarté sur ce qu’on écrit et les différentes variantes de textes qui se dessinent.

La limite de l’outil est dans la complexité du masterspin et sa longueur. Au-delà d’un certain nombre de mots et d’alternatives, il ne faut plus compter sur cette vision globale qui fait l’intérêt essentiel de l’outil. A tester au moins une fois.

Pagasa

L’outil de Thibaut est online et gratuit ; il suffit d’insérer un texte. Ses limites sont proportionnelles à sa simplicité.

.

Cela dit il peut avoir son intérêt pour effectuer quelques tests et voir certains tirages.

.

 

.

DiscodogLab

Cet outil nécessite aujourd’hui de s’inscrire sur discodog.fr pour y accéder. Je n’ai pas demandé à Rudy où il en était avec cet outil depuis la sortie de son assistant.

 

 

.

Les connexions sont limitées à 5/jour, ce qui ne peut permettre une utilisation à plein régime.

Le projet Content Spinning

Lancé par Nicolaseo épaulé par Ringout, le projet se veut collaboratif. Pour l’utiliser il faut participer. Ce projet a pour objectif d’automatiser à 100% la phase de spin en enrichissant une base de données géante.

Personnellement je n’ai pas confiance dans un traitement 100% automatique pour faire des textes propres (à cause de la destination, non par principe).

De grands laboratoires, avec leurs armées d’ingénieurs, n’ont toujours pas réussi. Le langage naturel et a fortiori la langue française ne se laisse pas formaliser si facilement.

Killdc

L’accès à l’interface d’utilisation de cet outil est spécifique à une démarche d’inscription d’offre commerciale, de soumission automatique d’annuaires. Il demeure gratuit mais peut paraitre un peu laborieux pour qui veut uniquement spinner.

Cela étant l’outil propose une génération automatique d’alternatives peu satisfaisante. Toujours le même problème avec l’automatique, le temps gagné à la génération est inférieur à celui rendu nécessaire par la correction. Il a cependant l’avantage de faire appel à une DB qui permet d’associer des groupes de mots et non uniquement des mots uniques, incontestablement un gros avantage. Côté prise en main manuelle du masterspin, à chacun de tester pour considérer l’ergonomie avec ses propres besoin.

Enfin les statistiques fournies sur les taux de similarités sont assez obscures. Bien que faisant appel à un Levenstein, les indications retournées restent difficilement interprétables si l’on ne connait pas les critères de calculs (de type « levenstein = 530″ ???). On peut déjà se faire une idée avec la vidéo de présentation.

Les executables français

Effispin

En plus d’être gratuit, Effispin est complet. Deux en un, il est à la fois assistant à la proposition d’alternatives et générateur de textes.

Le contrôle de similarité des textes est assez évolué, mixe de Levenstein et de Kuhn-Munkres. Sur ce point, nul ne connaissant ni les techniques (précisément) ni les critères (précisément) utilisés par Google pour identifier et/ou pénaliser le near-duplicate artificiel, difficile de savoir à quoi se fier.

Une des limites de l’outil est dans son incapacité à traiter des masterspin supérieurs à 1000 caractères. Peu pratique pour les articles, il conviendra par exemple pour les descriptions d’annuaires.

Cela étant il y a un vrai travail derrière Effispin qui en fait un outil pragmatique et utile. Côté assistance aux alternatives, c’est du mot à mot, une limite très vite atteinte.

Cet outil révèle un véritable potentiel. Le pas décisif sera certainement de pouvoir traiter des groupes de mots et des véritables variations sémantiques tout en capable de calculer des générations de textes optimisées sur des volumes de mots importants.

Web Imago Spin

Outil gratuit également.  Gestion de synonymes, génération de textes, calcul de similarités, Web Imago fait partie de ces logiciels pratiques d’utilisation.

 

 

Côté remarques, on pourrait faire un peu les mêmes que pour Effispin.

Les executables anglophones

On peut compter parmi les plus actifs pas mal de mises à jour. Cela étant on peut considérer aujourd’hui qu’il y a assez de nouvelles ressources francophones pour se sentir moins dépendant du boulot de nos amis anglophones.

Présentation de Spinner Chief II

Au passage, si vous voulez proposer de nouveaux outils (performants), n’hésitez pas, cette page est faite pour cela.

51 thoughts on “Ressources pour le spinning

  1. Bonjour,
    je ne pense pas que les logiciels utilisent une méthode aléatoire, autrement ils ne servent à rien. Il est vrai que lors que lors du codage de ce type de logiciel, très rapidement on se heurte à une masse de combinaisons ingérable (memoire insuffisante). Mais de là à proposer une solution au hasard…
    Je fais un peu d’auto-promotion et vous propose de vous pencher sur le logiciel gratuit que j’ai réalisé, disponible sur lab.webimago.fr

  2. Entendu par « aléatoire » l’absence de sélection des plus grandes distances à l’intérieur d’une population de textes. Et en ce sens je confirme.

    • Pourtant spinner chief donne un indice de « uniqueness » (comme ils disent) donc il y a un tri ex post. On n’est plus dans le hasard.
      Je ne peux pas parler pour les autres logiciel mais je certifie que s’il ne choisi pas la solution optimale(cardinalité) WIspin ne choisi pas non plus totalement au hasard les solutions avant de les classer selon leurs similarités. On peut donc supposer que les autres font de même.

  3. Merci pour cette liste. Exactement ce que je cherchais.
    Pour moi synonymizer est bien trop simple. Même e, se creusant la tête les textes sont trop semblables à mon goût.
    @ Web imago: je découvre tes softs. J’essaye ça immédiatement!

  4. Pas mal du tout cette liste…
    C’est sûr que l’humain devra toujours s’acquitter de tâches nécessaires à la compréhension des textes les plus « mélangés » mais elles devraient voir leur temps requis diminuer de plus en plus en rapport aux nouveautés logicielles qui ne cessent de sortir.

  5. Juste pour reprendre la phrase  » A mon humble avis, l’unique solution pour faire un spin de réelle qualité, c’est le cerveau. »
    Je suis d’accord sauf que le spinning aide bien pour générer des bases de texte, à retravailler par la suite pour arriver à du bon résultat !

    Pas de logiciel qui gère les synonymes en français ?

  6. Je viens d’aller sur le site projet content spinning et l’idée est très intéressante, je me tâte. Sans une bonne base de données le travail préalable ne peut se faire, au final, il faut passer du temps de toutes façons pour aller plus loin qu’un usage de synonymes (idem avec les spins anglais).

  7. Bonjour,
    Je travaille beaucoup en Anglais et j’utilise the Best Spinner qui est le meilleur à mon avis. Mais pour le français, savez-vous où pourrais-je trouver une base de données pour TBS?
    Merci!

  8. Bonsoir

    Je suis en train de confectionner mon propre outil de spinning (VB.Net, avec gestion de projets, mémorisation des historiques, mesure de similarité « maison », etc.) et je suis à la recherche de ressources au niveau algorithmique pour tout ce qui touche au dénombrement des combinaisons possibles.

    En fait mon appli fonctionne bien pour le moment, mais je souhaiterais aller plus loin, et notamment :
    - pouvoir calculer le nombre maximal de combinaisons sur un masterspin
    - calculer TOUTES les variantes d’un masterspin

    Actuellement j’utilise le classique algo aléatoire pour la génération des spins, et mon calcul de similarité (qui utilise l’algorithme de Levenshtein couplé à celui de Kuhn-Munkres pour un calcul plus orienté champs sémantique qu’alphabétique pur et dur) peut s’appliquer sur le spin obtenu (par rapport à l’ensemble de l’historique !) ou pour chaque paragraphe pris indépendamment, le tout avec des calculs de taux de similarité maximals paramétrables ;-)

    Ça fonctionne bien mais j’aimerais aller plus loin en optimisant les performances et ne plus me fier au hasard pour la partie génération, voire carrément au final proposer un outil qui calcule direct tous les spins répondant à un critère de similarité donné…

    Si vous aviez une référence pour le dénombrement ou plus simplement la génération de toutes les variantes à partir d’un master, je suis preneur !

    • Intéressant. Par contre je ne crois pas vraiment à l’exhaustivité du calcul. C’est très couteux en énergie. Le nombre de possibilités de tirages à partir d’un masterspin standard peut largement dépasser le nombre d’atomes connus dans l’univers. L’explosion combinatoire est quasiment ingérable par rapport à son utilité réelle AMHA.
      Pour alléger un peu le calcul on peut toutefois passer en logarithme, c’est déjà une économie non négligeable.

      • Bonjour et merci pour votre réponse (même si je repasse tardivement !)

        Effectivement je n’avais pas vu ça sous cet angle… Je travaille essentiellement sur des master spins de petite taille (au plus 400 caractères : j’utilise un logiciel de diction pour les « gros volumes », ça me prend certainement moins de temps que d’élaborer un master spin de 400 ou 500 mots valable… Enfin, je pense !)

        Du coup effectivement, on peut très vite monter dans les hautes sphères en matière de calcul.

        Je vais donc me contenter de ma méthode actuelle :)

        Je suis en train de refaire mon site web/SEO (celui de mon ancienne agence web), je diffuserai mes outils une fois la nouvelle version en ligne :)

  9. le content spinning peut etre un outil puissant si il est bien maitiser

    (Ce commentaire est si passionné que je n’ai pas cru bon laisser le bl…)

  10. Bof… vraiment décevant. C’est de la préhistoire, ces « outils ».

    Je crois que je ne trouverais jamais un équivalent des outils en anglais, capables de donner une version avec la syntaxe {a|b|c}.
    c’est ça qui est intéressant, quitte ensuite à « checker » par soi-même et corriger par-ci, par-là.

    Les codeurs et les développeurs, ça existe pas en France ou quoi ?!

    Pourquoi c’est le désert en outils et logiciels SEO pour le langage français ???

    Désespérant…

  11. Bonjour à tous.

    Je suis étonné de ne pas apercevoir dans les outils en ligne ce nouvel arrivant : http://www.revolusyn.com/inscription.php

    Je ne l’ai pas encore testé car je préfère d’abord approfondir mes connaissances théoriques sur le sujet avant de me lancer concrètement tête baissée dans ce système mais la vidéo présente sur le site est assez parlante je trouve…

    Une petite review de ce nouvel outil (ses capacités, avantages, inconvénients, etc…) serait fortement intéressante pour les newbies comme moi.

    Merci d’avance,
    Alexandre

  12. D’après le site, the best spinner existe désormais en version multilingue, dont le français.
    Quelqu’un a-t-il un retour d’expérience à nous proposer ?

    Merci d’avance !

    Nico

    • Je viens juste d acheter TBS car il propose de spinner en francais. Hmmm tbs ne trouve presque pas de synonymes et dans son video il parle de thesaurus. Je vais essayer encore voir si je peux le faire travailler mieux mais à date c est pas fort.

      Le spinning francophone est encore préhistorique si je compare aux logiciels anglophone. Bon je vais essayer encore…

  13. Bonjour

    Un peu « auto promo », mais bon mon outil étant sorti, gratuit, français et en français, le voici donc : http://www.effi10.com/logiciel-spinning-gratuit/

    Au programme :
    - gestion de projets avec restauration/sauvegarde
    - historique des spins générés
    - éditeur avec coloration syntaxique et contrôle de validité
    - dictionnaire des synonymes intégré (Hunspell) donc modifiable (à la main pour le moment)
    - génération par lot avec export mono ou multifichiers
    - contrôle de similarité paramétrable (par rapport aux historiques)
    - spins paramétrés (couplés avec une base de donnée, une variante étant générée par enregistrement)
    etc.

    Enfin bref… Un outil d’abord créé pour mes propres besoins, mais que j’essaye de faire évoluer ;)

      • Salut papy, ça va?

        Je n’ai toujours pas eu de suite à mon commentaire. Peut être que vous n’avez tous pas encore eu le temps de prendre connaissance du logiciel online.

        Connais-tu cet outil que je présente? (qui n’est pas à moi d’ailleurs).

        Merci d’avance à tout le monde pour votre gentillesse et votre patiente.

        Cordialement, Alexandre.

  14. Merci pour la Maj. J’ai re-lu encore cet article très récemment et les commentaires étaient une grande source d’infos.

    Je trouve que ce qu’il manque c’est un outil pour calculer la similarité des spuns d’un masterspin. Un outil qui ne sélectionnerait que les textes ayant le plus faible taux de similarité entre eux.

    Bref un outil difficile mais ô combien crucial.

    Cordialement.

    Olabonga

  15. Pour ma part, très circonspect sur l’offre existante, je m’y suis mis aussi :
    Je suis en train de terminer un logiciel desktop qui fera du spinning de façon très différente de tout ce qui est présenté ici (et même de ce qui n’y s’y trouve pas)… Développé avec Real Studio, il tourne sur Mac et sur Windows en natif (code exécutable compilé, pas de framework) avec une base Valentina.
    Pas de limitation de taille de texte, pas de limites de taille des dicos, ultra-rapide.
    On verra bien si cela plaît car il est différent, et quand c’est différent, on prend un risque…

    Christian

  16. Salut Christian !

    J’ai hâte de tester ta mouture, elle donne envie dis donc … ;-)

    Sinon, je ne suis peut-être pas objectif car il me faudrait tester toute la liste ci-dessus mais pour le moment j’ai porté mon dévolu sur EffiSpin.
    Il faut ajouter que mes besoins de spin ne sont pas considérables et des textes courts me suffisent amplement pour le moment.

    Pour finir, je tiens à remercier PapySpin pour avoir pris le temps d’effectuer cette liste et surtout d’avoir communiquer ses retours et critiques.

  17. Bonjour,

    je recherche depuis plusieurs jours, en vain, un script permettant de calculer la distance entre 2 spins.
    Enfin… Plus précisément, de générer X spins les plus éloignés possibles.
    Ce genre de script existe-t-il ?

    En tout cas merci pour le partage d’informations, elles sont très utiles.

    • Oui ça existe. Tout le problème est de savoir ce qu’utilise Google et quels seuils de tolérance il met en place. Sinon cela reste toujours approximatif.

  18. Merci pour ta réponse :-)

    As tu des adresses, liens, ou autre, où je pourrais trouver ce genre de ressources ?
    Il doit y avoir des scripts qui tournent mais j’ai pas encore mis la main dessus.

    J’ai réfléchi de mon côté mais impossible de trouver une logique pour la génération de spins éloignés.

    Si c’est des outils privés, je comprend aussi =)

  19. Vraiment très intéressant ton site pour m’améliorer sur le content spinning ! Merci pour toutes ces ressources que tu partages ici. On dit Merci Papy Spinning :)

  20. Bonjour,

    Merci pour ce precieux listing. C’est la liste que je cherchais…cependant je me pose une question:

    Je possède une boutique de tshirt en ligne, j’aimerais pouvoir référencer plusieurs pages de mes articles mais j’ai enornement de descriptifs d’articles similaires…Car lorsque vous avez 60 teeshirts hommes il faut savoir quoi raconter.

    Donc ma question est: Ce genre de logiciel, est-il utile dans mon cas pour differencier par exemples 50 articles t-shirt femmes?

    Je sais que je peux faire un script robot por dire a google de ne pas passé sur les pages dupliquer, mais a ce moment là mon site n’aurait que peu de page référencé: débardeur, tee shirt, tunique et c’est tout…

    cordialement,

  21. Bonjour,

    Comme d’habitude je fais le référencement white-hat. Un client vient deme contacter pour cette rédaction + spin. Je sais très bien le content spinning mais mon problème comment le faire? Quelles sont les stratégies à suivre? Comment faire ce {|}…?

    Merci d’avance

  22. Hello,

    il n’y avait pas un gem ruby pour le content spinning ?

    edit : je viens de voir le lien de maxime plus haut :)

    je ferais surement un tuto dessus sur suppresion/du/lien/qui/fait/sa/pub.cc »

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>