Tuto analyser ses reviews (1) : créer la base de données

Jun 02, 2017 13:10


Vous me connaissez, j'aime bien les statistiques. Et puis Owlie Wood m'a demandé de remettre des graphiques. Comme je n'en fais plus, j'ai eu une autre idée : vous indiquer comment récupérer sans trop de peine vos reviews, les organiser en données et en tirer des conclusions.
I : Copier les données sur une feuille Excel

[C est parti pour le CTR+C - CTR+V]
  1. Aller sur la page de reviews et évaluer ce qui se découpera en moins de pages : ordre chronologique ou par chapitres ? Filtrer la page de la manière la plus pertinente
  2. Copier la première page. Vous pouvez prendre seulement la partie des reviews ou faire un CTR + A pour tout sélectionner sans distinction

  3. Coller sur Excel en TEXTE SEULEMENT - tout le texte se colle sur une colonne

  4. Revenir sur fanfiction.net, charger la page suivante, copier
  5. Coller la page juste en dessous de la précédente.
  6. Coller toutes les pages....


II : Distinguer les lignes où se trouvent la date, le chapitre et le pseudo

Pour cela, il faut trouver un élément qui soit sur toutes les lignes qui nous intéressent, et seulement sur celles-la. On a de la chance, on en a un :  le terme "Chapter" (heureusement qu'on est francophones)
[Comment découper une cellule avec un séparateur]
  1. Faire un Rechercher/Remplacer : Chercher "Chapter" et le Remplacer tout par * (étoile... ou autre signe n'ayant que peu de chance d'être utilisé ailleurs)

  2. On va ensuite utiliser l'étoile comme séparateur pour créer une seconde colonnes sur les lignes où se trouve les pseudo et la date (on ne peut utiliser qu'un caractère unique comme séparateur, c'est pour ça qu'on a fait le remplacement précédent) :
    Données / Convertir / Clique le bouton radio : Délimité, puis Suivant


    Sur la seconde fenêtre, cocher "Autre" et mettre l'étoile (*) dans la case blanche. Cliquer sur Terminer


    => seules les lignes qui nous intéressent ont maintenant deux colonnes

  3. Sélectionner les colonnes A et B (colonnes entières) et faire un tri sur la colonne B en utilisant l'icône Trier et choisissant la colonne B

  4. Le bloc [Pseudo - chapitre-date] apparait clairement.

  5. Copier et le coller ce bloc dans une autre feuille pour l'isoler.
    Note : Pourquoi ne pas supprimer les ligne en trop plutôt que coller ce dont on a besoin sur une autre feuille ?

    Parce qu'il vaut mieux garder trace des étapes intermédaires pour ne pas avoir à tout recommencer en cas d'erreur

    ATTENTION les données doivent être COLLÉES EN LIGNE 2. Mettre des titres en ligne 1



III : Détacher le chapitre et la date

[Encore des découpages]
  1. Pour séparer la date et le chapitre, on va utiliser le point qui se trouve entre les deux comme séparateur.
    Sélectionner la colonne B et faire Données / Convertir / Cliquer sur le bouton radio Délimité puis sur Suivant.
    Cocher Autre et mettre un point dans la case blanche


    Une troisième colonne est créée qui ne contient que la date

  2. Pour séparer la date en trois bloc, refaire une conversion : Données / Convertir / Cliquer sur le bouton radio Délimité puis sur Suivant.
    Décocher Autre et cocher Espace


    La date est désormais sur 3 colonnes : mois, jour, année



IV : Traiter les dates
[Construire la date]
  • Pour transformer les mois en lettres en mois en chiffres
    • Mettre un filtre en haut des colonnes (il vaut mieux avoir mis un titre pour chaque colonne existante)

    • En utilisant le filtre sur la colonne contenant les mois, sélectionnez les mois un à un et remplacez-les par le nombre correspondant au mois. Vous avez à effectuer l'opération 12 fois en modifier toutes les lignes concernées à chaque fois


      Astuce : pour mettre la même valeur dans toute une zone, sélectionner la zone, taper la valeur (elle se met dans la cellule active comme on le voit dans l'image ci-dessus), puis presser sur CTR + ENTREE. Toute la zone prendra la valeur de la cellule active (ici, tous les "Apr" vont devenir 4).
  • Compléter l'année (ffnet ne met pas l'année pour les dates de l'année en cours)
    • Dans la colonne des années, faire un filtre sur les années vides


      Puis compléter la colonne avec l'année en cours

  • créer une date avec les trois colonnes
    • Dans la colonne qui contenait la date à l'ancien format et qui maintenant doit être vide (normalement, c'est la colonne C, sinon la créer) , mettre la formule suivante : =DATE(F2;D2;E2)
      Explication : on construit une date avec l'année, le mois et le jour (cette formule est valable pour la ligne 2)

    • Étirer la formule jusqu'à bas de la colonne
  • Copier la colonnes C et la coller sur elle-même avec le collage spécial "Coller les valeurs". Cela transforme les formules en nombres définitifs.



    V : Ne garder que ce dont on a besoin
    1. Retirer les colonnes en trop : le mois, le jour. Garder l'année, elle servira pour l'analyse.
      Vous pouvez éventuellement retirer les doublons. Normalement il n'y en a pas mais vous avez pu faire une erreur de collage. S'il y en a beaucoup, c'est que vous avez dû faire une erreur quelque part.
    2. Trier par date (par exemple)


    Et voilà, vous avez transformé une page de fanfiction.net en base de données.
    Dans le prochain billet, je vous montrerai comment faire parler les chiffres !

    PS : Owlie, comme tu as sans doute remarqué, ce sont tes reviews qui ont servi d'exemple. Je peux t'envoyer le fichier complet si cela t'intéresse ^-^

    secrets de fabrication

    Previous post Next post
    Up