Sauvegarder son blog avec Scrapbook X

Comme promis sur les forums d'Eklablog, voici la méthode la plus simple, pratique, rapide et efficace que j'ai trouvée pour sauvegarder mon mes blogs. Elle ne vous permettra certes pas de le(s) réimporter mais du moins de sauvegarder vos textes, images ainsi que la mise en page de vos billets — et accessoirement du design de votre blog tout en sachant que cette partie ne sera pas réutilisable ailleurs car chaque plateforme d'hébergement possède des structures qui lui sont propres.

En effet, comme je l'avais expliqué à certains, j'ai longtemps utilisé avec satisfaction un aspirateur de sites du monde du libre (HTTtrack) jusqu'à que, pour des raisons obscures, il ne parvienne plus à capturer tous les éléments, zappant souvent des images, le formatage voire même carrément des pages entières. De plus, cela prenait un temps considérable (plusieurs heures) à chaque mise à jour sans possibilité de sauvegarder les billets programmés (non publiés) ou verrouillés par un mot de passe. Aussi j'utilisais déjà conjointement l'extension Scrapbook pour Firefox afin de copier mes ajouts entre les actualisations réalisées par HTTrack ce qui, au bout du compte, consommait à la fois beaucoup de temps, d'espace disque et de bande passante.

J'ai finalement décidé de tester la sauvegarde intégrale avec Scrapbook X (un « fork » alternatif et grandement amélioré du développement de l'extension originale), non pas en faisant glisser chaque onglet ouvert dans le panneau latéral — ce qui aurait été bien trop fastidieux vu le nombre à récupérer — mais en mettant à profit la fonction de capture d'URL multiples.

Téléchargement

Pour utiliser Scrapbook X, vous devez impérativement installer Firefox ou tout autre navigateur basé sur le même moteur acceptant les extensions pour Firefox même si par ailleurs vous préférez utiliser un autre navigateur (une installation portable, sur clé USB par exemple, est également possible).

Récupération du fichier « sitemap.xml »

Tout d'abord vous devez récupérer le fichier « sitemap.xml » qui est une sorte de plan de votre blog généré automatiquement par Eklablog. Pour ce faire, il suffit simplement de saisir son URL suivie de /sitemap.xml dans la barre d'adresse de votre navigateur.

Exemple pour la Pensine (fonctionne normalement avec n'importe quelle plateforme).

http://lapensinemutine.eklablog.com/sitemap.xml

Normalement une page de code va s'afficher. Sauvegardez-la sur votre disque dur en conservant bien l'extension XML.

Ouvrez-la ensuite à l'aide d'un éditeur de texte amélioré.

Sélectionnez-tout (CRTL+A) et appelez la fonction de tri par ordre croissant (format ANSI) qui va vous permettre de grouper toutes les URL.

Il va ensuite falloir supprimer les balises <LOC> et </LOC> encadrant chacun de ces liens. Pour ce faire, lancer la fonction recherche/remplacement de texte en saisissant <LOC> dans le champ recherche et de laisser le texte de remplacement vierge. Attention de bien veiller à cocher les options de recherche dans les deux sens et tous pour que toutes les lignes soient prises en compte et ne pas avoir à tout valider manuellement.

Répétez l'opération pour la balise </LOC>.

Vous pouvez désormais sélectionner tous ces liens isolés en les mettant en surbrillance pour les copier vers le presse-papiers (et ne copiez rien d'autre entre temps).

NOTE : Les pages protégées et les articles programmés ne figurant pas dans le sitemap, il vous faudra les capturer ultérieurement un à un ou bien récupérer leurs URL et les ajouter à cette liste avant de la copier. Il va sans dire, également, que vous devrez être connecté à votre compte avant de lancer la procédure sinon vous ne pourrez accéder ni aux articles non publiés ni aux pages nécessitant un mot de passe.

Capture de pages multiples avec Scrapbook X

Dans votre navigateur, activez Scrapbook X dans le panneau latéral, sélectionnez votre Scrapbook (si vous en avez plusieurs) et cliquez sur le bouton Outils puis Capturer des URLs multiples (voir Fig. 1).

Fig. 1
Fig. 2
Fig. 3

Dans la boite de dialogue qui s'ouvre (Fig. 2), indiquez dans quel dossier vous voulez capturer votre blog ou bien laissez à la racine par défaut (il est préférable néanmoins de créer un dossier pour faciliter le tri et la sélection). Dans la zone des URL, collez les liens que vous avez copiés dans votre éditeur de texte (il se peut que le contenu du presse-papiers ait automatiquement été récupéré et que vous n'ayez pas besoin de coller). Cliquez ensuite sur le bouton Démarrer.

Une nouvelle boite de dialogue s'ouvre (Fig. 3) dans laquelle vous pouvez décocher certaines pages (comme par exemple archives, contact, recent, search et tags qui n'ont pas besoin d'être sauvegardées mais qui figurent dans le sitemap). Cliquez une nouvelle fois sur Démarrer et la récupération de votre site se fait alors.

Vous pouvez suivre la progression dans l'angle supérieur gauche de cette fenêtre qui indique le nombre de pages sauvegardées par rapport au nombre de liens total. C'est assez rapide : pour un blog assez conséquent comme le mien, cela m'a pris moins d'une heure !

Mises à jour

Rassurez-vous, vous n'aurez à faire ceci qu'une seule fois. Pour toute page (ou article) que vous modifierez sur votre blog, il vous suffira de la sélectionner dans l'arborescence de votre Scrapbook et d'appeler la fonction Outils via le menu contextuel (clic droit) pour la capturer à nouveau (Fig. 4).

Fig. 4
Fig. 5

Une boite de dialogue va s'ouvrir. Je vous conseille de conserver les réglages par défaut. Pour ma part, j'ai juste rajouté les images liées pour récupérer les galeries (autrement vous n'aurez que les vignettes).

Il faut savoir également que les vidéos ou musiques embarquées (en provenance de sites externes comme YouTube, Soundcloud, Vimeo, DailyMotion, etc.) ne peuvent être récupérées de cette manière. Je n'ai pas réussi à récupérer les codes d'intégration des iframes non plus. Si quelqu'un connait une astuce rapide pour récupérer en masse ces adresses avec Scrapbook X ou autres, nous lui serions très reconnaissant de se manifester dans les commentaires. Parle... ou bien emporte ton secret dans la tombe !

Voilà, j'espère que ce tuto vous aura été utile et n'hésitez pas à venir partager vos astuces de sauvegarde et tous les trucs auxquels je n'aurais pas pensé.

MàJ 15.06.2024 :

Avec l'abandon du XUL pour créer des extensions au profit des Webextensions, Scrapbook X n'est plus pris en charge par les navigateurs Mozilla (Firefox) actuels. La bonne nouvelle c'est qu'il existe un navigateur libre dérivé de Firefox appelé Basilisk, multi-plateformes et régulièrement mis à jour pour les failles de sécurité qui utilise les extensions XUL et vous permettra donc d'utiliser Scrapbook X téléchargeable ICI. Comme ce navigateur n'est plus trop à la page, il ne vous servira que pour sauvegarder vos pages (jeu de mots involontaire).

© La Pensine Mutine. Tous droits réservés. Reproduction interdite.

Partager :

3 commentaires:

Sorciere Corbeau a dit…

Salut! J'avais des blogs aussi sur ekla avant maintenant je suis ici tous comme toi. J'ai vue ton comms sur le forum car je me tiens au courrant la migration parce que je suis un peu curieuse d e l'evolution. Quil immigre ou pas j'ai quand meme blogger cest pas mal ma maison depuis 1 an . Je tenais a te commenté sur ton blog Enchantée et bienvenue sur blogger. Tu peux venir me voir sur blog d'astuces si tu veux. BOnne soiree

Ey@el a dit…

Merci beaucoup, on se sent moins seul du coup. Je ne manquerai pas d'aller visiter ton blog dès que j'aurais une minute.

Sorciere Corbeau a dit…

N'hesite pas . SI tu regarde dans la colonne de gauche jai mis des liens de blog chez BLoggers qui sont ou etainent sur EKlablog. TU connais peut etre certains d'entre eux.

À l'affiche

La panthère du lac

À l'approche d'Halloween, je comptais publier un article d'Alanna Ketler sur la symbolique véritable du chat noir que je m'...

Derniers articles

Formulaire de contact

Nom

E-mail *

Message *