Creare un elenco di URL partendo da un file CSV

By Sante Achille February 24, 2014



Come estrarre un elenco di URL in formato TXT partendo dal file CSVdi Majestic SEO

È abbastanza semplice estrarre l’elenco degli indirizzi Web (URL) partendo dal file CSV che Majestic mette a disposizione degli utenti … fino a quando i file sono di dimensioni “umane” o meglio “gestibili” dai nostri computer.

Per quelli che hanno un abbonamento platinum e che possono (e devono) scaricare ed analizzare milioni e milioni di link, è più facile a dirsi che a farsi e chi ha provato ha visto Excel inchiodarsi e piantare l’intera macchina … il “copia ed incolla” non funziona.

I problemi arrivano quando c’è bisogno di fare una analisi dettagliata del profilo di linking: ad esempio per segmentare i link entranti in gruppi (o categorie) che sono funzione dei valori di citation flow e di Trust Flow.

La sessione di Terminale

Meglio noto come il prompt DOS su windows.

Su Mac e Linux

Apri una sessione di terminale (è una app – terminal.app) e posizionati nella directory dove si trova il file decompresso scaricato da Majestic SEO.

Inserire la seguente stringa:

cut -d, -f3 report_source.csv | sed ‘s/”//g > report_links.txt

Su Windows

Che interessa la maggior parte degli utenti Majestic SEO …

  1. Apri un prompt DOS (su windows 8 metti il comando “cmd” nella ricerca e Windows suggerisce come “app” il prompt dei comandi – clicca lì per aprire una sessione di terminale
  2. Naviga (come per il Mac) fino ad arrivare dove si trova posizionato il file si cui si deve lavorare
  3. Al prompt DOS scrivi Notepad dacsvatxt.bat che apre una sessione di lavoro in notepad che crea un file vuoto che si chiama dacsvatxt.bat
  4. Copia ed incolla il seguente codice:

    @echo off
    for /f “usebackq tokens=1-13 delims=,” %%A in (“%1%”) do (
    echo %%~C
    )

Per far girare la routine appena scritta, dal prompt DOS bisogna dare il comando di esecuzione del file batch (.bat):

dacsvatxt report_sorgente.csv > report_link.txt

Dove il file report_sorgente.csv è il file sorgente csv che contiene i dati scaricati da Majestic (ricorda che il file deve essere scompattato prima di fare qualsiasi cosa).

Avviso Importante

Come per tutte le routine e la sviluppo software in generale ci sono sempre dei problemi nel far eseguire anche delle piccole routine. Uno dei problemi che ho visto nei commenti al post scritto da Dixon deriva dal fatto che WordPress, per motivi suoi, trasforma le virgolette semplici (per intenderci quelle che trovi sulla tua tastiera sopra il 2) in virgolette decorative che nulla hanno a che fare con i simboli della programmazione bloccando la routine stessa. Nel redigere questo post ho utilizzato i simboli giusti ma quando salvo WordPress me li cambia e non c’è verso di mantenere quello originali (eppure scrivo utilizzando l’interfaccia HTML e non quella WYSIWYG…)

Quindi prima di provare assicurati che le virgolette (e l’apostrofo) siano quelli giusti – se non va temp che non posso esserti di grande aiuto … in bocca al lupo!

Traduzione libera dell’Articolo scritto da Dixon Jones a cura di:

Posted In: General

One Response to “Creare un elenco di URL partendo da un file CSV”

  1. Emanuele said:

    March 11, 2014 at 4:41 pm

    Grazie della dritta…il lavoro di analisi dei backlink nella SEO è tanto importante quanto lungo, e ogni spunto per facilitare e velocizzare il processo ben venga!