L'intelligenza artificiale a supporto del copywriting SEO

Dei rapporti tra intelligenza artificiale e SEO si è detto di tutto di più; io stesso ho riportato su questo sito parecchi interventi.
Spesso si parla di potenzialità futuribili ed immense secondo le quali i sistemi di intelligenza artificiale scriveranno direttamente i contenuti; è un approccio in realtà di limitata e complicata applicazione, anche se possibile, preferisco un approccio intermedio grazie al quale l'ia aiuta l'umano a scrivere contenuti di senso.
Ovviamente un copywriter non può conoscere l'intero scibile umano; quando scrive un contenuto interroga la rete cercando di distillare le informazioni più importanti per scrivere qualcosa di senso compiuto, senza utilizzare il copia/incolla e raggiungendo almeno il valore di 1000/1500 parole totali che sono un valore raccomandabile da raggiungere.

Ciò che voglio descrivere è il metodo con cui interrogare la rete per ottenere la maggior parte di informazioni possibili con le quali il copywriter possa accingersi ad elaborare un contenuto di qualità che si presti ad una buona indicizzazione da parte di Google.
Questo metodo è stato da me applicato negli ultimi 6/8 anni di lavoro, ovviamente con modifiche nel tempo, e ha consentito di raggiungere ottimi risultati in termini di posizionamento.

Partiamo dalla fine: lo scopo è ottenere, per ogni contenuto da scrivere, un elenco che comprenda:

  1. le caratteristiche 'fisiche' del contenuto: la lunghezza del contenuto, il numero di immagini, i campi SEO da curare di più, la lunghezza dei titoli e delle metadescrizioni, la facilità di lettura richiesta, il numero di link; tutti questi 'ranking factors', utili solo per il contenuto in questioni, sarebbe utile averli a disposizione ordinati per importanza; per esempio è più importante curare la leggibilità del testo piuttosto che la sua lunghezza.
  2. l'elenco dei competitor più importanti, sia come nome di dominio che come singole pagine che saranno le 'concorrenti' del contenuto che si viene a creare
  3. l'elenco delle keyword utilizzate dai competitor, possibilmente anche l'elenco degli n-grams ovvero aggregazioni di due o tre parole più spesso utilizzate
  4. Gli argomenti da trattare, descritti con i termini da utilizzare; all'interno di quello principale oggetto del contenuto quali possano essere i sottocontenuti da scrivere
  5. Per ognuno di questi argomenti, l'elenco dei siti che lo trattano
  6. l'elenco delle migliori pagine  in rete che rispettano queste caratteristiche
  7. l'elenco dei siti dai quali sarebbe utile ricevere link
  8. l'elenco dei siti che sarebbe utile linkare, cioè la linkografia dell'articolo
Ottenuti questi dati un buon copywriter ha la strada spianata per scrivere buoni contenuti; non ha davanti il foglio bianco e un campo di ricerca vuoto su Google ma parte da dati certi su cui costruire i contenuti.
Per raggiungere  questo obbiettivo useremo metodi dell'intelligenza artificiale.
Il percorso che seguiremo sarà costituito di più fasi:
  • in una prima fase ci occuperemo di raccogliere i dati: sappiamo che l'ia si nutre di essi in quantità elevate, quindi dovremo recuperarne la più grande quantità possibile
  • in una seconda fase elaboreremo questi dati con diversi algoritmi per ottenere l'elenco sopra descritto

La raccolta dei dati


La fase di harvesting è abbastanza semplice da mettere in pratica e consiste nell'ottenere da google le pagine che ci interessano. Non si tratta però di una o di qualche decina di pagine; dobbiamo averne a migliaia, in modo da poter avere quella massa critica di dati di cui l'ia necessita.
Google è un motore semantico, ragiona per significati; per questo è necessario mettere insieme qualche decina di keyword che descrivano il significato del contenuto da scrivere. ovviamentre si possono utilizzare appositi strumenti per ottenerle, ma è anche abbastanza semplice inventarsele sul momento perchè non è la singola keyword ad essere importante, ma il concetto che le keyword descrivono nel loro insieme, questo ciò mette al riparo da qualsiasi SEO-evoluzione di Google nel futuro. Le analisi che andremo a compiere non sono effettuate (solo) sulle singole keyword, ma sull'insieme dei risultati: proprio per questo hanno un valore decisamente maggiore.
Quindi, una volta raccolte qualche decina di keyword, le inseriamo su google e andiamo a segnalare i primi n risultati del motore di ricerca; tipicamente n per le mie analisi è tra 50 e 100, in questo modo si ottengono qualche migliaio di link. Già i posizionamenti ottenuti in questa fase possono essere oggetto di analisi e spesso alcune consulenze hanno raggiunto già a questo punto risultati importanti in termini di analisi del contesto competitivo;  ma procediamo.
Con questo elenco di migliaia di link andiamo a costruire tre insiemi di dati che daremo in pasto agli algoritmi di intelligenza artificiale:
  • la tabella stessa dei link, keyword e posizionamenti
  • il corpus documentale, ovvero l'insieme di tutti i testi leggibili
  • il grafo di rete, ovvero la rappresentazione di tutte le connessioni tra i risultati
Il terzo punto viene ulteriormente esteso ricavando da ognuna delle pagine analizzate l'elenco dei link presenti, in questo modo si aggiunge al grafo di rete un livello di complessità; partendo dalle migliaia di risultati e supponendo che ognuno di esso contenga una decina di link, si arriva facilmente ad un grafo di rete con decine di migliaia di nodi (=pagine linkate tra loro); un boccone ghiotto per l'ia.