LinkedIn ha pubblicato alcune novità sul funzionamento del suo algoritmo di classificazione dei contenuti (le cui caratteristiche avevo approfondito qui).
Quando l’utente entra nella piattaforma, il sistema individua una lista di possibili post candidati ad essere mostrati. La scrematura dei candidati viene effettuata applicando ad ogni post un'”algoritmo di classificazione leggero” che ha il compito di prevedere se sarà gradito dall’utente.
Cosa considera l’algoritmo di classificazione di LinkedIn
La previsione, fatta grazie a modelli di machine learning, tiene conto di:
- P (l’azione) = la probabilità che l’utente compia un’azione vedendo il post candidato ad essere mostrato
- E [downstream clicks/virals | action] = l’effetto downstream ossia l’effetto virale che si genererebbe (interazioni successive) nel caso in cui l’utente che vede il post candidato compisse un’azione (es. un like)
- E [upstream value | action] = l’effetto upstream ossia l’effetto positivo sull’autore del post (in termini di motivazione a scrivere di più) che si potrebbe generare se l’utente che vede il post candidato compisse un’azione (es. un commento).
Questi tre elementi vengono bilanciati in modo da mantenere un ecosistema di notizie “salutare”. Più facile a dirsi che a farsi. In realtà il sistema tenderà a mostrare solo i post che hanno più probabilità di essere cliccati. Ecco perché è stato introdotto un segnale nuovo: il tempo di permanenza.
L’importanza del tempo di permanenza
Il tempo di permanenza, di cui già tiene conto l’algoritmo di Facebook, è un segnale dell’interesse verso un contenuto molto utile. Infatti i click e le altre interazioni non sempre bastano. Ci sono utenti passivi che leggono i post senza compiere azioni, utenti che cliccano un link ma subito chiudono la pagina o che lasciano un like compulsivo su contenuti qualitativamente poveri.
Tipicamente ogni aggiornamento permette di considerare due tipi di tempo di permanenza. Il primo “sul feed” che parte dal momento in cui almeno metà del contenuto appare sullo schermo di chi scrolla. Il secondo è quello “dopo il click” ossia il tempo speso sul contenuto linkato.
Analizzando milioni di post diversi, LinkedIn ha correlato il periodo di visualizzazione del post con la probabilità di interazioni. Come immaginabile, c’è un tempo Tskip nel quale l’utente “guarda e passa” (la linea verde tratteggiata), trascorso quel tempo, più rimane a leggerlo, più aumenta la probabilità di una nostra interazione. Dunque oggi l’algoritmo di classificazione di LinkedIn considera anche questo fattore quando deve decidere quali aggiornamenti mostrarci.
Si tratta di un ulteriore passo, non ancora decisivo, nella previsione dell’interesse verso un contenuto per via algoritmica. Non a caso parlo di interesse e non di qualità del contenuto.
Perché il tempo speso può essere un fattore facilmente sfruttabile da chi cerca attenzione, senza offrire sostanza. Sono quelli che scrivono post demagogici o inutilmente lunghi e pieni di tag. Se ne incontrano tanti nell’open space LinkedIn, che assomiglia sempre più al centro commerciale Facebook.