Comunicazione

Mappatura delle differenze individuali su Internet: caso di studio della comunità del diabete di tipo 1

social media, connections, networking

Photo by GDJ on Pixabay

Le piattaforme di social media, come Twitter, sono sempre più popolari tra le comunità di persone con malattie croniche, comprese quelle con diabete di tipo 1 (T1D) []. Queste piattaforme hanno potenzialmente un impatto smisurato sulle esperienze quotidiane delle persone con diabete, in quanto forniscono nuove opportunità per cercare supporto, che sembra essere un fattore chiave nell’aderenza alla terapia []. Twitter e altre piattaforme potenzialmente forniscono anche un supporto strumentale alle persone con diabete e ai loro caregiver attraverso la diffusione di informazioni relative a nuovi trattamenti o politiche mediche (ad es. assistenza sanitaria). Una delle principali sfide per studiare il ruolo dei social media per le persone con diabete è l’analisi efficiente dei contenuti; i partecipanti alle community web-based ammontano a decine di migliaia di utenti, generando milioni di post. Questo studio tenta di documentare i temi principali dei post di Twitter utilizzando un metodo di elaborazione del linguaggio naturale per identificare argomenti di interesse nella comunità basata sul web di T1D. Sebbene questo studio si concentri sulle persone con T1D, riteniamo che metodi simili possano essere impiegati per esplorare altre comunità sanitarie su Internet.

I social media avvantaggiano le persone con diabete

Il lavoro precedente che documenta il ruolo delle piattaforme di social media, tra cui Facebook, Instagram, Reddit, YouTube, Tumblr e Twitter, nonché bacheche di messaggi specifiche della comunità, conclude che i social media sono principalmente utili per le persone con diabete. Questa conclusione si basa principalmente sull’evidenza che gli argomenti dei post sui social media della comunità TID sono in gran parte positivi e ruotano attorno al miglioramento della salute mentale correlata al diabete, alla fornitura di supporto sociale e alla condivisione di informazioni pratiche [-]. Ad esempio, l’analisi qualitativa di varie piattaforme di social media ha rilevato che i post includevano temi di umorismo, orgoglio e costruzione della comunità, oltre a discutere di tecnologia relativa al diabete e condividere suggerimenti pratici []. Quando viene chiesto direttamente, le persone con diabete confermano questi temi segnalando che le comunità basate sul web forniscono supporto sociale, aiutali a sentirsi responsabilizzati e insegna loro conoscenze pratiche per la gestione del diabete [,]. È importante sottolineare che le preoccupazioni sul ruolo delle piattaforme di social media nella diffusione della disinformazione o nell’impatto negativo sull’autostima tra i giovani con diabete [] sembrano essere in gran parte infondate, poiché una recente sintesi suggerisce relativamente poche conseguenze negative per questa comunità [].

Le impressioni soggettive sulla potenziale utilità dei social media sono supportate dall’associazione dei social media con indici oggettivi di salute [,]. Coloro che cercavano informazioni sulla salute su Internet erano più bravi a testare la glicemia regolarmente, a intraprendere azioni adeguate per l’iperglicemia e ad adottare una gestione non farmacologica [], e i blogger segnalano un miglioramento dei livelli di glucosio nel sangue []. Oltre a fornire supporto emotivo e alfabetizzazione sanitaria specifica per il diabete, le “comunità online del diabete” (DOC) sembrano fornire informazioni rilevanti sulla navigazione nei sistemi sanitari []. Molti dei benefici dei DOC sono vissuti non solo dalle persone con diabete ma anche dai loro caregiver [,]. È importante notare, tuttavia, che questi studi si basano su dati osservativi; pertanto, l’effetto causale dei social media è sconosciuto.

I DOC servono come principali fonti di sostegno per le comunità del diabete []. In un caso, una valutazione qualitativa delle comunità basate sul web ha suggerito che gli individui anziani sono preoccupati per l’accesso limitato al trattamento, l’incapacità di fornire assistenza personale e la capacità degli operatori sanitari di supportare l’invecchiamento []; l’uso di piattaforme web porta consapevolezza a questi problemi e genera il potenziale per l’azione. Ad esempio, Omer [] documenta il caso “#WeAreNotWaiting” in cui i DOC hanno sollevato la consapevolezza delle imprecisioni nei monitor del glucosio, culminando in una chat basata sul web tra i pazienti e la Food and Drug Administration e un incontro di persona per lavorare su questi problemi .

Infine, le piattaforme di social media possono avvantaggiare le persone con diabete facilitando l’accesso alle informazioni sul diabete. Le informazioni possono essere condivise, ad esempio, da operatori sanitari che utilizzano i social media come strumento di pubbliche relazioni [], per fornire servizi pubblicitari. Condividendo le informazioni su Internet, gli operatori sanitari e i ricercatori sanitari hanno il potenziale per ridurre le barriere sistematiche all’accesso a nuove informazioni. In un caso, la valutazione dell’uso dei social media intorno alle conferenze mediche ha suggerito che anche quando solo una piccola percentuale di partecipanti utilizza i social media, le informazioni presentate alla conferenza possono essere ampiamente divulgate a coloro che non possono partecipare [,].

Aumentare la ricerca sui social media per le comunità del diabete

Poiché i siti di social media hanno guadagnato popolarità, la quantità di informazioni generate su questi siti è aumentata in modo esponenziale. Questo è un vantaggio per i ricercatori sul diabete e presenta una sfida metodologica: i metodi comunemente usati di analisi qualitativa dei dati hanno un’utilità limitata nel campo della ricerca sui social media.

I metodi empirici o basati sui dati per misurare e analizzare l’uso dei social media possono orientare la ricerca sulle comunità del diabete in diverse direzioni chiave. Innanzitutto, questi metodi sono scalabili per ampi campioni di partecipanti. Gli approcci basati sui dati rinunciano alla necessità di intervistatori e programmatori, consentendo così ai ricercatori di analizzare potenzialmente decine di migliaia di partecipanti e milioni di post. Campioni di grandi dimensioni sono essenziali per catturare esperienze rare ma di grande impatto, che potrebbero rimanere non documentate fino a questo punto. Ad esempio, mentre la ricerca sui DOC fino ad oggi ha concluso che queste comunità sono solidali e inclusive, è possibile che un piccolo sottoinsieme di individui subisca l’esclusione o il bullismo su Internet. Piccoli campioni potrebbero non catturare questi individui, o includerne solo alcuni, non riuscendo così a identificare queste esperienze. Inoltre,

In secondo luogo, i metodi basati sui dati consentono una rapida valutazione di eventi o cambiamenti, preparando ricercatori e medici a una risposta più rapida. Ad esempio, i dibattiti politici sull’assistenza sanitaria universale o i cambiamenti nella copertura assicurativa sanitaria nazionale sono importanti preoccupazioni per le persone con diabete, poiché questi cambiamenti spesso influiscono sul prezzo e sulla disponibilità delle tecnologie di monitoraggio dell’insulina e del glucosio (ad es. campagna []). I ricercatori possono analizzare la risposta a tali dibattiti in tempo reale utilizzando modelli che adottano un approccio basato sui dati.

Identificazione degli argomenti di discussione

Una sfida con gli approcci basati sui dati per analizzare grandi insiemi di dati è che molte tecniche funzionano in una “scatola nera”, oscurando le relazioni tra le variabili e rendendo difficile o impossibile l’interpretazione dei modelli statistici. Ad esempio, molti modelli di apprendimento automatico utilizzati per valutare grandi pool di dati danno principalmente la priorità alla previsione fuori campione piuttosto che alla sintesi interpretabile []. I recenti progressi nelle analisi linguistiche aprono la strada ad analisi empiriche del comportamento basato sul web e consentono la sintesi del comportamento basato sul web, sfruttando così grandi set di dati mantenendo l’attenzione sui modelli descrittivi, piuttosto che sui modelli predittivi.

Latent Dirichlet Allocation (LDA) [,] è uno di questi metodi per riassumere il comportamento basato sul web. LDA è una tecnica di modellazione di argomenti che cerca di identificare i temi sottostanti che possono essere utilizzati per classificare il testo in un documento (ad esempio, l’insieme di tweet di un utente). Questa analisi tenta di scoprire un processo nascosto senza input o ipotesi da parte dei ricercatori sui temi principali dei documenti. È importante sottolineare che l’ADL consente l’adesione mista o che un singolo documento contenga 2 o più argomenti. L’analisi LDA è già stata applicata con successo ai social media: gli argomenti dei tweet (post di Twitter) sono associati ai tassi di obesità a livello di contea [] e prevedono il rischio individuale di sviluppare condizioni di salute croniche [].

Sono stati utilizzati anche altri metodi di apprendimento automatico per analizzare il comportamento basato sul web. Pertinente a questo studio, Ahne et al [] hanno identificato i tweet relativi al diabete attraverso l’uso di parole chiave e hashtag e hanno riassunto gli argomenti in essi utilizzando k-significa raggruppamento. Hanno identificato una serie di 30 argomenti, molti dei quali erano variazioni sulle preoccupazioni relative al prezzo e alla disponibilità dell’insulina. Questi risultati sono promettenti, in quanto la maggior parte degli argomenti identificati è stata facilmente compresa dai ricercatori e chiaramente collegata alle principali preoccupazioni delle persone con T1D. Tuttavia, l’inclusione dei soli tweet relativi al diabete, piuttosto che di tutti i tweet di persone con diabete di tipo 1, potenzialmente omette esperienze importanti di queste comunità. Inoltre, non è chiaro come questi argomenti vengano trasmessi all’interno dei DOC. Ad esempio, il prezzo dell’insulina è un argomento discusso in dettaglio da un sottoinsieme di account o diffuso ampiamente in tutta la comunità? Con queste domande in mente, passiamo allo studio attuale.

Lo studio attuale

Questo studio cerca di valutare empiricamente l’uso di Twitter da parte della comunità T1D, comprese le persone con diabete, gli operatori sanitari, i professionisti medici, i sostenitori e i responsabili politici. Miriamo a rispondere a 3 domande di ricerca principali: (1) qual è il sentimento generale dei post sui social media? (2) Quali sono i principali argomenti di discussione su Internet? (3) Come è organizzato il social network degli utenti di Twitter intorno agli argomenti di discussione?

Da notare, analisi simili sull’uso di Twitter da parte di persone con (tutti i tipi di) diabete sono state condotte di recente da Ahne et al []. Sebbene il nostro studio sia concettualmente e analiticamente simile a quello di Ahne et al [], espandiamo la metodologia e le domande di ricerca in due modi: in primo luogo, la raccolta dei dati è stata guidata dall’obiettivo di includere membri del DOC di tipo 1, piuttosto che tweet che trattano un argomento specifico. Questo ci consente di generare una visione più olistica delle vite e delle preoccupazioni di questi utenti. In secondo luogo, includendo analisi di rete, possiamo indagare in che modo gli argomenti vengono condivisi all’interno dei DOC, se gli utenti sono esposti a un numero elevato di argomenti o a un sottoinsieme ristretto e fino a che punto esiste un unico DOC grande o molti più piccoli su Twitter.

Metodi

Raccolta di campioni e dati

Per iniziare a identificare i tweet nella comunità T1D, abbiamo utilizzato i seguenti hashtag: #t1d, #t1dlookslikeme, #brokenpancreas, #type1kid, #typeonetypenone, #diabadass, #type1warrior, #beyondtype1, #insulindependent, #typeonestrong, #dexcom e # GBdoc. Questo elenco è stato generato attraverso la discussione con gli utenti di Twitter all’interno della comunità T1D e un sondaggio informale sui tweet. Abbiamo evitato di utilizzare hashtag più generici come #diabetes, che possono includere anche tweet di persone della comunità del diabete di tipo 2, che non erano al centro di questo studio. Utilizzando il pacchetto Rtweet (versione 0.7.0) [] in R, abbiamo estratto 1500 tweet contenenti questi hashtag nella settimana precedente (dal 28 dicembre 2019 al 3 gennaio 2020). Questi tweet rappresentano una combinazione dei tweet più recenti e dei tweet più popolari durante quel periodo di 1 settimana.

In questo pull iniziale, abbiamo raccolto 915 account Twitter unici. In linea con il nostro obiettivo di includere tutti i tweet dei membri della comunità T1D, non solo i tweet su T1D, abbiamo estratto i 100 tweet più recenti (inclusi retweet e risposte) da ciascuno di questi account. Inoltre, per assicurarci che gli account che abbiamo estratto fossero account con T1D come argomento ricorrente dei tweet, abbiamo incluso solo account con almeno 3 tweet separati contenenti almeno 1 degli hashtag T1D (481 account e 42.062 tweet). Infine, riconosciamo che non tutte le persone con T1D avranno twittato delle loro diagnosi nell’ultima settimana. Tuttavia, è più probabile che queste persone seguano account che includono post frequenti sul T1D. Perciò, cerchiamo di catturare più membri della comunità basata sul web di T1D estraendo i follower Twitter degli account nei nostri dati (fino a 5000 follower per ogni account). Per ciascuno di questi follower, abbiamo estratto 100 dei loro tweet più recenti. Abbiamo nuovamente incluso solo quegli account in cui c’erano 3 tweet separati contenenti uno dei nostri hashtag T1D selezionati, per limitare gli account inclusi a quelli della comunità T1D. Infine, per coerenza nei nostri risultati di elaborazione del linguaggio naturale, abbiamo incluso solo quei tweet scritti in inglese. Il nostro campione di analisi finale consisteva di 691.691 tweet da 8557 account (). limitare gli account inclusi a quelli della comunità T1D. Infine, per coerenza nei nostri risultati di elaborazione del linguaggio naturale, abbiamo incluso solo quei tweet scritti in inglese. Il nostro campione di analisi finale consisteva di 691.691 tweet da 8557 account (). per limitare gli account inclusi a quelli della comunità T1D. Infine, per coerenza nei nostri risultati di elaborazione del linguaggio naturale, abbiamo incluso solo quei tweet scritti in inglese. Il nostro campione di analisi finale consisteva di 691.691 tweet da 8557 account ().

I tweet utilizzati in questa analisi coprono un intervallo di date compreso tra il 4 aprile 2008 e il 15 gennaio 2020. Poco più della metà (54%) dei tweet nel nostro campione si è verificato dopo gennaio 2019, entro circa 1 anno dalla data di raccolta dei dati e Il 69% dei tweet si è verificato entro 2 anni dalla data di raccolta.

?
Figura 1. Procedura di raccolta dei Tweet. T1D: diabete di tipo 1.
Visualizza questa figura

Analisi dei dati

Prima di analizzare i nostri tweet, gli URL sono stati rimossi dal nostro campione di tweet così come i segni di maggiore (>), di minore (<), e commerciale (&) e le lettere “RT”, che denotano la versione classica del retweet. Questi caratteri sono stati rimossi perché non contribuiscono al sentimento di un tweet e spesso non sono gestiti bene dai metodi di elaborazione del linguaggio []. Infine, abbiamo rimosso il set di hashtag inizialmente utilizzato per cercare e identificare i tweet T1D poiché sono sovracampionati nel nostro set di tweet.

Per rispondere alla nostra prima domanda di ricerca (vale a dire, “Qual è il sentimento generale dei post sui social media?”), Abbiamo analizzato il nostro campione di tweet utilizzando l’analisi del sentimento. Questo approccio, noto anche come opinion mining, viene utilizzato per determinare se un determinato testo è positivo, negativo o neutro. Per questo studio, siamo interessati, in media, a quanto sia positivo o negativo il set di tweet di un utente. Possiamo raggiungere questo obiettivo utilizzando il lessico dei sentimenti della ricerca non commerciale (NRC) [], un dizionario dei sentimenti progettato e convalidato con i tweet; questo include un ampio insieme di parole in cui a ciascuna parola è stato assegnato un punteggio per il sentimento positivo/negativo (che varia da –6,93 a 7,53). Questo insieme di parole viene quindi confrontato con le parole nei tweet di un utente, fornendoci un sentimento medio per ciascun utente. Finalmente,

Successivamente, abbiamo risposto alla nostra seconda domanda di ricerca (vale a dire, “Quali sono i principali argomenti di discussione su Internet?”) utilizzando la tecnica di elaborazione del linguaggio naturale di LDA [], un algoritmo di apprendimento automatico non supervisionato che identifica le informazioni sull’argomento latente tra grandi raccolte di documenti . A differenza di altri metodi di modellazione degli argomenti, l’LDA non si concentra sulla frequenza delle parole, ma presuppone piuttosto che un argomento sia costituito da una distribuzione di probabilità di parole. Un argomento è un elenco di parole. Ad ogni parola viene assegnato un valore di probabilità per ogni argomento, che rappresenta la probabilità che la parola venga utilizzata in un documento contenente quell’argomento. LDA assegna a ciascun documento argomenti latenti insieme a un valore di probabilità che ciascun argomento contribuisca al documento complessivo. In questo caso, un documento fa riferimento ai 100 tweet più recenti di un utente.

Analogamente ad altri metodi di riduzione dei dati (ad es. analisi fattoriale), i ricercatori devono scegliere il numero di argomenti latenti da adattare. Abbiamo usato sia la perplessità (un indice quantitativo) che l’interpretabilità soggettiva per decidere quanti argomenti inserire. Perplessitàmisura quanto male un modello di probabilità predice un campione. Più specificamente, la probabilità logaritmica normalizzata di un set di dati di test trattenuto viene utilizzata per determinare quanto sia “sorprendente” il set di test, considerando il modello. Abbiamo adattato molti modelli LDA, ciascuno per un numero diverso di argomenti () e calcolato il punteggio di perplessità per ciascuno. Come al solito, una soluzione LDA con più argomenti comporta una minore perplessità, il che indica una previsione superiore nel nostro modello. Mentre è auspicabile una minore perplessità, è importante anche l’interpretabilità degli argomenti latenti. Mentre un modello a 30 argomenti sembra ideale in termini di utilità predittiva, questo gran numero di argomenti era difficile da interpretare (mostra il modello a 30 argomenti). Abbiamo invece scelto 6 argomenti come nostro modello finale, che sembrava essere una sorta di gomito nella nostra tabella delle perplessità e mostrava argomenti generalmente interpretabili.

Per la nostra terza e ultima domanda di ricerca (vale a dire, “Com’è organizzato il social network degli utenti di Twitter attorno ad argomenti di discussione?”), abbiamo utilizzato l’analisi dei social network []. Qui, abbiamo mappato una rete degli account più seguiti nel nostro campione di tweet, collegando gli account in base al fatto che uno segua l’altro. Abbiamo colorato i nodi (account) in base all’argomento dominante nei loro tweet. A differenza delle precedenti 2 analisi, questo metodo è una rappresentazione più qualitativa dei dati. L’interpretazione di una visualizzazione grafica del social network, in cui i singoli utenti di Twitter, o “nodi”, sono codificati a colori in base al loro argomento più comune è in qualche modo soggettiva. Metodi simili sono stati utilizzati in altre ricerche per mappare i commenti relativi alle organizzazioni di diplomazia pubblica giapponese e coreana [], nonché contributi di siti web relativi al movimento per la sicurezza alimentare negli Stati Uniti []. Insieme, questi metodi forniscono una panoramica di come la comunità si connette e interagisce.

Tutte le analisi sono state preregistrate sull’Open Science Framework []. Twitter vieta la condivisione dei contenuti dei tweet, ma siamo autorizzati a condividere gli ID tweet e gli ID utente per i tweet analizzati qui. Quel file di dati, così come tutto il codice R per queste analisi, può essere trovato su Open Science Framework []. I ricercatori interessati possono utilizzare questi dati per identificare il contenuto del tweet utilizzando l’interfaccia di programmazione dell’applicazione Twitter.

?
Figura 2. Perplessità per il numero di argomenti nei modelli di allocazione di Dirichlet latente. LDA: Allocazione Dirichlet Latente.
Visualizza questa figura

Risultati

Qual è il sentiment generale dei post sui social media?

Il lessico del sentimento NRC [] è stato utilizzato per rispondere alla nostra prima domanda relativa al sentimento generale nel nostro campione di post su Twitter. Il punteggio del sentiment di un utente è la media del punteggio del sentiment delle sue parole in tutti i tweet. In quanto tale, il sentimento degli utenti è indipendente dal numero di volte che il post o dalla lunghezza dei loro post. Il sentiment degli utenti variava da -2,03 a 1,64, con un punteggio medio di 0,052 (Cohen d = 0,32), indicando un sentimento complessivamente leggermente positivo dei tweet degli utenti (). All’interno del nostro campione, il 64% degli utenti ha avuto un sentimento maggiore di zero, il che indica che il sentimento dei propri tweet era più spesso positivo che negativo.

?
Figura 3. Distribuzione del sentiment per il nostro campione di tweet sul diabete di tipo 1.
Visualizza questa figura

Quali sono i principali argomenti di discussione su Internet?

Prima di eseguire l’analisi LDA, abbiamo prima esaminato le parole più popolari nel nostro campione (). Le parole principali includevano indicatori molto espliciti del diabete e strumenti di gestione correlati tra cui diabete, #diabete e insulina. Sebbene queste parole non siano sorprendenti da vedere, servono come indicatore del fatto che il nostro metodo per estrarre i tweet ha avuto accesso alla comunità a cui ci rivolgevamo. Inoltre, abbiamo notato un forte tema di incoraggiamento con parole popolari di amore, sostegno e cura.

Successivamente, abbiamo estratto 6 argomenti utilizzando l’approccio LDA. Per garantire una lunghezza del documento sufficiente, abbiamo aggregato i tweet all’interno degli account per creare un unico documento. Questo ci consente di caratterizzare i contenuti generati da ciascun utente, ma non siamo in grado di disaggregare questi risultati in singoli tweet. Dopo aver estratto gli argomenti, abbiamo esaminato le parole con maggiori probabilità di apparire in ciascun argomento utilizzando una nuvola di confronto (). Successivamente, abbiamo esaminato i tweet degli utenti, che avevano la più alta probabilità di essere assegnati a quell’argomento per ottenere un contesto per le parole più probabili e aiutare a generare descrizioni per ciascun argomento. L’argomento 1 era incentrato sulla crisi dei prezzi dell’insulina, che fa riferimento al drastico aumento dei prezzi dell’insulina dagli anni ’90 e alla richiesta di accesso all’insulina a prezzi accessibili come diritto umano. Questo argomento fa inoltre riferimento a Donald Trump e al suo coinvolgimento con questo movimento. La crisi del prezzo dell’insulina ha rappresentato circa il 19% delle parole in tutti i tweet. Il secondo argomento riguarda la ricerca clinica sul diabete di tipo 1 , incluso il riferimento a studi, rischio, pazienti e trattamento. Questo è incentrato sui nuovi sviluppi nell’area di ricerca degli studi clinici e ha rappresentato il 14% delle parole. Argomento 3 affrontato gestione quotidiana di T1De strumenti in primo piano tra cui una pompa e parole legate all’alimentazione tra cui “zucchero” e “carboidrato”. Questo argomento era il più diffuso, rappresentando il 23% delle parole. Il quarto argomento del nostro modello ha evidenziato i progressi tecnologiciusando parole tra cui “loop”, riferendosi al concetto di un sistema a circuito chiuso o “pancreas artificiale”. Questo metodo di regolazione della glicemia T1D combina un monitor continuo del glucosio e una pompa per insulina per gestire la somministrazione di insulina con un’interazione minima richiesta dal paziente. Questo argomento ha anche utilizzato pesantemente l’hashtag #wearenotwaiting, facendo riferimento a un movimento di coloro nella comunità T1D che stanno prendendo in mano lo sviluppo tecnologico con nuove app e soluzioni basate su cloud che utilizzano i dati sulla salute dei pazienti per informare la gestione della glicemia. Tuttavia, questo argomento era anche tra i meno diffusi, rappresentando solo il 13% delle parole. L’argomento 5 comprende le numerose organizzazioni di sensibilizzazioneche utilizzano Twitter per educare il pubblico sul T1D e sui relativi eventi di raccolta fondi. Questo argomento ha rappresentato il 13% delle parole twittate. Infine, il sesto argomento sembra racchiudere emozioni positivecon parole come “amore” e “felice” e vita al di fuori del T1D usando parole come “guarda”, “corri”, “gioco”, “casa” e “fine settimana” e questo argomento ha rappresentato il 18% di parole. Questo argomento è notevole, soprattutto considerando l’obiettivo di studiare tutti i tweet della comunità T1D e non solo quelli specificamente sul diabete. Nel loro insieme, questi argomenti ci danno una visione ampia degli argomenti chiave discussi su Internet nella comunità T1D (). Abbiamo esaminato la relazione tra i nostri 6 argomenti correlando la probabilità che i tweet di un utente si trovino in un determinato argomento. Le correlazioni sono state negative, variando da –0.12 a –0.26. Una grandezza bassa suggerisce che gli argomenti sono relativamente distinti (cioè non altamente associati), ma anche che poiché gli account includono più contenuti relativi a un argomento, è meno probabile che includano contenuti relativi agli altri.

?
Figura 4. Parole più popolari nel nostro esempio di tweet sul diabete di tipo 1.
Visualizza questa figura
?
Figura 5. Nube di confronto delle parole più probabili da visualizzare in ciascun argomento del nostro modello di allocazione di Dirichlet latente a 6 argomenti.
Visualizza questa figura
Tabella 1. Esempio di tweet per ogni argomento latente.

Argomento latente Esempio di tweet
Crisi del prezzo dell’insulina “Non è colpa mia se l’insulina costa così tanto. Faccio la mia parte di cittadino, lavoro. Ho questi vantaggi. Posso farmi pulire i denti, controllare gli occhi, ma non posso prendere la medicina che tiene in vita me e mia sorella. #insulina4all”
Ricerca clinica “I rapporti di @WNDU sull’innovativo studio di @T1D_TrialNet che hanno mostrato che un farmaco immunoterapico ha ritardato di due anni la diagnosi di diabete di tipo 1. #immunoterapia”
Gestione quotidiana di T1D “I miei zuccheri nel sangue di lunedì e martedì erano BELLISSIMI Oggi i miei zuccheri nel sangue erano spazzatura perché avrei dovuto cambiare il mio sito prima E sto bene con questo. Ecco il tuo promemoria per darti una pacca sulla spalla per i giorni buoni e imparare dai tuoi errori in quelli cattivi!”
Avanzamento tecnologico “Gestire i miei figli mentre dorme negli Stati Uniti mentre è in Costiera Amalfitana! Sono #forevergrato a tutti voi @NightscoutFound @WeAreNotWaiting #wearenotwaiting #tripofalifetime #sohardtoleavehim”
Organizzazioni di sensibilizzazione “Cammina con noi per trasformare il Tipo Uno in Tipo Nessuno. Donando o registrandoti oggi, aiuterai JDRF a creare un mondo senza diabete di tipo 1 (T1D)”
Emozioni positive “Ho trascorso un fine settimana così bello e pieno. Sabato sono andato a fare un giro in macchina fino alla Gold Coast dopo l’allenamento e ho mangiato dell’ottimo cibo vegano da Govindas, poi sono andato a fare una lunga passeggiata sulla spiaggia per riflettere sulla settimana passata”

Come è organizzato il social network degli utenti di Twitter intorno agli argomenti di discussione?

Per affrontare il modo in cui il social network degli utenti di Twitter si è organizzato attorno agli argomenti di discussione, abbiamo utilizzato l’analisi dei social network (). Sebbene sarebbe l’ideale completare questa analisi con tutti gli 8557 partecipanti al nostro campione, ciò non sarebbe fattibile con la potenza di calcolo personale a nostra disposizione. Invece, abbiamo ristretto il nostro campione ai 100 account con il maggior numero di follower. Questo ci ha fornito un campione di account altamente influenti all’interno della comunità basata sul web di T1D per la valutazione. Questi account andavano da 7202 follower a 278.180 follower e abbracciavano una vasta gamma di identità tra cui organizzazioni di ricerca o di sensibilizzazione, personaggi pubblici tra cui attori o cantanti, account incentrati su blog o comunità e medici. Nella nostra analisi dei social network, ogni nodo rappresentava un account Twitter e ogni edge rappresentava un follow. Il colore di ciascun nodo rappresenta l’argomento dominante di ciascun account in corrispondenza del modello LDA a 6 argomenti descritto sopra. L’argomento dominante è stato determinato selezionando l’argomento con la maggiore probabilità per documento per argomento; ovvero, la probabilità di ciascun argomento all’interno dell’insieme di tweet di ciascun account.

?
Figura 6. Analisi dei social network dei primi 100 account più seguiti nel nostro campione di tweet sul diabete di tipo 1. I nodi rappresentano gli account Twitter e i bordi rappresentano i follow. Il colore di ogni nodo rappresenta l’argomento dominante di ogni account in corrispondenza del modello LDA a 6 argomenti.
Visualizza questa figura

La nostra analisi ha mostrato che c’è una notevole quantità di mescolanze tra gli argomenti dominanti nel nostro gruppo di account Twitter influenti. Una possibilità è che vedremmo distinti gruppi di colori nella nostra analisi, indicando che i gruppi stavano principalmente seguendo resoconti che avevano lo stesso argomento dominante del proprio resoconto. Invece, vediamo una notevole sovrapposizione di colori dominanti nella nostra rete di account. Ciò indica che gli account influenti nella comunità basata sul web di T1D vedono una vasta gamma di argomenti sul loro feed Twitter piuttosto che solo l’argomento che domina i loro tweet. È stato osservato che esiste un cluster di argomento 2 ( ricerca clinica ), che rappresenta il centro della nostra rete, indicando che questi account sono i più seguiti all’interno della comunità T1D. Conti conle emozioni positive come argomento dominante raramente appaiono al centro della nostra rete. Sebbene questi account sembrino seguire altri account nella rete, sembrano essere in qualche modo meno integrati. Questa potrebbe essere un’indicazione che, sebbene possano essere membri della comunità basata sul web di T1D, TID potrebbe non essere centrale per la loro identità basata sul web. Anche gli account che twittavano principalmente sui prezzi dell’insulina tendevano a rimanere ai margini della nostra rete e quegli account erano seguiti da pochissimi altri all’interno della nostra rete. La crisi del prezzo dell’insulina colpisce coloro al di fuori della comunità T1D ed è spesso discussa anche dai politici o da coloro che lavorano in settori correlati alle politiche o alle assicurazioni. Infine, abbiamo osservato che all’interno del nostro campione di 100 account più seguiti, la ricerca clinicaera l’argomento dominante più comune (34 resoconti). Seguono le emozioni positive (21), il progresso tecnologico (14), il prezzo dell’insulina (13), la gestione quotidiana del T1D (10) e infine l’ organizzazione (8). Al contrario, la gestione del T1D è stato l’argomento più popolare nel nostro campione completo di 8557 account.

Discussione

Principali risultati

L’attuale studio ha esaminato i tweet e la struttura di rete degli account all’interno della comunità T1D Twitter, dimostrando la fattibilità della modellazione di argomenti latenti come strumento per analizzare l’uso dei social media da parte di questa e altre comunità. Abbiamo identificato diversi argomenti ad ampia larghezza di banda, che vanno dalla clinica alla difesa, alla gestione quotidiana fino alla salute emotiva, che possono informare ricercatori e professionisti interessati ai bisogni delle persone con T1D. Inoltre, l’analisi della rete suggerisce che è probabile che gli utenti vedano un mix di questi argomenti discussi dagli account che seguono.

È importante sottolineare che questi risultati convergono con le precedenti conclusioni sull’impegno basato sul web, come quelle comunità basate sul web che fungono da fonti di emozioni positive [], fornendo supporto pratico [-], sostenendo le necessarie riforme sanitarie [,] e diffondendo i risultati dalla ricerca clinica [,]. Rispetto al lavoro precedente, tuttavia, queste analisi hanno incorporato un numero molto elevato di utenti e hanno utilizzato metodi algoritmici per classificare i messaggi basati sul web. Nonostante si utilizzi una metodologia diversa per selezionare i tweet da includere e per identificare i principali argomenti di interesse, replichiamo il recente lavoro di Ahne et al [], che ha riferito che una delle principali preoccupazioni del DOC Twitter è il prezzo dell’insulina. Abbiamo anche recuperato molti altri argomenti importanti, come la consapevolezza e il supporto del diabete, e le nostre emozioni positivel’argomento potrebbe corrispondere a “godendo lo scambio nella comunità online del diabete” [], sebbene il contenuto dei tweet positivi nei nostri dati sia apparso più tangenziale per il diabete. Tuttavia, una grande divergenza tra questi progetti è stata la scelta del numero di argomenti da estrarre e valutare (6 nei nostri, rispetto a 30). Un numero maggiore di argomenti offre il vantaggio di specificità e sfumature, sebbene vi sia anche una maggiore suscettibilità a tendenze, argomenti di nicchia e coincidenze. Ad esempio, Ahne et al [] hanno trovato tra i loro 30 argomenti una discussione sulla pop star Nick Jonas (a cui è stato diagnosticato il T1D) e pubblicità per un prodotto di trucco chiamato Bloodsugar. Non è chiaro se argomenti come questi siano irrilevanti per gli obiettivi di ricerca di psicologi e clinici o se rappresentino fonti di advocacy e normalizzazione. Il giudizio può essere espresso in base agli argomenti specifici estratti e agli obiettivi di una particolare analisi. Certamente, argomenti di nicchia e di tendenza informano la comprensione delle influenze culturali e della vita interiore delle persone con diabete, ma possono avere un potere predittivo limitato per risultati generali. Parlando in modo più ampio, un numero inferiore di argomenti può essere più generalizzabile e più facile da monitorare nel tempo, sebbene perdano specificità. Diversi numeri di argomenti sono probabilmente utili per diverse domande di ricerca. Ad esempio, la ricerca futura potrebbe includere l’abbinamento delle informazioni di Twitter con i risultati del mondo reale (ad esempio, i livelli di HbA1c) per identificare gli argomenti che prevedono cambiamenti nello stato di salute. argomenti di nicchia e di tendenza informano la comprensione delle influenze culturali e della vita interiore delle persone con diabete, ma possono avere un potere predittivo limitato per risultati generali. Parlando in modo più ampio, un numero inferiore di argomenti può essere più generalizzabile e più facile da monitorare nel tempo, sebbene perdano specificità. Diversi numeri di argomenti sono probabilmente utili per diverse domande di ricerca. Ad esempio, la ricerca futura potrebbe includere l’abbinamento delle informazioni di Twitter con i risultati del mondo reale (ad esempio, i livelli di HbA1c) per identificare gli argomenti che prevedono cambiamenti nello stato di salute. argomenti di nicchia e di tendenza informano la comprensione delle influenze culturali e della vita interiore delle persone con diabete, ma possono avere un potere predittivo limitato per risultati generali. Parlando in modo più ampio, un numero inferiore di argomenti può essere più generalizzabile e più facile da monitorare nel tempo, sebbene perdano specificità. Diversi numeri di argomenti sono probabilmente utili per diverse domande di ricerca. Ad esempio, la ricerca futura potrebbe includere l’abbinamento delle informazioni di Twitter con i risultati del mondo reale (ad esempio, i livelli di HbA1c) per identificare gli argomenti che prevedono cambiamenti nello stato di salute. Diversi numeri di argomenti sono probabilmente utili per diverse domande di ricerca. Ad esempio, la ricerca futura potrebbe includere l’associazione delle informazioni di Twitter con i risultati del mondo reale (ad esempio, i livelli di HbA1c) per identificare gli argomenti che prevedono cambiamenti nello stato di salute. Diversi numeri di argomenti sono probabilmente utili per diverse domande di ricerca. Ad esempio, la ricerca futura potrebbe includere l’abbinamento delle informazioni di Twitter con i risultati del mondo reale (ad esempio, i livelli di HbA1c) per identificare gli argomenti che prevedono cambiamenti nello stato di salute.

Riteniamo che l’attuale ricerca dimostri l’utilità del metodo LDA per l’utilizzo dei dati dei social media negli studi sul diabete di tipo I e più in generale per i pazienti con malattie croniche. Infatti, queste analisi potrebbero essere facilmente applicate ad altre comunità semplicemente cambiando le parole chiave iniziali e la ricerca hashtag. Attraverso un software open source, siamo stati in grado di analizzare quasi 700.000 tweet da più di 8000 account. Data la fattibilità di queste analisi, prevediamo che potrebbero essere utilizzate per diversi scopi. Semplici adattamenti del nostro codice consentiranno lo studio di altre comunità di persone con condizioni croniche (ad esempio, sopravvissuti al cancro o condizioni autoimmuni). In alternativa, collegando Twitter ad altre forme di raccolta dati (ad es.

Limitazioni

Tuttavia, questi metodi non sono privi di limitazioni. Contrariamente ai metodi di elaborazione del linguaggio naturale sviluppati più di recente, l’LDA non si basa sull’incorporamento di parole e non tiene conto della struttura della frase in quanto presuppone che le parole siano scambiabili. Inoltre, non si può sostenere che gli utenti di Twitter siano rappresentativi degli Stati Uniti o della popolazione mondiale, né ci aspettiamo che siano rappresentativi di tutte le persone con T1D. Ci aspettiamo di avere sottocampionato gli anziani [] e le comunità con accesso a Internet limitato o inaffidabile, e ci sono problemi previsti con il campionamento relativi alla geografia e alla razza/etnia []. In particolare, tuttavia, i neri possono essere più rappresentati su Twitter (rispetto ad altri gruppi etnici) [], creando un vantaggio nell’utilizzo di questa piattaforma in quanto i ricercatori possono raggiungere le popolazioni tipicamente svantaggiate. Più specifico per questa popolazione, il nostro metodo di selezione dei partecipanti allo studio sulla base del contenuto dei loro 100 tweet più recenti non catturerà gli utenti di Twitter che scelgono di non rivelare il loro stato T1D su Internet. Questa esclusione non è probabilmente rilevante per la domanda di ricerca: “Qual è il focus e la struttura di rete delle comunità online sul diabete?” poiché questi utenti non parteciperebbero a queste comunità. “Qual è il focus e la struttura di rete delle comunità online sul diabete?” poiché questi utenti non parteciperebbero a queste comunità. “Qual è il focus e la struttura della rete delle comunità online sul diabete?” poiché questi utenti non parteciperebbero a queste comunità.

Conclusioni

In sintesi, l’attuale studio contribuisce a una crescente letteratura sull’esame dell’uso dei social media da parte di persone con condizioni croniche; in questo caso, T1D. Questi risultati mostrano che i ricercatori sanitari possono sfruttare la grande quantità di dati disponibili su Twitter (e potenzialmente su altre piattaforme) per comprendere in modo efficiente le principali preoccupazioni di queste popolazioni. Inoltre, questi risultati supportano il lavoro precedente che mostra che le persone con condizioni croniche possono utilizzare i social media per accedere a informazioni pratiche e supporto sociale.

Sostienici con un acquisto o donazione

?A cura di K Mizokami-Stout; presentata il 27.05.21; recensito da A Garrity, A Ahne; commenti all’autore 24.07.21; versione rivista ricevuta il 19.08.21; accettato 24.08.21; pubblicato il 15.10.21

©Cianna Bedford-Petersen, Sara J Weston. Pubblicato originariamente su JMIR Diabetes (https://diabetes.jmir.org), 15.10.2021.

Questo è un articolo ad accesso aperto distribuito secondo i termini della Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0/), che consente l’uso, la distribuzione e la riproduzione senza restrizioni con qualsiasi mezzo, a condizione che l’originale lavoro, pubblicato per la prima volta su JMIR Diabetes, è correttamente citato. La pubblicazione originale è accessibile su https://diabetes.jmir.org/, nonché queste informazioni sul copyright e sulla licenza.

Sostienici con un acquisto o donazione
Sostienici con un acquisto o donazione