Skip to content

Costruire curva roc con excel

Febbraio 22, 2024
Costruire curva roc con excel

Roc analizi excel

In effetti, se la soglia è troppo bassa, considereremo troppe persone nella categoria “malattia”, e la sensibilità del test è eccellente. Tuttavia, la specificità di questo test è molto negativa perché molti di questi soggetti sono “falsi positivi” e saranno erroneamente inclusi in una serie di trattamenti medici.

Al contrario, una soglia troppo alta conferisce al test una buona specificità (poche persone sane sono incluse nella categoria “malattia”), ma la sensibilità è pessima perché il test lascia fuori molti soggetti che hanno effettivamente la malattia e che non saranno inclusi in serie di trattamenti medici mentre ne hanno bisogno.

La soglia migliore per un test medico è il valore per il quale sensibilità e specificità sono le più alte allo stesso tempo, cioè un test in grado di rilevare il massimo numero di pazienti che hanno la malattia e di lasciare il massimo numero di pazienti sani.

È necessario specificare come vengono identificati i soggetti affetti dalla malattia studiata e i soggetti sani, quindi selezionare l’intervallo di celle relative alla variabile “Malattia” e l’intervallo di celle relative alla variabile “Diagnosi” o “Test medico”.

Analisi Roc spss

Questo corso vi preparerà a progettare e implementare modelli predittivi realistici basati sui dati. Nel progetto finale (modulo 6) assumerete il ruolo di analista di dati aziendali per una banca e svilupperete due diversi modelli predittivi per determinare quali richiedenti di carte di credito dovrebbero essere accettati e quali rifiutati. Il primo modello si concentrerà sulla minimizzazione del rischio di insolvenza e il secondo sulla massimizzazione dei profitti della banca. I due modelli dovrebbero dimostrare in modo pratico e pratico l’idea che la scelta della metrica aziendale determina la scelta di un modello ottimale.

  Archivio estrazioni lotto 2017 excel

La seconda grande idea che questo corso vuole dimostrare è che i risultati dell’analisi dei dati non possono e non devono mirare a eliminare tutta l’incertezza. Il vostro ruolo di analisti dei dati è quello di ridurre l’incertezza per i responsabili delle decisioni di un incremento economicamente valido, quantificando al contempo l’incertezza rimanente. Imparerete a calcolare e ad applicare ad esempi reali le più importanti misure di incertezza utilizzate nel mondo degli affari, tra cui i tassi di errore di classificazione, l’entropia dell’informazione e gli intervalli di confidenza per la regressione lineare.

Esempio di curva Roc

ROC è l’acronimo di Receiver Operating Characteristic. Si tratta di un metodo statistico sviluppato durante la Seconda Guerra Mondiale per analizzare le prestazioni di un operatore radar. Gli operatori radar dovevano guardare lo schermo del radar e analizzare se un punto rappresentava un aereo nemico o solo un rumore casuale. Molto più tardi, negli anni ’80, quando i farmaci venivano sviluppati su larga scala, la stessa curva (ROC) veniva utilizzata per misurare le prestazioni di un farmaco per la cura delle malattie.

  Ordinare numeri in ordine crescente excel

Creare una curva ROC in Excel è facile se si dispone degli strumenti giusti. Tuttavia, noi lo faremo nel modo più difficile, partendo da zero. È un po’ faticoso, ma lo scopo è capire il concetto di ROC. Se vi sembra eccessivo, potete passare alla sezione in cui interpretiamo la curva ROC e realizziamo la curva ROC in Python.

Per ridurre ulteriormente i punti dati, utilizziamo le parentesi della lunghezza dei sepali al posto dei dati grezzi. Ad esempio, qui abbiamo creato 6 parentesi (di lunghezza del sepalo) e per ognuna di esse abbiamo contato le occorrenze della specie. Consideratela come una versione compressa dell’intero set di dati.

Come disegnare la curva roc in excel

Le curve ROC sono state sviluppate per la prima volta durante la Seconda Guerra Mondiale per mettere a punto mezzi efficaci di rilevamento degli aerei giapponesi. In seguito è stata applicata più in generale al rilevamento dei segnali e alla medicina, dove è ora ampiamente utilizzata.

  Registro merci in conto deposito excel

Il problema è il seguente: si studia un fenomeno, spesso binario (ad esempio, la presenza o l’assenza di una malattia) e si vuole sviluppare un test per rilevare efficacemente il verificarsi di un evento preciso (ad esempio, la presenza della malattia).

Se il test è quantitativo (possibilmente ordinale), ad esempio la concentrazione di una molecola, cercheremo di determinare a partire da quale concentrazione un paziente può essere considerato malato. Le curve ROC e gli indici calcolati ci aiuteranno a prendere la decisione migliore.

Selezioniamo quindi i dati che corrispondono al test diagnostico che stiamo valutando e specifichiamo il tipo di regola da utilizzare per identificare il valore soglia al di sotto o al di sopra del quale il test deve essere considerato positivo.

La prima tabella mostra le statistiche descrittive per la variabile del test, qui la concentrazione, seguita dalle statistiche per la variabile dell’evento, qui la malattia. La prevalenza osservata sul campione è pari a 0,4.