Dubbio calcolo probabilità per Data Mining
Inviato: 12 nov 2010, 0:43
Ciao a tutti. Sto avendo alcuni problemi a formalizzare l'azione di un disturbo su un set di elementi. Mi spiego meglio: supponiamo che "I" sia un insieme universo di oggetti, I={A,B,C,D,E} e che sia definito un insieme di alcuni suoi sottogruppi (o transazioni come vengono chiamate in Data Mining), ad esempio K=( {A,B,C}, {A,D}, {E}, {A,B,D} ). Una richiesta classica dei problemi di data mining è di calcolare il supporto di un certo elemento (ad esempio {A,D}) in K, ossia la quantità di volte che questo elemento compare all'interno delle transazioni in relazione al numero totale di transazioni(ad esempio per {A,D}, riferendosi a K, è 2/4). Il mio problema è il seguente: supponendo di avere un insieme di sottogruppi K0 identico a K, ma in cui ogni elemento (lettera) ha una probabilità 'p' (uguale per tutti) di venire eliminato, come posso trovare una relazione che mi permetta di calcolare il supporto di {A,D} nel nuovo insieme? Ad intuito il nuovo supporto sarà minore, e legato sia alla probabilità p sia alla dimensione dell'elemento da ricercare, ma la formalizzazione matematica mi sfugge. Consigli o suggerimenti?