Ca exemplu ilustrativ, rezolv?m problema de clasificare a modului de transport pe baza vârstei ?i venitului de c?tre LDA în R.
Acest lucru se poate face cu u?urin?? prin func?ia „lda” din biblioteca „de mas?”. Pentru toat? analiza prezentat? aici, va trebui s? instal?m ?i s? înc?rc?m urm?toarele pachete R:

Datele studiate vin într-un fi?ier csv (numit „transnpor_example”), care poate fi importat cu u?urin?? în R rulând aceast cod:

Pentru a avea o prim? impresie asupra datelor, putem reprezenta un grafic e?antionul sub forma unui grafic de dispersie ca:

Codurile de mai sus produc graficul de dispersie prezentat în sec?iunea introductiv? a celui de-al treilea document.
Alternativ, am putea reprezenta datele ca o serie de histograme ca:

Prin rularea oric?reia dintre aceste dou? linii, putem avea o idee despre modul în care modul de transport se distribuie între valorile legate de vârst? ?i venit.
De exemplu:

Or:

LDA se realizeaz? pur ?i simplu rulând:

Rezultatele clasice arat? mediile ini?iale pe grupe, coeficien?ii din proiec?iile LD ?i propor?ia dintre varian?a (urm?) pe care o explic? fiecare coordonat? LD:

În exemplul nostru, prima coordonat? LD este corelat? pozitiv cu venitul ?i negativ cu vârsta ?i con?ine aproape 90% din variabilitatea dintre clase.
A doua func?ie LD prezint? o corela?ie pozitiv?, dar mai slab?, cu ambele variabile ?i reprezint? doar aproximativ 10% din variabilitatea între variabile.
Noile coordonate sunt produse proiectând punctele de date originale cu coeficien?ii LDA prin expresia ???.
În aceste noi coordonate, observa?iile sunt mai clar separate între grupuri.
În exemplul nostru, avem dou? coordonate LD pentru fiecare individ, având în vedere vârsta ?i venitul acestuia.
Coordonatele corespunz?toare primei func?ie LD au puterea discriminant? mai mare.
Putem vedea cu u?urin?? aceast? putere discriminant? prin trasarea în R a unei histograme, punând acum primele coordonate LD în axa orizontal?:

Ob?inând:

Acest grafic arat? modul în care cantitatea de suprapunere se reduce considerabil.
Cu alte cuvinte, prima coordonat? LD (re?ine?i c? este un „compozit” care se coreleaz? negativ cu vârsta ?i pozitiv cu venitul) discrimineaz? în mod adecvat între categoriile de transport.