Marketing · Clustering
Segmentazione Clienti
Segmentazione Clienti
per E-Commerce
Sistema di customer segmentation end-to-end per e-commerce: analisi RFM, normalizzazione, clustering KMeans e visualizzazione PCA. Output direttamente integrabile in CRM e piattaforme di marketing automation.
KMeans
PCA
Python
RFM Analysis
Scikit-learn
4Cluster
5.2kClienti analizzati
0.68Silhouette Score
87%Varianza spiegata PCA
Visualizzazione PCA — 4 cluster clienti
Profilo dei segmenti
🏆
Champions
Alta frequenza, alto valore. Ultimi acquisti recenti. Target ideale per programmi fedeltà premium e referral.
18% dei clienti · 42% del fatturato
💎
Loyal
Acquistano regolarmente. Valore medio. Ottimo target per upselling e cross-selling.
29% dei clienti · 31% del fatturato
⚠️
At Risk
Un tempo attivi, ora inattivi da 3-6 mesi. Necessitano campagne di re-engagement personalizzate.
31% dei clienti · 19% del fatturato
💔
Lost
Inattivi da oltre 12 mesi. Basso valore storico. Win-back con offerte aggressive o eliminazione dalla lista.
22% dei clienti · 8% del fatturato
Snippet chiave
from sklearn.cluster import KMeans
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
# RFM features + normalizzazione
scaler = StandardScaler()
X_scaled = scaler.fit_transform(rfm[['Recency', 'Frequency', 'Monetary']])
# KMeans con k ottimale (elbow method → k=4)
kmeans = KMeans(n_clusters=4, init='k-means++', random_state=42)
rfm['Cluster'] = kmeans.fit_predict(X_scaled)
# PCA per visualizzazione 2D
pca = PCA(n_components=2)
coords = pca.fit_transform(X_scaled) # 87% variance explained
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
# RFM features + normalizzazione
scaler = StandardScaler()
X_scaled = scaler.fit_transform(rfm[['Recency', 'Frequency', 'Monetary']])
# KMeans con k ottimale (elbow method → k=4)
kmeans = KMeans(n_clusters=4, init='k-means++', random_state=42)
rfm['Cluster'] = kmeans.fit_predict(X_scaled)
# PCA per visualizzazione 2D
pca = PCA(n_components=2)
coords = pca.fit_transform(X_scaled) # 87% variance explained
Risultati e applicabilità
Il Silhouette Score di 0.68 conferma cluster ben separati e coerenti. I 4 segmenti identificati coprono l'intero ciclo di vita del cliente, dal più prezioso al più a rischio.
La pipeline è progettata per essere replicabile su qualsiasi database transazionale e-commerce, con output compatibile con i principali CRM (HubSpot, Salesforce) per attivazione immediata delle campagne per segmento.