Lead scoring AI-val — prioritizálás 2026-ban
A lead scoring nem új téma. 15 éve csinálják a Salesforce-féle scoring rule-okkal: ha email-domain education TLD, +10 pont. Ha pricing oldalra látogatott, +20. Ennek a megközelítésnek volt egy fő gyengesége: a szabályokat emberek írták, és emberek nem skáláznak. A Nortinia Sales AI scoring modulja ML-alapú — de nem dobtuk el a heurisztikákat sem, csak más szerepet adtunk nekik.
A 14 feature
A model bemenete 14 feature, mindegyik az enrichment outputjából vagy historikus touch-adatokból származik:
- Ipar (NACE kód, ha kinyerhető)
- Méret (becsült alkalmazotti létszám, 0-50 / 50-200 / 200-1000 / 1000+)
- Recent funding (utolsó 12 hónap)
- Website tech stack (modern vs. legacy)
- Email pattern (firstname.lastname vs. info@ — különböző érettségi jel)
- Pricing transparencia (publikus ár vs. "contact us")
- Földrajzi reach (EU only, EMEA, global)
- Korai termékérettség (changelog frissesség, blog cadence)
- Sales team mérete (LinkedIn search proxy)
- Recent news sentiment (acquisition pletyka, leépítés, terjeszkedés)
- Tech-stack overlap velünk (ha pl. Nortinia Engine-kompatibilis stacket használ)
- Engagement signal (ha valaha látogatott website-ra)
- Referral signal (ha másik ügyfél által ajánlott)
- Vertical fit (tenant-konfigurált ICP-vel való hasonlóság)
A modell
LightGBM gradient-boosted trees. 8 000 historikus labeled példán tanult — minden példa egy lead, amelynek lezárult az életciklusa (vagy konvertált, vagy bevallottan elveszett). A label binary: konvertált igen / nem.
Miért gradient boosting és nem mély háló: az adat kicsi (10k nagyságrend), a feature-ök elsősorban kategorikus / numerikus, és a fontos: minden döntés magyarázható. Egy SHAP-érték értéssel tudjuk mondani egy adott lead-re: "ez azért lett 73 pontos, mert a méret +18, a tech-stack +12, de a no-pricing -7". Sales rep-nek ez kommunikálható.
LLM re-rank
A modell-pontszám 0-100 közötti. A határsávban (60-65) az LLM (gpt-4.1-mini) kap egy strukturált promptot: lead-feature-ök + 2-3 hasonló korábbi lead a tanító setből, és egy javasolt nudge fel vagy le, maximum ±5 pont. Ez nem felülbírálja a modellt, csak finomítja a sávhatáron.
Miért csak itt és nem mindenhol: minden lead-re LLM hívás 1 420 / hét × 0,01 USD = 14 USD / hét, ami nem sok. De a modell maga 95%-os agreement-en van a humán labellerrel a stable zónákban — az LLM csak a határsávban ad értéket. Pareto-elv.
Drift detector
A modell havonta egyszer újratanul, de erre csak akkor van szükség, ha drift van. A drift detektor két dolgot figyel:
- Input drift: a 14 feature eloszlása összehasonlítva a tréning sethez. KL-divergencia, küszöb 0,15.
- Output accuracy: a lead-eken, amelyeknek lezárult az életük, mennyi a model accuracy-je. Küszöb: 5 százalékpontos esés a baseline-tól.
Ha bármelyik triggerel, automatikus retraining indul. Az új modellt egy shadow rétegben futtatjuk először (érintetlen production score, csak megfigyelés), és csak 200 lead után promotáljuk, ha a metrika javul.
Eredmény
Egy közepes tenantnál mért szám hat hónap után:
- Top 20% (A+B bucket): 41% konverzió
- Maradék 80%: 12% konverzió
- Random baseline (score nélkül): 18% konverzió
A scoring 2,3x-ra emelte a top-bucket konverziót a baseline-hoz képest, és a sales rep idejét 4,2x hatékonyabbra tette (mivel a magas pontszámú lead-ekre fókuszálnak).
Mit nem teszünk be a modellbe
- Etnikai vagy nem-jelek — szándékosan nem feature
- Személyes adatok (lakcím, telefon) — csak company-szintű feature
- Versenytárs-touch history ("már beszélt a versenytárssal") — túl könnyen félre lehet érteni a sales rep oldalán
Ez nem csak compliance kérdés. A modell akkor megbízható, ha érti, miért dönt — és minél kevesebb morálisan terhelt feature van benne, annál jobban értjük.
A drága hiba: első hat hét
Az első modell-verzió tartalmazott egy "ország" feature-t. A label adathalmaz aránytalanul nagy részben volt nyugat-európai, és a modell automatikusan lehúzta a kelet-európai lead-eket. Egy közép-európai tenant 3 hét múlva panaszkodott, hogy az ő hazai piacát "alábecsüljük". Igaza volt. Levettük a feature-t, retrain, és azóta egyik geo sem aránytalanul büntetve. Tanulság: a feature-választás moralizál.