איך לעשות A/B Testing במרקטינג אוטומיישן: המדריך המעשי לשיפור תוצאות.
- Gil Kochavi
- 12 בפבר׳
- זמן קריאה 8 דקות
עודכן: 4 במאי
ארגונים צומחים, לומדים להביא יותר תוצאות ממה שכבר קיים. פה בדיוק נכנס ה A/B Testing לתמונה.
אם אתם רוצים לשפר את פעילות ה-Marketing Automation שלכם — התחילו כאן
שאלה שאני שומע הרבה: "יש לנו כלי מרקטינג אוטומיישן פעיל , מה עושים עכשיו כדי לשפר את התוצאות?"
התשובה שלי עקבית: תתחילו עם A/B Testing.
לא כי זה הכי מרשים. כי זה הכי שיטתי, הכי מהיר להשפיע, והכי קל ליישום עם כלי Marketing Automation קיים.
מה זה A/B Testing?
לאלו שלא מכירים, A/B Testing (בדיקת A/B) היא מתודולוגיה שבה מחלקים אוכלוסייה לשתי קבוצות אקראיות ושוות. קבוצה A שמקבלת גרסה אחת של תיקשור, וקבוצה B שמקבלת גרסה שונה - כדי לבחון בצורה מבוקרת איזו גרסה מניבה תוצאות טובות יותר.
העיקרון הבסיסי: שינוי משתנה אחד בכל פעם, כדי שאפשר יהיה לייחס את ההבדל בתוצאות בוודאות לאותו משתנה ספציפי.
למה זה קריטי בשיווק פרסונלי? כי ה"אמת" אצל הלקוחות שלכם לא תמיד תואמת לאינטואיציה שלכם. אני ראיתי שוב ושוב מצבים שבהם הגרסה שכולם היו בטוחים שתנצח - הפסידה. הדאטה הוא זה שמנצח, לא הדעה.
למה A/B Testing הוא ה-Quick Win הכי משמעותי במרקטינג אוטומיישן?
השפעה על Top of Funnel - שם נמצאים רוב הלקוחות
הוא משפיע בעיקר על מדדי Top of Funnel: שיעורי פתיחה, הקלקה, ותגובה ראשונית. אלה המדדים שמגדירים כמה לקוחות בכלל נכנסים למשפך.
ולמה זה חשוב כל כך? כי שיפור ב-Top of Funnel מכפיל את עצמו לאורך כל המשפך:
שיעור פתיחה | שיעור הקלקה | לקוחות שמגיעים לדף |
20% (baseline) | 5% | 100 לקוחות מתוך 10,000 |
25% (+5%) | 5% | 125 לקוחות - גידול של 25% |
20% | 6.5% (+1.5%) | 130 לקוחות - גידול של 30% |
"כל שיפור של חצי אחוז משפיע על שורת ההכנסה" - זו לא סיסמה. כשיש לכם מסה של עשרות אלפי לקוחות, חצי אחוז שיפור בהמרה שווה לעיתים מאות אלפי שקלים בשנה.
הכלים כבר שם
כמעט כל כלי ה-Marketing Automation המודרניים שאני מכיר, מכילים יכולות A/B Testing מובנות.
לא צריך לבנות כלום מאפס. צריך רק להפעיל.
שלושת תחומי ה-A/B Testing שמניבים הכי הרבה ערך
תחום 1: מסרים (Messaging)
זה המקום הכי קל להתחיל בו -ולרוב גם הכי משמעותי.
שורת הנושא של המייל (Subject Line) זה האלמנט שמשפיע הכי הרבה על שיעור הפתיחה. כמה אחוז הפרש בין שורת נושא טובה לגרועה? מניסיוני -5-15%. זה משמעותי
מה בודקים בשורת הנושא:
מחיר vs. ערך: "20% הנחה על חידוש הביטוח שלכם" לעומת "הגנה מלאה לרכב שלכם -במחיר שמפתיע"
דחיפות: "ההצעה תקפה עד מחר בלבד" לעומת "בדקו את המסלול החדש שלנו"
אישי vs. כללי: "דוד, יש לנו הצעה בשבילך" לעומת "הצעה מיוחדת לחברי הקהילה"
שאלה vs. הצהרה: "האם ידעתם שאתם יכולים לחסוך 30%?" לעומת "חסכו 30% על חידוש הפוליסה"
גוף המייל
סדר המסרים -האם ה-CTA ראשון או אחרון?
אורך הטקסט -קצר וממוקד לעומת מפורט עם הסברים
תמונה ביחס לטקסט בלבד
כפתור ה-CTA -ניסוח, צבע, מיקום
תחום 2: קהלים (Audiences)
לא כל המסרים עובדים על כל הקהלים. A/B Testing על קהלים עוזר לבנות מפה של רלוונטיות -איזה מסר מתאים למי.
סגמנטציה בסיסית לבדיקה:
לפי ותק: לקוחות חדשים (0-6 חודשים) לעומת לקוחות ותיקים (2+ שנים)
לפי אחזקות במוצרים: לקוחות עם מוצר אחד מול לקוחות עם כמה מוצרים.
לפי רמת מעורבות: לקוחות פעילים (פתחו 3 מיילים אחרונים) לעומת לקוחות רדומים
סגמנטציה מתקדמת:
לפי שלב במסע הלקוח: Lead >> Trial >> Active >> At-Risk >> Churned
לפי ערך לקוח (CLV): לקוחות High Value לעומת Low Value
לפי התנהגות דיגיטלית: ביקרו בדף מוצר X לעומת לא ביקרו
חשוב: שלבו בדיקת קהלים עם בדיקת מסרים. קהל A + מסר 1 לעומת קהל A + מסר 2 -תגלו שהמסר המנצח שונה לפי קהל.
תחום 3: ערוצים וסדר פנייה (Channel Mix)
לא כל לקוח מגיב לאותו ערוץ. A/B Testing על ערוצים הוא אחד הכי קשים לביצוע -אבל גם אחד הכי בעלי ערך.
זה Benchmark שכדאי להכיר:
ערוץ | שיעור פתיחה / השגה ממוצע | חוזקה | חולשה |
מייל | 20-35% פתיחה | עשיר בתוכן, זול, ניתן למדידה | מתחרה על תשומת לב, אתגר האינבוקס. |
SMS | 85-98% נקרא | הגעה גבוהה, מיידי | מוגבל ב-160 תווים, יקר יחסית |
70-90% נקרא | אישי, rich content | יקר. דורש opt-in, שימוש לא נכון עלול להביא לסגירת החשבון | |
פוש (אפליקציה) | 5-15% קליק | מיידי, פרסונלי | דורש אפליקציה + הרשאה |
שיחת מוקד | 40-65% השגה | אנושי, יכולת שכנוע גבוהה | יקר, לא ניתן לסקייל |
מה בודקים:
ערוץ ראשון ביחס לערוץ שני: מייל תחילה >> SMS למי שלא פתח. לעומת SMS תחילה >> מייל.
תזמון: האם שליחה בבוקר עדיפה על צהריים? ראשון על רביעי?
תדירות: שני מגעים בשבוע לעומת אחד -מה משפיע על unsubscribe ועל המרה?
איך עושים A/B Testing נכון -מתודולוגיה מעשית
שלב 1: הגדירו שאלת מחקר ברורה
לפני שמריצים -ענו על השאלה: "אנחנו מאמינים ש-[שינוי X] יגרום ל-[תוצאה Y] כי [סיבה Z]."
לדוגמה: "אנחנו מאמינים ששורת נושא עם שם הלקוח תגביר את שיעור הפתיחה ב-10%+ כי תגרום למסר להרגיש אישי יותר."
שאלת מחקר ברורה מונעת "data fishing" -חיפוש מדד שמוכיח מה שרצינו להוכיח.
שלב 2: הגדירו מדד הצלחה יחיד (Primary KPI)
בדיקה אחת -מדד אחד. שיעור פתיחה, או שיעור הקלקה, או המרה. לא שלושתם ביחד.
כשמודדים הכל -לא לומדים כלום.
שלב 3: חשבו נפח מינימלי (Statistical Significance)
הטעות הכי נפוצה: הפסקת הבדיקה אחרי 200 שליחות ו"הכרזה על מנצח".
כדי שתוצאה תהיה סטטיסטית מובהקת (95% confidence), צריך נפח מינימלי. הכלל הבסיסי:
לשיעורי פתיחה: מינימום 1,000 שליחות לכל קבוצה
לשיעורי הקלקה: מינימום 2,000-5,000 שליחות לכל קבוצה
להמרות: עשרות אלפים -תלוי בשיעור ההמרה הבסיסי
כלי מרקטינג אוטומיישן עם יכולות מתקדמות, מחשבים Statistical Significance אוטומטית -השתמשו בזה.
שלב 4: הריצו את הבדיקה עד לסיומה
טעות נפוצה נוספת: עצירת הבדיקה כשרואים מגמה מעודדת. זה "Peeking Problem" -בדיקה שנעצרה מוקדם מדי מייצרת תוצאות מוטות. הגדירו מראש תאריך סיום -ועמדו בו.
שלב 5: תעדו, למדו, יישמו -ובדקו שוב
כל בדיקה שמסתיימת היא נכס ידע. תעדו: מה בדקתם, מה היתה שאלת המחקר, מה יצא, ומה אתם עושים עם זה. בנו "ספריית A/B Tests" שמצטברת לאורך זמן. זה מה שמבדיל ארגונים לומדים מארגונים שחוזרים על אותן טעויות.
עקרונות:
תפיסה זו, של ניסוי וטעייה צריכה להיות ״דרך חיים״ בשיווק פרסונלי.
צריך לעשות את זה כל הזמן ולהקדיש משאבים גם חשיבה וגם לביצוע.
החיבור של הדאטה לתוכן ולערוצים בכלי המרקטינג אוטומיישן, מאפשר זה לעשות זה די בקלות.
גם האוטומציה מסייעת רבות וחלק לא מבוטל מהכלים מכילים יכולות A/B Testing מובנות, כך שנותר לכם רק להפעיל.
למה זה חשוב:
כי זה בד״כ משפיע על מדדי Top Of Funnel. ההשפעה באה לידי ביטוי על היקף גבוה יותר של לקוחות מה שבד״כ בא לידי ביטוי בשיפור היקף הלקוחות הממירים.
ארגונים מבוססי דיגיטל משקיעים בזה המון משאבים. גם ברמה הטכנולוגית, אנליטית ותהליכית.
כל שיפור של חצי אחוז משפיע על שורת ההכנסה.
מה ההבדל בין A/B Testing ל Multivariate Testing - ומתי להשתמש בכל אחד?
א. A/B Testing: בודק גרסה אחת מול גרסה אחת. שינוי משתנה יחיד. מתאים לרוב הארגונים ולרוב המקרים.
ב. Multivariate Testing (MVT): בודק שילובים מרובים בו-זמנית. לדוגמה: 2 שורות נושא × 2 תמונות × 2 CTA = 8 גרסאות. מאפשר להבין אינטראקציות בין משתנים.
מתי להשתמש ב-MVT? רק כשיש לכם נפח גדול מאוד (מאות אלפי שליחות לפחות) וכשאתם שולטים היטב בA/B Testing בסיסי. עבור רוב הארגונים -A/B Testing פשוט הוא הנכון.
השינוי שמגיע - GenAI ו-A/B Testing
הGenAI מתחיל לשנות את הגישה הקלאסית ל-A/B Testing בשלושה אופנים:
1. ייצור אוטומטי של וריאנטים במקום להמציא 2 גרסאות ידנית, מודלי GenAI יכולים לייצר 10, 20, 50 גרסאות שונות של שורת נושא -ולתת לאלגוריתם לבחור את המנצח. זה Multi-Armed Bandit approach לעומת A/B Testing קלאסי.
2. פרסונליזציה ברמת הפרט במקום A/B Testing שבוחר "גרסה מנצחת לכולם" -GenAI מאפשר להגיש לכל לקוח את הגרסה שהכי מתאימה לו ספציפית, בהתבסס על פרופיל. זה מוריד את הצורך ב-A/B Testing קלאסי לטובת real-time personalization.
3. ניתוח תוצאות אוטומטי כלים חדשים מאפשרים ל-AI לנתח תוצאות A/B Tests ולהציע שאלת מחקר לבדיקה הבאה - על בסיס מה שלמד מהבדיקות הקודמות.
המסקנה: A/B Testing קלאסי עדיין רלוונטי ואפקטיבי -אבל ארגון שמשלב אותו עם יכולות GenAI, מאיץ את קצב
הלמידה פי כמה.
גילוי נאות: הטכנולוגיה בתחילת דרכה כמו גם קצב האימוץ גם בהטמעה בתוך הכלים וגם בארגון.
אבל... קצב ההתפתחות מהיר. מאוד.
הטעויות הנפוצות ב-A/B Testing -ואיך נמנעים מהן
טעות 1: בדיקת יותר מדי משתנים בו-זמנית "בואו נשנה את שורת הנושא, התמונה, ה-CTA, והצבעים ביחד." התוצאה: אם יש הבדל -לא תדעו מה גרם לו.
פתרון: שנו משתנה אחד בכל פעם.
טעות 2: נפח קטן מדי "בדקנו 150 שליחות ו-A ניצחה." 150 שליחות הן לא מספקות לאף מסקנה סטטיסטית.
פתרון: חשבו נפח מינימלי לפני שמתחילים.
טעות 3: עצירה מוקדמת "ראינו ש-B מובילה אחרי יומיים, אז הפסקנו." ייתכן שמדובר ב-random variation.
פתרון: הגדירו מראש תאריך סיום ואחוז confidence נדרש.
טעות 4: בדיקה לא בו-זמנית שליחת גרסה A בשבוע אחד וגרסה B בשבוע הבא -זו לא בדיקה הוגנת. גורמים חיצוניים (ימי שבוע, אירועים, מזג אוויר) משפיעים.
פתרון: שלחו שתי הגרסאות תמיד בו-זמנית.
טעות 5: אין תיעוד בדיקה שלא מתועדת -היא בדיקה שאבדה.
פתרון: בנו log פשוט עם: תאריך, שאלת מחקר, משתנה שנבדק, תוצאה, מסקנה.
שאלות נפוצות
כמה A/B Tests כדאי להריץ במקביל?
תלוי בנפח הקהל. ארגון עם מאות אלפי לקוחות -יכול להריץ מספר בדיקות מקבילות על סגמנטים שונים. ארגון קטן יותר -עדיף בדיקה אחת ממוקדת בכל פעם.
מה עושים כשאין "מנצח ברור"?
תוצאה לא מובהקת היא גם תוצאה. היא אומרת שהשינוי שבדקתם לא משמעותי לקהל שלכם. לפעמים זה valuable insight. המשיכו לבדיקה הבאה.
האם A/B Testing מתאים גם למסעות לקוח (Journeys) ולא רק לשליחות חד-פעמיות?
בהחלט. אפשר לבדוק זמן ההמתנה בין שלבים, סדר המסרים, ואפילו ערוצים שונים בנקודות שונות במסע. זה מתקדם יותר, אבל אפשרי עם כלי MA מודרני.
מה עדיף לבדוק קודם -subject line או תוכן המייל?
שורת נושא תמיד קודם. הסיבה: שיעור הפתיחה הוא ה-gate הראשון -אם לא פותחים, כל שאר התוכן לא רלוונטי. אחרי שיש suשורת נושא מנצחת - עברו לתוכן.
לסיכום: A/B Testing הוא לא פיצ'ר -הוא תרבות
תפיסה של ניסוי, מדידה ולמידה צריכה להיות דרך חיים בשיווק פרסונלי. לא פרויקט חד-פעמי. לא "נעשה את זה כשיהיה זמן".
ארגונים מבוססי דיגיטל מובילים - כמו אמזון, נטפליקס, Booking.com -מריצים מאות A/B Tests בו-זמנית. הם לא גדולים יותר כי יש להם יותר תקציב. הם גדלים יותר כי הם לומדים מהר יותר.
במקום להשקיע מאמצעים גדולים רק בבניית דברים חדשים, הם לומדים להביא יותר תוצאות ממה שכבר קיים.
עם כלי MA קיים -זה קל. צריך רק להפעיל, לתעד, וללמוד.
אם אתם רוצים לבנות תרבות A/B Testing בארגון שלכם -דברו איתי.
גיל כוכבי הוא יועץ דאטה ומרקטינג אוטומיישן עם ניסיון רב שנים בעבודה עם ארגונים גדולים ובינוניים במגוון רחב של מגזרים.
הוא מתמחה בבניית אסטרטגיות דאטה, הקמת מערכי שיווק פרסונלי מבוססי אונליין ואופליין (O2O) והטמעת מרקטינג אוטומיישן, המאפשרים לארגון לנהל את לקוחותיו בצורה פרסונלית, אפקטיבית ומדידה.
בנוסף, הוא המייסד של קהילת הלינקדאין Linkers וקהילת "AI & Data-Driven & Digital Marketing in Israel" שמטרתה לחבר את אנשי השיווק, הדיגיטל והדאטה לשיח אחד המגביר את שת"פ בין היחידות.
📞 052-5112167 | LinkedIn | kochavigil@gmail.com






תגובות