بناء تحليل الإيصالات وذكاء المنتج مع باتريك كويستيمبيرت، المهندس باتريك كويستيمبيرت

لطالما كان فريقنا شغوفاً بالتقاطع بين الذكاء الاصطناعي والعالم الحقيقي، حيث يتشارك رؤية جريئة لجلب فوائد الذكاء الاصطناعي لكل شخص على وجه الأرض. منذ ما يقرب من عقد من الزمان، ونحن نعمل على تطوير وتقديم منتجات متنوعة تؤثر حالياً على أكثر من 300 مليون مستخدم في 60 بلداً.

في محاولة لعرض المزيد عن فريقنا من وراء الكواليس، جلسنا مع باتريك كويستيمبيرت من قسم الهندسة الذي يعمل على بناء حلول بيانات الشراء لدينا منذ البداية، لمعرفة المزيد.

كان رئيسنا التنفيذي، دارين، يبحث عن أشخاص لديهم خبرة سابقة في استخراج النصوص من الصور من أجل مساعدته في بناء وتنفيذ رؤيته لاستخلاص بيانات الشراء من الإيصالات المطبوعة. كنت أنا ونائب رئيس قسم الهندسة لدينا قد عملنا سابقًا على “ScanBizCards”، والذي كان أول تطبيق للهاتف المحمول لمسح بطاقات العمل والتقاطها لتحويلها إلى إدخالات دفتر العناوين. كان حماس دارين واندفاعه معديًا، لذا انضممت بعد شهرين من ذلك الاجتماع الأول.

ما هي المشكلة الأصلية التي كان الفريق يتطلع إلى حلها، وكيف أدت إلى تقنية المسح الضوئي للإيصالات؟

كانت المشكلة التقنية الرئيسية التي احتجنا إلى حلها في وقت مبكر من عام 2015 هي التعرف على الأحرف الموجودة على الإيصالات المطبوعة، ثم تفسير هذا النص لفهم المنتجات التي تم شراؤها، والأسعار المدفوعة، والتاجر، وطريقة الدفع، وما إلى ذلك. تُعد بيانات الشراء من الطرف الأول للمستهلكين ذات قيمة كبيرة لعدد من الشركات. وعلى الرغم من أننا بدأنا بالإيصالات المطبوعة، إلا أننا طورنا تقنيتنا للتعامل مع عمليات الشراء عبر الإنترنت/التجارة الإلكترونية أيضاً مع استمرار اتجاهات التسوق عبر الإنترنت.

نحن نعمل مع بعض أكبر تطبيقات التسوق للمستهلكين في العالم، وبعضها يحفز مستخدميها على التقاط صور للإيصالات مقابل الحصول على مكافآت. يمكن تضمين تقنيتنا في شكل مجموعة برمجيات SDK لمسح الإيصالات لنظامي iOS وAndroid، بالإضافة إلى واجهة برمجة تطبيقات على الويب.

هل يمكنك أن تشرح بعبارات بسيطة كيف يعمل إثراء البيانات لدينا. ما الذي يجعلها سحرية للغاية؟

مع الإيصالات المادية، على سبيل المثال، يقوم برنامجنا بتحليل صورة واحدة أو أكثر من الإيصال المطبوع [أكبر عدد من الصور المطلوبة لالتقاط الإيصال بالكامل] ويقوم بإجراء “السحر” المطلوب لإرجاع تمثيل رقمي لجميع المعلومات في النهاية. نقوم كذلك بإرجاع بيانات إضافية حول المنتجات أو التاجر، غير موجودة في الإيصال. على سبيل المثال، نقوم بتوسيع أوصاف المنتجات المختصرة المختصرة إلى أسماء المنتجات الكاملة، ثم نستفيد من كتالوج المنتجات لدينا لتحديد المنتج بدقة، ورمز UPC الخاص به، وفئته، وغير ذلك. يتم تعيين “CPH SENS & EN SHEI” في إيصال CVS إلى “معجون أسنان Crest Pro-Health Sensitive & Enamel Shield” في فئة معجون الأسنان للعناية الشخصية > العناية بالفم >.

مثل العديد من المنتجات التي تعمل بالذكاء الاصطناعي، يحدث السحر من خلال مزيج من نماذج التعلم الآلي الكبيرة والرموز البرمجية التي صممها الإنسان لاستكمال التعلم الآلي حيثما أمكن. في هذه الحالة، نحن نتعامل مع نماذج تتعرف على الكلمات أو اختصارات العلامات التجارية عبر الإيصالات وتوسيعها إلى أسماء كاملة، إلى جانب كتالوجنا الخاص الذي يضم 15 مليون منتج ويتزايد.

كيف نتعامل مع بيانات الشراء عبر الإنترنت؟

في وقت مبكر، أصبح من الواضح أن عملائنا يحتاجون أيضًا إلى القدرة على التقاط الإيصالات الإلكترونية لمستخدميهم. تتزايد التجارة الإلكترونية كل عام، وتمثل نسبة أكبر من أي وقت مضى من مشتريات المستهلكين. وتتسم عمليات الشراء عبر الإنترنت بالتعقيد؛ فبعض الإيصالات الإلكترونية تتضمن الإيصال الفعلي في ملف PDF مرفق [بدلاً من إدراج المنتجات ضمن HTML في البريد الإلكتروني نفسه]، في حين أن بعض التجار لا يتضمنون أي معلومات عن المنتجات على الإطلاق في رسالة تأكيد الشراء الإلكترونية، وبدلاً من ذلك يقدمون رابطًا لحساب العميل حيث توجد المشتريات في سجل الطلبات. ليس من السهل تحديد المنتجات من رسائل التأكيد الإلكترونية أو استخراج خصائص المنتج المختلفة (مثل السعر والكمية ورقم المنتج ورقم الطلب ورسوم الشحن وما إلى ذلك) بدقة وكفاءة.

Microblink يتبع نهجًا مبتكرًا متعدد الجوانب لجمع بيانات الشراء عبر الإنترنت يتيح للمستهلكين ربط صندوق البريد الإلكتروني الخاص بهم أو الاتصال بالتجار المدعومين عبر تطبيق الهاتف المحمول أو من خلال المتصفح. على عكس عملية التقاط الإيصال الفعلي وتحميله، فإن هذه العملية هي أقرب إلى روتين “اضبطها وانسها” بالنسبة للمستهلكين بمجرد إدخال بيانات اعتمادهم.

تتمثل إحدى مزايا الاتصال المباشر بالتاجر في إمكانية جمع بيانات الشراء منذ فترة طويلة تصل إلى ثلاث سنوات، مما يتيح الحصول على حجم هائل من رؤى بيانات الشراء من الطرف الأول بسرعة كبيرة.

ما هي المشاريع التي تعمل عليها حالياً؟

صدِّق أو لا تصدق، ما زلت أقضي معظم وقتي في العمل على تقنية المسح الضوئي للإيصالات المادية والإيصالات الإلكترونية – بعد مرور ثماني سنوات! يتمثل دوري داخل مجموعة التكنولوجيا في اكتشاف الأشياء التي لم تستطع نماذج تعلّم الآلة حلها بمفردها، مما يعني حل مشاكل جديدة وصعبة طوال الوقت. لذلك على الرغم من أن “ملعبي” هو نفسه كل يوم، إلا أن المشاكل وحلولها تتغير طوال الوقت. لقد توقفت عن العد، ولكنني كتبت ما يقرب من مليون سطر من التعليمات البرمجية على مر السنين، وهو ما لم يكن ممكناً لمهندس لو لم أكن أستمتع بذلك.

ما هي بعض اللحظات البارزة على مر السنين؟

كانت إحدى اللحظات البارزة عندما أدركت أننا قمنا بمسح عدة مليارات من الإيصالات المادية – مليار بحرف الباء، وليس خطأ مطبعي!

أتذكر أيضًا أنه في وقت مبكر جدًا، كنت أشعر بالفخر الشديد عندما وصلنا إلى مرحلة كانت الدقة فيها مذهلة، بغض النظر عن جودة أو حالة الإيصال المادي: سواء كان الضوء ساطعًا أو خافتًا، أو الإيصالات المجعدة، أو طابعات نقاط البيع المعطوبة، أو كل شيء، كنا قادرين على التقاطها وقراءتها.

وبقدر ما يبدو الأمر مبتذلاً، فإن الوقت الذي قضيته في Microblink هو تذكير لي بأنه لا بأس من إدراك الأخطاء، طالما أنك تتكيف معها بسرعة. من الضروري أن تحيط نفسك بأشخاص موهوبين يهتمون بالقيام بعمل جيد أكثر من اهتمامهم بالمظهر الجيد، وهذا يساعدني على حب ما أقوم به، وهو أمر مهم لأن النجاح في العمل وحده لن يحفزك إلا إلى حد بعيد.

أبريل 25, 2023

اكتشف حلولنا

استكشاف حلولنا على بُعد نقرة واحدة فقط. جرّب منتجاتنا أو تحدث معنا مع أحد خبرائنا للتعمق أكثر في ما نقدمه.