Abstract

The increasing complexity of business processes drives the need for advanced predictive monitoring solutions capable of handling multi-entity interactions. Traditional case-centric event logs fall short of capturing these complexities, leading to the emergence of Object-Centric Event Logs (OCEL). Despite the growing interest in OCELs, their structural complexity and impact on predictive performance remain unexplored. This thesis investigates how process complexity influences the performance of machine learning models in predictive process monitoring using OCEL. A framework combining Graph Neural Networks and graph embedding-based models is applied across three predictive tasks: next activity, next timestamp, and remaining time prediction. The evaluation covers five diverse OCEL datasets with varying complexity levels. Results show that model performance is significantly affected by structural complexity factors such as object diversity, event-to-object ratios, and execution variability. While Graph Neural Networks perform well in moderately complex scenarios, embedding-based models often match or outperform with greater stability and efficiency, making them a practical and scalable alternative. Clustering and feature importance analyses reveal that factors like event-to-object ratios and average events per execution are strong predictors of model performance. This research provides a novel complexity classification framework and offers practical guidance for selecting predictive models aligned with the structural nature of object-centric processes

Student Author First name, Last name, and other information

Buthaina Hasan Aidaros Alhebshi, Zayed University

Name of Guide/supervisor

Sinan Salman

Year of awarding

2025

Keywords

Object-Centric Event Logs (OCEL), Predictive Process Monitoring, Process Complexity, Graph Neural Networks, Graph Embeddings, Machine Learning, Process Mining

Arabic Title

تحليل مقارنة لنماذج التعلم الالي لمراقبة العمليات التنبؤية باستخدام سجلات مرتكزة على العناصر

Arabic Abstract

يساهم التعقيد المتزايد في سير العمليات التجارية في تعزيز الحاجة إلى حلول تنبؤية متقدمة قادرة على التعامل مع التفاعلات متعددة العناصر. لا تُظهر سجلات الأحداث التقليدية المبنية على الحالة كفاءة في تمثيل هذا النوع من التعقيد، مما أدى إلى ظهور السجلات مرتكزة على العناصر، وهي سجلات أحداث توثق العلاقات المتعددة بين الأحداث والعناصر المرتبطة بها. وعلى الرغم من الاهتمام المتزايد بهذا النوع من السجلات، فإن تعقيدها الهيكلي وتأثيره على أداء النماذج التنبؤية لا يزال غير مستكشف بشكل كافٍ. تستعرض هذه الدراسة أثر تعقيد العمليات على أداء نماذج التعلم الآلي في مراقبة العمليات التنبؤية باستخدام عدة سجلات مرتكزة على العناصر. وقد تم تطبيق إطار يجمع بين الشبكات العصبية للرسم البياني والنماذج القائمة على التمثيلات المتجهية للرسوم البيانية، عبر ثلاث مهام تنبؤية: التنبؤ بالنشاط التالي، الزمن المتوقع للنشاط التالي، والتنبؤ بالوقت المتبقي للعملية. شمل التقييم خمس مجموعات بيانات متنوعة من نوع سجلات مرتكزة على العناصر، تغطي مستويات مختلفة من التعقيد. أظهرت النتائج أن أداء النماذج يتأثر بشكل كبير بعوامل هيكلية مثل تنوع العناصر، ونسبة الأحداث إلى العناصر، وتفاوت أنماط التنفيذ ووقتها. وبينما تُحقق الشبكات العصبية للرسم البياني أداءً جيدًا في السيناريوهات متوسطة التعقيد، غالبًا ما تُظهر النماذج المعتمدة على التمثيلات المتجهية للرسوم البيانية أداءً مماثلًا أو أفضل، مع كفاءة تدريب أعلى وثبات أكبر، مما يجعلها خيارًا عمليًا وقابلًا للتوسع. كما كشفت الخوارزمية التصنيفية وأهمية الخصائص أن نسبة الأحداث إلى العناصر ومتوسط عدد الأحداث لكل تنفيذ تُعد من أبرز العوامل المرتبطة بأداء النموذج. تُقدّم هذه الدراسة إطارًا جديدًا لتصنيف تعقيد السجلات المرتكزة على العناصر، وتوفّر إرشادات عملية لاختيار النماذج التنبؤية المناسبة استنادًا إلى البنية المدروسة.

Arabic Keywords

سجلات مرتكزة على العناصر، العمليات التنبؤية، تعقيد العمليات، الشبكات العصبية للرسم البياني، التمثيلات المنهجية للرسوم البيانية، التعلم الآلي، التنقيب في العمليات

Share

COinS