بهینه سازی تخصیص و زمان‌بندی شاول وکامیون در معادن روباز با استفاده از شبیه‌سازی مبتنی بر الگوریتم‌های یادگیری تقویتی

نوع مقاله : یادداشت فنی

نویسندگان

1 دانشگاه تربیت مدرس

2 عضو هیات علمی دانشکده مهندسی صنایع و سیستم ها، دانشگاه تربیت مدرس

10.24200/j65.2025.66883.2436

چکیده

با توجه به پیچیدگی‌های موجود در سیستم‌های حمل و نقل معادن، روش‌های سنتی برنامه‌ریزی اغلب با محدودیت‌هایی مواجه می‌شوند. در این پژوهش، با هدف افزایش بهره‌وری، یک سیستم شبیه‌سازی مبتنی بر الگوریتم‌های یادگیری تقویتی برای بهینه-سازی تخصیص و زمان‌بندی شاول/کامیون در معادن روباز ارائه شده است. با استفاده از الگوریتم‌های یادگیری تقویتی، یک عامل هوشمند برای تصمیم‌گیری در مورد مسیر حرکت وسایل نقلیه، زمان‌بندی عملیات بارگیری و تخلیه و تخصیص منابع بهینه بر روی یک معدن روباز واقعی آموزش داده شده است. نتایج نشان داد که مدل یادگیری تقویتی با استفاده از الگوریتم Q-learning قادر است تا تخصیص بهینه کامیون‌ها به شاول ها را یاد بگیرد و بهترین عملکرد را نسبت به دو مدل ساده‌تر داشته باشد. این مدل با استفاده از به‌روزرسانی مقادیر Q و یادگیری از تجربیات گذشته، سیاستی بهینه می‌آموزد که منجر به بیشترین تعداد بارگیری‌های موفق شده و بهره‌وری کلی سیستم را افزایش می‌دهد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Optimization of shovel and truck allocation and scheduling in open pit mines using simulation based on reinforcement learning algorithms

نویسندگان [English]

  • Erfan Mazinani 1
  • Nasim Nahavandi 2
1 Tarbiat Modares University
2 Prof. of Industrial and Systems Engineering / Tarbiat Modares University
چکیده [English]

The intricate nature of material transportation systems in extensive open-pit mines presents significant challenges for conventional planning methodologies. These traditional approaches often fall short in effectively managing the dynamic interplay between large fleets of trucks and shovels, navigating complex routes, and adapting to ever-changing operational conditions. Consequently, this can lead to suboptimal resource allocation, decreased productivity, and increased operational expenditures. To overcome these limitations and boost productivity, a simulation system leveraging the power of reinforcement learning (RL) algorithms has been developed to optimize the crucial aspects of shovel and truck allocation and scheduling within open-pit mining environments. By employing RL, an intelligent agent undergoes a training process to make informed decisions regarding the most efficient vehicle movement pathways, establish precise schedules for loading and unloading operations, and strategically allocate available resources across the mine site. This agent learns through continuous interaction with a simulated mine environment, receiving feedback on its actions to progressively refine its decision-making policies.The findings of this research underscore the effectiveness of the implemented RL model, which utilizes the Q-learning algorithm as its core learning mechanism. The model demonstrated a significant ability to learn the optimal assignment of trucks to shovels, consistently outperforming simpler, more conventional models in terms of efficiency and productivity. The success of the Q-learning approach lies in its iterative process of updating Q-values – which represent the expected future reward for taking a specific action in a particular state and its capacity to learn from the accumulated experience gained through simulated operations. Through this continuous learning and adaptation, the RL model gradually converges towards an optimal operational policy. This optimized policy results in a higher frequency of successful material downloads, minimizing idle times and bottlenecks within the transportation network. Ultimately, this leads to a substantial enhancement in the overall efficiency of the mine's transportation system. The implications of this research highlight the transformative potential of integrating reinforcement learning techniques into the planning and management of mining operations, paving the way for the development and deployment of more intelligent, adaptive, and ultimately more productive autonomous and semi-autonomous systems in the mining sector.

کلیدواژه‌ها [English]

  • Simulation
  • reinforcement learning algorithms
  • shovel allocation and scheduling
  • truck allocation and scheduling
  • open pit mines