نوع مقاله : مقاله استخراج شده از پایان نامه
موضوعات
عنوان مقاله English
نویسندگان English
Using network data envelopment analysis (NDEA) models to assess the efficiency of Decision Making Units (DMUs) is a widely accepted method in academic research. An ongoing challenge in this field involves the computation and implementation of enhancement solutions within homogeneous clusters utilizing Machine Learning techniques. The primary aim of this paper is to identify the optimal clustering algorithm for a two-stage sustainable supply chain within the petrochemical industry in Iran. Subsequently, the application of NDEA within each cluster aims to ascertain efficiency levels and devise improvement strategies to facilitate a more targeted development approach for inefficient units. This paper investigates the best clustering algorithms in the area of Machine Learning by using quality measurement indicators and using Network Data Envelopment Analysis (NDEA) for measuring the efficiency of DMUs with sustainability approach. Upon examination, it has been determined that the Deep Embedded Clustering algorithm yields the most favorable results when applied to the data set. Furthermore, the comparison of the clustering result with the standard NDEA model has demonstrated the utility of clustering and comparing units in homogeneous categories for the purpose of efficiency calculation and determining the distance to the efficient frontier. This article, showed that how to find the best algorithm for two-stage supply chain clustering. Also, by comparing the effect of clustering on measuring the distance of inefficient units to the efficiency frontier, it was shown that clustering of units can play a significant role in planning to reach a practical development plan in each cluster.
کلیدواژهها English
مقدمه
مفهوم کارایی که عبارت است از نسبت حداکثر خروجی مطلوب به ورودی (منابع) مصرف شده، یکی از شاخصهای ارزیابی کننده وضعیت واحدها است و کارایی نسبی معیاری جهت مقایسه بین واحدها معرفی شدهاست. حداکثر سازی خروجی مطلوب به ازای ورودی معین یا کاهش ورودی ها به ازای مقدار مشخصی خروجی از جمله راهکارهای افزایش کارایی که در روش تحلیل پوششی دادهها (DEA) با در نظر گرفتن مجموعه امکان تولید و تعیین مرز کارا به ارزیابی واحدهای تصمیم میپردازد. راهکارهای سنتی محاسبه کارایی بر مبنای DEA در حالت کلی به دو دسته پوششی و مضربی تقسیم میشوند. در فرم مضربی برای هر واحد تصمیم بهترین وزنهای ممکن برای ورودی و خروجیهای نظیرش محاسبه میشود و در نهایت کارایی نسبی بر اساس این وزنهای بهینه، از تقسیم مجموع وزندار خروجیها بر مجموع وزندار ورودیها بهدست میآید (Charnes et al., 1978). طراحی بهینه ساختار شبکهای در زنجیره تأمین یکی از رویکردهای پژوهشی امروزی در حوزه مدیریت زنجیره تأمین (SCM) است. توجه به شاخصهای کلیدی پایداری نیز از مهمترین بخشهای مدیریت واحدهای صنعتی بر اساس مدلهای پایهای در طراحی ساختار شبکه زنجیره تأمین است (Hofmann, 2013). با ترکیب مفاهیم پایداری و ظهور زنجیره تأمین پایدار (SSCM) استفاده از حلقه بسته و جریان بازگشتی در طول زنجیره تأمین در نظر گرفته شد که هدف آن استفاده حداکثری از ضایعات و مواد بازیافتی و پسماندها برای کاهش تأثیرات منفی در طول زنجیره تأمین است (Jabbarzadeh et al., 2018). یکی دیگر از وجه تمایز زنجیره تأمین پایدار با زنجیره تأمینهای سنتی استفاده از شاخصهای پایداری در محاسبه کارایی و عملکرد کل زنجیره تأمین است. در این پژوهش فرایندهای واحدهای تصمیم بر اساس سه حوزه اصلی رویکرد پایداری یعنی، مسئولیت اجتماعی، محیط زیست و اقتصاد طراحی و سنجیده میشود (Halog & Nguyen, 2017; Shokri Kahi et al., 2017).
همان طور که اشاره شد، از روشهای تحلیل پوششی دادهها برای محاسبه کارایی در محیطهای با پیچیدگی بالا که بهدست آوردن تابع تولید امکانپذیر نیست استفاده میشود. لازم به ذکر است مدل کلاسیک DEA دو ایراد اصلی در محاسبه کارایی دارد، دیدگاه مدلسازی بر مبنای جعبه سیاه عیب اول است که در آن تنها ورودیها و خروجیهای کلی واحد در نظر گرفته میشود پس فرایندهای درونی واحد در محاسبه کارایی بیتأثیر است. با در نظر گرفته شدن فرایندهای داخلی هر واحد در محاسبه کارایی محدودیت اول مدل سنتی DEA برداشته شد که از آن با تحلیل پوششی دادههای شبکهای (NDEA) یاد میشود. ایراد دیگر مدل سنتی تحلیل پوششی داده است است که فرض میکند ورودیهای یک دوره زمان به طور کامل برای تولید خروجیهای همان دوره مورد استفاده است. با استناد به اینکه عملکرد یک سازمان در دورههای زمانی متوالی به یکدیگر مرتبط است، در عمل ارزیابی کارایی واحد صنعتی به صورت یک دوره زمانی مجزا و مستقل دقت پایینی خواهد داشت. لذا با توجه به اینکه تصمیمات گذشته و فعلی، عملکرد آینده را تحت تأثیر قرار خواهد داد ورودی و خروجی یک دوره بر دوره بعدی اثر گذار خواهد بود (Herrera-Restrepo et al., 2016). بسیاری از مقالات با در نظر گرفتن یک شبکه دو مرحلهای سعی در تشریح جزئیات فرایندهای داخلی و دقیق سازی محاسبات کارایی واحدهای تصمیم با این روش مدلسازی نمودند (Fang, 2020). پس برای پوشش عیب دوم تحلیل پوششی داده پویا (DDEA) توسعه یافت تا کارایی را بین چند دوره زمانی بررسی و محاسبه کند. با توجه به اینکه مورد مطالعه در این پژوهش در حوزه زنجیره تأمین پایدار است، با استفاده از نوعی از روش محاسبه کارایی بر اساس NDEA، محاسبه کارایی برای کل زنجیره تأمین صورت میگیرد و محاسبه کارایی و بسیاری از مسائل مربوط به تصمیم گیری چند معیاره در این مدل پیشنهادی لحاظ میگردد.
در کشورهایی که دارای منابع طبیعی نفت و گاز هستند فرایند استخراج نفت و انتقال آن به پالایشگاه در واحدهای پتروشیمی طی یک زنجیره تأمین دو یا چند سطحی در نظر گرفته میشود. در این پژوهش با درنظر گرفتن یک زنجیره تأمین دوسطحی متشکل از مرحلهی استخراج نفت (سطح1) و پالایش نفت (سطح2) با الگو برداری از مفهوم ارزیابی کارایی مبتنی بر تحلیل پوششی دادههای شبکهای (NDEA) مدل پیشنهادی ارائه شدهاست. در این مدل هر زنجیره تأمین مربوط به یک واحد پتروپالایشی به عنوان یک واحد تصمیم (DMU) در مدل شبکهای حضور دارد در نتیجه علاوه بر ورودی و خروجی های ابتدا و انتهای شبکه، تبادلات بین دو سطح زنجیره نیز در محاسبات کارایی تأثیر دارد (Tone & Tsutsui, 2010).
یکی از چالشها در مدیریت زنجیره تأمین ارائه راهکار بهبود عملیاتی و مقایسه عادلانه بین واحدهای تصمیم و به تبع آن محاسبه کارایی رتبهبندی و ارائه راهکار بهبود است. در راستای پاسخدهی به این چالش میتوان واحدهای مشابه و همگون را در یک دسته (یا خوشه) قرار داد، سپس محاسبات مبتنی بر تحلیل پوششی داده شبکهای را داخل هر دسته به صورت مجزا انجام داد. در این روش کاراترین واحد در هر دسته به عنوان الگویی برای سایر واحدهای ناکارا در نظر گرفته میشود. از طرفی کاراترین واحد هر دسته کاندید جابهجایی به دسته بالاتر و آماده رقابت برای بهبود کارایی و پایداری خود با واحدهای تصمیم هم سطح خود در دورههای آتی خواهد شد. در همین راستا بهرهگیری از روشهای خوشهبندی در دستور کار قرار گرفت (Queiroz et al., 2022). در پژوهشهای مشابه با بهرهگیری از شبکه عصبی مصنوعی واحدهای تصمیم در خوشههای همگون قرار گرفتند و محاسبه کارایی با روش دو مرز کارا و ناکارا مورد ارزیابی و بررسی پژوهشگران بودهاست (Yousefi et al., 2019). بهرهگیری از کاربردهای شبکه عصبی مصنوعی صرفا منوط به خوشهبندی نیست همان طور که در مقاله (Yousefi et al., 2021) از آن در کنار تحلیل پوششی داده شبکهای و پویا برای پیشبینی پایداری در دوره زمانی آتی نیز استفاده شدهاست. استفاده از هوش مصنوعی جهت پیشبینی کارایی جهت ارائه راهکار بهبود بیش از وقوع ناکارایی یکی از زمینههای پژوهشی شاخص در زنجیره تأمین با رویکرد پایداری است. یادگیری ماشین میتواند به عنوان یکی از زیرمجموعههای هوش مصنوعی در این بخش کاربرد داشته باشد. هدف این مقاله ارائه راهکاری ترکیبی با استفاده از یادگیری ماشین و NDEA است. نتایج نشان داد فاصله واحدهای ناکارا تا مرزکارای خوشه خود کمتر از فاصله آنها تا کاراترین واحد بین تمام واحدها است پس این روش میتواند مبنای مناسبتری جهت محاسبه کارایی نسبی و انتخاب الگو باشد که تاثیر آن در برنامهریزی تولید و توسعه واحد نمایان میشود. بهرهگیری از خوشهبندی با استفاده از یادگیری ماشین برای واحدهای پتروپالایشی در ایران برای اولین بار در این پژوهش استفاده شدهاست.
مرورادبیات و پیشینه پژوهش
مقالات مرتبط با این پژوهش به سه بخش اصلی تقسیم شدهاست. با توجه به عنوان مقاله اولویت اصلی در محاسبه کارایی خوشهبندی واحدهای تصمیم به دستههای همگون بودهاست که برای این قسمت تمرکز اصلی بر روی بررسی الگوریتمهای زیر مجموعه یادگیری ماشین قرار گرفته است. در بخش بعدی هم با استفاده از تحلیل پوششی داده شبکهای، ورودی و خروجیهایی با رویکرد پایداری در زنجیره تأمین دو سطحی صنعت پتروشیمی در ایران مورد بررسی قرار گرفت. به این ترتیب سه بخش اصلی در پیشینه پژوهش عبارتاند از: الف) بررسی کاربرد یادگیری ماشین در مدیریت زنجیره تأمین، ب) تحلیل پوششی داده شبکهای و ج) طراحی شبکه زنجیره تأمین پایدار.
بررسی کاربرد یادگیری ماشین و هوش مصنوعی در مدیریت زنجیره تأمین
یکی از نکات قابل توجه بهرهبرداری از هوش مصنوعی، ایجاد دیدگاه توسعه در سازمانها پیش از گسترش استفاده از این دانش است. اشاعه پذیرش تکنولوژی مبتنی بر هوش مصنوعی و یادگیری ماشین از ملزومات استقرار این تکنولوژی در فرایندهای مدیریت عملیات و مدیریت زنجیره تأمین به حساب میآید. در مقاله (Fosso Wamba et al., 2022) ضمن اشاره به کارکردهای عملی و اجرا شده در صنعت به ارتباط هوش مصنوعی با مدیریت عملیات و مدیریت زنجیره تأمین پرداخته شده است و هدف آن کمک به توسعه کاربردهای هوش مصنوعی در صنعت به ویژه کمک به تصمیم گیری، رتبه بندی، مدیریت عرضه و تقاضا و افزایش دانش و گسترش دیگاه مثبت برای بهرهبرداری هر چه بیشتر ذینفعان در این شاخه از علم تبیین شدهاست.
با ظهور انقلاب صنعتی چهارم ، تکنولوژیهای نوظهور از قبیل دادههای حجیم، هوش مصنوعی، زنجیره بلوکی، رباتیک، واقعیت افزورده، واقعیت مجازی، پرینتر سه بعدی، اینترنت اشیا و 5G جایگاه و ارزش خود را در ارتباط بین زنجیره لجستیک و جامعه به وضوح نشان دادند. در این عصر اهمیت تطابق پذیری مدل کسب و کارها و فرایندهای لجستیک برای ایجاد محیط پویای تولید و مصرف بیش از پیش احساس میشود (Papadopoulos et al., 2022; Queiroz et al., 2020). در واقع نسل جدید مدیریت عملیات و زنجیره تأمین بدون حضور این تکنولوژیها، غیرقابل تصور خواهد بود. نسل جدید این سامانهها از سیستم پیشنهاد دهنده تولید هوشمند، قیمت گذاری پویا، ردیابی هوشمند محصول، سیستم خودکار جلوگیری از تاخیر در فرایندها، کاهش هزینههای انبارداری، سامانه هوشمند ارتباط لحظهای با مشتری و توسعه محصول و پایش لحظهای منابع برای کاهش هزینهها استفاده مینمایند (Dong et al., 2021). مدیران زنجیره تأمین و تصمیم گیرندگان اصلی این حوزه نیاز است که آگاهی کامل از جنبههای کارکرد هوش مصنوعی داشته باشند. البته توجه به این نکته حائز اهمیت است که صرف استفاده از هوش مصنوعی به تنهایی ایجاد بهرهوری نخواهد کرد، بلکه نیاز است که تغییرات در مجموعهای از استراتژیها برای استقرار هوش مصنوعی در بدنه فرایندها صورت گیرد (Fosso Wamba et al., 2022). در صورتی که پیشنیازهای استقرار هوش مصنوعی در سازمان به درستی پیادهسازی شده باشد امکان بهرهگیری از هوش مصنوعی و زیر مجموعههای آن در حوزه کنترل و برنامه ریزی تولید، پیشبینی تقاضا و کنترل کیفیت فراهم خواهد شد (Queiroz et al., 2022). در همین راستای از جمله کاربردهای یادگیری ماشین در پایش لحظهای مشتری و بررسی فیدبکهای آن است که با آنالیز دقیق این دادهها زنجیره تأمین میتواند به دادههای واقعی دسترسی داشته باشد و خوشبینانه ترین پیشبینی را از وضعیت تولید برنامه ریزی نماید (Jacobsen & Tan, 2022). ترکیب یادگیری ماشین و دادههای حجیم در صنعت فوتوولتائیک توانست که تأثیر بسیار زیادی در مدیریت کیفیت و افزایش کارایی سیستم تولید هوشمند با تولید دانش از دادههای خام و با حجم بالا پیاده سازی کند (Xia et al., 2022).
رویکرد استفاده از یادگیری ماشین همگام با انقلاب صنعتی چهارم، منجر به افزایش دقت تصمیم گیری و جایگزین شدن ماشین به جای مغز انسان در تصمیمگیریهای کلیدی و حساس شد که در آن دقت و سرعت عاملی تعیین کننده است. در واقع در این حالت کامپیوتر توانایی یادگیری را از دادههای جمع آوری شده که به نوعی تجربیات پیشین است بهدست میآورد (Mitchell, 1999). با تکیه بر توانایی یادگیری از دادهها و سرعت پردازش بالا، ماشین توانایی تشخیص الگوهای پیچیده و روابط بین متغیرهای مختلف و در نتیجه رسیدن به بهترین تصمیم را خواهد داشت (Marr, 2016). در حوزه زنجیره تأمین بهره گیری از یادگیری ماشین در تصمیمگیری چند معیاره و شرایط عدم قطعیت با تکیه بر توانایی تشخیص روابط غیرخطی منجر به پیشبینی دقیق و جلوگیری از وقوع تأثیرات اثر شلاقی خواهد شد که در نهایت نیز موجب افزایش کارایی کلی زنجیره تأمین میشود. یکی از نکات حائز اهمیت در استقرار یادگیری ماشین در فرایندها توجه به جایگاه آن در فرهنگ سازمان است. در پژوهشی در خصوص جایگاه یادگیری ماشین در مدیریت زنجیره تأمین اشاره شد که اغلب پژوهشهایی که ازهوش مصنوعی بهره بردهاند از شبکه عصبی مصنوعی(ANN) ، ماشین بردار پشتیبان(SVM) ، رگرسیون لجستیک (LR) و درخت تصمیم گیری (DT) استفاده کردهاند (Ni et al., 2020). در نتیجه در این پژوهش لزوم استفاده از یادگیری ماشین در حوزه زنجیره تأمین به عنوان زمینه پژوهشی مناسب تاکید شدهاست. توجه به قابلیت پیشبینی وضعیت در دورههای زمانی آتی همواره یکی از قابلیتهای ارزشمند برای مدیران ناظر بر کارایی زنجیره تأمین است. پژوهشگران اغلب برای مدلسازی زنجیره از شبکه عصبی، یادگیری عمیق یا یادگیری ماشین، متناسب با نوع داده و حجم آن استفاده کردهاند. یکی از کارکردهای یادگیری ماشین در حوزه یادگیری بدون نظارت، خوشهبندی است که استفاده از این قابلیت در پژوهشهای مدیریتی و به خصوص زنجیره تأمین کمتر مورد انتخاب پژوهشگران بودهاست (Ni et al., 2020). در پژوهش حاضر با بررسی عمیق استفاده از یادگیری ماشین در خوشهبندی زنجیره تأمین با استناد به دادهها 90 دوره زمانی کیفیت خوشهبندی بین روشهای سه الگوریتم زیرمجموعه یادگیری ماشین بررسی و تحلیل شد تا به این سوال پاسخ داده شود که بهترین راه خوشهبندی با استفاده از یادگیری ماشین چیست و چگونه باید انتخاب شود؟
با مرور پژوهشهای پیشین دیده شد، گرچه مسئله زنجیره تأمین پایدار برای صنعت پتروشیمی با روشهای مختلف و رویکردهای متنوع بررسی شدهاست، اما به کارگیری از یادگیری ماشین در حوزه خوشهبندی واحدهای تصمیم در این حوزه مورد توجه پژوهشگران نبودهاست. در ادامه با بررسی کیفیت خوشهبندی تعدادی از الگوریتمهای زیر مجموعه یادگیری ماشین، بهترین روش خوشهبندی با استفاده از یادگیری ماشین تعیین شد. در این قسمت گزارشی از انواع الگوریتمهای یادگیری ماشین که در حوزه زنجیره تأمین بین سال-های 1998 تا 2018 از 123 مقاله مستخرج گردیده در شکل1 قابل مشاهدهاست (Ni et al., 2020).
شکل1 : توزیع مقالات چاپ شده در حوزه یادگیری ماشین مرتبط با زنجیره تأمین
نکته جالب توجه رشد قابل توجه (پیک اول) استفاده از یادگیری ماشین در پژوهشها حوزه زنجیره تأمین در حدود سال 2008 تا 2009 مصادف با بحران اقتصادی ثبت شده که از قابلیت یادگیری و پیشبینی کنندگی آن برای مدیریت عرضه و تقاضا بین بازیگران زنجیره استفاده شدهاست (Zhu et al., 2017). پیک دوم نیز در سالهای 2016 تا 2017 مصادف با فراگیر شدن استفاده از Soft Computing در پژوهشهای بین رشتهای بود. در شکل2 به بررسی تنوع الگوریتمهای یادگیری ماشین در حوزه مدیریت زنجیره تأمین طی 20 سال اشاره شدهاست. همان طور که مشاهده میشود تمایل پژوهشگران برای استفاده از شبکه عصبی در بحث پیشبینی همواره مورد توجه بودهاست در صورتی که در حال حاضر به دلیل به وجود آمدن انبار داده در سازمانها پدیده داده حجیم که به تبع وجود پایگاهها داده متعدد در صنایع و سازمانها است بیش از پیش قابل مشاهده است. بهرهگیری از داده کاوی و یادگیری ماشین به خصوص در بخش خوشهبندی و طبقه بندی میتواند بسیار کارا و موثر باشد. همان طور که در شکل 2 قابل مشاهده است بیش از 75% مقالات چاپ شده صرفا از شبکه عصبی (NN) و الگوریتم بردار ماشین پشتیبان (SVM) برای مقاصد مختلف که اغلب پیشبینی بودهاست، استفاده کردهاند. در طبقه دیگر اشاره شد که از مجموعه مقالات چاپ شده در طی 20 سال 81% مقالات در دسته یادگیری نظارت شده، 12% یادگیری بدون نظارت و تنها 7% در دسته یادگیری تقویتی قرار گرفتند. از بررسی این آمار نتیجه میشود که پرداختن به الگوریتمهای زیرمجموعه یادگیری ماشین به خصوص یادگیری بدون نظارت که خوشهبندی از مهمترین آن است در حوزه مدیریت زنجیره تأمین بسیار محدود بوده و زمینه بسیار مناسبی برای پژوهشگران معرفی میگردد.شکل2 طبقه بندی الگوریتمهای ML بر اساس میزان استفاده در مقالات را نشان می دهد.
تحلیل پوششی داده شبکهای
بررسی فرایندهای چندگانه و داخلی در زنجیره تأمین یکی از عواملی است که منجر به ارائه راهکار تحلیل پوششی داده شبکهای در ارزیابی کارایی واحدهای تصمیم شد. کائو و هوانگ [i](2008) به ارائه یک مدل مضربی و یک مدل جمعی جهت محاسبه کارایی زنجیره دو سطحی پرداختند (Chen et al., 2009; Kao & Hwang, 2008). آذر و همکاران در پژوهش با محوریت تحلیل پوششی داده شبکهای در حوزه محیط زیست به این راهکار پرداخته اند (Omid et al., 2021). در پژوهشی دیگر با ارائه یک ساختار دوسطحی به ارزیابی کارایی زنجیره تأمین در صنعت هتلداری پرداخته شد (Yin et al., 2020). پژوهشی دیگر با ارائه یک روش رتبه بندی فاصلهای برای ساختار دوسطحی با در نظر گرفتن بهینه چندگانه اقدام به ارزیابی DMUها به روش تحلیل پوششی داده شبکهای نمودد (Li et al., 2020). صنعت حمل و نقل هوایی و ارزیابی کارایی فرودگاهها از جمله حوزههایی است که با در نظر گرفتن زنجیره تأمین چندسطحی و رویکرد NDEA به ارزیابی عملکرد واحدهای تصمیم پرداخته است (Zhang et al., 2021).
بهرهگیری از DEA پوششی و مضربی برای ارزیابی عملکرد نسبی DMUها با ساختار شبکهای چند سطحی با ارائه مدلی مفهومی از دیگر کارهای مشابه با رویکرد شبکهای است (Boloori et al., 2016). پاتریزی و همکاران مدل شبکهای دوسطحی را در شرایط بازده به مقیاس متغیر با رویکردی متفاوت توسعه دادند (Patrizii, 2020). فخرموسوی و همکاران (2022) با در نظر گرفتن واحدهای تصمیم به فرم سیستم دو مرحلهای کارا در یک مجموعه مرجع مدلی بر مبنای اندازه دامنه تنظیم شده کاملا فازی با شرایط مکمل زائد قوی را مورد بررسی قرار دادند (FakhrMousavi et al., 2022). لوزانو و همکاران با بهرهگیری از رویکرد کمترین بهبود در تحلیل پوششی داده شبکهای با استفاده از دو رویکرد همکارانه و غیرهمکارانه به ارزیابی واحدهای تصمیم پرداختند (Lozano & Khezri, 2021).
طراحی شبکه زنجیره تامین پایدار
امروزه به دلیل تأثیر گازهای گلخانهای و روند افزایشی گرم شدن زمین، تغییرات آب و هوایی و انتشار کربن دی اکسید، توجه به پایداری از جمله فاکتورهای اصلی در تحلیل بقای اقتصادی و اجتماعی در سازمانها به شمار میرود (Acquaye et al., 2017). توجه به مسائل زیست محیطی و توجه به الگوهای جهانی برای جلوگیری از مشتقات کربن و حفاظت از محیطزیست سازمانها را به سمت پیشبرد مفاهیم توسعه پایدار در صنایع سوق داده است. بر اساس این اصل مهم توجه به نیازهای فعلی در کنار حصول اطمینان از امکان توانایی بهرهبرداری نسل آتی از محیط زیست و منابع طبیعی تعریف میشود. پس جهت اعمال توسعه پایدار در سیاستهای سازمان و صنایع، رویکرد اصلی اعمال محدودیت از طریق تأثیر فناوری بر منابع طبیعی در راستای حفظ محیط زیست و جلوگیری از افزایش اثرات مخرب تولید شده از صنایع تبیین شدهاست (Angelakoglou & Gaidajis, 2020). لذا محاسبه میزان پایداری در زنجیره تأمین صنایع به گونهای به معنای محاسبه کارایی بر اساس شاخصهای پایداری تعریف میشود. بدین ترتیب مسائل ارزیابی عملکرد محیطزیستی (پایداری) در سالهای اخیر به عنوان شاخه مهمی از پژوهش در بین محققان همواره مورد توجه بودهاست (Olafsson et al., 2014). یکی از تفاوتهای بارز زنجیره تأمین پایدار با زنجیره تأمین سنتی توجه به جریان داده و تأثیر آن در بهبود فرایندهای زنجیره با رویکرد حفظ پایداری، کاهش ضایعات و رسیدن به محصول با کیفیتتر است (Yu & Tseng, 2014). اگر بخواهیم برای زنجیره تأمین پایدار یک تعریف جامع ارائه دهیم عبارت است از:
در پژوهش دیگر با در نظر گرفتن نیروی کار شاغل و میزان سرمایه گذاری اولیه به عنوان ورودی و میزان تولید ناخالص و انتشار گاز دیاکسید کربن به عنوان خروجی عملکرد اقتصادی واحدهای صنعتی با محاسبه شاخص مالم کوئیست مورد ارزیابی قرار گرفته است (Zhou et al., 2010). سوزوکی و همکاران (2016) کارایی اقتصادی و زیست محیطی کشورهای حوزه اتحادیه اروپا، آسه آن و اپک را در قالب یک مدل DFM با عوامل ثابت مورد بررسی قرار داده اند که در آن متغیرهای کل مصرف انرژی و جمعیت به عنوان ورودی و تولید ناخالص داخلی و انتشار CO2 به عنوان خروجی در نظر گرفته شد و سپس کارایی واحدها ارزیابی شد (Lenz et al., 2018). وانگ و همکاران با ارائه یک مدل SBM اقدام به بررسی بهبود کارایی 25 کشور در بازه زمانی سالهای 2010 تا 2017 نموده اند که در مدل خود نیروی کار، مصرف انرژی، سرمایه ثابت ناخالص به عنوان ورودی و میزان GDP و حجم گاز کربن دیاکسید به عنوان متغیرهای خروجی در نظر گرفته شده است (Wang et al., 2019).
روش تحقیق
این پژوهش از بعد مخاطب، بنیادی (جامعه علمی)، از بعد هدف توصیفی و از بعد زمان مقطعی است. این پژوهش در نظر دارد تا با ارائه یک روش ترکیبی از تحلیل پوشش دادهها و یادگیری ماشین تاثیر خوشهبندی واحدهای همگون را در محاسبه کارایی نسبی بررسی نماید. مورد مطالعه 28 واحد فعال پتروپالایش در ایران است که دادههای آن در 90 دوره زمانی جمع آوری شده است. با توجه به اینکه این روش در کلیه صنایع و برای سایر زنجیره تامینهای فعال در صنعت کاربرد دارد، این پژوهش از بعد مخاطب بنیادی است. در این مقاله ابتدا به کاربرد الگوریتمهای زیر مجموعه یادگیری ماشین در خوشهبندی واحدهای همگن پرداخته شده و کیفیت خوشهبندی هر روش با استفاده از شاخصهای استاندارد ارزیابی کیفیت خوشهبندی به تفکیک بررسی و مقایسه گردیدهاست. در مطالعت پیشین، کاربرد یادگیری ماشین در حوزه زنجیره تأمین بیشتر معطوف به پیشبینی عرضه و تقاضا بوده در صورتی که این پژوهش در خوشه خوشهبندی واحدها انجام شده است. در بخش بعدی ارزیابی عملکرد زنجیره تامین با رویکرد پایداری در نظر گرفته شد. نتایج در دو حالت مورد بررسی بدین شرح است: حالت اول استفاده از تحلیل پوششی داده بر روی کل دادهها و محاسبه میزان ناکارایی و حالت بعدی اجرای آن در هر خوشه به صورت مجزا و اندازهگیری مجدد میزان ناکارایی که در نهایت تمامی نتایج در بخش یافتهها بررسی شدهاست. دادههای این پژوهش از بانک اطلاعاتی شرکت دانش بنیان سامانه اندیشمند پگاه استخراج گردید که یکی از فعالان نرم افزاری در حوزه زنجیره تأمین صنایع کلیدی در کشور است. در شکل3 روند اجرای پژوهش قابل مشاهده است.
شکل3 : روش شناسی پژوهش
طراحی شبکه زنجیره تأمین پایدار در صنعت پتروشیمی
در ابتدا به فرایند تولید محصولات پتروشیمی پرداخته میشود، در سطح اول که فاز استخراج در نظر گرفته شدهاست ابتدا نفت خام از میادین نفتی استخراج شده و در سطح دوم به همراه سایر ورودیهایی که از جنس پایداری در نظر گرفته شدهاند به پالایشگاه وارد میشوند. در این بخش نیز خروجی سطح دو به خروجیهای مطلوب و نامطلوب تقسیم میشود که در نهایت هر واحد تصمیم که یک زنجیره تأمین مجزا دوسطحی در این مقاله تعریف شدهاست، سعی در افزایش خروجی مطلوب و کاهش خروجی نامطلوب دارد.
شکل4 : زنجیره تأمین دو مرحلهای مدل پیشنهادی
لازم به ذکر است خروجیهای مطلوب شامل کلیه مشتقات نفتی قابل مصرف در انتهای زنجیره تأمین در نظر گرفته شدهاست، برای مثال محصولهای نهایی که بدون نیاز به فرایند مجدد قابل مصرف هستند عبارتاند از: کودهای شیمیایی، پلیاتیلن، اسیدها و حلالهای شیمیایی و خوراک قابل مصرف در صنایع دارویی و سایر صنایع وابسته که بالاخره توسط مصرف کننده یا یک واحد صنعتی ثانویه قابل مصرف باشد. (لازم به ذکر است با توجه به تنوع محصولات خروجی واحدهای پتروشیمی جهت قابل قیاس بودن آنها، حجم معادلات آنها به عنوان درآمد حاصله از فروش محصولات با واحد دلار به عنوان خروجی مطلوب در نظر گرفته شده است) خروجی نامطلوب نیز عبارت است از ضایعات نفتی که قابل مصرف نبوده و نیاز است جهت پالایش مجدد به چرخه پالایش برگشت داده شود یا به عنوان زباله و دور زیر از چرخه خارج شود که در نهایت هدف کاهش این موارد خواهد بود (این خروجی نیز به واحد دلار در مجموعه داده در نظر گرفته شدهاست). در شکل 4 شمایی از زنجیره تأمین دوسطحی پیشنهادی در این پژوهش قابل مشاهده است. (ورودیهای سه گانه نیز از جنس هزینه و با واحد دلار در نظر گرفته شدهاند)
بررسی متغیرهای ورودی و خروجی
همان طور که در شکل 4 قابل مشاهده است، ساختار دوسطحی مورد مطالعه در هر مرحله دارای 3 ورودی است، این ورودیها با ارجاع به ادبیات پژوهش در بخش زنجیره تأمین پایدار انتخاب شدهاند و عبارتاند از:
شکل5 : ساختار دوبخشی شبکه پیشنهادی
متغیرهای خروجی در شبکه به دو دسته خروجی مطلوب و نامطلوب تقسیم شدهاند. خروجی مطلوب عبارت است از هر محصولی که پس از خروجی از برجهای تقطیر قابل مصرف برای مصرف کننده باشد یا خود به عنوان خوراک برای واحد صنعتی دیگری قابل استفاده باشد که در ساختار دو سطحی به عنوان مجموع درآمد حاصل از این محصولات در نظر گرفته شدهاست. خروجی نامطلوب عبارت است از کلیه پسماندها و ضایعاتی که یاد قابل استفاده نبوده یا نیاز است برای پالایش مجدد به چرخه پالایشگاه برگشت داده شود که این خروجی هم به صورت مجموع هزینه از دست رفته در زنجیره در نظر گرفته میشود.(لازم به ذکر است با توجه به تفاوت تنوع محصولات واحدهای پتروشیمی جهت قیاس پذیر بودن حجم تولیدات به نسبت ورودی مصرفی هر دو خروجی مطلوب و نامطلوب با واحد دلار درنظر گرفته شدهاند.)
نفت خام حاصل از فرایند استخراج در مرحله اول نیز به عنوان خروجی مرحله (یا سطح) یک و ورودی مرحله (یا سطح) دو در نظر گرفته میشود که ماهیت دوگانه داشته و به عنوان متغیر داخلی شبکه حضور دارد. جهت معرفی متغیرها در معادلات تحلیل پوششی داده شبکهای شکل 5 خلاصه شده، ساختار دوسطحی را به صورت ساده تر نمایش داده است. در ساختار ارائه شده در شکل 5، ورودیهای مرحله اول با X نمایش داده شدهاند که در صورت بررسی واحد j ام ورودیهای مرحله اول به صورت Xij در معادله در نظر گرفته خواهد شد که به معنای ورودی i ام مرحله 1 از واحد j ام تعریف میشود. به همین ترتیب ورودیهای مرحله 2 با S نمایش داده شدهاست. خروجی مرحله 1 که به نوعی یکی از ورودیهای مرحله 2 است با Z نمایش داده شده که Zij که در واقع خروجی مرحله 1 واحد تحت بررسی j ام در نظر گرفته میشود. خروجیهای مرحله 2 که در واقع خروجی نهایی زنجیره هستند با YD به عنوان خروجی مطلوب و YU به عنوان خروجی نامطلوب نمایش داده شدهاند. جدول 1 متغیرهای مدل پیشنهادی را نمایش میدهد.
جدول1 : متغیرهای مدل پیشنهادی
|
متغیر |
شرح |
|
xij |
ورودی i ام مرحله 1 از واحد تحت بررسی j ام |
|
zdj |
خروجی d ام مرحله 1 از واحد تحت بررسی j ام |
|
shj |
ورودی h ام مرحله 2 از واحد تحت بررسی j ام |
|
yrjU |
خروجی نامطلوب مرحله 2 از واحد تحت بررسی j ام |
|
yrjD |
خروجی مطلوب مرحله 2 از واحد تحت بررسی j ام |
|
wd |
ضرایب خروجی مرحله اول (Zdj) |
|
vi |
ضرایب ورودی مرحله اول (Xij) |
|
qh |
ضرایب ورودی مرحله دوم (Shj) |
|
ur |
ضرایب خروجی مطلوب مرحله دوم (yrjD) |
برای محاسبه کارایی زنجیره تأمین از روش تحلیل پوششی داده شبکهای چندین مدل ارائه شدهاست که دو مدل اصلی آن فرم جمعی و ضربی است. در محاسبه کارایی به فرم جمعی کارایی کل به صورت مجموع وزندار کارایی دو مرحله محاسبه میشود به گونهای که جمع ضرایب کارایی هر سطح برابر با یک در نظر گرفته شود ( ) که درواقع محاسبه اوزان کارایی هر مرحله به روشهای مختلف در مدلهای ریاضی تعریف شدهاست. این اوزان به گونهای ضریب اهمیت و تأثیر کارایی هر مرحله در محاسبه کارایی کل زنجیره تأمین را معین میکند (Cook & Zhu, 2014). در محاسبه کارایی به فرم ضربی، کارایی کل برابر ضریب کارایی مرحله اول در مرحله دوم خواهد بود. بدین ترتیب ابتدا طبق معادله (1) کارایی مرحله اول محاسبه میشود. سپس کارایی مرحله دوم با در نظر گرفتن ورودی و خروجیهای وارد شده به مرحله دوم ضمن اعمال قید ثابت بودن مقادیر کارایی قبلی محاسبه شده است. پس از محاسبه کارایی هر مرحله برای بهدست آوردن کارایی کل زنجیره تأمین کافی است دو عدد بهدست آمده در هم ضرب شوند. نکته حائز اهمیت در این محاسبات توجه به اهمیت و اولویت بین مرحله 1 و 2 است. در صورتی که مرحله 2 نسبت مرحله 1 اولویت داشته باشد میتوان ابتدا طبق معادله (5) کارایی واحد دوم را محاسبه کرد و سپس قید ثابت بودن این کارایی مرحله دوم را در محاسبه کارایی کل دخیل کرد. بدین ترتیب با تقسیم کارایی کل بر روی کارایی مرحله دوم مقدار کارایی مرحله اول نیز قابل محاسبه خواهد بود. لازم به ذکر است این معادلات کارایی در ابتدا به فرم کسری نوشته شده بودند که با استفاده از تبدیل چارنز و کوپر به فرم معادله برنامهریزی خطی به فرم (1) تا (5) تبدیل شدند.
بر اساس مدل پیشنهادی در شکل 5 زنجیره مورد بررسی دارای خروجی مطلوب و نامطلوب است که نیاز است در محاسبات کارایی به روش NDEA لحاظ شود. برای بهدست آوردن بیشینه کارایی نیاز است تا همزمان خروجیهای مطلوب افزایش و خروجیهای نا مطلوب کاهش یابند. به همین ترتیب جهت دخیل کردن خروجیها نامطلوب در سنجش کارایی در انتهای معادل (4) با استفاده از تبدیل ریاضی ماهیت خروجی نامطلوب به گونهای تغییر پیدا کرد که میتوان آن را به عنوان یک خروجی مطلوب تحت عنوان در محاسبات در نظر گرفت به این ترتیب به عنوان یک در محاسبات مدل نهایی تأثیر گذار است. لازم به ذکر است مقدار b باید به اندازهای مثبت و بزرگ در نظر گرفته شود که همواره مقدار مثبتی داشته باشد(Cook & Zhu, 2014). با استفاده از این تبدیل در صورتی که تلاش در افزایش باشد در واقع مقدار اصلی خروجی نامطلوب در کمترین حالت خود قرار میگیرد، پس در مدل نهایی دو خروجی در نظر گرفته شد و حالت بهینه افزایش هر دو خروجی در نظر گرفته میشود. در بسیاری از مدلهای پیشین کارایی کل به روش تحلیل پوششی داده شبکهای بدون در نظر گرفتن عوامل نامطلوب پیادهسازی میشد در این مقاله جهت مقایسه نتایج بهدست آمده و تأثیر خروجی نامطلوب در محاسبه کارایی زنجیره تأمین نتایج به سه روش پیادهسازی و مقایسه شدهاست (با فرض بازده به مقیاس ثابت):
یکی از روشهای بررسی عوامل نامطلوب استفاده از مدل DFF یا تابع فاصله جهت دار است، در این مدل ضمن فرض بازده به مقیاس ثابت (CRS)، استفاده از فرض دسترسی پذیری قوی میتوان همزمان در جهت افزایش ورودی مطلوب و کاهش خروجی نامطلوب به صورت همزمان حرکت کرد. مقدار هدف در این مدل برنامهریزی خطی برابر θ* (بهترین مقدار برای تتا) محاسبه میشود که میزان ناکارایی هر واحد را نشان میدهد. پس در این مدل درصورتی که مقدار نهایی0= θ بهدست آید، واحد کارا در نظر بوده و هر زنجیره تأمین به صورت یک بلک باکس در نظر گرفته میشود. لازم به ذکر است جهت مشاهده تأثیر استفاده از خوشهبندی در محاسبات مدل سه گانه مطرح شده هر یک به صورت مجزا در دوحالت پیادهسازی و مقایسه میشوند:
در نهایت محاسبات برای 28 واحد تصمیم (DMU) که در این پژوهش زنجیره تأمین صنایع پتروشیمی در ایران در نظر گرفته شدهاست. طبق سه مدل و هر یک در دو حالت بدون خوشهبندی و با خوشهبندی در نرم افزار گمز (GAMS) پیادهسازی شد و نتایج مورد تحلیل و بررسی قرار گرفت. ضمن توجه به ماهیت مدل سنتی تحلیل پوششی داده به فرم مدل CCR بهترین وزنها برای تمامی ورودی و خروجیها به گونهای انتخاب میشود که هر واحد در بهینهترین حالت خود در محاسبه کارایی درنظر گرفته شود، البته با قید اینکه هیچ کارایی بالاتر از 1 در نظر گرفته نشود.
پیش از محاسبه کارایی در نرم افزار گمز، ابتدا انواع روشهای یادگیری ماشین در خوشهبندی واحدها به همراه فرایند ارزیابی کیفیت خوشهبندی پیادهسازی شد و بهترین الگوریتم خوشهبندی زیر مجموعه یادگیری ماشین برای مجموعه داده مورد مطالعه انتخاب گردید. دلیل تمرکز بر روی یادگیری ماشین جهت خوشهبندی کمبود استفاده از یادگیری ماشین برای خوشهبندی زنجیره تأمین است که به عنوان یکی از شکافهای دانش مورد مطالعه این پژوهش در نظر گرفته شد. در قسمت بعد انواع روشهای خوشهبندی و شاخصهای ارزیابی کیفیت خوشهبندی معرفی شدهاست.
خوشه بندی با استفاده از یادگیری ماشین
تحلیل خوشهبندی و تحلیل طبقه بندی به عنوان زیر مجموعهها، یادگیری ماشین به حساب میآیند. خوشهبندی در دسته یادگیری بدون نظارت و طبقهبندی در دسته یادگیری با نظارت تفکیک شدهاند. خوشهبندی فرایندی است که در آن مجموعه اعضا به دستههایی تقسیم میشوند که اعضای هر دسته بیشترین شباهت را به یکدیگر داشته باشند و از طرف دیگر اعضای هر دسته بیشترین تفاوت را نسبت به سایر دستهها داشته باشند. با توجه به اینکه در خوشهبندی برچسبی برای توصیف دستهها وجود ندارد، اعضا بر اساس ویژگیهای مشترک و روشهای اندازهگیری فاصل یا بیشترین شباهت بین اعضا به صورت خودکار در یک دسته (یا خوشه) قرار میگیرند. توصیف هر خوشه نیز پس از اتمام خوشهبندی بر اساس مشترکات اعضا و تفاوت بین خوشهها تفسیر و تحلیل میشود. روشهای متعددی در خوشهبندی وجود دارد که اجرا هر کدام از آنها بر روی مجموعه داده نتایج منحصر بفردی را حاصل میکند. در این مقاله سه الگوریتم از زیر مجموعههای یادگیری ماشین برای خوشهبندی استفاده شده و سپس نتایج و کیفیت خوشهبندی بین این سه روش بررسی گردیده است. هرچند اکثر الگوریتمهای خوشهبندی مبنای یکسانی برای محاسبه بیشترین شباهت یا فاصله دارند و در جزئیات محاسبات ریاضی تفاوتهایی دیده میشود. استفاده از فاصله اقلیدسی، منهتن و مینکوفسکی از جمله تفاوتهای محاسباتی بین انواع روشهای خوشهبندی است. در ادامه به بررسی روشهای K-Means، Hierarchial Clustering و Deep Embedded Clustering که زیر مجموعه یادگیری ماشین است، میپردازیم.
تعیین بهترین تعداد خوشه
برای تعیین بهترین تعداد خوشه (مقدار k) میتوان از شاخص ریشه میانگین مربعات انحراف استاندارد (RMSSTD) استفاده کرد. این شاخص میزان شباهت اعضای درون یک خوشه را اندازهگیری میکند. برای بهدست آوردن بهترین مقدار k، کافی است مقدار RMSSTD را به ازای مقادیر مختلف k محاسبه و در یک نمودار به فرم خط شکسته رسم کرد. در شکل 6 این نمودار برای دادههای مسئله مورد بحث در مقاله رسم شدهاست، طبق این نمودار با افزایش مقدار k، میزان RMSSTD روند نزولی پیدا کرده است. نمودار در یک نقطه دچار شکستگی قابل توجه شده که آن را به فرمی شبیه آرنج دست شبیه کرده است، به این نقطه Elbow یا آرنج گفته میشود. مقادیر پس از نقطه elbow کاهش چندانی را در میزان RMSSTD ایجاد نمیکند. در نتیجه مقدار بهینه برای تعداد خوشهها در نقطه آرنج برآورد میگردد. از این روش برای تعیین بهترین خوشه در مسائل مربوط به خوشهبندی استفاده میشود. با توجه به نمودار بهدست آمده تعداد خوشهها 4 برآورد گردیده است.
برای محاسبه RMSSTD مقادیر زیر بدین ترتیب تعریف میشود:
شکل6 : نمودار آرنج – تشخیص بهترین مقدار برای k
روشهای ارزیابی نتایج خوشهبندی
ارزیابی نتیجه خوشهبندی (که یک فرایند بدون نظارت است) به عنوان گامی مهم در روند پژوهش تلقی می-شود. در حالت کلی دو معیار ارزیابی نتایج خوشهبندی وجود دارد. الف) معیارهای ارزیابی درونی (Internal Criteria Index) و ب) معیارهای ارزیابی بیرونی (External Criteria Index). معیارهای ارزیابی درونی سعی در اندازهگیری میزان شباهت اعضا خوشه و تفاوت آنها با سایر خوشهها دارند. استفاده از روش تحلیل واریانس یکی از راهکارهای ارزیابی است، پس بر اساس این معیار آماری هدف بهدست آوردن حالتی از خوشهبندی است که میزان پراکندگی درون خوشهای کمینه (یعنی بیشترین شباهت بین اعضا) و میزان پراکندگی بین خوشهای بیشینه (یعنی بیشترین تفاوت بین سایر خوشهها) شود. در صورتی که تعداد ابعاد داده بیشتر از یک باشد نیاز است تا مجموع پراکندگی بین ابعاد تحت عنوان پراکندگی کل محاسبه گردد. در ادامه به بررسی سه شاخص ارزیابی استفاده شده در این پژوهش پرداخته خواهد شد:
الف) شاخص نیمرخ (Silhouette Score): این معیار هم به پیوستگی درون خوشهای و هم به تفکیک پذیری بین خوشهها بستگی دارد. در واقع مقدار شاخص سیلوت میزان تعلق به هر خوشه را در مقایسه با خوشه مجاور محاسبه میکند. برای فهم دقیق این شاخص نیاز به بررسی دو مفهوم کلیدی است:
- میانگین فاصله یک نقطه از خوشه با نقاط دیگر آن خوشه: که میتواند ملاکی برای ارزیابی تعلق نقطه x در خوشهاش در نظر گرفته شود. طبیعتا هر چه این مقدار کمتر باشد نشان دهنده تعلق x به این خوشه است. این مقدار با a(i) به صورت زیر محاسبه میگردد:
- حداقل میانگین فاصله نقطه با خوشههای دیگر: فرض کنید نقطه x متعلق به خوشه 1 باشد. حال میانگین فاصله این نقطه با نقاط خوشههای دیگر اندازه گرفته میشود، خوشهای که دارای کمترین میانگین فاصله برای نقطه x باشد به عنوان خوشه مجاور در نظر گرفته میشود. مقدار میانگین فاصله برای نقطه x با سایر نقاط مجاور با b(i) نمایش داده میشود که Ck در آن خوشه k ام است.
اگر مقدار a(i) کمتر از b(i) باشد مقدار Silhouette Score مثبت و اگر این شرط برقرار نباشد مقدار آن منفی خواهد شد و منفی شدن مقدار این شاخص نشان دهنده خوشهبندی ضعیف است زیرا در صورت منفی شدن نقطه x بیش از آنکه شبیه اعضای هم خوشهای خود باشد شبیه خوشه مجاور شده که نشان دهنده کیفیت پایین نتیجه خوشهبندی است. مقدار این شاخص عددی بین 1- و 1+ است که در چه این مقدار با 1 نزدیک تر باشد نشان دهنده کیفیت بالاتر خوشهبندی است. کم شدن این شاخص میتواند دلایل مختلفی داشته باشد، عدم انتخاب درست مقدار k، شباهت بسیار زیاد و تفکیک پذیر نبودن فضای داده یا عدم انتخاب بهترین الگوریتم برای خوشهبندی میتواند از جمله این عوامل تعیین کننده در مقدار معیار نیمرخ باشد. شاخص نیمرخ (سیلوت) برای نقطه x از رابطه زیر تعریف میشود که اگر میانگین این مقدار برای نقاط هر خوشه محاسبه گردد معیار ارزیابی هر خوشه بهدست آمده همچنین میانگین کل مقادیر نیمرخ برای تمام خوشهها نتیجه ارزیابی عملیات خوشهبندی را محاسبه میکند:
ب) شاخص دیویس – بولدین (Davies-Bouldin Score): برای محاسبه این شاخص نیاز است که دو معیار اندازه پراکندگی (که فرمول محاسبه آن شبیه فاصله مینکوفسکی نقاط هر خوشه از مرکز آن است و با Si نمایش داده شده) و عدم شباهت بین خوشهها (فاصله بین مرکز دو خوشه که با Dij نمایش داده شده) محاسبه گردد. سپس همان طور که در فرمول زیر دیده میشود مقدار Rij بدین صورت محاسبه میشود. طبق این فرمول در صورت میزان پراکندگی دو خوشه باهم جمع و در مخرج نیز عدم شباهت بین دو خوشه قرار گرفته است. هر چه خوشهها پراکندگی بیشتری داشته باشند مقدار Rij بزرگتر و هرچه دو خوشه از هم فاصله کمتری داشته باشند هم مجدد بر روی افزایش Rij تأثیر مثبت میگذارد.
پس برای محاسبه شاخص دیویس-بولدین در یک روش خوشهبندی کافی است ابتدا بیشینه فاصله هر خوشه نسبت به سایر خوشهها بهدست آید که آن را با Ri نمایش میدهیم. سپس میانگین Ri ها برای همه خوشههای ایجاد شده توسط الگوریتم خوشهبندی محاسبه میشود که در حقیقت میانگین حداکثر نسبت پراکندگی درون به پراکندگی بین خوشهها خواهد بود و هر مقدار آن کمتر باشد نشان دهنده کیفیت بالاتر عملیات خوشهبندی است.
ج) شاخص کالینسکی-هاراباسز (Calinski-Harabasz Score): عبارت است از نسبت واریانس به نسبت میان پراکندگی درون خوشهای و پراکندگی بین خوشهای. به بیان دیگر به آن معیار نسبت واریانس (VRC) نیز گفته میشود که در این فرمول SSb مجموع واریانس بین خوشهها و SSw مجموع واریانس درون خوشهها در نظر گرفته شدهاست. مقادیر n و k هم به ترتیب تعداد اعضا نمونه و تعداد خوشهها است:
یکی دیگر از چالشهای یادگیری ماشین در خوشهبندی حداکثر تعداد دفعات اجرای الگوریتم و تعداد دفعاتی است که الگوریتم به نقاط مختلفی به عنوان مرکز خوشه اجرا میشود که هدف آن رسیدن به بهترین نتیجه لازم در خوشهبندی است. لازم به ذکر است با توجه به اهمیت ارزیابی الگوریتمهای خوشهبندی زیرمجموعه یادگیری ماشین، کلیه توابع شاخصهای معرفی شده در این بخش در کتابخانه scikit learn و Tensorflow موجود است که با استفاده از زبان برنامه نویسی پایتون پیادهسازی شدهاست. در بخش بعد هر کدام از الگوریتم اصلی معرفی شده با استفاده از زبان پایتون و در محیط VScode اجرا شده و مقایسه کیفیت عملکرد آنها بر روی دادههای مورد مطالعه مدنظر این پژوهش با استفاده از شاخصهای سه گانه معرفی شده مورد ارزیابی قرار گرفته است.
یافتههای پژوهش
دراین قسمت ابتدا سه الگوریتم خوشهبندی زیر مجموعه یادگیری ماشین بر روی دادهها پیادهسازی شدهاست. سپس نتایج بهدست آمده بر اساس سه شاخص ارزیابی کیفیت مورد بررسی قرار گرفت. در گام بعد پس از خوشهبندی واحدهای مشابه (که در واقع همان زنجیره تأمین صنایع پتروشیمی است) تحلیل پوششی داده شبکهای طبق ساختار شبکهای پیشنهادی و مدل معرفی شده در بخش 3 به محاسبه کارایی نسبی بر مبنای معیارهای پایداری پرداخته است. همان طور که اشاره شد وضعیت 28 زنجیره تأمین دوسطحی در صنایع پتروشیمی برای 90 دوره زمانی جمع آوری شدهاست. بهترین کیفیت خوشهبندی در این 90 دوره زمانی متعلق به دورهای است که شاخصها ارزیابی کیفیت در آن بهترین مقادیر را در بین تمام دورهها زمانی داشته باشد. فضای داده در این پژوهش دارای ابعاد و پارامترهای متعددی است و امکان رسم نتایج بهدست آمده به صورت دوبعدی به گونهای که تمامی عوامل در شکلی واحد قابل رویت و مقایسه باشند وجود نداشت، لذا در شکل7 نتایج خوشهبندی به روش K-Means به ازای سه ورودی مجزا و صرفا خروجی مطلوب در سه نمودار مجزا برای نشان دادن تفکیک پذیری مناسب دادهها رسم شدهاست. اصلی ترین موارد کاربرد یادگیری بدون نظارت میتوان الف) تقسیم دیتاست بر مبنای ویژگیهای مشترک، ب) تشخیص ناهنجاریها یا دادهها پرت و ج) سادهسازی دیتاست و جمع آوری متغیرهایی با ویژگی مشابه. در صورت خلاصه در یک جمله هدف از یادگیری بدون نظارت مطالعه و بررسی ساختار ذاتی مجموعه داده مورد بررسی است که دو مسئله کاهش ابعاد و خوشهبندی از جمله کارکردهای اصلی آن است. هر کدام از این الگوریتمها دارای محدودیتهایی هستند برای مثال K-Means برای دادهها به فرم کروی پاسخ مناسبی نمیدهد.
یکی از مهمترین مراحلی که متخصصان علوم داده در انتخاب بهترین الگوریتم خوشهبندی آن را رعایت میکنند مشاهده تصویری فضای داده است. مشاهده پراکندگی و فرم داده گزینههای پیادهسازی نرم افزاری را برای رسیدن به بهترین جواب محدود میکند. البته امروزه با افزایش ابعاد دادهها در بسیاری از مواقع رسم نمودار بر اساس ویژگیهای متعدد از فضای دو یا سه بعدی فراتر میرود و عملا رسم دیتاست میسر نخواهد بود. در این میان استفاده از روشهای کاهش ابعاد (مانند PCA) پیشنهاد میشود که البته این راهکار هم در دیتاستی متناسب به متغیرها و ویژگیهای منحصر بفرد آن برنامه ریزی میشود. شکل7 صرفا عملکرد الگوریتم K-Means به ازای دو مورد از ورودیهای زنجیره و خروجی مطلوب رسم کرده است. نتایج نشان دهنده عملکرد مناسب این الگوریتم در خوشهبندی است. در جدول3 نتایج ارزیابی هر الگوریتم با بررسی سه شاخص معرفی شده در این مقاله ارائه شدهاست.
با توجه به نتایج مندرج در جدول الگوریتم Deep Embedded Clustering (DEC) در هر سه شاخص سیلوت، دیویس و کالینسکی بهترین عملکرد را نشان میدهد. در سطر انتهایی این جدول ضمن در نظر گرفتن هر زنجیره تأمین به صورت یک بلک باکس (درنظر نگرفتن فعالیتهای بین دوسطح) DEA سنتی به روش CCR پیادهسازی شد که نتایج رتبهبندی واحدهای تصمیم بر اساس کارایی نسبی کل زنجیره را نشان میدهد.
شکل7: نمودار خروجی الگوریتم K-Means به ازای سه ورودی مجزا و خروجی مطلوب
جهت ملموس شدن نتیجه خوشهبندی و عدم ارتباط آن با کارایی نسبی با استفاده از رنگها متفاوت و بر مبنای نتایج بهترین الگوریتم خوشهبندی که DEC معرفی شد نتایج بدین شرح تفسیر میگردد.
جدول3: ارزیابی کیفیت خوشهبندی
شاید در گام اول در نظر گرفتن کارایی نسبی واحدها و دستهبندی آنها بر این اساس و قیاس برای ارائه راهکار بهبود روشی مناسب باشد ولی خوشهبندی وظیفه پیدا کردن و کشف مشابهتهایی را دارد که از نظر ظاهری برای کاربر ملموس نیست نتایج بهدست آمده نشان میدهد که خوشهبندی واحدهای تصمیم به فرم زنجیره تأمین چند سطحی میتواند تا حد قابل توجهی ارائه راهکار بهبود عملیاتی برای واحدهای ناکارا در پی داشته باشد، ارائه راهکاری که قابل دسترس برای هر کدام از واحدها بوده و مدیران میتوانند آن را به عنوان هدفی کوتاه مدت در اتخاد استراتژی مناسب برای توسعه واحد صنعتی خود در نظر داشته باشند. و اما در خصوص واحدهای کارای در خوشه این نکته حائز اهمیت است که این واحدها در خوشه خود کارا هستند و اینها نیز نیاز است که برای خود راهکار بهبود داشته باشند. این واحدها میتوانند با الگو قرار دادند کاراترین واحد کل برای توسعه خود برنامه ریزی نمایند تا بتوانند در دورهها زمانی آتی در خوشهای بالاتر برای رسین به نتایج بهتر رقابت نمایند.
پس از یافتن بهترین نتیجه برای خوشهبندی مبتنی بر یادگیری ماشین، طبق شکل5، شبکه زنجیره تأمین پیشنهادی مدلسازی شد و معادلات برای محاسبه کارایی بر اساس تحلیل پوششی داده شبکهای در نرمافزار GAMS پیادهسازدی گردید. در جدول4 ابتدا نتایج کارایی بدون در نظر گرفتن خوشهبندی برای کلیه واحدهای صنعتی پتروشیمی در ایران جمع آوری شدهاست. در این جدول با فرض بازده به مقیاس ثابت، معادلات در سه روش اشاره شده در بخش 3 (روش تحقیق) پیادهسازی شدهاست. در این جدول کارایی کل زنجیره تأمین با استفاده از فرم ضربی، یعنی از حاصلضرب کارایی مرحله اول و دوم در دو حالت بدون در نظر گرفتن خروجی نامطلوب و با درنظر گفتن خروجی نامطلوب به روش تحلیل پوشش داده شبکهای (NDEA) محاسبه گردیده است. به علاوه مقدار ناکارایی هر واحد نیز با استفاده از مدل DDF (تابع فاصله جهت دار) با مقدار تتا در جدول قابل مشاهده است. جدول 5 مقادیر کارایی کل و ناکارایی هر واحد در خوشه محاسبه کرده است.
در جدول5 همان طور که مشاهده میشود کارایی کل از ضرب کارایی مرحله اول (استخراج) در مرحله دوم (پالایشگاه) و با اولویت مرحله دوم یعنی پالایشگاه مورد محاسبه قرار گرفته است. تعداد واحدهایی که دارای کارایی 1 شدهاند (واحدهای کارا) در روش خوشهبندی مورد بیشتر است. پس میتوان با استفاده از رویکرد خوشهبندی کارایی واحدهای پتروشیمی مورد مطالعه را با رویکرد خوشبینانه ارزیابی نمود و واحدهای ناکارا میتوانند جهت برنامه ریزی برای توسعه واحد خود، شاخصهای کاراترین واحد خوشه خود را برای برنامه-ریزی کوتاه مدت در نظر داشته باشند.
همان طور که در در روش تحقیق اشاره شد میزان k (تعداد خوشه) به روش elbow برای دادهها مورد مطالعه مقداری برابر 4 بهدست آمد، البته محاسبات برای k=3 هم انجام شد که نتایج خوشهبندی مورد تأیید نبود. لازم به ذکر است با توجه به اینکه خوشه 3 و 4 از نظر تعداد واحد از خوشه 1 و 2 کمتر بودند در بخشی جداگانه تر کیب شده و به عنوان یک خوشه در نظر گرفته شدند تا تفاوت نتایج بهدست آمده مورد ارزیابی قرار گیرد. نتایج نشان داد که درصورتی که تعداد اعضای یک خوشه از 5 کمتر باشد محاسبات کارایی نتایج مناسبی را نمیدهد به همین دلیل نیاز است که پس از محاسبه k و نتایج بهدست آمده در صورت برای جمع بندی نهایی و تحلیل دو دستهای که کمترین اعضا را دارند در یک دسته بزرگتر قرار بگیرند تا نتایج برای اعضای خوشه قابل تفسیر باشد. در بخش بعد به تحلیل نتایج بهدست آمده پرداخته شدهاست.
بحث و نتیجهگیری
در مهمترین پدیده قرن حاضر ظهور حجم عظیمی از داده در سازمانها و صنایع است، بهرهگیری از علوم داده در پالایش و تفسیر این دادهها یکی از مهمترین فاکتورهای ایجاد مزیت رقابتی در صنعت است، درواقع این دادهها به عنوان دارایی ضمنی در سازمانها تلقی میشوند. پژوهش حاضر توجه ویژه به جایگاه علوم داده در مدیریت زنجیره تامین را در روش تحقیق در نظر گرفت و به طور خاص کاربرد الگوریتمهای یادگیری ماشین را در حوزه خوشهبندی مورد بررسی قرارداده است. در همین راستا ضمن بررسی الگوریتمهای به روز و مورد استفاده در مقالات و مجلات بینالمللی، جایگاه این قبیل بررسیها در پژوهشهای پیشین مرتبط با محاسبه کارایی نسبی و پایداری در زنجیره تأمین بررسی شد تا یک خط سیر پژوهشی در حوزه کارایی زنجیره تأمین با استفاده از NDEA با بهرهگیری از علوم داده ترسیم گردد. این پژوهش نشان داد که تأثیر دسته بندی بهینه واحدهای تصمیم به خوشههایی با بیشترین شباهت میتواند راهکار عملی بهتری را نسبت به روشهای سنتی محاسبه کارایی نسبی ارائه دهد. خوشهبندی DMUها باعث شد تا واحدهای ناکارا هر خوشه فاصله کمتری را برای بهبود با کاراترین واحد دسته خود داشته باشند که این امر میتواند معیاری مناسب برای هدف گذاری کوتاه مدت واحدهای صنعتی برای رسیدن به کاراترین واحد خوشه خود در نظر گرفته شود. از طرفی با توجه به اینکه کارایی نسبی برای تمامی DMUها بدون در نظر گرفتن خوشهبندی هم اجرا شدهاست، واحدهای کارای هر خوشه نیز میتوانند هدف خود را رسیدن شاخصهای کاراترین واحد در بین 28 واحد صنعتی قرار دهند تا محاسبات به روش پیشنهاد شده در این مقاله بتواند سیر توسعه عملیاتی برای تمامی واحدها را در نظر گرفته باشد. نتایج مشاهده شده در جدول 4 و 5 محاسبه کارایی مرحلههای 1 و 2 زنجیره تأمین را در دو حالت بدون خوشهبندی و با خوشهبندی نشان داد. همان طور که اشاره شد کارایی به فرم ضربی و بر اساس مدل ارائه شده در شکل 5 در نرم افزار گمز پیادهسازی شد.
جدول2: داده یک دوره زمانی و نتیجه خوشهبندی به سه روش
جدول4 : نتایج محاسبه کارایی و ناکارایی برای کل واحدهای تصمیم
جدول 5: نتایج محاسبات کارایی به تفکیک هر خوشه
نتایج نشان داد که در صورت خوشهبندی میزان ناکارایی برای هر واحد تصمیم کاهش مییابد، یعنی واحدهای هر خوشه برای رسیدن به کارایی نسبی کافی است که کاراترین واحد خوشه خود را الگو قراردهند. لازم به ذکر است با توجه به پیادهسازی تحلیل پوششی داده به فرم ضربی و الویت قرار دادن سطح 2، منجر شد که اکثر وزنها در معادله به گونهای در راستای حداکثرسازی کارایی مرحله 2 در نظر گرفته شوند به همین دلیل در اکثر موارد تأثیر مرحله پالایشگاه در محاسبه کارایی نسبی و محاسبه ناکارایی به روش DDF مشهود است. خوشهبندی و ارائه راهکار بهبود سلسله مراتبی میتواند واحدهای صنعتی را در بهبود و توسعه مستمر ترغیب کند که نتایج شبیهسازی هم این ادعا را ثابت مینماید. در بررسی دیگر بین محاسبه کارایی بدون خروجی نامطلوب و با خروجی نامطلوب نتایج نشان داد که با توجه به تأثیر خروجی نامطلوب که با یک تبدیل خطی به عنوان خروجی مطلوب تحت عنوان y^ در نظر گرفته شد میزان کارایی کل و کارایی مرحله دوم در تمامی موارد نسبت به حالت بدون خروجی نامطلوب افزایش پیدا کرد که خود نشان دهنده تأثیر پذیری مثبت دخیل شدن این عامل در افزایش دقت محاسبات کارایی نسبی است. این راهکار منجر به ارائه بهبود مستمر و توسعه پلکانی در صنایع میشود که خود یکی از شاخصها توسعه پایدار در اصول مدیریتی است. بهرهگیری از تکنیکهای علوم داده در مباحث مدیریت زنجیره تأمین زمینه ظهور پژوهشهای میان رشتهای خواهد شد که میتواند تأثیر به سزایی در بهبود و توسعه واحدهای صنعتی داشته باشد. برای ادامه روند این پژوهش نیز میتوان روشهای خوشهبندی بیشتری از قبیل خوشهبندی با استفاده از DEA را بر روی دادههای مورد مطالعه در نظر گرفت. روش خوشهبندی مبتنی بر DEA از توابع تولید تکهای بهدستآمده از روش DEA را برای خوشهبندی دادهها با انواع ورودی و خروجی در نظر میگیرد. بنابراین، هر واحد تصمیمگیری ارزیابیشده نه تنها خوشهای که به آن تعلق دارد را میشناسد، بلکه نوع تابع تولید دسته خود را در نظر میگیرد. این روش برای تصمیمگیریهای مدیریتی مهم است که در آن مدیران علاقه دارند که تغییرات مورد نیاز در ترکیب منابع ورودی و خروجی را شناسایی کنند تا بر این اساس بتوانند خود را در یک خوشه مطلوب قرار دهند. از طرفی با توجه به تأثیر کارایی دورههای زمانی گذشته بر کارایی دوره زمانی آتی، میتوان از مدل تحلیل پوششی داده شبکهای پویا برای تحلیل زنجیره تأمین دوسطحی با در نظر گرفتن حلقه بازگشتی برگشت ضایعات به چرخه پالایش و اضافه شدن عوامل بیشتر در محاسبه کارایی نسبی استفاده کرد.
[i] Kao and Hwang