مقایسه دو الگوریتم درخت تصمیم‌گیری و ماشین بردار پشتیبان برای طبقه‌بندی مکان‌های جاذب گردشگری بر اساس اطلاعات زمینه‌ای کاربر

نوع مقاله : مقاله پژوهشی

نویسندگان

دانشگاه صنعتی خواجه نصیرالدین طوسی

10.22034/jtd.2019.155024.1560

چکیده

امروزه گردشگری و جذب گردشگر به عنوان یکی از منابع اقتصادی و همچنین بررسی داده‌های گردشگری با توجه به اهمیت روزافزون صنعت گردشگری و تجارتی و رقابتی شدن این صنعت اهمیت ویژه‌ای یافته است. در صنعت گردشگری شناخت خصوصیات و اطلاعات زمینه‌ای کاربر سبب اتخاذ تصمیمات هدفمندتر و ارائه خدمات رضایت‌بخش‌تری به کاربر می‌شود که این امر بدون استفاده از ابزارها و تکنیک‌های داده‌کاوی میسر نمی‌شود. روش‌های مختلفی برای طبقه‌بندی و بررسی داده‌ها وجود دارد. با توجه به اهمیت بالای شناخت رفتار و ویژگی‌های گردشگران در انتخاب مکان جاذب گردشگری و در نتیجه جلب رضایت گردشگران هدف این مطالعه مقایسه دو الگوریتم درخت تصمیم‌گیری و ماشین بردار پشتیبان برای طبقه‌بندی مکان‌های جاذب گردشگری بر اساس اطلاعات زمینه‌ای کاربر در نرم‌افزار Weka است. در این راستا از اطلاعات زمینه‌ای کاربر ازجمله سن، جنسیت، میزان تحصیلات، نوع مکان گردشگری و امتیازی که کاربران به مکان گردشگری داده‌اند برای طبقه‌بندی مکان‌های جاذب گردشگری استفاده شده است. برای این منظور اطلاعات زمینه‌ای و اطلاعات مکان‌های گردشگری از 220 کاربر در مورد جاذبه‌های گردشگری تهران جمع‌آوری گردید و برای آموزش و تست دو الگوریتم مورد استفاده قرار گرفته است. با بررسی نتایج این تحقیق با معیارهای مختلف مشخص گردید که درخت تصمیم‌گیری عملکرد بهتری در مقایسه با روش ماشین بردار پشتیبان بر روی داده-های استفاده‌شده دارد.

کلیدواژه‌ها


عنوان مقاله [English]

Comparison of Decision Tree and Support Vector Machine Algorithm for Classification of Tourist Attraction Sites Based on User Context

نویسندگان [English]

  • soheil rezaee
  • abolghasem Sadeghi niaraki
  • maryam shakeri
k.n. toosi university of technology
چکیده [English]

Today, tourism and tourist attraction as one of the economic resources, as well as the study of tourism data, have become especially important given the growing importance of the tourism industry and the competitiveness of this industry. In the tourism industry, recognizing the characteristics and information of the user's context leads to more targeted decisions and more satisfactory service to the user, which is not possible without the use of datamining tools and techniques. There are several methods for categorizing and verifying data. Considering the importance of recognizing the behavior and characteristics of tourists in choosing a tourist attraction place and thus attracting tourists' satisfaction, the aim of this study is to compare two decision tree and Support Vector Machine algorithms for categorizing tourist attraction sites based on user context information in Weka software. In this regard, user context information such as age, gender, educational level, type of tourist site and the point that users have given to the tourist destination has been used to classify tourist attraction sites. For this purpose, the user context and information of tourist place from 220 users were collected in Tehran tourist attractions and used for training and testing of two algorithms. By examining the results of this research, it was determined by different criteria that the decision tree has a better performance than the Support Vector Machine on the data used.

کلیدواژه‌ها [English]

  • Classification
  • context
  • decision tree
  • Support Vector Machine
  • Tourism
انصاری، آذرنوش و اسدی، علی (1395). «گردشگری، ارزیابی وفاداری گردشگر به مقصد با رویکرد داده‌کاوی گردشگران داخلی شهر اصفهان». فصل‌نامۀ مطالعات مدیریت گردشگری، سال یازدهم، شمارۀ 35، ص 85-106.
برزمینی، س. (1396). «داده‌کاوی و کاربرد آن در صنعت گردشگری». کنفرانس ملی علوم مهندسی.
صفدری و همکاران (2018). «مقایسۀ الگوریتم‌های مختلف طبقه‌بندی داده‌ها برای تعیین نوع زردی در نوزادان». مجلۀ پیاورد سلامت، سال یازدهم، شمارۀ 5، ص 541-548.
مسلمی نجار کلایی، فردین و همکاران (1394). «پیش‌بینی زمان سفر در مسیرهای برون‌شهری با استفاده از تکنیک‌های داده‌کاوی مکانی، مطالعۀ موردی: مسیر قائمشهر به بابل و ساری به قائمشهر». مجلۀ رایانش نرم و فناوری اطلاعات، سال چهارم، شمارۀ 3، ص 3-15.
محمدی، شهریار و پیرمحمدیانی، راجیار (1394). «امتیازبندی رفتاری مشتریان بانک با استفاده از رویکرد داده‌کاوی و فرآیند تحلیل سلسله‌مراتبی». رایانش نرم و فناوری اطلاعات، سال چهارم، شمارۀ 3، ص 52-65.
Batet, M. et al. (2012). “Turist@: Agent-based personalised recommendation of tourist activities”  in Expert Systems with Applications. 39(8), 7319-7329.
Buhalis, D., & Amaranggana, A. (2015). “Smart tourism destinations enhancing tourism experience through personalisation of services” in Information and communication technologies in tourism Springer, 377-389.
Chen, K. Y., & Wang C. H. (2007). “Support vector regression with genetic algorithms in forecasting tourism demand”. Tourism Management, 28(1), 215-226.
Cho, Y.H., Kim, J. K., & Kim, S.H.J.E.s.w.A. (2002). “A personalized recommender system based on web usage mining and decision tree induction”. 23(3), 329-342.
Dey, A. (2001). “Understanding and using context”. personal ubiquitous computing, 5(1), 4-7.
Golbandi, N., Koren, Y., & Lempel, R. (2011). “Adaptive bootstrapping of recommender systems using decision trees”. in Proceedings of the fourth ACM international conference on Web search and data mining. ACM.
Gunn, S. R. (1998). “Support vector machines for classification and regression”. ISIS technical report, 14(1), 5-6.
Jadhav, S. D., & Channe, Hemlata (2016). “Comparative study of K-NN, naive Bayes and decision tree classification techniques”. International Journal of Science and Research (IJSR), 5(1), 1842-1845.
Kim, S.S., Timothy, D.J. and Hwang, J.J.T.M. (2011). “Understanding Japanese tourists’ shopping preferences using the Decision Tree Analysis method”. Tourism Management, 32(3), 544-554.
Lim, K. H. (2015). “Recommending tours and places-of-interest based on user interests from geo-tagged photos”. in Proceedings of the ACM SIGMOD on PhD Symposium. ACM.
Liu, H. H., Chang, L. C., Li, C. W., & Yang, C. H. (2018). “Particle Swarm Optimization-Based Support Vector Regression for Tourist Arrivals Forecasting . Computational Intelligence and Neuroscience,  2018.
Nikam, S. S. (2015). “A comparative study of classification techniques in data mining algorithms. Oriental journal of computer science & technology, 8(1), 13-19.
Perera, C. et al. (2014). “Context aware computing for the internet of things: A survey”. IEEE commun surv.tutor, 16(1), 414-454.
Rafidah, A. et al. (2017). “A Wavelet Support Vector Machine Combination Model for Singapore Tourist Arrival to Malaysia” in IOP Conference Series: Materials Science and Engineering. IOP Publishing.
Ramya, R. et al. (2018). A Review Of Different Classification Techniques In Machine Learning Using Weka For Plant Disease Detection.
Stein, G. et al. (2005).“Decision tree classifier for network intrusion detection with GA-based feature selection” in Proceedings of the 43rd annual Southeast regional conference-2, 136-141, ACM.
Swain, P. H., & Hauska, H. (1977). “The decision tree classifier: Design and potential”. IEEE Transactions on Geoscience Electronics, 15(3), 142-147.
Xu, X., Law, R., & Wu, T. (2007). “Classification of business travelers using SVMs combined with kernel principal component analysis”. in International Conference on Advanced Data Mining and Applications.
Yoneyama, Y. et al. (2002). “Increased plasma adenosine concentrations and the severity of preeclampsia”. 100(6), 1266-1270.