dn=sqrt(sum((V-repmat(AN,r,1)).^2,2));
cl=(dp+dn);
cl=dn./cl;
rawRank=cl;
=sort(cl);
end
۴-۳ نمونه شبیه‌سازی مدل پیشنهادی
در زیر یک مثال از اجرای برنامه آورده شده که به ازای یک پرس‌وجوی مشخص بازخوردهای ذکر شده در بالا را برای ۱۰ سایت اول از ۱۰۰۰ کاربر گرفته و سایت‌ها را رتبه‌بندی کرده و در یک فاصله زمانی مشخص و با بهره گرفتن از بازخوردهای بعدی این رتبه‌بندی‌ها را به روز می‌کند.
پایان نامه

شکل ۴-۱۱۴: نمونه‌ای از شبیه‌سازی مدل پیشنهادی
فصل پنجم
نتیجه گیری
۵-۱ بحث و نتیجه گیری
امروزه رشد روز افزون وب موجب بروز چالش‌های جدی برای سیستم‌های بازیابی اطلاعات در محیط وب گردیده است. از این رو، ارائه‌ روش‌هایی به منظور تسریع و هدفمند کردن جستجوی اطلاعات در این محیط، مورد توجه محققان مختلف، قرار گرفته است. از طرفی، ناهمگون بودن اطلاعات در این محیط، موجب هر چه پیچیده‌تر شدن بازیابی اطلاعات در وب شده است.
مهم‌ترین ابزار برای جستجو در این اقیانوس بی کران اطلاعات، موتورهای جستجو می‌باشند که یکی از اصلی‌ترین بخش‌های آن‌ رتبه‌بندی نتایج در پاسخ به پرس‌وجوی کاربر است. رتبه‌بندی فرآیندی است که کیفیت یک صفحه توسط موتور جستجو تخمین زده می‌شود. هدف از این تحقیق بررسی روش‌ها و الگوریتم‌های موجود در بحث رتبه‌بندی صفحات وب در موتورهای جستجو و تشریح نقاط قوت و ضعف یا به عبارتی چالش‌های موجود در هر یک از روش‌ها و الگوریتم‌ها بوده است. هم چنین، برخی از راه حل‌های ممکن برای مشکلات عنوان شده، که توسط محققین این حوزه به شکل مقاله و ژورنال در مراجع معتبر و بین‌المللی در دسترس هستند، معرفی شدند.
موتورهای جستجو نتایج جستجو را بدون توجه به علایق یا زمینه کاری کاربر ارائه می‌دهند. بر همین اساس کاربران هنگام استفاده از موتورهای جستجو اغلب با نتایجی مواجه می‌شوند که ممکن است مورد علاقه آن‌ها نباشند و مسئله مهم دیگر اینکه اکثر موتورهای جستجو از الگوریتم‌هایی به منظور جستجو استفاده می‌کنند که فقط به تعداد لینک‌های ورودی و خروجی یک وب سایت نگاه می‌کنند مانند پیجرنک، بنابراین الگوی رفتاری کاربر در رتبه‌بندی نقش مهمی را ایفا می‌کند.
در این کار روشی برای رتبه‌بندی اسناد وب با استفاده همزمان از پنج مورد از بازخوردهای مثبت و منفی کاربران شامل (open click, dwelltime, download, plus click, negative click) بر روی لیست نتایج وب ارائه دادیم که در این مدل پیشنهادی از یکی از مدل‌های تصمیم‌گیری چند شاخصه به نام TOPSIS برای رتبه‌بندی استفاده می‌کنیم. فرض این روش بر این است که مطلوبیت برای هر یک از شاخص‌ها به طور یکنواخت افزایشی یا (کاهشی) است. بعلاوه این روش به دلیل ماهیت توأم دو فاصله از گزینه ایده‌آل مثبت و ایده‌آل منفی روش مناسبی برای اولویت بندی صفحات محسوب می‌شود. یکی از مهم‌ترین مزایت های روش پیشنهادی در مقایسه با روش‌های مشابه تصمیم‌گیری چند شاخصه این است که در صورتی که بعضی از معیارهای تصمیم‌گیری مثبت و هدف افزایش آن‌ها باشد و بعضی از معیارها منفی و هدف کاهش آن‌ها باشد، این روش به آسانی جواب ایده‌آل را که ترکیبی از بهترین مقادیر دست‌یابی همه معیارها است پیدا می‌کند، و در نهایت یک رتبه‌بندی بر روی اسناد انجام می‌دهد. در واقع نوآوری این مدل در این است که به طور همزمان از تعداد زیادی از بازخوردهای کاربران برای رتبه‌بندی استفاده می‌کند. که در میان این بازخوردها زمان که یکی از روش‌های جدید شناخته شده از انواع فیدبک های ضمنی کاربران می‌باشد و محققان معتقد هستند که برای تعداد ثابتی از کاربران در یک جلسه پرس وجو مشخص، زمان توجه کاملاً نشانگر علاقه کاربر می‌باشد. و هر چه قدر کاربر زمان بیشتری را صرف مطالعه یک سند می‌کند، آن سند برای وی با اهمیت‌تر خواهد بود، نیز در نظر گرفته شده است.
۵-۲ مزایای روش پیشنهادی
یکی از مهم‌ترین مزیت‌های این روش این است که معیارها یا شاخص‌های به کار رفته برای مقایسه می‌توانند دارای واحدهای سنجش متفاوتی بوده و طبیعت منفی یا مثبت داشته باشند. به عبارتی می‌توان از شاخص‌های منفی و مثبت به شکل ترکیبی در این تکنیک استفاده نمود. بر اساس این روش بهترین گزینه یا راه حل نزدیک‌ترین گزینه به راه حل یا گزینه ایده‌آل است. به طور خلاصه راه حل ایده‌آل از مجموعه مقادیر حداکثر هر یک از معیارها به دست می‌آید، در حالی که راه حل غیر ایده‌آل از مجموعه پایین‌ترین مقادیر هر یک از معیارها حاصل می‌گردد.
این روش به سادگی و با سرعت مناسب اعمال می‌گردد، و به دلیل کاهش حجم محاسبات در ارزیابی تعداد زیادی گزینه بهره گرفته می‌شود.
تعداد قابل توجهی معیار را می‌توان در نظر گرفت.
از آنجایی که روش TOPSIS جزء روش‌های جبرانی است اجازه مبادله در بین شاخص‌ها در آن‌ها مجاز است، یعنی مثلاً تغییری در یک شاخص می‌تواند توسط تغییری مخالف در شاخص یا شاخص‌های دیگر جبران شود.
اطلاعات ورودی را می‌توان تغییر داد و نحوه پاسخگویی را بر اساس این تغییرات بررسی کرد.
۵-۳ کارهای آینده
با توجه به مطالعه و تحقیق انجام شده به این نتیجه رسیدیم که علی‌رغم اینکه استفاده از رفتار کاربر در رتبه‌بندی در سال‌های اخیر مورد توجه واقع شده است و روش‌هایی نیز برای آن ارائه گردیده است، اما همچنان فضا برای پژوهش جدید خصوصاً با بهره گرفتن از روش‌های رفتاری وجود دارد. همچنین شخصی سازی با توجه به رفتار گذشته‌ی کاربران از مواردی است که هنوز به طور کامل حل نشده است و به تأمل و بررسی بیشتری نیاز دارد. از کارهای آینده تهیه و استفاده از داده‌های واقعی در این روش و همین‌طور بررسی روش‌های ترکیبی دیگر است. همین‌طور برای رتبه‌بندی بهتر صفحات وب می‌توانیم در این روش پیشنهادی می‌توانیم الگوریتم TOPSIS فازی را نیز استفاده کنیم.

فهرست منابع

[۱] Baeza-Yates R, and Ribeiro-Neto B. Modern Information Retrieval. ACM Press / Addison-Wesley, 2005.
[۲] Bharat K, Henzinger MR. Improved algorithms for topic distillation in a hyperlinked environment. In Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Melbourne, Australia, August 2006. pp:104-111.
[۳] Kleinberg M. Authoritative sources in a hyperlinked environment. Journal of the ACM, Vol. 46 No. 5, September 1999. pp:604–۶۳۲٫
[۴] Kent P. Search Engine Optimization for dummies. John Wiley & Sons Inc. 2008.
[۵] Keyhanipour AH, Moshiri B, Piroozmand M, Lucas C. Aggregation of Multiple Search Engines Based on Users’ Preferences in WebFusion. Elsevier Journal of Knowledge-Based Systems, Vol. 20, No. 4, May 2007. pp:321–۳۲۸٫
[۶] Liu TY, Qin T, Xu J, Xiong W, Li H. LETOR: Benchmark dataset for research on learning to rank for information retrieval. In SIGIR Workshop on Learning to Rank for Information Retrieval, 2007.
[۷] Castillo C. Effective Web Crawling, Ph.D. Thesis, University of Chile, Nov2004.
[۸] Baeza-Yates R. Challenges in the interaction of information retrieval and natural language processing. In Proceedings of 5th international conference on Computational Linguistics and Intelligent Text Processing (CICLing), Lecture Notes in Computer Science Springer, Vol. 2945, February 2004. pp:445–۴۵۶٫
[۹] Tomasic A, Garcia-Molina H. Performance of inverted indices in sharednothing distributed text document informatioon retrieval systems. In Proceedings of the second international conference on Parallel and distributed information systems,IEEE Computer Society Press,1993. pp: 8–۱۷٫
[۱۰] Moussea V. Figueria J. Gomes silv C. Resolving Inconsistencies Among Constraints on the parameters of MCDA model” , European jornal of operational research. Volume 147, 2006. pp: 72-93.
[۱۱] Zhang Y, Chen W, Wang D, Yang Q. User-click modeling for understanding and predicting search-behavior. In Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD’11). ACM, New York, NY, USA, August 2011. pp: 1388-1396.
[۱۲] Zhao D, Zhang M, Zhang D. A Search Ranking Algorithm Based on UserPreferences. Journal of Computational Information Systems, November 2012. pp: 8969-8976.
[۱۳] Attenberg J, Pandey S, Suel T. Modeling and predicting user behavior in sponsored search. In Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD ‘09). ACM, New York, NY, USA,2009. pp:1067-1076.
[۱۴] Yu J, Lu Y, Sun S, Zhang F. Search Results Evaluation Based on User Behavior. Springer-
analysis of dwell time. In Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval (SIGIR ‘10). ACM, New York, NY, USA,2010. pp: 386-379.
[۱۷] Yang C, Liu C, Shao-chieh H, A Hybrid Item-Based Recommendation Ranking Algorithm Based on User Access Patterns. Springer-Verlag Berlin Heidelberg, vol. 163,2013. pp: 233-225.
[۱۸] Guo F, Liu C, Wang Y. Efficient Multiple-Click Models in Web Search. The definitive version will appear in WSDM ’۰۹: Proceedings of the second ACM international conference on web search and data mining. 2008 ACM.
[۱۹] Salton G, Buckley C. Term-weighting approaches in automatic text retrieval. Information Processing and Management: an International Journal, Vol. 24 No.5,1988. pp:513–۵۲۳٫
[۲۰] Salton G. The SMART retrieval system - experiments in automatic document processing. Prentice-Hall, 1971.

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...