Web-meatzaritza

Web-meatzaritza (ingelesez, Web mining) Webetik patroiak deskubritzeko datu-meatzaritza tekniken aplikazioa da. Analisiaren helburuaren arabera, hiru mota ezberdindu daitezke: Web erabileraren meatzaritza, Web edukien meatzaritza eta Web egituraren meatzaritza.

Web erabileraren meatzaritza

Web erabileraren meatzaritza erabiltzaileak webeko datuekin egiten duen erabilera aztertu eta deskubritzeko datu-meatzaritza aplikatzean datza. Erabiltzaileak webgune batean nabigatu eta ekintzak burutzen dituenean gordetzen dira erabilera datuak. Web zerbitzari bat edo gehiagotik patroien ezagutze automatikoa beharrezkoa du. Erakundeen datu kopuru handiak sortu eta gordetzen dituzte; informazio gehiena web zerbitzariek automatikoki sortzen dituzte eta bertako log fitxategian gordetzen da. Datu horiek aztertzeak laguntza handia eskaini diezaioke erakundeari bere bezeroak ezagutu ahal izateko.

Web erabileraren meatzaritzarako prozesua

  • Arazoaren identifikazioa
  • Datuak jasotzea
  • Datuen aurreprozesamendua
  • Patroien deskubrimendu eta analisia

Web edukien meatzaritza

Web edukien meatzaritza web orrialde baten edukitik informazio erabilgarria erauztean datza. Web edukia mota ezberdinetakoa izan daiteke, hala nola testua, irudiak, soinua edo bideoa. Web edukien meatzaritza testu meatzaritza izenez ezagutzen da askotan, testuzko edukiak direlako ikerketa arlo honetan zabalduena. Web edukien meatzaritzan erabilitako teknologia ohikoenak lengoaia naturalen prozesamendua eta informazioa eskuratzea (edo zehatzago, informazio erauzketa) dira.

Web egituren meatzaritza

Web egituren meatzaritza webgune baten nodo eta konexioen egitura aztertzeko grafikoen teoria erabiltzean datza. Webean egituratutako datuen ezaugarriak kontuan izanik, web egituren meatzaritzaren barruan bi mota ezberdindu daitezke.

Lehena hiperloturetatik patroiak lortzea da. Hiperlotura bat web orrialde bat beste leku batekin lotzen duen egitura elementua da. Eta bigarrena, dokumentuen egituran oinarritzen da. Web orrialde baten HTML edo XML kodea aztertzeko zuhaitz erako egitura erabiltzen da.

Web meatzaritzaren aplikazioak

  • E-commerce
  • Bilaketa motoreak
  • Pertsonalizazioa
  • Webguneen diseinua

Baliabideak

Liburuak

  • Jesus Mena, "Data Mining Your Website", Digital Press, 1999
  • Soumen Chakrabarti, "Mining the Web: Analysis of Hypertext and Semi Structured Data", Morgan Kaufmann, 2002
  • Advances in Web Mining and Web Usage Analysis 2005 - revised papers from 7 th workshop on Knowledge Discovery on the Web, Olfa Nasraoui, Osmar Zaiane, Myra Spiliopoulou, Bamshad Mobasher, Philip Yu, Brij Masand, Eds., Springer Lecture Notes in Artificial Intelligence, LNAI 4198, 2006
  • Web Mining and Web Usage Analysis 2004 - revised papers from 6 th workshop on Knowledge Discovery on the Web, Bamshad Mobasher, Olfa Nasraoui, Bing Liu, Brij Masand, Eds., Springer Lecture Notes in Artificial Intelligence, 2006

Erreferentziak

  • Cooley, R. Mobasher, B. and Srivastave, J. (1997) “Web Mining: Information and Pattern Discovery on the World Wide Web” In Proceedings of the 9th IEEE International Conference on Tool with Artificial Intelligence
  • Cooley, R., Mobasher, B. and Srivastava, J. “Data Preparation for Mining World Wide Web Browsing Patterns”, Journal of Knowledge and Information System, Vol.1, Issue. 1, pp.5-32, 1999
  • Kohavi, R., Mason, L. and Zheng, Z. (2004) “Lessons and Challenges from Mining Retail E-commerce Data” Machine Learning, Vol 57, pp. 83-113
  • Mobasher, B., Cooley, R. and Srivastava, J. (2000) “Automatic Personalisation based on web usage Mining” Communications of the ACM, Vol. 43, No.8, pp. 142-151
  • Mobasher, B., Dai, H., Kuo, T. and Nakagawa, M. (2001) “Effective Personalization Based on Association Rule Discover from Web Usage Data” In Proceedings of WIDM 2001, Atlanta, GA, USA, pp. 9-15
  • Nasraoui O., Petenes C., "Combining Web Usage Mining and Fuzzy Inference for Website Personalization", in Proc. of WebKDD 2003 – KDD Workshop on Web mining as a Premise to Effective and Intelligent Web Applications, Washington DC, August 2003, p. 37
  • Nasraoui O., Frigui H., Joshi A., and Krishnapuram R., “Mining Web Access Logs Using Relational Competitive Fuzzy Clustering,” Proceedings of the Eighth International Fuzzy Systems Association Congress, Hsinchu, Taiwan, August 1999
  • Nasraoui O., “World Wide Web Personalization,” Invited chapter in “Encyclopedia of Data Mining and Data Warehousing”, J. Wang, Ed, Idea Group, 2005
  • Pierrakos, D., Paliouras, G., Papatheodorou, C., Spyropoulos C. D. (2003) “Web usage mining as a tool for personalization: a survey”, User modelling and user adapted interaction journal, Vol.13, Issue 4, pp. 311-372
  • Combining ethnographic and clickstream data to identify user Web browsing strategies Paper by Lillian Clark, I-Hsien Ting, Chris Kimble, Peter Wright, Daniel Kudenko in Information Research, Vol. 11 No. 2, January 2006
  • UBB Mining: Finding Unexpected Browsing Behaviour in Clickstream Data to Improve a Web Site’s Design Paper by I-Hsien Ting, Chris Kimble, Daniel Kudenko.

Kanpo estekak

  • (Ingelesez) Datu-meatzaritzari buruzko tutorialak
  • (Ingelesez) Web-meatzaritza
  • (Ingelesez) Web-meatzaritzari buruzko tutoriala
  • (Ingelesez) Web Pertsonalizazioari buruzko tutoriala
Autoritate kontrola
  • Wikimedia proiektuak
  • Wd Datuak: Q785337
  • Wd Datuak: Q785337

Softwarea

  • YALE (Yet Another Learning Environment) (yale.sf.net).
  • WUM (Web Utilization Miner).

Erlazionatutako konferentziak

  • WebKDD 2006.
  • WebMine 2006.
  • WebConMine 2006.