مقدمه ای بر دادهکاوی
در دو دهه قبل توانايي های فنی بشر در برای توليد و جمع آوری دادهها به سرعت افزايش يافته است. عواملی نظير استفاده گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسب و کار، علوم، خدمات دولتی و پيشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاوير تا سيستمهای سنجش از دور ماهواره ای، در اين تغييرات نقش مهمی دارند [1].
بطور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. اين رشد انفجاری در دادههای ذخيره شده، نياز مبرم وجود تکنولوژی های جديد و ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا اين حجم زياد داده را به اطلاعات و دانش تبديل کند: داده کاوی به عنوان يک راه حل برای اين مسائل مطرح مي باشد. در يک تعريف غير رسمی داده کاوی فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی مي کنند، که اين دانش به صورت ضمنی در پايگاه داده های عظيم، انباره داده و ديگر مخازن بزرگ اطلاعات، ذخيره شده است. داده کاوی بطور همزمان از چندين رشته علمی بهره مي برد نظير: تکنولوژی پايگاه داده، هوش مصنوعی، يادگيری ماشين، شبکه های عصبی، آمار، شناسايی الگو، سيستم های مبتنی بر دانش ، حصول دانش ، بازيابی اطلاعات ، محاسبات سرعت بالا و بازنمايی بصری داده . داده کاوی در اواخر دهه 1980 پديدار گشته، در دهه 1990 گامهای بلندی در اين شاخه از علم برداشته شده و انتظار می رود در اين قرن به رشد و پيشرفت خود ادامه دهد [2].....
مقدمه:
در این قسمت از تماس و تاثیر Web data mining روی تکنولوژی های پشتیبانی صحبت خواهیم کرد. در این فصل یک دید کلی از داده کاوی فراهم می سازیم و به توضیح کاربردها و ابزارهای آن می پردازیم. توسط اطلاعات روی وب، امکان استخراج داده و دستیابی به اطلاعات برای کاربران بسیار آسان و مطلوب شده است. عمل جستجو روی اینترنت را برای کاربران خیلی آسانتر خواهد ساخت. بنابراین بهره های زیادی در Webminnig وجود دارد، از جمله کاوش پایگاه داده ها روی وب یا کاوش الگوهای مورد استفاده را می توان نام برد تا اطلاعات مفید برای کاربران تامین شوند .داده کاوی و وب به عنوان تکنولوژی مستقل در اواسط 1990 توسعه یافت.زمان زیادی از هنگامی که پژوهشگران به صورت جدی شروع به فکر کردن در مورد Webminnig کردند نگذشته است. کارگاه Webminnig در جریان کنفرانس کشف دانش پایگاه داده در 1999 یکی از اولین تجربه ها بود.
Stivastava و cooley یک طبقه بندی برای Webminnig تعیین کرده اند آنها در ابتدا Webminnig را به دو قسمت تقسیم کردند:
1- بدست آوردن الگوها از داده های وب
2- بدست آوردن ثبت وقایع وب