داده کاوی فرآیند تجزیه و تحلیل مقادیر زیادی داده (Data) به منظور کشف الگوها و سایر اطلاعات است. معمولاً در پایگاه داده (Database) انجام میشود که دادهها را در قالبی ساختاریافته ذخیره میکند. با "کاوی" مقادیر زیادی از داده ها، می توان اطلاعات پنهان را کشف کرد و برای مقاصد دیگر مورد استفاده قرار داد.
یک شرکت کارت اعتباری ممکن است از داده کاوی برای کسب اطلاعات بیشتر در مورد خود استفاده کند. عادات خرید اعضا با تجزیه و تحلیل خرید از دارندگان کارت در سراسر ایالات متحده، شرکت ممکن است عادات خرید را برای جمعیتهای مختلف، مانند سن، نژاد و مکان کشف کند. این اطلاعات می تواند در ارائه تبلیغات خاص به افراد مفید باشد. همین داده ها همچنین ممکن است الگوهای خرید را در مناطق مختلف کشور نشان دهد. این اطلاعات میتواند برای شرکتهایی که به دنبال تبلیغ یا راهاندازی کسبوکار در ایالتهای خاص هستند، ارزشمند باشد.
خدمات آنلاین، مانند گوگل (Google) و فیس بوک (Facebook)، حجم عظیمی از دادهها را استخراج میکنند. برای ارائه محتوا و تبلیغات هدفمند به کاربران خود. برای مثال، Google ممکن است جستجوی پرس و جو (Query) را تجزیه و تحلیل کند تا جستجوهای پرطرفدار برای مناطق خاص را کشف کند و آنها را به بالای فهرست تکمیل خودکار (پیشنهادهایی که هنگام تایپ ظاهر میشوند) منتقل کند. با استخراج دادههای فعالیت کاربر، فیسبوک ممکن است موضوعات پرطرفدار را در میان گروههای سنی مختلف کشف کند و بر اساس این اطلاعات تبلیغات هدفمند ارائه دهد.
در حالی که دادهکاوی معمولاً برای اهداف بازاریابی استفاده میشود، کاربردهای بسیار دیگری نیز دارد. به عنوان مثال، شرکت های مراقبت های بهداشتی ممکن است از داده کاوی برای کشف پیوند بین ژن ها و بیماری های خاص استفاده کنند. شرکت های هواشناسی می توانند داده ها را برای کشف الگوهای آب و هوایی که ممکن است به پیش بینی رویدادهای هواشناسی آینده کمک کند استخراج کنند. موسسات مدیریت ترافیک میتوانند دادههای خودرو را استخراج کنند تا سطح ترافیک آینده را پیشبینی کنند و برنامههای مناسبی برای بزرگراهها و خیابانها ایجاد کنند.
دادهکاوی به دو چیز نیاز دارد: دادههای زیاد و مقدار زیادی از قدرت پردازش. هرچه دادهها سازماندهیتر باشند، استخراج آنها برای اطلاعات مفید آسانتر است. بنابراین برای هر سازمانی که میخواهد در دادهکاوی شرکت کند مهم است که در انتخاب دادههایی که باید ثبت شوند و نحوه ذخیره آنها فعال باشد. وقتی نوبت به استخراج داده میرسد، ابر رایانه (Supercomputer) و خوشه (Cluster) ممکن است برای پردازش پتابایت (Petabyte) دادهها استفاده شود.
تعریف داده کاوی (Data Mining) در این صفحه یک تعریف پایه نگاشته شده توسط تک بورد است. اگر مایل به ارجاع به این صفحه یا استناد به این تعریف هستید، با شرط درج لینک به این صفحه می توانید از این محتوا استفاده کنید.
هدف تک بورد توضیح اصطلاحات کامپیوتری به روشی است که به راحتی قابل درک باشد. ما برای سادگی و دقت با هر تعریفی که منتشر می کنیم تلاش می کنیم. اگر بازخوردی درباره تعریف داده کاوی (Data Mining) دارید یا میخواهید یک اصطلاح فنی جدید پیشنهاد کنید، لطفاً با ما تماس بگیرید.
آیا می خواهید اصطلاحات فنی بیشتری یاد بگیرید؟ در خبرنامه روزانه یا هفتگی مشترک شوید و شرایط و آزمون های ویژه را در ایمیل خود تحویل بگیرید.