يقصد بتعدين البيانات البحث عن المعلومات ذات العلاقة ببعضها البعض التي يجمعها خصائص وسمات مشتركة ويربطها وحدة الموضوع أو التخصص، ويتم البحث عن هذه المعلومات ذات العلاقة بين كم كبير جداً من المعلومات التي لا تربطها علاقة أو وحدة موضوعية واستخلاصها ثم تقديمها لمتخذ القرار.

برزت الحاجة لهذا العلم أو التخصص عندما توفر لدى المؤسسات والشركات كميات كبيرة جداً من المعلومات في مختلف الموضوعات والمجالات لا تختص بموضوع بعينه، وفي خضم هذا الكم الهائل من المعلومات يصبح من الصعوبة بمكان البحث عن المعلومات المختصة في مجال محدد أو موضوع معين.

وعمدت المؤسسات والشركات إلى تخزين هذه الكميات الكبيرة من المعلومات في مخازن عامة للبيانات تسمى Data Warehousing لتخزين المعلومات في مختلف المواضيع. ومن هنا برزت الحاجة إلى التنقيب أو التنجيم عن المعلومات المتخصصة وذات العلاقة في وسط هذا الكم المعلوماتي الكبير، وبالتالي الحصول على معرفة جديدة من خلال كميات كبيرة من البيانات.

يمر تعدين البيانات بعدد من المراحل تبدأ من تنقية البيانات، ثم توحيد البيانات، واختبار البيانات ذات العلاقة، ثم نقلها، وتصنيفها ثم تقييمها واستخراجها. هذه هي مراحل تعدين البيانات ولكل مرحلة تفاصيلها الدقيقة، وتتم مرحلة تلو الأخرى لتخرج في النهاية معلومات مفيدة ذات علاقة وقواسم وروابط مشتركة، لكي تقدم في النهاية إلى صناع القرار والجهات المستفيدة بحيث يتم توظيفها والاستفادة منها في مختلف المجالات العلمية والعملية.