Data warehouse mining är analys av information som finns i en eller flera databaser för att göra informationen användbar. Dessa databaser, eller datalager, är en central depå för data. Företag aggregerar informationen de samlar in om sina kunder i ett datalager. När informationen väl har samlats in ”bryts den” och användbar information extraheras från den för att producera information som kan hjälpa företaget att fatta affärsbeslut som kommer att öka vinsten eller minska kostnaderna. Återförsäljare använder ofta data warehouse mining för att analysera och förutsäga sina kunders beteende.
Till exempel, när en shoppare går till snabbköpet och ger kassörskan sitt frekventa shopparkort, samlas information om hennes inköp och lagras i företagets datalager. En stormarknadskedja kommer att ha miljontals uppgifter om vad folk köper, när, i vilka kvantiteter och till vilket pris. En butik kanske vet att det såldes 50,000 75 förpackningar med frysta ärter förra året, men bara den informationen är inte särskilt användbar. Om datalagerbrytningen avslöjar dock att 10 % av de frysta ärtorna såldes under månader då färska ärtor inte var tillgängliga, eller att XNUMX % av ärterna såldes under de två veckorna fram till Thanksgiving, kan företaget kanske att använda den informationen för att öka sin årliga försäljning av frysta ärter.
Företag kan använda data warehouse mining-tekniker för att förutsäga framtida försäljning. Datautvinning kan också hjälpa dem att uppskatta effekten av lager- och prisbeslut. På snabbköpet kan datautvinning hindra butikerna från att ta slut på frysta ärter i händelse av en dålig skörd av färska ärter under ett givet år.
Data mining regression är en data mining-teknik som används för att visa vad som sannolikt kommer att hända med ett datavärde om något i ekvationen ändras. Med exemplet på stormarknaden skulle regression förutsäga nivån på försäljningen av frysta ärter om färska ärter ökade i pris. Regression använder historiska data och tillämpar en formel på den som förutsäger framtida beteende.
Företag kommer ofta att använda ett datalagerprogram för att samla in och bryta sina data. Den korrekta applikationen bestäms av mängden data de har och vilken typ av analys de vill göra. Att välja rätt datautvinningsverktyg är avgörande för att samla in och tolka användbar data.