Vad är mönsterigenkänning?

Mönsterigenkänning är förmågan hos ett system att känna igen mönster inom uppsättningar av data, beroende på både programmerad och inlärd kunskap. Detta är en viktig del av datavetenskap, eftersom det möjliggör utveckling av system som är kapabla till komplex dataanalys. Detta kan hjälpa forskare att sortera data snabbt för att hitta meningsfull information, eftersom de inte behöver läsa igenom data manuellt för att hitta intressanta platser. Mönsterigenkänning kan också vara användbart för att upptäcka fel, bedrägerier och andra problem inom datamängder.

Detta skiljer sig från mönstermatchning, där systemet kan matcha material exakt genom att använda en känd databas. Ett tydligt exempel på denna skillnad kan ses i e-postfilter. Många webbaserade e-postkonton har en skräppostmapp. E-postleverantören skannar inkommande e-post och använder mönsterigenkänning för att identifiera skräppost och släppa det i den här mappen. Användaren kan också filtrera sin e-post och be klienten att släppa e-post från en viss avsändare eller med särskilt innehåll till en specifik mapp.

Att leta efter spam kräver förmågan att känna igen allmänna mönster, såsom närvaron av specifika ord, kända misstänkta IP-adresser och andra röda flaggor som kan markera en bokstav som falsk. Detta är mer avancerat än ett filter, som helt enkelt ber systemet att matcha mönster. Om systemet ser ett ord eller avsändare som passar mönstret kan det flytta e-postmeddelandet till lämplig mapp.

Komplexa algoritmer stöder mönsterigenkänning. Systemet kan använda flera sätt för att utforska inkommande data och bestämma hur det bäst ska hanteras. Den kan programmeras för att utföra specifika funktioner, som att dirigera misstänkta eller korrupta data till en viss plats, klassificera data på ett meningsfullt sätt och så vidare. Systemet är kapabelt att lära sig och använder detta som ett verktyg för att bli bättre på mönsterigenkänning. Varje gång en användare flaggar ett e-postmeddelande som spam, till exempel, skannar systemet e-postmeddelandet för att lära sig mer om det, och systemet kommer inte att fortsätta att göra misstaget att lägga liknande e-postmeddelanden i inkorgen.

Datavetare utvecklar nya mönsterigenkänningstekniker i labb- och forskningsmiljöer. Dessa kan tillämpas på en mängd olika uppgifter och kräver konstruktion av neurala nätverk som kan interagera med data och förändras över tiden. Vissa program är extremt sofistikerade och kapabla till mycket detaljerad mönsterigenkänning, och andra är mer förenklade. Sådana program skär ner på antalet mänskliga timmar som krävs för att analysera data och kan fånga saker som en människa kan missa, till exempel bevis på bedrägeri i form av oegentligheter som sträcker sig över tusentals försäkringskrav.