Vad är en textfil?

En textfil är en datorfil som lagrar ett maskinskrivet dokument som en serie alfanumeriska tecken, vanligtvis utan visuell formateringsinformation. Innehållet kan vara en personlig anteckning eller lista, en tidskrift eller tidningsartikel, en bok eller någon annan text som kan återges korrekt i maskinskriven form. Textfiler liknar ordbehandlingsfiler genom att innehållet i båda är huvudsakligen textmässigt; de skiljer sig åt genom att textfiler vanligtvis inte registrerar information som teckenstil och storlek, paginering eller andra detaljer som skulle specificera utseendet på ett färdigt dokument. Vissa datoroperativsystem gör en grundläggande skillnad mellan en textfil, som är avsedd att översättas direkt till läsbar text, och en binär fil, som tolkas direkt av datorn.

I de flesta scheman som används för att koda text tilldelas varje tecken ett numeriskt värde, där texten sedan skrivs som en sträng av binära tal. En familj av kodningsscheman, kallad American Standard Code for Information Interchange (ASCII), blev en allmänt använd standard tidigt i datorns historia, trots dess dåliga stöd för andra språk än engelska. ISO 8859-kodfamiljen har gett mycket bättre stöd för språk baserade på det latinska alfabetet och liknande alfabet, men har inte kunnat koda tecknen från östasiatiska språk som japanska, vilket har lett till en ökning av inkompatibla standarder.

På senare tid har Unicode® Consortium utvecklat ett kodningssystem som heter Unicode® som har som mål att tilldela ett unikt nummer till varje tecken som används på alla språk på jorden. Detta gör att en enda kod kan användas för varje språk och att texter från flera språk visas i en enda fil. Den första delen av Unicode är baserad på ISO 8859, som i sig är baserad på ASCII. Att använda Unicode® kan ha fördelar även i engelsktalande länder, eftersom text kodad med äldre scheman kan visa mindre inkonsekvenser när den flyttas från system till system.

Fördelarna med textfiler inkluderar liten storlek och mångsidighet. Kilobyte eller megabyte mindre än samma data som lagras i andra format, de kan snabbt och massivt utbytas via e-post eller disk. De flesta kan öppnas på datorer som kör olika operativsystem, med mycket grundläggande programvara. Den främsta nackdelen är bristen på formatering. En textfil kan vara ett dåligt val för att representera ett dokument som innehåller bilder eller som förlitar sig på designelement för att kommunicera dess betydelse – en fil som innehåller tabelldata, matematiska formler eller konkret poesi, till exempel.

Textfiler är i allmänhet avsedda att läsas och redigeras av människor, men inte alla innehåller innehåll som i första hand är avsett för mänsklig konsumtion. Det mesta av programmeringskoden lagras i en textfil innan den kompileras – det vill säga översätts till en maskinläsbar binär fil. Filer kan också innehålla maskinläsbara texttaggar som ger formateringsinformation utöver vanlig text. Till exempel kan en HTML-fil (Hypertext Markup Language) öppnas som en vanlig textfil i en textredigerare, eller visas som en formaterad webbsida efter att ha tolkats av en webbläsare. Liknande system inkluderar LaTeX, som används för att lägga ut vetenskapliga artiklar, och Extensible Markup Language (XML), som används för att strukturera data.