Nedenfor er en liste over sprog efter antallet af indfødte talere.
Over halvdelen af verdens befolkning taler de 15 mest anvendte modersmål. Oplysningerne nedenfor bygger på traditionelle opgørelser fra bl.a. den svenske Nationalencyklopedin (2007, 2010), men tilsvarende lister findes i flere moderne kilder. Tal og placering kan variere afhængigt af, hvordan man definerer et sprog, hvilke dialekter man medregner, og hvilke statistiske kilder der anvendes.
Sondringen mellem sprog og dialekt er ofte uklar. Nogle gensidigt forståelige versioner er blevet forenet. Disse omfatter indonesisk og malayisk, kroatisk, bosnisk og serbisk. Det omfatter ikke standardhindi og urdu. Hindustani er her blevet opdelt i de sociolingvistiske enheder hindi og urdu, men mindst 100 millioner talere af nogle hindi-dialekter er ikke medregnet nedenfor.
Hvad menes med "indfødte talere"?
Indfødte talere (mother tongue eller native speakers) er personer, der lærer sproget som deres første sprog i barndommen og bruger det i hjemmet. Denne måling adskiller sig fra »samlede talere«, som inkluderer andetsprogstalere (f.eks. engelsktalende, der ikke har engelsk som modersmål). Når man sammenligner sprog efter antal indfødte talere, sammenligner man altså primært 1.-sprogstalere.
Typisk liste over de mest udbredte modersmål
Forskellige kilder giver lidt forskellige lister, men de 15 sprog, der oftest nævnes som de mest udbredte modersmål i verden, omfatter typisk:
- Mandarin-kinesisk
- Spansk
- Engelsk
- Hindi
- Bengali
- Portugisisk
- Russisk
- Japansk
- Punjabi (Lahnda/vestpunjabi)
- Marathi
- Telugu
- Tyrkisk
- Koreansk
- Fransk
- Tysk eller vietnamesisk (placering kan variere mellem kilder)
Bemærk, at rækkefølgen og de nøjagtige placeringer varierer mellem kilder. Nogle tabeller inkluderer f.eks. forskellige kinesiske varianter (Wu, Yue, mv.) separat, mens andre samler dem under »kinesisk« eller »mandarin«. Ligeledes kan kombinationen af indonesisk og malaysisk føre til anden placering.
Begrænsninger og fejlkilder
- Dataindsamling: Mange tal stammer fra nationale folketællinger eller skøn, og kvaliteten af data varierer mellem lande.
- Definition af sprog vs. dialekt: Politiske, kulturelle og historiske faktorer kan få forskelle i sprog til at blive betragtet som »sprog« i ét land og »dialekter« i et andet.
- Gensidig forståelighed: To varianter kan være gensidigt forståelige, men alligevel regnes som separate sprog af politiske grunde (fx kroatisk/bosnisk/serbisk), eller omvendt samles til ét sprog (fx indonesisk og malayisk) afhængigt af kriteriet.
- Tidsmæssige ændringer: Befolkningstilvækst, migration og sprogskift (særligt i byområder) ændrer tallene over tid. Ældre kilder som NE 2007/2010 afspejler situationen på det tidspunkt.
- Modersmål vs. andetsprog: Nogle sprog, især engelsk, har et langt større antal andetsprogstalere, hvilket kan gøre deres samlede udbredelse større, selvom antallet af indfødte talere er mindre end for andre sprog.
Praktiske råd til læsere
- Brug lister over indfødte talere til at få et overblik over globale mønstre, men vær opmærksom på metodiske forskelle mellem kilder.
- Hvis du har brug for præcise tal (fx til forskning eller undervisning), sammenlign flere kilder og tjek, om tallene angiver indfødte talere eller samlede tal.
- Husk de sociolingvistiske forhold: et sprogs politiske status, skriftsystem og udbredelse kan påvirke, hvordan det tælles og kategoriseres.
Hvis du ønsker en opdateret, kvantitativ liste med nøjagtige tal og kilder (fx nyere folketællinger eller estimater fra linguistiske forskere), kan jeg hente og sammenfatte de seneste tal for dig.