Modul:lang/data
Dokumentation för denna modul finns på /dok (redigera), /test
Se även Wiktionary:Stilguide/Språknamn#Lägg till nytt språk.
Om
- Användning av språkkod som saknas i den här listan kommer att skicka den berörda sidan in i Kategori:Okänd språkkod, eller visa "okänt språk".
- Undvik dubbla språkkoder och dubbla språknamn för samma språkkod då sådant riskerar att orsaka fel i artiklarna.
- Wikimedias språkkoder används i första hand, i annat fall används ISO 639-1 om sådana finns, annars 639-3-koder (för en mindre lista med identiska språkkoder, används 639-2/T).
Tabellens struktur
- tabell över språk
- enskilt språk identifierad med dess kod
- "name" (obligatorisk) - språkets namn
- "source"
- "sort_rules"
- "entry_name"
- "nolemma" (optionell) boolean värde true markerar koden som är reserverad för etymologi, sådan kod ska inte ha några uppslag
- enskilt språk identifierad med dess kod
Sorteringsnycklar
Rörande sorteringsnycklar följer en förklaring av tecken:
- a~ betyder "sortera efter a" eller "sortera före b"
- a¡ betyder "sortera efter a~"
- a° betyder "sortera efter a¡"
- a² betyder "sortera efter a°"
- a³ betyder "sortera efter a²"
- specialregler kan behövas. Eftersom dzs i ungerskan ska ändras före dz har jag placerat den i rätt ordning i listan.
- "språknamn, språkkod:", "språknamn, språkkod: ?" eller "språknamn, språkkod: -" används för att visa att språket saknar speciella sorteringsinställningar.
- ? innebär att språket inte är kontrollerat om speciella sorteringsinställningar behövs. - innebär att språket är kontrollerat, men inte har behov av speciella sorteringsinställningar. ? eller - har alltså ingen betydelse för hur sorteringen går till.
- Saknas speciella sorteringsinställningar används sorteringsnyckel som motsvaras av tecknet utan diakriter, dvs. ö sorteras som o, é som e osv.
- Bindestreck, punkt, komma, mellanslag, kolon med flera tecken exkluderas från sorteringsnycklarna.
local data = {}
local u = mw.ustring.char
-- UTF-8 encoded strings for some commonly-used diacritics
local GRAVE = u(0x0300)
local ACUTE = u(0x0301)
local CIRC = u(0x0302)
local TILDE = u(0x0303)
local MACRON = u(0x0304)
local BREVE = u(0x0306)
local DOTABOVE = u(0x0307)
local DIAER = u(0x0308)
local CARON = u(0x030C)
local DGRAVE = u(0x030F)
local INVBREVE = u(0x0311)
local DOTBELOW = u(0x0323)
local RINGBELOW = u(0x0325)
local CEDILLA = u(0x0327)
local OGONEK = u(0x0328)
local RSQUO = u(0x2019)
local PSILI = u(0x1FBD)
local CORONIS = u(0x1FBF)
-- possible attributes: name, nolemma, (script), sort_rules, source, entry_name
data["--"] = {
name = "tvärspråkligt",
source = "Wiktionary"
}
data["abq"] = {
name = "abazinska",
source = "ISO 639-3"
}
data["ab"] = {
name = "abchaziska",
source = "Wiktionary",
entry_name = {
from = {GRAVE, ACUTE},
to = {}
}
}
data["abe"] = {
name = "abenakiska",
source = "ISO 639-3"
}
data["ace"] = {
name = "acehnesiska",
source = "Wikimedia"
}
data["ady"] = {
name = "adygeiska",
source = "ISO 639-3"
}
data["aa"] = {
name = "afar",
source = "Wiktionary",
sort_rules = {"t>b~", "s>b¡", "e>b°", "k>c~", "x>c¡", "i>c°", "q>d~", "r>d¡", "o>g~", "h>w~"}
}
data["af"] = {
name = "afrikaans",
source = "Wiktionary"
}
data["ain"] = {
name = "ainu",
source = "ISO 639-3"
}
data["ak"] = {
name = "akan",
source = "Wiktionary"
}
data["akk"] = {
name = "akkadiska",
source = "ISO 639-3"
}
data["sia"] = {
name = "akkalasamiska",
source = "ISO 639-3"
}
data["sq"] = {
name = "albanska",
source = "Wiktionary",
sort_rules = {"ç>c~", "dh>d~", "ë>e~", "gj>g~", "ll>l~", "nj>n~", "rr>r~", "sh>s~", "th>t~", "xh>x~", "zh>z~"}
}
data["als"] = { -- enwikt och ISO 639-3 "gsw"
name = "alemanniska",
source = "Wiktionary"
}
data["ale"] = {
name = "aleutiska",
source = "ISO 639-3"
}
data["tut"] = {
name = "altaiska",
source = "ISO 639-2"
}
data["am"] = {
name = "amhariska",
source = "Wiktionary"
}
data["xaa"] = {
name = "andalusisk arabiska",
source = "ISO 639-3"
}
data["xno"] = {
name = "anglo-normandiska",
source = "ISO 639-3"
}
data["ar"] = {
name = "arabiska",
source = "Wiktionary",
entry_name = {
from = {u(0x0671), u(0x064B), u(0x064C), u(0x064D), u(0x064E), u(0x064F), u(0x0650), u(0x0651), u(0x0652), u(0x0670), u(0x0640)},
to = {u(0x0627)}
}
}
data["an"] = {
name = "aragonska",
source = "Wiktionary"
}
data["arc"] = {
name = "arameiska",
source = "Wikimedia"
}
data["hy"] = {
name = "armeniska",
source = "Wiktionary",
entry_name = {
from = {"՞", "՜", "՛", "՟", "և", "<sup>յ</sup>", "<sup>ի</sup>"},
to = {"", "", "", "", "եւ", "յ", "ի"}
}
}
data["roa-rup"] = {
name = "arumänska",
source = "Wiktionary"
}
data["as"] = {
name = "assamesiska",
source = "Wiktionary"
}
data["ast"] = {
name = "asturiska",
source = "Wiktionary",
sort_rules = {"ñ>n~"}
}
data["av"] = {
name = "avariska",
source = "Wiktionary",
entry_name = {
from = {GRAVE, ACUTE},
to = {}
}
}
data["ave"] = {
name = "avestiska",
source = "ISO 639-3"
}
data["ay"] = {
name = "aymara",
source = "Wiktionary"
}
data["az"] = {
name = "azerbajdzjanska",
source = "Wiktionary",
sort_rules = {"ç>c~", "ə>e~", "ğ>g~", "x>h~", "ı>h¡", "q>k~", "ö>o~", "ş>s~", "ü>u~"}
}
data["ban"] = {
name = "balinesiska",
source = "ISO 639-3"
}
data["bal"] = {
name = "baluchiska",
source = "ISO 639-2"
}
data["bm"] = {
name = "bambara",
source = "Wiktionary"
}
data["bjn"] = {
name = "banjaresiska",
source = "ISO 629-3"
}
data["ba"] = {
name = "basjkiriska",
source = "Wiktionary"
}
data["eu"] = {
name = "baskiska",
source = "Wiktionary",
sort_rules = {"ñ>n~"}
}
data["bbl"] = {
name = "bats",
source = "ISO 639-3",
entry_name = {
from = {"̃", "<sup>ნ</sup>", MACRON, BREVE},
to = {"", "ნ"}
}
}
data["bar"] = {
name = "bayerska",
source = "ISO 639-3"
}
data["be"] = {
name = "belarusiska",
source = "Wiktionary",
sort_rules = {"ć>c~", "č>¡", "dz>d~", "dź>d¡", "dž>d°", "ch>h~", "ł>l~", "ń>n~", "ś>s~", "š>¡", "ŭ>u~", "ź>z~", "ž>z¡"},
entry_name = {
from = {"Ѐ", "ѐ", GRAVE, ACUTE},
to = {"Е", "е"}
}
}
data["bem"] = {
name = "bemba",
source = "ISO 639-3"
}
data["bn"] = {
name = "bengali",
source = "Wiktionary"
}
data["ber"] = {
name = "berberspråk",
source = "ISO 639-2"
}
data["bym"] = {
name = "bidjara",
source = "ISO 639-3"
}
data["bh"] = {
name = "bihari",
source = "Wiktionary"
}
data["bcl"] = {
name = "bikol",
source = "Wikimedia"
}
data["bpy"] = {
name = "bishnupriya manipuri",
source = "Wikimedia"
}
data["bi"] = {
name = "bislama",
source = "Wiktionary"
}
data["no"] = {
name = "bokmål",
source = "Wiktionary",
sort_rules = {"æ>æ", "ä>æ", "ø>ø", "å>ø~", "œ>ø", "ö>ø"}
}
data["bs"] = {
name = "bosniska",
source = "Wiktionary",
sort_rules = {"č>c~", "ć>c¡", "dž>d~", "đ>d¡", "lj>l~", "nj>n~", "š>s~", "ž>z~", "ð>d¡"},
entry_name = {
from = {"[ȀÀȂÁĀÃ]", "[ȁàȃáāã]", "[ȄÈȆÉĒẼ]", "[ȅèȇéēẽ]", "[ȈÌȊÍĪĨ]", "[ȉìȋíīĩ]", "[ȌÒȎÓŌÕ]", "[ȍòȏóōõ]", "[ȐȒŔ]", "[ȑȓŕ]", "[ȔÙȖÚŪŨ]", "[ȕùȗúūũ]", "Ѐ", "ѐ", "[ӢЍ]", "[ӣѝ]", "[Ӯ]", "[ӯ]", GRAVE, ACUTE, DGRAVE, INVBREVE, MACRON, TILDE},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "R" , "r" , "U" , "u" , "Е", "е", "И" , "и", "У", "у" }
}
}
data["br"] = {
name = "bretonska",
source = "Wiktionary"
}
data["bug"] = {
name = "buginesiska",
source = "Wikimedia"
}
data["bg"] = {
name = "bulgariska",
source = "Wiktionary",
entry_name = {
from = {"Ѐ", "ѐ", "Ѝ", "ѝ", GRAVE, ACUTE},
to = {"Е", "е", "И", "и"}
}
}
data["bxr"] = {
name = "burjatiska",
source = "Wikimedia",
sort_rules = {"ç>c~", "ө>o~", "ş>s~", "ƶ>z~"}
}
data["my"] = {
name = "burmesiska",
source = "Wiktionary"
}
data["cps"] = {
name = "capiznon",
source = "ISO 639-3"
}
data["ceb"] = {
name = "cebuano",
source = "Wikimedia"
}
data["nhn"] = {
name = "centralnahuatl",
source = "ISO 639-3"
}
data["ch"] = {
name = "chamorro",
source = "Wiktionary"
}
data["kca"] = {
name = "chantiska",
source = "ISO 639-3",
sort_rules = {"ә>e~", "һ>h~", "ļ>l~", "ł>l¡", "ņ>n~", "ŋ>n¡", "ş>s~", "s̷>s¡", "ƶ>z~", "ƅ>ƅ"}
}
data["cbk"] = {
name = "chavacano",
source = "ISO 639-3"
}
data["chr"] = {
name = "cherokesiska",
source = "Wiktionary"
}
data["chy"] = {
name = "cheyenne",
source = "Wikimedia"
}
data["ny"] = {
name = "chichewa",
source = "Wikimedia",
entry_name = {
from = {"ŵ", "Ŵ", "á", "Á", "é", "É", "í", "Í", "ó", "Ó", "ú", "Ú", "ń", "Ń", "ḿ", "Ḿ"},
to = {"w", "W", "a", "A", "e", "E", "i", "I", "o", "O", "u", "U", "n", "N", "m", "M"}
}
}
data["chn"] = {
name = "chinook jargon",
source = "ISO 639-3"
}
data["chk"] = {
name = "chuukesiska",
source = "ISO 639-3"
}
data["cia"] = {
name = "cia-cia",
source = "ISO 639-3"
}
data["crn"] = {
name = "cora",
source = "ISO 639-3"
}
data["cr"] = {
name = "cree",
source = "Wiktionary"
}
data["btd"] = {
name = "dairi batak",
source = "ISO 639-3"
}
data["da"] = {
name = "danska",
source = "Wiktionary",
sort_rules = {"æ>æ", "ä>æ", "ø>ø", "å>ø~", "œ>ø", "ö>ø"}
}
data["prs"] = {
name = "dari",
source = "ISO 639-3"
}
data["egy-dem"] = {
name = "demotiska",
source = "ISO 639-2 / konstruerad"
}
data["din"] = {
name = "dinka",
source = "ISO 639-3",
sort_rules = {"ä>a~", "dh>d~", "ë>e~", "ɛ>e¡", "ɛ̈>e°", "ɣ>g~", "ï>i~", "nh>n~", "ny>n¡", "ŋ>n°", "ö>o~", "ɔ>o¡", "ɔ̈>o°", "th>t~"}
}
data["dv"] = {
name = "divehi",
source = "Wikimedia"
}
data["dz"] = {
name = "dzongkha",
source = "Wiktionary"
}
data["smn"] = {
name = "enaresamiska",
source = "ISO 639-3"
}
data["en"] = {
name = "engelska",
source = "Wiktionary",
sort_rules = {} -- no special rules
}
data["egy"] = {
name = "egyptiska",
source = "ISO 639-3"
}
data["myv"] = {
name = "erzya",
source = "Wikimedia"
}
data["eo"] = {
name = "esperanto",
source = "Wiktionary",
sort_rules = {"ĉ>c~", "ĝ>g~", "ĥ>h~", "ĵ>j~", "ŝ>s~", "ŭ>u~"}
}
data["et"] = {
name = "estniska",
source = "Wiktionary",
sort_rules = {"š>s~", "z>s¡", "ž>s°", "õ>w~", "ä>w¡", "ö>w°", "ü>w²"}
}
data["ett"] = {
name = "etruskiska",
source = "ISO 639-3"
}
data["evn"] = {
name = "evenki",
source = "ISO 639-3"
}
data["ee"] = {
name = "ewe",
source = "ISO 639-3",
sort_rules = {"ɖ>d~", "dz>d~", "ɛ>e~", "ƒ>f~", "gb>g~", "ɣ>g¡", "kp>k~", "ny>n~", "ŋ>n¡", "ts>t~", "ʋ>v~"}
}
data["ext"] = {
name = "extremaduriska",
source = "ISO 639-3",
sort_rules = {"ñ>n~"}
}
data["fan"] = {
name = "fang",
source = "ISO 639-3"
}
data["phn"] = {
name = "feniciska",
source = "ISO 639-3"
}
data["fj"] = {
name = "fiji",
source = "Wiktionary"
}
data["hif"] = {
name = "fijiansk hindi",
source = "Wikimedia"
}
data["fil"] = {
name = "filipino",
source = "ISO 639-3",
sort_rules = {"ñ>n~", "ng>n¡"}
}
data["fi"] = {
name = "finska",
source = "Wiktionary",
sort_rules = {"š>s", "ž>z", "å>z~", "ä>ä", "ö>ö"},
entry_name = {
from = {"ˣ"}, -- Used to indicate gemination of the next consonant
to = {}
}
}
data["rmf"] = {
name = "finsk romani",
source = "ISO 639-3"
}
data["gmq-fda"] = { --enwikt gmq-oda
name = "forndanska",
source = "ISO 639-5 / konstruerad",
entry_name = {
from = {"Ā", "ā", "Ē", "ē", "Ī", "ī", "Ō", "ō", "Ū", "ū", "Ȳ", "ȳ", "Ǣ", "ǣ", "Ø̄", "ø̄", MACRON},
to = {"A", "a", "E", "e", "I", "i", "O", "o", "U", "u", "Y", "y", "Æ", "æ", "Ø", "ø"}
}
}
data["ang"] = {
name = "fornengelska",
source = "Wiktionary",
entry_name = {
from = {"[ĀÁ]", "[āá]", "[ǢǼ]", "[ǣǽ]", "Ċ", "ċ", "[ĒÉ]", "[ēé]", "Ġ", "ġ", "[ĪÍ]", "[īí]", "[ŌÓ]", "[ōó]", "[ŪÚ]", "[ūú]", "[ȲÝ]", "[ȳý]", MACRON, ACUTE, DOTABOVE},
to = {"A", "a", "Æ", "æ", "C", "c", "E", "e", "G", "g", "I", "i", "O", "o", "U", "u", "Y", "y"}
},
sort_rules = {} -- no special rules
}
data["frk"] = {
name = "fornfrankiska",
source = "ISO 639-3"
}
data["fro"] = {
name = "fornfranska",
source = "ISO 639-3"
}
data["ofs"] = {
name = "fornfrisiska",
source = "ISO 639-3",
entry_name = {
from = {"[ĀÂ]", "[āâ]", "[ĒÊ]", "[ēê]", "[ĪÎ]", "[īî]", "[ŌÔ]", "[ōô]", "[ŪÛ]", "[ūû]"},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "U" , "u"}
}
}
data["oge"] = {
name = "forngeorgiska",
source = "ISO 639-3",
entry_name = {
from = {"̂"},
to = {""}
}
}
data["goh"] = {
name = "fornhögtyska",
source = "ISO 639-3",
entry_name = {
from = {"[ĀÂ]", "[āâ]", "[ĒÊË]", "[ēêë]", "[ĪÎ]", "[īî]", "[ŌÔ]", "[ōô]", "[ŪÛ]", "[ūû]", "ʒ"},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "U" , "u" , "z" }
}
}
data["sga"] = {
name = "forniriska",
source = "ISO 639-3",
entry_name = {
from = {"ḟ", "ṡ", "Ḟ", "Ṡ", "ä", "ë", "ï", "ö", "ü", "·"},
to = {"f", "s", "F", "S", "a", "e", "i", "o", "u"}
}
}
data["owl"] = {
name = "fornkymriska",
source = "ISO 639-3"
}
data["cu"] = {
name = "fornkyrkoslaviska",
source = "Wikipedia",
entry_name = {
from = {u(0x0484)}, -- kamora
to = {}
}
}
data["odt"] = {
name = "fornlågfrankiska",
source = "ISO 639-3",
entry_name = {
from = {"[ĀÂ]", "[āâ]", "[ĒÊ]", "[ēê]", "[ĪÎ]", "[īî]", "[ŌÔ]", "[ōô]", "[ŪÛ]", "[ūû]"},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "U" , "u"}
}
}
data["non"] = {
name = "fornnordiska",
source = "ISO 639-2"
}
data["pro"] = {
name = "fornoccitanska",
source = "ISO 639-3"
}
data["peo"] = {
name = "fornpersiska",
source = "ISO 639-3"
}
data["roa-fpt"] = {
name = "fornportugisiska",
source = "ISO 639-5 / konstruerad"
}
data["osx"] = {
name = "fornsaxiska",
source = "ISO 639-3",
entry_name = {
from = {"[ĀÂ]", "[āâ]", "[ĒÊ]", "[ēê]", "[ĪÎ]", "[īî]", "[ŌÔ]", "[ōô]", "[ŪÛ]", "[ūû]"},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "U" , "u"}
}
}
data["osp"] = {
name = "fornspanska",
source = "ISO 639-3"
}
data["gmq-fsv"] = { --enwikt gmq-osw
name = "fornsvenska",
source = "ISO 639-5 / konstruerad",
sort_rules = {"þ>d~", "z>s~", "æ>y~", "ø>y¡"},
entry_name = {
from = {"Ā", "ā", "Ē", "ē", "Ī", "ī", "Ō", "ō", "Ū", "ū", "Ȳ", "ȳ", "Ǣ", "ǣ", "Ø̄", "ø̄", MACRON},
to = {"A", "a", "E", "e", "I", "i", "O", "o", "U", "u", "Y", "y", "Æ", "æ", "Ø", "ø"}
}
}
data["otk"] = {
name = "fornturkiska",
source = "ISO 639-3"
}
data["frp"] = {
name = "frankoprovensalska",
source = "Wikimedia"
}
data["fr"] = {
name = "franska",
source = "Wiktionary",
sort_rules = {"æ>ae", "œ>oe"}
}
data["fy"] = {
name = "frisiska",
source = "Wiktionary"
}
data["fur"] = {
name = "friuliska",
source = "ISO 639-3"
}
data["fud"] = {
name = "futuniska",
source = "ISO 639-3"
}
data["fo"] = {
name = "färöiska",
source = "Wiktionary",
sort_rules = {"á>a~", "ð>d~", "Ð>d~", "í>i~", "ó>o~", "ú>u~", "ý>y~", "æ>æ", "ø>ø"}
}
data["gag"] = {
name = "gagauziska",
source = "ISO 639-3",
sort_rules = {"ä>a~", "ç>c~", "ı>h~", "I>h~", "i>i", "İ>i", "ö>o~", "ş>s~", "ţ>t~", "ü>u~"}
}
data["gl"] = {
name = "galiciska",
source = "Wiktionary"
}
data["ka"] = {
name = "georgiska",
source = "Wiktionary",
entry_name = {
from = {"̂"},
to = {""}
}
}
data["got"] = {
name = "gotiska",
source = "Wikimedia",
entry_name = {
from = {"Ā", "ā", "Ē", "ē", "Ī", "ī", "Ō", "ō", "Ū", "ū"},
to = {"A", "a", "E", "e", "I", "i", "O", "o", "U", "u"}
}
}
data["el"] = {
name = "grekiska",
source = "Wiktionary"
}
data["gos"] = {
name = "groningska",
source = "ISO 639-3"
}
data["kl"] = {
name = "grönländska",
source = "Wiktionary"
}
data["gnc"] = {
name = "guanche",
source = "ISO 639-3"
}
data["gn"] = {
name = "guaraní",
source = "Wiktionary",
sort_rules = {"ã>a~", "ch>a¡", "ẽ>e~", "g̃>g~", "ĩ>i~", "mb>m~", "nd>n~", "nt>n¡", "ñ>n°", "õ>o~", "rr>r~", "ũ>u~", "ỹ>y~"}
}
data["ngu"] = {
name = "guerreronahuatl",
source = "ISO 639-3",
}
data["gu"] = {
name = "gujarati",
source = "Wiktionary"
}
data["guz"] = {
name = "gusii",
source = "ISO 639-3"
}
data["h-nor"] = { -- enbart etymologi
name = "norska",
nolemma = true,
source = "ISO 639-5"
}
data["h-smi"] = { -- enbart etymologi
name = "samiska",
nolemma = true,
source = "ISO 639-5"
}
data["ht"] = {
name = "haitisk kreol",
source = "Wikimedia"
}
data["hak"] = {
name = "hakka",
source = "Wikimedia"
}
data["ha"] = {
name = "hausa",
source = "Wiktionary",
sort_rules = {"ɓ>b~", "ɗ>d~", "ƙ>k~", "sh>s~", "ts>t~", "ƴ>y~"},
entry_name = {
from = {"R̃", "r̃", "À", "à", "È", "è", "Ì", "ì", "Ò", "ò", "Ù", "ù", "Â", "â", "Ê", "ê", "Î", "î", "Ô", "ô", "Û", "û", "Ā", "ā", "Ē", "ē", "Ī", "ī", "Ō", "ō", "Ū", "ū", "Á", "á", "É", "é", "Í", "í", "Ó", "ó", "Ú", "ú", "Ā̀", "ā̀", "Ḕ", "ḕ", "Ī̀", "ī̀", "Ṑ", "ṑ", "Ū̀", "ū̀", GRAVE, ACUTE},
to = {"R", "r", "A", "a", "E", "e", "I", "i", "O", "o", "U", "u", "A", "a", "E", "e", "I", "i", "O", "o", "U", "u", "A", "a", "E", "e", "I", "i", "O", "o", "U", "u", "A", "a", "E", "e", "I", "i", "O", "o", "U", "u", "A", "a", "E", "e", "I", "i", "O", "o", "U", "u"}
}
}
data["haw"] = {
name = "hawaiiska",
source = "Wikimedia",
sort_rules = {"i>e~", "o>e¡", "u>e°"}
}
data["he"] = {
name = "hebreiska",
source = "Wiktionary",
entry_name = {
from = {"[" .. u(0x0591) .. "-" .. u(0x05BD) .. u(0x05BF) .. "-" .. u(0x05C5) .. u(0x05C7) .. "]"},
to = {}
}
}
data["hit"] = {
name = "hettitiska",
source = "ISO 639-3"
}
data["hil"] = {
name = "hiligaynon",
source = "ISO 639-2",
entry_name = {
from = {"Á", "á", "É", "é", "Í", "í", "Ó", "ó", "Ú", "ú", MACRON},
to = {"A", "a", "E", "e", "I", "i", "O", "o", "U", "u"}
}
}
data["hi"] = {
name = "hindi",
source = "Wiktionary"
}
data["hnd"] = {
name = "hindko",
source = "ISO 639-3"
}
data["mww"] = {
name = "hmong daw",
source = "ISO 639-3"
}
data["xhu"] = {
name = "hurritiska",
source = "ISO 639-3"
}
data["hsb"] = {
name = "högsorbiska",
source = "Wiktionary",
sort_rules = {"č>c~", "ć>c¡", "ě>e~", "ł>k~", "ń>n~", "ó>o~", "ř>r", "š>s~", "ž>z~", "ch>h"}
}
data["rmq"] = {
name = "iberisk romani",
source = "ISO 639-3"
}
data["io"] = {
name = "ido",
source = "Wiktionary"
}
data["ig"] = {
name = "igbo",
source = "Wikimedia",
sort_rules = {"gb>b~", "gh>g~", "ị>i~", "ṅ>n~", "ọ>o~", "kp>p~", "sh>sh~", "ụ>u~", "ch>z~", "gw>z¡", "kw>z°", "nw>z²", "ny>n³"}
}
data["ilo"] = {
name = "ilokano",
source = "Wikimedia",
entry_name = {
from = {"[áàâ]", "[éèê]", "[íìî]", "[óòô]", "[úùû]", ACUTE, GRAVE, CIRC},
to = {"a" , "e" , "i" , "o" , "u" }
}
}
data["id"] = {
name = "indonesiska",
source = "Wiktionary"
}
data["ia"] = {
name = "interlingua",
source = "Wiktionary"
}
data["ie"] = {
name = "interlingue",
source = "Wiktionary"
}
data["iu"] = {
name = "inuktitut",
source = "Wiktionary"
}
data["ik"] = {
name = "iñupiaq",
source = "Wiktionary"
}
data["ga"] = {
name = "iriska",
source = "Wiktionary",
sort_rules = {"á>a~", "é>e~", "í>i~", "ó>o~", "ú>u~"}
}
data["is"] = {
name = "isländska",
source = "Wiktionary",
sort_rules = {"á>a~", "ð>d~", "í>i~", "ó>o~", "ú>u~", "ý>y~", "þ>y¡", "æ>æ", "ö>ö"}
}
data["ist"] = {
name = "istriotiska",
source = "ISO 639-3"
}
data["it"] = {
name = "italienska",
source = "Wiktionary"
}
data["sah"] = {
name = "jakutiska",
source = "ISO 639-3"
}
data["ja"] = {
name = "japanska",
source = "Wiktionary"
}
data["jv"] = {
name = "javanesiska",
source = "Wiktionary",
sort_rules = {"é>e~", "è>e¡"}
}
data["yi"] = {
name = "jiddisch",
source = "Wiktionary"
}
data["kbd"] = {
name = "kabardinska",
source = "ISO 639-3"
}
data["kab"] = {
name = "kabyliska",
source = "ISO 639-3"
}
data["xal"] = {
name = "kalmuckiska",
source = "Wikimedia"
}
data["kam"] = {
name = "kamba",
source = "ISO 639-3"
}
data["xmu"] = {
name = "kammu",
source = "ISO 639-3"
}
data["kjb"] = {
name = "kanjobal",
source = "ISO 639-3"
}
data["kn"] = {
name = "kannada",
source = "Wiktionary"
}
data["yue"] = {
name = "kantonesiska",
source = "Wikimedia"
}
data["pam"] = {
name = "kapampangan",
source = "Wikimedia"
}
data["kaa"] = {
name = "karakalpakiska",
source = "ISO 639-3"
}
data["kr"] = {
name = "kanuri",
source = "Wikimedia",
entry_name = {
from = {"À", "à", "È", "è", "Ǝ̀", "ǝ̀", "Ì", "ì", "Ò", "ò", "Ù", "ù", "Â", "â", "Ê", "ê", "Ǝ̂", "ǝ̂", "Î", "î", "Ô", "ô", "Û", "û", "Ă", "ă", "Ĕ", "ĕ", "Ǝ̆", "ǝ̆", "Ĭ", "ĭ", "Ŏ", "ŏ", "Ŭ", "ŭ", "Á", "á", "É", "é", "Ǝ́", "ǝ́", "Í", "í", "Ó", "ó", "Ú", "ú", GRAVE, ACUTE},
to = {"A", "a", "E", "e", "Ǝ", "ǝ", "I", "i", "O", "o", "U", "u", "A", "a", "E", "e", "Ǝ", "ǝ", "I", "i", "O", "o", "U", "u", "A", "a", "E", "e", "Ǝ", "ǝ", "I", "i", "O", "o", "U", "u", "A", "a", "E", "e", "Ǝ", "ǝ", "I", "i", "O", "o", "U", "u"}
}
}
data["krc"] = {
name = "karatjajbalkariska",
source = "Wikimedia"
}
data["krl"] = {
name = "karelska",
source = "ISO 639-3"
}
data["ks"] = {
name = "kashmiri",
source = "Wiktionary"
}
data["csb"] = {
name = "kasjubiska",
source = "Wiktionary",
sort_rules = {"ą>a~", "ã>a¡", "é>e~", "ë>e¡", "ł>l~", "ń>n~", "ò>o~", "ó>o¡", "ô>o°", "ù>u~", "ż>z~"}
}
data["ca"] = {
name = "katalanska",
source = "Wiktionary"
}
data["kk"] = {
name = "kazakiska",
source = "Wiktionary"
}
data["kjh"] = {
name = "khakasiska",
source = "ISO 639-3"
}
data["km"] = {
name = "khmer",
source = "Wiktionary"
}
data["kzg"] = {
name = "kikai",
source = "ISO 639-3"
}
data["kg"] = {
name = "kikongo",
source = "Wikimedia"
}
data["ki"] = {
name = "kikuyu",
source = "Wikimedia"
}
data["sjd"] = {
name = "kildinsamiska",
source = "ISO 639-3"
}
data["zh"] = {
name = "kinesiska",
source = "Wiktionary"
}
data["ky"] = {
name = "kirgiziska",
source = "Wiktionary"
}
data["rn"] = {
name = "kirundi",
source = "Wiktionary"
}
data["ktu"] = {
name = "kituba",
source = "ISO 639-3"
}
data["grc"] = {
name = "klassisk grekiska",
source = "ISO 639-3",
entry_name = {
from = {"[ᾸᾹ]", "[ᾰᾱ]", "[ῘῙ]", "[ῐῑ]", "[ῨῩ]", "[ῠῡ]", "µ", "["..RSQUO..PSILI..CORONIS.."]", "["..MACRON..BREVE.."]" },
to = {"Α", "α", "Ι", "ι", "Υ", "υ", "μ", "'", ""}
}
}
data["nci"] = {
name = "klassisk nahuatl",
source = "ISO 639-3",
entry_name = {
from = {"Ā", "ā", "Ē", "ē", "Ī", "ī", "Ō", "ō", "Ū", "ū", "Ȳ", "ȳ"},
to = {"A", "a", "E", "e", "I", "i", "O", "o", "U", "u", "Y", "y"}
}
}
data["syc"] = {
name = "klassisk syriska",
source = "ISO 639-3",
}
data["tlh"] = {
name = "klingonska",
source = "ISO 639-3"
}
data["kpv"] = {
name = "komi",
source = "ISO 639-3"
}
data["cop"] = {
name = "koptiska",
source = "ISO 639-3",
entry_name = {
from = { "ˋ", GRAVE, MACRON, },
to = {},
}
}
data["ko"] = {
name = "koreanska",
source = "Wiktionary"
}
data["kpy"] = {
name = "korjakiska",
source = "ISO 639-3"
}
data["kw"] = {
name = "korniska",
source = "Wiktionary"
}
data["co"] = {
name = "korsikanska",
source = "Wiktionary",
sort_rules = {"chj>c~", "ghj>g~"}
}
data["avk"] = {
name = "kotava",
source = "ISO 639-3",
}
data["crh"] = {
name = "krimtatariska",
source = "Wikimedia",
sort_rules = {"ç>c~", "ı>h~", "ö>o~", "ş>s~", "ü>u~"}
}
data["jct"] = {
name = "krimtjakiska",
source = "ISO 639-3",
}
data["hr"] = {
name = "kroatiska",
source = "Wiktionary",
sort_rules = {"č>c~", "ć>c¡", "dž>d~", "đ>d¡", "lj>l~", "nj>n~", "š>s~", "ž>z~", "ð>d¡"},
entry_name = {
from = {"[ȀÀȂÁĀÃ]", "[ȁàȃáāã]", "[ȄÈȆÉĒẼ]", "[ȅèȇéēẽ]", "[ȈÌȊÍĪĨ]", "[ȉìȋíīĩ]", "[ȌÒȎÓŌÕ]", "[ȍòȏóōõ]", "[ȐȒŔ]", "[ȑȓŕ]", "[ȔÙȖÚŪŨ]", "[ȕùȗúūũ]", "Ѐ", "ѐ", "[ӢЍ]", "[ӣѝ]", "[Ӯ]", "[ӯ]", GRAVE, ACUTE, DGRAVE, INVBREVE, MACRON, TILDE},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "R" , "r" , "U" , "u" , "Е", "е", "И" , "и", "У", "у" }
}
}
data["kum"] = {
name = "kumykiska",
source = "ISO 639-3"
}
data["xug"] = {
name = "kunigami",
source = "ISO 639-3"
}
data["ku"] = {
name = "kurdiska",
source = "Wiktionary",
sort_rules = {"ç>c~", "ê>e~", "î>i~", "ş>s~", "û>u~"}
}
data["fkv"] = {
name = "kvänska",
source = "ISO 639-3"
}
data["cy"] = {
name = "kymriska",
source = "Wiktionary",
sort_rules = {"ch>c~", "dd>c~", "ff>f~", "ng>g~", "ll>l~", "ph>p~", "rh>r~"}
}
data["lad"] = {
name = "ladino",
source = "Wikimedia"
}
data["lld"] = {
name = "ladinska",
source = "ISO 639-3",
sort_rules = {"ese>e~"}
}
data["lbe"] = {
name = "lak",
source = "ISO 639-3"
}
data["lac"] = {
name = "lakandonska",
source = "ISO 639-3"
}
data["lkt"] = {
name = "lakota",
source = "ISO 639-3",
sort_rules = {"aŋ>a~", "č>b~", "čh>b¡", "č’>b°", "ǧ>g~", "ȟ>h~", "iŋ>i~", "kh>k~", "kȟ>k¡", "k’>k°", "ph>p~", "pȟ>p¡", "p’>p°", "š>s~", "th>t~", "tȟ>t¡", "t’>t°", "uŋ>u~", "ž>z~"}
}
data["lo"] = {
name = "lao",
source = "Wiktionary"
}
data["la"] = {
name = "latin",
source = "Wiktionary",
entry_name = {
from = {"[ĀĂ]", "[āă]", "[ĒĔ]", "[ēĕë]", "[ĪĬÏ]", "[īĭï]", "[ŌŎ]", "[ōŏ]", "[ŪŬÜ]", "[ūŭü]", "Ȳ", "ȳ", MACRON, BREVE, DIAER},
to = {"A", "a", "E", "e", "I", "i", "O", "o", "U", "u", "Y", "y"}
}
}
data["lzz"] = {
name = "laziska",
source = "ISO 639-3",
entry_name = {
from = {"̂", GRAVE, ACUTE},
to = {}
}
}
data["ltg"] = {
name = "lettgalliska",
source = "ISO 639-3",
sort_rules = {"ā>a~", "č>c~", "ē>e~", "ģ>g~", "ī>i~", "ķ>k~", "ļ>l~", "ņ>n~", "š>s~", "ū>u~", "ž>z~"}
}
data["lv"] = {
name = "lettiska",
source = "Wiktionary",
sort_rules = {"ā>a~", "č>c~", "ē>e~", "ģ>g~", "ī>i~", "ķ>k~", "ļ>l~", "ņ>n~", "š>s~", "ū>u~", "ž>z~"},
entry_name = {
-- This attempts to convert vowels with tone marks to vowels either with
-- or without macrons. Specifically, there should be no macrons if the
-- vowel is part of a diphthong (including resonant diphthongs such
-- pìrksts -> pirksts not #pīrksts). What we do is first convert the
-- vowel + tone mark to a vowel + tilde in a decomposed fashion,
-- then remove the tilde in diphthongs, then convert the remaining
-- vowel + tilde sequences to macroned vowels, then delete any other
-- tilde. We leave already-macroned vowels alone: Both e.g. ar and ār
-- occur before consonants. FIXME: This still might not be sufficient.
from = {"Ȩ", "ȩ", "[ÂÃÀ]", "[âãà]", "[ÊẼÈ]", "[êẽè]", "[ÎĨÌ]", "[îĩì]", "[ÔÕÒ]", "[ôõò]", "[ÛŨÙ]", "[ûũù]", "[ÑǸ]", "[ñǹ]", "[" .. CIRC .. TILDE ..GRAVE .."]", "([aAeEiIoOuU])" .. TILDE .."?([lrnmuiLRNMUI])" .. TILDE .. "?([^aAeEiIoOuUāĀēĒīĪūŪ])", "([aAeEiIoOuU])" .. TILDE .."?([lrnmuiLRNMUI])" .. TILDE .."?$", "([iI])" .. TILDE .. "?([eE])" .. TILDE .. "?", "A" .. TILDE, "a" .. TILDE, "E" .. TILDE, "e" .. TILDE, "I" .. TILDE, "i" .. TILDE, "U" .. TILDE, "u" .. TILDE, TILDE},
to = {"E", "e", "A" .. TILDE, "a" .. TILDE, "E" .. TILDE, "e" .. TILDE, "I" .. TILDE, "i" .. TILDE, "O", "o", "U" .. TILDE, "u" .. TILDE, "N", "n", TILDE, "%1%2%3", "%1%2", "%1%2", "Ā", "ā", "Ē", "ē", "Ī", "ī", "Ū", "ū", ""}
}
}
data["lez"] = {
name = "lezginska",
source = "ISO 639-3",
entry_name = {
from = {GRAVE, ACUTE},
to = {}
}
}
data["lij"] = {
name = "liguriska",
source = "Wikimedia"
}
data["li"] = {
name = "limburgiska",
source = "Wiktionary",
sort_rules = {"äö>a~", "è>e~", "ó>o~", "ö>o¡", "ô>o°", "q>z~", "x>z¡"}
}
data["ln"] = {
name = "lingala",
source = "Wiktionary"
}
data["lt"] = {
name = "litauiska",
source = "Wiktionary",
sort_rules = {"ą>a~", "ch>c~", "č>c¡", "ę>e~", "ė>e¡", "į>i~", "y>i¡", "š>s~", "ų>u~", "ū>u¡", "ž>z~"},
entry_name = {
from = {"[áãà]", "[ÁÃÀ]", "[éẽè]", "[ÉẼÈ]", "[íĩì]", "[ÍĨÌ]", "[ýỹ]", "[ÝỸ]", "ñ", "[óõò]", "[ÓÕÒ]", "[úũù]", "[ÚŨÙ]", ACUTE, GRAVE, TILDE},
to = {"a", "A", "e", "E", "i", "I", "y", "Y", "n", "o", "O", "u", "U"}
}
}
data["liv"] = {
name = "liviska",
source = "ISO 639-3",
sort_rules = {"ā>a~", "ä>a¡", "ǟ>a°", "ḑ>d~", "ē>e~", "ī>i~", "ļ>l~", "ņ>n~", "ō>o~", "ȯ>o¡", "ȱ>o°", "õ>o²", "ȭ>o³", "ŗ>r~", "š>s~", "ț>t~", "ū>u~", "ž>z~"}
}
data["olo"] = {
name = "livvi",
source = "ISO 639-3"
}
data["jbo"] = {
name = "lojban",
source = "Wiktionary"
}
data["lmo"] = {
name = "lombardiska",
source = "Wikimedia"
}
data["lg"] = {
name = "luganda",
source = "Wikimedia",
entry_name = {
from = {"á", "Á", "é", "É", "í", "Í", "ó", "Ó", "ú", "Ú", "ń", "Ń", "ḿ", "Ḿ", "â", "Â", "ê", "Ê", "î", "Î", "ô", "Ô", "û", "Û"},
to = {"a", "A", "e", "E", "i", "I", "o", "O", "u", "U", "n", "N", "m", "M", "a", "A", "e", "E", "i", "I", "o", "O", "u", "U"}
}
}
data["smj"] = {
name = "lulesamiska",
source = "ISO 639-3"
}
data["lb"] = {
name = "luxemburgiska",
source = "Wiktionary"
}
data["luy"] = {
name = "luhya",
source = "ISO 639-3"
}
data["sco"] = {
name = "lågskotska",
source = "Wikimedia"
}
data["dsb"] = {
name = "lågsorbiska",
source = "Wikimedia",
sort_rules = {"č>c~", "ć>c¡", "ě>e~", "ł>k~", "ń>n~", "ó>o~", "ŕ>r~", "š>s~", "ś>s¡", "ž>z~", "ź>z¡", "ch>h"}
}
data["nds"] = {
name = "lågtyska",
source = "Wiktionary"
}
data["mas"] = {
name = "maa",
source = "ISO 639-3"
}
data["mad"] = {
name = "maduresiska",
source = "ISO 639-3"
}
data["mai"] = {
name = "maithili",
source = "Wikimedia"
}
data["mak"] = {
name = "makassariska",
source = "ISO 639-3"
}
data["mk"] = {
name = "makedonska",
source = "Wiktionary",
entry_name = {
from = {ACUTE},
to = {}
}
}
data["mg"] = {
name = "malagassiska",
source = "Wiktionary"
}
data["ms"] = {
name = "malajiska",
source = "Wiktionary"
}
data["ml"] = {
name = "malayalam",
source = "Wiktionary"
}
data["mt"] = {
name = "maltesiska",
source = "Wiktionary",
sort_rules = {"ġ>f~", "għ>g~", "ħ>h~", "ie>i~", "ż>y~"}
}
data["mnc"] = {
name = "manchu",
source = "ISO 639-3"
}
data["mns"] = {
name = "mansiska",
source = "ISO 639-3"
}
data["gv"] = {
name = "manx",
source = "Wiktionary"
}
data["mi"] = {
name = "maori",
source = "Wiktionary"
}
data["arn"] = {
name = "mapudungun",
source = "Wikimedia"
}
data["mrh"] = {
name = "mara",
source = "ISO 639-3"
}
data["mr"] = {
name = "marathi",
source = "Wiktionary"
}
data["mh"] = {
name = "marshallesiska",
source = "Wiktionary"
}
data["mfe"] = {
name = "mauritisk kreol",
source = "ISO 639-3"
}
data["enm"] = {
name = "medelengelska",
source = "ISO 639-3",
entry_name = {
from = {"[ĀÁ]", "[āá]", "[ǢǼ]", "[ǣǽ]", "Ċ", "ċ", "[ĒÉĖ]", "[ēéė]", "Ġ", "ġ", "[ĪÍ]", "[īí]", "[ŌÓ]", "[ōó]", "[ŪÚ]", "[ūú]", "[ȲÝ]", "[ȳý]", MACRON, ACUTE, DOTABOVE},
to = {"A", "a", "Æ", "æ", "C", "c", "E", "e", "G", "g", "I", "i", "O", "o", "U", "u", "Y", "y"}
}
}
data["frm"] = {
name = "medelfranska",
source = "ISO 639-3"
}
data["gmh"] = {
name = "medelhögtyska",
source = "ISO 639-3",
entry_name = {
from = {"[ĀÂ]", "[āâ]", "[ĒÊË]", "[ēêë]", "[ĪÎ]", "[īî]", "[ŌÔ]", "[ōô]", "[ŪÛ]", "[ūû]"},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "U" , "u" },
}
}
data["gml"] = {
name = "medellågtyska",
source = "ISO 639-3",
entry_name = {
from = {"[ĀÂÄǞ]", "[āâäǟ]", "[ĒÊ]", "[ēê]", "[ĪÎ]", "[īî]", "[ŌÔÖȪ]", "[ōôöȫ]", "[ŪÛÜǕ]", "[ūûüǖ]", "[̂]"},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "U" , "u" , "" },
}
}
data["dum"] = {
name = "medelnederländska",
source = "ISO 639-3",
entry_name = {
from = {"[ĀÂ]", "[āâ]", "[ĒÊË]", "[ēêë]", "[ĪÎ]", "[īî]", "[ŌÔ]", "[ōô]", "[ŪÛ]", "[ūû]"},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "U" , "u"}
}
}
data["pal"] = {
name = "medelpersiska",
source = "ISO 639-3"
}
data["fit"] = {
name = "meänkieli",
source = "ISO 639-3",
sort_rules = {"š>s", "ž>z", "å>z~", "ä>ä", "ö>ö"}
}
data["min"] = {
name = "minangkabau",
source = "Wikimedia"
}
data["zh-min-nan"] = {
name = "min nan",
source = "Wiktionary"
}
data["mwl"] = {
name = "mirandesiska",
source = "ISO 629-3"
}
data["miq"] = {
name = "miskito",
source = "ISO 629-3",
entry_name = {
from = {"Â", "â", "Î", "î", "Û", "û"},
to = {"A", "a", "I", "i", "U", "u"}
}
}
data["mvi"] = {
name = "miyako",
source = "ISO 639-3"
}
data["mdf"] = {
name = "moksja",
source = "ISO 639-3"
}
data["mdh"] = {
name = "magindanao",
source = "ISO 639-3"
}
data["mo"] = {
name = "moldaviska",
source = "Wiktionary"
}
data["mn"] = {
name = "mongoliska",
source = "Wiktionary"
}
data["mos"] = {
name = "mossi",
source = "ISO 639-3"
}
data["mrw"] = {
name = "maranao",
source = "ISO 639-3"
}
data["gmy"] = {
name = "mykensk grekiska",
source = "ISO 639-3"
}
data["nah"] = {
name = "nahuatl",
source = "Wiktionary",
sort_rules = {"ch>c~", "cu>c¡", "hu>h~", "qu>q~", "tl>t~", "tz>t¡", "ā>ā", "ē>ē", "ī>ī", "ō>ō", "ll>ō~", "h>ō¡"}
}
data["pih"] = {
name = "norfuk",
source = "ISO 639-3",
sort_rules = {"aa>a~", "ee>e~", "ii>i~", "oo>o~", "uu>u~"}
}
data["na"] = {
name = "nauruanska",
source = "Wiktionary"
}
data["nv"] = {
name = "navajo",
source = "Wikimedia"
}
data["ng"] = {
name = "ndonga",
source = "Wikimedia"
}
data["nap"] = {
name = "neapolitanska",
source = "Wikimedia"
}
data["nl"] = {
name = "nederländska",
source = "Wiktionary"
}
data["ne"] = {
name = "nepali",
source = "Wiktionary"
}
data["nij"] = {
name = "ngaju dayak",
source = "ISO 639-3"
}
data["ryn"] = {
name = "nordamami",
source = "ISO 639-3"
}
data["frr"] = {
name = "nordfrisiska",
source = "ISO 639-3"
}
data["kmr"] = {
name = "nordkurdiska",
source = "ISO 639-3",
entry_name = {
from = {"'"},
to = {"’"}
}
}
data["nd"] = {
name = "nordndebele",
source = "ISO 639-1",
entry_name = {
from = {"[āàáâǎ]", "[ēèéêě]", "[īìíîǐ]", "[ōòóôǒ]", "[ūùúûǔ]", "ḿ", "[ǹńň]", MACRON, ACUTE, GRAVE, CIRC, CARON},
to = {"a" , "e" , "i" , "o" , "u" , "m", "n" }
}
}
data["se"] = {
name = "nordsamiska",
source = "Wikimedia",
sort_rules = {"á>a~", "č>c~", "đ>d~", "ŋ>n~", "š>s~", "ŧ>t~", "ž>z~", "ð>d~"},
entry_name = {
from = {"([đflmnŋrsšŧv])'%1"},
to = {"%1%1"}
}
}
data["nrm"] = {
name = "normandiska",
source = "Wiktionary"
}
data["nrn"] = {
name = "norn",
source = "ISO 639-3"
}
data["nov"] = {
name = "novial",
source = "Wikimedia"
}
data["nn"] = {
name = "nynorska",
source = "Wiktionary",
sort_rules = {"æ>æ", "ä>æ", "ø>ø", "å>ø~", "œ>ø", "ö>ø"}
}
data["aii"] = {
name = "nyöstsyriska",
source = "ISO 639-3"
}
data["oc"] = {
name = "occitanska",
source = "Wiktionary"
}
data["oj"] = {
name = "ojibwe",
source = "ISO 639-1"
}
data["ryu"] = {
name = "okinawianska",
source = "ISO 639-3"
}
data["okn"] = {
name = "okinoerabu",
source = "ISO 639-3"
}
data["or"] = {
name = "oriya",
source = "Wiktionary"
}
data["om"] = {
name = "oromo",
source = "Wiktionary"
}
data["orv"] = {
name = "fornöstslaviska",
source = "ISO 639-3",
entry_name = {
from = {u(0x0484)}, -- kamora
to = {}
}
}
data["ota"] = {
name = "osmanska",
source = "ISO 639-3"
}
data["os"] = {
name = "ossetiska",
source = "Wikimedia",
entry_name = {
from = {GRAVE, ACUTE},
to = {}
}
}
data["pau"] = {
name = "palauiska",
source = "ISO 639-3"
}
data["pi"] = {
name = "pali",
source = "Wiktionary"
}
data["pag"] = {
name = "pangasinan",
source = "ISO 639-3",
sort_rules = {"ng>n~"}
}
data["pap"] = {
name = "papiamento",
source = "Wikimedia"
}
data["ps"] = {
name = "pashto",
source = "Wiktionary"
}
data["jam"] = {
name = "patwa",
source = "ISO 639-3 (och Wikimedia)?"
}
data["pdc"] = {
name = "pennsylvaniatyska",
source = "ISO 639-3"
}
data["fa"] = {
name = "persiska",
source = "Wiktionary",
sort_rules = {"á>a~"},
entry_name = {
from = {u(0x064E), u(0x064F), u(0x0650), u(0x0651), u(0x0652)},
to = {}
}
}
data["pms"] = {
name = "piedmontesiska",
source = "Wikimedia"
}
data["pcd"] = {
name = "pikardiska",
source = "Wikimedia"
}
data["sje"] = {
name = "pitesamiska",
source = "ISO 639-3"
}
data["pjt"] = {
name = "pitjantjatjara",
source = "ISO 639-3",
sort_rules = {"ly>l~", "ḻ>l¡", "ng>n~", "ny>n¡", "ṉ>n°", "ṟ>r~", "tj>t~", "ṯ>t¡"}
}
data["pl"] = {
name = "polska",
source = "Wiktionary",
sort_rules = {"ą>a~", "ć>c~", "ę>e~", "ł>l~", "ń>n~", "ó>o~", "ś>s~", "ż>z~", "ź>z¡"}
}
data["pox"] = {
name = "polabiska",
source = "ISO 639-3"
}
data["pt"] = {
name = "portugisiska",
source = "Wiktionary"
}
data["pim"] = {
name = "powhatan",
source = "ISO 639-3"
}
data["prg"] = {
name = "preussiska",
source = "ISO 639-3"
}
data["pa"] = {
name = "punjabi",
source = "Wiktionary"
}
data["qu"] = {
name = "quechua",
source = "Wiktionary",
sort_rules = {"p>a~", "t>b~", "ch>c~", "k>d~", "q>d¡", "p'>d°", "t'>e~", "ch'>e¡", "k'>e°", "q'>f~", "ph>f¡", "th>f°", "chh>g~", "kh>g¡", "qh>g°", "s>g²", "sh>g³", "m>h~", "n>h¡", "ll>l~", "ñ>y~", "a>y¡", "i>y°", "u>y²"}
}
data["rej"] = {
name = "rejang",
source = "ISO 639-3"
}
data["rhg"] = {
name = "rohingya",
source = "ISO 639-3"
}
data["rom"] = {
name = "romani",
source = "ISO 639-2"
}
data["dru"] = {
name = "rukai",
source = "ISO 639-3"
}
data["ro"] = {
name = "rumänska",
source = "Wiktionary",
sort_rules = {"ă>a~", "â>a¡", "î>i~", "ş>s~", "ţ>t~"}
}
data["rue"] = {
name = "rusinska",
source = "ISO 639-3",
entry_name = {
from = {GRAVE, ACUTE},
to = {}
}
}
data["rw"] = {
name = "rwanda",
source = "Wiktionary"
}
data["ru"] = {
name = "ryska",
source = "Wiktionary",
entry_name = {
from = {"Ѐ", "ѐ", "Ѝ", "ѝ", GRAVE, ACUTE},
to = {"Е", "е", "И", "и"}
}
}
data["rm"] = {
name = "rätoromanska",
source = "Wiktionary"
}
data["sm"] = {
name = "samoanska",
source = "Wiktionary"
}
data["sg"] = {
name = "sango",
source = "Wiktionary"
}
data["sa"] = {
name = "sanskrit",
source = "Wiktionary"
}
data["sc"] = {
name = "sardiska",
source = "Wiktionary"
}
data["sas"] = {
name = "sasak",
source = "ISO 639-3"
}
data["stq"] = {
name = "saterfrisiska",
source = "ISO 639-3"
}
data["szl"] = {
name = "schlesiska",
source = "Wikimedia"
}
data["swg"] = {
name = "schwabiska",
source = "ISO 639-3"
}
data["sel"] = {
name = "selkupiska",
source = "ISO 639-3"
}
data["nso"] = {
name = "sepedi",
source = "ISO 639-3"
}
data["sr"] = {
name = "serbiska",
source = "Wiktionary",
sort_rules = {"č>c~", "ć>c¡", "dž>d~", "đ>d¡", "lj>l~", "nj>n~", "š>s~", "ž>z~", "ð>d¡"},
entry_name = {
from = {"[ȀÀȂÁĀÃ]", "[ȁàȃáāã]", "[ȄÈȆÉĒẼ]", "[ȅèȇéēẽ]", "[ȈÌȊÍĪĨ]", "[ȉìȋíīĩ]", "[ȌÒȎÓŌÕ]", "[ȍòȏóōõ]", "[ȐȒŔ]", "[ȑȓŕ]", "[ȔÙȖÚŪŨ]", "[ȕùȗúūũ]", "Ѐ", "ѐ", "[ӢЍ]", "[ӣѝ]", "[Ӯ]", "[ӯ]", GRAVE, ACUTE, DGRAVE, INVBREVE, MACRON, TILDE},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "R" , "r" , "U" , "u" , "Е", "е", "И" , "и", "У", "у" }
}
}
data["st"] = {
name = "sesotho",
source = "Wiktionary"
}
data["psu"] = {
name = "shauraseni",
source = "ISO 639-3"
}
data["shn"] = {
name = "shan",
source = "Wiktionary"
}
data["sn"] = {
name = "shona",
source = "Wiktionary"
}
data["scn"] = {
name = "sicilianska",
source = "Wiktionary"
}
data["sid"] = {
name = "sidamo",
source = "ISO 639-3"
}
data["sd"] = {
name = "sindhi",
source = "Wiktionary"
}
data["si"] = {
name = "singalesiska",
source = "Wiktionary"
}
data["ss"] = {
name = "siswati",
source = "Wiktionary",
entry_name = {
from = {"[āàáâǎ]", "[ēèéêě]", "[īìíîǐ]", "[ōòóôǒ]", "[ūùúûǔ]", "ḿ", "[ǹńň]", MACRON, ACUTE, GRAVE, CIRC, CARON},
to = {"a" , "e" , "i" , "o" , "u" , "m", "n" }
}
}
data["cjs"] = {
name = "sjoriska",
source = "ISO 639-3"
}
data["sms"] = {
name = "skoltsamiska",
source = "ISO 639-3",
sort_rules = {"â>a~", "č>c~", "ʒ>c¡", "ǯ>c°", "đ>d~", "ǧ>g~", "ǥ>g¡", "ǩ>k~", "ŋ>n~", "õ>o~", "š>s~", "ž>z~", "å>z¡", "ä>ä", "ð>d~"}
}
data["gd"] = {
name = "skotsk gäliska",
source = "Wiktionary"
}
data["sk"] = {
name = "slovakiska",
source = "Wiktionary",
sort_rules = {"á>a~", "ä>a¡", "č>c~", "ď>d~", "dz>d¡", "dž>d°", "é>e~", "í>i~", "ľ>l~", "ĺ>l¡", "ň>n~", "ó>o~", "ô>o¡", "ŕ>r~", "š>s~", "ť>t~", "ú>u~", "ý>y~", "ž>z~"}
}
data["sl"] = {
name = "slovenska",
source = "Wiktionary",
sort_rules = {"č>c~", "š>s~", "ž>z~"},
entry_name = {
from = {"[ÁÀÂȂȀ]", "[áàâȃȁ]", "[ÉÈÊȆȄỆẸ]", "[éèêȇȅệẹə]", "[ÍÌÎȊȈ]", "[íìîȋȉ]", "[ÓÒÔȎȌỘỌ]", "[óòôȏȍộọ]", "[ŔȒȐ]", "[ŕȓȑ]", "[ÚÙÛȖȔ]", "[úùûȗȕ]", "ł", GRAVE, ACUTE, DGRAVE, INVBREVE, CIRC, DOTBELOW},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "R" , "r" , "U" , "u" , "l"}
}
}
data["sla-usl"] = { -- enwikt sla-pro
name = "urslaviska",
source = "ISO 639-5 / konstruerad",
entry_name = {
from = {"[ÀÁÃĀȀȂ]", "[àáãāȁȃ]", "[ÈÉẼĒȄȆ]", "[èéẽēȅȇ]", "[ÌÍĨĪȈȊ]", "[ìíĩīȉȋ]", "[ÒÓÕŌȌȎ]", "[òóõōȍȏ]", "[ÙÚŨŪȔȖ]", "[ùúũūȕȗ]", "[ỲÝỸȲ]", "[ỳýỹȳ]", "[Ǭ]", "[ǭ]", GRAVE, ACUTE, TILDE, MACRON, DGRAVE, INVBREVE},
to = {"A", "a", "E", "e", "I", "i", "O", "o", "U", "u", "Y", "y", "Ǫ", "ǫ"}
}
}
data["so"] = {
name = "somaliska",
source = "Wiktionary",
entry_name = {
from = {"[ÁÀÂ]", "[áàâ]", "[ÉÈÊ]", "[éèê]", "[ÍÌÎ]", "[íìî]", "[ÓÒÔ]", "[óòô]", "[ÚÙÛ]", "[úùû]", "[ÝỲ]", "[ýỳ]"},
to = {"A" , "a" , "E" , "e" , "I" , "i" , "O" , "o" , "U" , "u", "Y", "y"}
}
}
data["ckb"] = {
name = "sorani",
source = "Wikimedia"
}
data["es"] = {
name = "spanska",
source = "Wiktionary",
sort_rules = {"ñ>n~"}
}
data["sux"] = {
name = "sumeriska",
source = "ISO 639-3"
}
data["su"] = {
name = "sundanesiska",
source = "Wiktionary"
}
data["sul"] = {
name = "surigaonon",
source = "ISO 639-3"
}
data["srn"] = {
name = "surinamesiska",
source = "ISO 639-3"
}
data["sva"] = {
name = "svanetiska",
source = "ISO 639-3",
}
data["sv"] = {
name = "svenska",
source = "Wiktionary",
sort_rules = {"å>z~", "ä>z¡", "ö>z°", "ü>y", "æ>z¡", "ø>z°"}
}
data["rmu"] = {
name = "svensk romani",
source = "ISO 639-3",
sort_rules = {"å>z~", "ä>z¡", "ö>z°"}
}
data["swl"] = {
name = "svenskt teckenspråk",
source = "ISO 639-3"
}
data["sw"] = {
name = "swahili",
source = "Wiktionary"
}
data["ams"] = {
name = "sydamami",
source = "ISO 639-3"
}
data["azb"] = {
name = "sydazerbajdzjanska",
source = "ISO 639-3"
}
data["sdh"] = {
name = "sydkurdiska",
source = "ISO 639-3"
}
data["nr"] = {
name = "sydndebele",
source = "ISO 639-1",
entry_name = {
from = {"[āàáâǎ]", "[ēèéêě]", "[īìíîǐ]", "[ōòóôǒ]", "[ūùúûǔ]", "ḿ", "[ǹńň]", MACRON, ACUTE, GRAVE, CIRC, CARON},
to = {"a" , "e" , "i" , "o" , "u" , "m", "n" }
}
}
data["sma"] = {
name = "sydsamiska",
source = "ISO 639-3",
sort_rules = {"ï>i~", "æ>z", "ö>z~", "å>z¡"}
}
data["tg"] = {
name = "tadzjikiska",
source = "Wiktionary",
sort_rules = {"ç>c~", "ƣ>g~", "ī>i~", "ş>s~", "ū>u~", "ƶ>z~"},
entry_name = {
from = {ACUTE},
to = {}
}
}
data["tl"] = {
name = "tagalog",
source = "Wiktionary",
sort_rules = {"ng>n~"},
entry_name = {
from = {"[áàâ]", "[éèê]", "[íìî]", "[óòô]", "[úùû]", ACUTE, GRAVE, CIRC},
to = {"a" , "e" , "i" , "o" , "u" }
}
}
data["tsg"] = {
name = "tausug",
source = "ISO 639-3"
}
data["ty"] = {
name = "tahitiska",
source = "Wikimedia"
}
data["khb"] = {
name = "tai lü",
source = "ISO 639-3"
}
data["ta"] = {
name = "tamil",
source = "Wiktionary"
}
data["tt"] = {
name = "tatariska",
source = "Wiktionary",
sort_rules = {"ä>a~", "ç>c~", "ğ>g~", "İ>i", "í>i~", "ı>i¡", "I>i¡", "ñ>n~", "ö>o~", "ş>s~", "ü>u~"}
}
data["te"] = {
name = "telugu",
source = "Wiktionary"
}
data["sjt"] = {
name = "tersamiska",
source = "ISO 639-3"
}
data["tet"] = {
name = "tetum",
source = "ISO 639-3",
sort_rules = {"á>a~", "é>e~", "í>i~", "ñ>n~", "ó>o~", "ú>u~"}
}
data["th"] = {
name = "thai",
source = "Wiktionary"
}
data["bo"] = {
name = "tibetanska",
source = "Wiktionary"
}
data["ti"] = {
name = "tigrinska",
source = "Wiktionary"
}
data["tiw"] = {
name = "tiwi",
source = "ISO 639-3"
}
data["cs"] = {
name = "tjeckiska",
source = "Wiktionary",
sort_rules = {"á>a~", "č>c~", "ď>d~", "é>e~", "ě>e¡", "ch>h~", "í>i~", "ň>n~", "ó>o~", "ř>r~", "š>s~", "ť>t~", "ú>u~", "ů>u¡", "ý>y~", "ž>z~"}
}
data["ce"] = {
name = "tjetjenska",
source = "ISO 639-1",
entry_name = {
from = {MACRON},
to = {}
}
}
data["ckt"] = {
name = "tjuktjiska",
source = "ISO 639-3"
}
data["cv"] = {
name = "tjuvasjiska",
source = "ISO 639-1"
}
data["tli"] = {
name = "tlingit",
source = "ISO 639-1"
}
data["bbc"] = {
name = "toba batak",
source = "ISO 639-3"
}
data["tpi"] = {
name = "tok pisin",
source = "Wiktionary"
}
data["tkn"] = {
name = "tokunoshima",
source = "ISO 639-3"
}
data["to"] = {
name = "tonganska",
source = "Wiktionary",
sort_rules = {"ng>n~"}
}
data["ts"] = {
name = "tsonga",
source = "Wiktionary"
}
data["tn"] = {
name = "tswana",
source = "Wiktionary"
}
data["tnq"] = { -- enbart etymologi
name = "taino",
nolemma = true,
source = "ISO 639-3"
}
data["tum"] = {
name = "tumbuka",
source = "Wikimedia"
}
data["tpn"] = {
name = "tupinambá",
source = "ISO 639-3"
}
data["tr"] = {
name = "turkiska",
source = "Wiktionary",
sort_rules = {"ç>c~", "ğ>g~", "ı>h~", "I>h~", "İ>i", "ö>o~", "ş>s~", "ü>u~"}
}
data["tk"] = {
name = "turkmeniska",
source = "Wiktionary",
sort_rules = {"ç>b~", "ä>e~", "ž>j~", "ň>n~", "ö>o~", "ş>s~", "ü>u~", "ý>y~"},
entry_name = {
from = {"ā", "ē", "ī", "ō", "ū", "ȳ", "ȫ", "ǖ", MACRON},
to = {"a", "e", "i", "o", "u", "y", "ö", "ü", ""}
}
}
data["tyv"] = {
name = "tuvinska",
source = "ISO 639-3"
}
data["tw"] = {
name = "twi",
source = "Wiktionary"
}
data["de"] = {
name = "tyska",
source = "Wiktionary",
sort_rules = {"ß>ss"}
}
data["udm"] = {
name = "udmurtiska",
source = "Wikimedia"
}
data["uga"] = {
name = "ugaritiska",
source = "ISO 639-3"
}
data["ug"] = {
name = "uiguriska",
source = "Wiktionary",
sort_rules = {"ə>a~", "p>b~", "t>b¡", "j>b°", "q>b²", "h>b³", "r>d~", "z>d¡", "ⱬ>d°", "s>d²", "x>d³", "ƣ>e~", "ķ>f~", "ng>k~", "g>k¡", "h̡>n~", "ɵ>u~", "ü>u¡", "e>v~", "i>v¡"}
}
data["uk"] = {
name = "ukrainska",
source = "Wiktionary",
entry_name = {
from = {"Ѐ", "ѐ", "Ѝ", "ѝ", GRAVE, ACUTE},
to = {"Е", "е", "И", "и"}
}
}
data["sju"] = {
name = "umesamiska",
source = "ISO 639-3"
}
data["hu"] = {
name = "ungerska",
source = "Wiktionary",
sort_rules = {"cs>c~", "dz>d~", "dzs>d¡", "gy>g~", "ly>l~", "ny>n~", "ö>o~", "sz>s~", "ty>t~", "ü>u~", "zs>z~", "ő>o~", "ű>u~"}
}
data["sqj-usq"] = {
name = "uralbanska",
source = "ISO 639-5 / konstruerad"
}
data["ur"] = {
name = "urdu",
source = "Wiktionary",
entry_name = {
from = {u(0x064B), u(0x064C), u(0x064D), u(0x064E), u(0x064F), u(0x0650), u(0x0651), u(0x0652)},
to = {}
}
}
data["gem-ugm"] = {
name = "urgermanska",
source = "ISO 639-5 / konstruerad"
}
data["gem-uno"] = {
name = "urnordiska",
source = "ISO 639-5 / konstruerad"
}
data["inc-uia"] = {
name = "urindoariska",
source = "ISO 639-5 / konstruerad"
}
data["ine-uie"] = {
name = "urindoeuropeiska",
source = "ISO 639-5 / konstruerad"
}
data["iir-uir"] = {
name = "urindoiranska",
source = "ISO 639-5 / konstruerad"
}
data["ira-uir"] = {
name = "uriranska",
source = "ISO 639-5 / konstruerad"
}
data["itc-uit"] = {
name = "uritaliska",
source = "ISO 639-5 / konstruerad"
}
data["cel-uce"] = {
name = "urkeltiska",
source = "ISO 639-5 / konstruerad"
}
data["smi-usm"] = {
name = "ursamiska",
source = "ISO 639-2 / konstruerad"
}
data["sem-use"] = {
name = "ursemitiska",
source = "ISO 639-5 / konstruerad"
}
data["trk-utr"] = {
name = "urturkiska",
source = "ISO 639-5 / konstruerad"
}
data["fiu-ufi"] = {
name = "uröstersjöfinska",
source = "ISO 639-5 / konstruerad"
}
data["uz"] = {
name = "uzbekiska",
source = "Wiktionary"
}
data["wa"] = {
name = "vallonska",
source = "Wiktionary"
}
data["ve"] = {
name = "venda",
source = "Wikipedia"
}
data["vec"] = {
name = "venetianska",
source = "Wikimedia"
}
data["vep"] = {
name = "vepsiska",
source = "ISO 639-3",
sort_rules = {"č>c~", "š>s~", "z>s¡", "ž>s°", "õ>w~", "ü>w¡", "ä>w°", "ö>w²", "'>w³"}
}
data["vi"] = {
name = "vietnamesiska",
source = "Wiktionary",
sort_rules = {"ă>a~", "â>a¡", "đ>d~", "ê>e~", "ô>o~", "ơ>o¡", "ư>u~", "ằ>a~", "ắ>a~", "ẳ>a~", "ẵ>a~", "ặ>a~", "ầ>a¡", "ấ>a¡", "ẩ>a¡", "ẫ>a¡", "ậ>a¡", "ề>e~", "ế>e~", "ể>e~", "ễ>e~", "ệ>e~", "ồ>o~", "ố>o~", "ổ>o~", "ỗ>o~", "ộ>o~", "ờ>o¡", "ớ>o¡", "ở>o¡", "ỡ>o¡", "ợ>o¡", "ừ>u~", "ứ>u~", "ử>u~", "ữ>u~", "ự>u~", "ð>d¡"}
}
data["wym"] = {
name = "vilamoviska",
source = "ISO 639-3",
sort_rules = {"ao>a~", "ć>c~", "ł>l~", "ń>n~", "ö>o~", "ś>s~", "ü>u~", "ź>z~", "ż>z¡"}
}
data["vo"] = {
name = "volapük",
source = "Wiktionary",
sort_rules = {"ä>a~", "ö>o~", "ü>u~"}
}
data["fiu-vro"] = {
name = "võro",
source = "Wikimedia"
}
data["vot"] = {
name = "votiska",
source = "ISO 639-3"
}
data["mrj"] = {
name = "västmariska",
source = "Wikimedia"
}
data["pnb"] = {
name = "västpanjabi",
source = "Wikimedia"
}
data["wls"] = {
name = "walliska",
source = "ISO 639-3"
}
data["war"] = {
name = "waray-waray",
source = "Wikimedia"
}
data["wo"] = {
name = "wolof",
source = "Wiktionary"
}
data["xh"] = {
name = "xhosa",
source = "Wiktionary",
entry_name = {
from = {"[āàáâǎ]", "[ēèéêě]", "[īìíîǐ]", "[ōòóôǒ]", "[ūùúûǔ]", "ḿ", "[ǹńň]", MACRON, ACUTE, GRAVE, CIRC, CARON},
to = {"a" , "e" , "i" , "o" , "u" , "m", "n" }
}
}
data["yka"] = {
name = "jakan",
source = "ISO 639-3"
}
data["rys"] = {
name = "yaeyama",
source = "ISO 639-3"
}
data["kdd"] = {
name = "yankunytjatjara",
source = "ISO 639-3",
sort_rules = {"ly>l~", "ḻ>l¡", "ng>n~", "ny>n¡", "ṉ>n°", "ṟ>r~", "tj>t~", "ṯ>t¡"}
}
data["ii"] = {
name = "yi",
source = "Wikimedia"
}
data["yoi"] = {
name = "yonaguni",
source = "ISO 639-3"
}
data["yox"] = {
name = "yoron",
source = "ISO 639-3"
}
data["yo"] = {
name = "yoruba",
source = "Wiktionary"
}
data["yua"] = {
name = "yukatekiska",
source = "ISO 639-3"
}
data["dje"] = {
name = "zarma",
source = "ISO 639-3"
}
data["diq"] = {
name = "zazaiska",
source = "Wikimedia"
}
data["zea"] = {
name = "zeeländska",
source = "ISO 639-3"
}
data["sgs"] = {
name = "žemaitiska",
source = "ISO 639-3"
}
data["za"] = {
name = "zhuang",
source = "Wiktionary"
}
data["zu"] = {
name = "zulu",
source = "Wiktionary",
entry_name = {
from = {"[āàáâǎ]", "[ēèéêě]", "[īìíîǐ]", "[ōòóôǒ]", "[ūùúûǔ]", "ḿ", "[ǹńň]", MACRON, ACUTE, GRAVE, CIRC, CARON},
to = {"a" , "e" , "i" , "o" , "u" , "m", "n" }
}
}
data["ovd"] = {
name = "älvdalska",
source = "ISO 639-3",
sort_rules = {"ą>a~", "ð>d~", "ę>e~", "į>i~", "ų>u~", "y̨>y~", "å>z~", "ą̊>z¡", "ä>ä", "ö>ö"}
}
data["mhr"] = {
name = "östmariska",
source = "Wikimedia"
}
local reverse_data = {}
local name = ''
for code, data_obj in pairs(data) do
name = data_obj["name"]
reverse_data[name] = code
end
return { data , reverse_data }