Wiktionary:Stilguide/Vilka ord ska tas med

Wiktionarys ledstjärna är att inkludera alla ord i alla språk.

Allmänna riktlinjer

redigera

Som allmän princip skall alla uttryck som det kan tänkas att någon stöter på och undrar vad de kan betyda finnas med. Detta leder i sin tur till att uttryck för att inkluderas skall vara belagda och idiomatiska.

Bred definition av uttryck

redigera

Uttryck är en bredare definition än ord. Alla nedanstående är acceptabla exempel på artikeluppslag:

Att belägga uttryck

redigera

Att ett uttryck är belagt betyder någotdera av:

  1. uppenbarligen spridd användning
  2. använt i välkänt verk
  3. förekommer på en myndighets hemsida eller i en granskad akademisk tidskrift
  4. använt åtminstone 3 gånger oberoende av varandra med åtminstone 1 års spridning för att uttrycka mening i ett permanent medium.

När så är möjligt så är det bättre att citera källor som med hög sannolikhet kommer att vara tillgängliga över ett långt tidsperspektiv. Då Wiktionary är ett nätbaserat lexikon så finns det en naturlig predisposition för usenet och bloggmaterial, vilka arkiveras av Google. Tryckt material, som böcker och tidskrifter, är naturligtvis också acceptabla, i synnerhet om deras innehåll är indexerat på nätet. Även ljud- och bildmaterial kan användas, om deras härkomst kan verifieras och de är hållbart arkiverade. Böcker som används som källmaterial bör listas med ISBN-nummer.

Att uttrycka mening

redigera

Ett uttryck uttrycker endast mening när det används för att referera till något annat än sig självt. En förekomst i en ordlista, eller inom citationstecken för att beskriva bruket av uttrycket innebär inte att någon mening uttrycks med hjälp av uttrycket i fråga. Observera att en användning av ett uttryck, som förutom att referera till något annat även innehåller en definition av uttrycket kan användas.

Att vara oberoende

redigera

Kravet på oberoende är tänkt att utesluta hänvisningar som refererar till varandra.

Antagande är att om ett uttryck enbart används i en mycket begränsad grupp, finns det inte någon anledning att inkludera uttrycket i ett generellt lexikon som detta.

Att vara använt under minst ett år

redigera

Detta avser att sålla bort dagsländor inom språket. Ettårströskeln kan verka godtycklig, men fungerar i praktiken bra.

Protologismer

redigera

Begreppet protologism används om ord och uttryck som definierats i hopp om att de skall bli vedertagna och spridda, men som inte de facto används. De uppfyller därmed inte de nyss nämnda kraven. Engelska Wiktionary har upprättat en lista (en:Wiktionary:List of protologisms) över dem, och om behovet uppstår bör Svenska Wiktionary göra något motsvarande.

Idiomaticitet

redigera

Ett uttryck är idiomatiskt om dess fulla mening inte lätt kan förstås från dess komponenter. Fraser vars betydelse helt kan härledas från dess komponenter medtas inte.

Felaktiga och alternativa stavningar

redigera

Det finns inte någon enkel regel för att avgöra huruvida en stavning är korrekt. Detta gäller i extra hög grad språk som engelska eller kinesiska där det finns olika standarder beroende på var språket talas. Den som vill inkludera en omtvistad stavning har bevisbördan för att motivera varför stavingen skall inkluderas. Härvid kan publicerade grammatikor och frekvensstatistik användas. Det skall också hållas i åtanke att långt i från alla språk har normativa språkvårdsinstitutioner, och att det därför kan vara svårt att fastställa vad som är vedertagen stavning. Regionala och historiska stavningsvarianter är inte felstavningar, men bör markeras med stiltaggar i tillämpliga fall. Rena omdirigeringar bör undvikas.

Felaktiga stavningar

redigera

Felaktiga stavningar kan peka om till uppslagsordet med hjälp av mall {{inget uppslag}} i en för övrigt tom sida och med hjälp av {{se även}} i en sida med innehåll. Dessa räknas inte som inkludering, utan är bara en hjälp för användaren att hitta rätt uppslag.

Alternativa stavningar

redigera

Alternativa stavningar presenteras liksom vanliga artiklar med språk- och ordklassrubriker, samt kategoriseringar och grammatiktabeller, men innehåller ingen självständig definition och saknar även översättningar och andra rubriker. Den alternativa stavningen presenteras istället i ordets huvudartikel under rubrikerna varianter och användning där informationen ställs emot den vanliga stavningen och eventuella andra alternativa stavningar. Istället för definition anges exempelvis #''mycket vanlig stavningsvariant av'' [[sjyst]], #''omtvistad stavningsvariant av'' [[omständlig]], eller liknande formuleringar. Allmänt sett är det alltid bra att försöka fokusera innehållet på en huvudartikel för att slippa merarbete i form av att bland annat behöva skriva samma sak i flera artiklar och ha flera översättningslistor när det egentligen är samma ord, och så vidare.

Chattstavningar

redigera

Chattstavningar bör vara etablerade, ha bred användning och stavningarna bör också vara rimliga. Eftersom gränsdragningarna kan komma att bli svåra ligger ett extra stort ansvar på den som vill behålla en ifrågasatt artikel att kunna motivera varför stavningen bör anses vara etablerad (endast hänvisning till ett antal förekomster på Google ensamt räcker inte). Chattstavningar kan taggas på lämpligt sätt och placeras i Kategori:Svenska/Chattspråk eller motsvarande.

Varumärken

redigera

Varumärken bör inte föras in av den enda anledningen att de är varumärken. Dock, varumärken som används för att beteckna något mer allmänt än vad varumärket täcker in, kan komma ifråga -- de vanliga reglerna för att belägga ordet gäller naturligtvis. Om ett visst varumärke egentligen syftar på ett föremål av ett visst fabrikat, men detta ordet vanligen används som beteckning för föremålet oavsett fabrikat, eller än mer generaliserat, så är det i tillräckligt bruk för att motivera införande. Exempelvis är MACK ursprungligen ett varumärke, produkten var bensinpumpar, men vilket nu har blivit generaliserat och används för bensinstationer i allmänhet, alltså är mack helt okej att föra in. Eventuellt kan dock varumärken som i allmänhet översätts mellan olika språk inkluderas om sådana översättningar tillhandahålls i artiklarna.

Förkortningar av varumärken

redigera

Förkortningar av varumärken, företag, organisationer osv. får gärna föras in, men eftersom varumärkena i sig inte ska ha några artiklar wikilänkas inte namnet för förkortningen. Exempelvis: #förkortning för företagsnamnet Svenska aeroplane aktiebolaget

Namn på organisationer, föreningar m.m.

redigera

Namn på företag, myndigheter, organisationer, föreningar, partier, idrottsklubbar, kommuner, landsting, byggnader, osv. delar inklusionskriterier med varumärken och inkluderas i regel inte. Förkortningar för dessa liksom förkortningar för varumärken inkluderas dock. Kortvarianter, smeknamn och liknande räknas inte som förkortningar.

Namn på böcker, filmer, karaktärer, spel m.m.

redigera

Namn på verk (eller förkortningar av dem) såsom böcker, konstverk, filmer, dator-, kort- och sällskapsspel med mera (inklusive delar av verket, personer och platser som omnämns i verket, uttryck som förekommer i verket och liknande) ska inte tas med. Några undantag finns, nämligen klassiska fiktiva karaktärer och platser som vanligen översätts mellan olika språk eller används utanför sitt sammanhang samt klassiska bräd- och sällskapsspel (ej datorspel) som vanligen översätts mellan olika språk.

Personnamn

redigera

Alla vanliga personnamn kan inkluderas. Namn på personer bör inte infogas för att en känd person bär namnet, utan för att namnet i sig är av värde för ordboken. För att avgöra detta gäller:

  • För svenska namn: Inkluderas kan de mansnamn respektive kvinnonamn som är eller har varit bland de 100 vanligaste för hela befolkningen vid någon tidpunkt (år 1900 och framåt) och även de mansnamn respektive kvinnonamn som ett givet år (1990 och framåt) har varit bland de 100 populäraste att ge nyfödda. Om svenskspråkiga Wikipedia har en namnartikel (existerande för namnets skull snarare än på grund av personer som bär eller har burit namnet) räcker detta som inkluderingskrav.
  • För icke-svenska namn: Inkluderas kan de mansnamn respektive kvinnonamn som är eller har varit bland de 10 vanligaste (år 1900 och framåt) för hela befolkningen eller de 10 populäraste att ge nyfödda, vid någon tidpunkt (år 1990 och framåt) för icke-europeiska språk med minst 10 miljoner talare i ett givet land, för europeiska språk med minst 1 miljon talare i ett givet land eller för nordiska språk med minst 100,000 talare i ett givet land (dvs. även isländska, men inte färöiska).
  • Vid skapandet av namnartiklar ska källa till namnstatistik alltid anges om namnet är på annat språk än svenska eller om namnet är på svenska och saknar en namnartikel på Wikipedia. För statistikinhämtning kan exempelvis [1] och [2] användas (för icke-svenska namn). Det är enklare för den som skapar artikeln att förse artikeln med sådan information än att i efterhand leta efter stöd för inkludering, och det stävjar därmed onödiga diskussioner om sidan ska inkluderas eller raderas.
  • Samma begränsningar gäller för efternamn som förnamn.
  • Stavningsvarianter och smeknamn kan existera som variantuppslag om de är uppenbart relevanta, även om de i övrigt inte uppfyller ovanstående kriterier.

Toponymer

redigera

Länder, svenska landskap, hav, större huvudstäder, svenska större städer och vissa andra toponymer finns inkluderade idag, men exakt vilka riktlinjer för inklusion av toponymer som ska gälla är oklart ännu. Uppslag med toponymer bör inte skapas om uppslaget har tveksam relevans (exempelvis då översättning till svenska respektive till andra språk saknas) och under inga omständigheter ska uppslag med toponymer masskapas (även om relevansen går att argumentera för) förrän vidare diskussion förts.

Räkneord

redigera

Vi begränsar oss till ett mindre antal räkneord, eftersom vi annars skulle få en väldig massa onödiga uppslag. De som tillåts är de räkneord som länkas från Appendix:Räkneord, och översättningar till andra språk. Andra räkneord kan också inkluderas om särskilda skäl föreligger, exempelvis googol.

Sammansättningar med tal

redigera

Tal som såväl siffror som bokstäver kan förekomma i sammansättningar. Endast de ord som faller under nedanstående punkter får inkluderas:

  1. Enstaka sammansättningar av tal (i form av siffror eller bokstäver) och ord får inkluderas: t.ex. 1337, 50-öring, dussintals, tolvfingertarm, åttatimmarsdag.
  2. I den mån ord som noll, halv, enkel, en, dubbel, halv eller liknande tolkas som tal räknas också dessa som enstaka och får inkluderas: t.ex. nolleperiod, ensidig, enkelspårig, dubbelseende, halveringstid.
  3. Serier av tal (bestående av siffror eller bokstäver) i sammansättningar ska inkluderas sparsamt.
  4. I övrigt tillåts sammansättningar som uttryckligen godkänns i följande punkter (fler kan vid behov läggas till efter diskussion):
    • Decennium 00-tal till 90-tal och motsvarande ord bestående av bara bokstäver.
    • Sekel 000-tal till 2100-tal och motsvarande ord bestående av bara bokstäver.
    • Millennium 0000-tal till 2000-tal och motsvarande ord bestående av endast bokstäver.

Böjningsformer

redigera

Även böjningsformer, såväl regelbundna som oregelbundna, ska ha egna uppslag. Böjningsformer av ord behöver dock inte skapas manuellt om det inte finns särskild anledning för detta. Lägg hellre till böjningsmallar i artiklar, då en bot senare smidigt kan använda sig av den informationen för att automatiskt skapa uppslagsord för böjningsformerna på ett enhetligt sätt.

Uttryckssymboler

redigera

Vanliga uttryckssomboler som ;) och :-) kan inkluderas i ordboken.

Lånord

redigera

Vilket ord som helst kan lånas in till svenska språket, men det är bara en begränsad mängd som faktiskt lånas. Att spagetti inkluderas innebär inte per automatik att varje sorts pasta ingår i det svenska ordförrådet. Vill man införa ett lånord i ordboken bör man kunna påvisa en spridd användning över tid. Till exempel används mejl ofta både i tidningsspråk och andra sammanhang och kan därför anses vara en del av svenskan.

Vilka språk ska vara med

redigera

Naturliga språk

redigera

Ord från ovanliga språk är välkomna så länge som de används (eller har använts) i daglig kommunikation för en identifierbar naturlig grupp av människor. Språk som saknar språkkod enligt ISO 639 bör med största sannolikhet undvikas. Observera att det i grund och botten är ett politiskt avgörande vad som är ett språk och vad som är en dialekt, vad som är standard och vad som är variant. Språk väcker starka känslor hos individer och används i hög grad för att signalera grupptillhörighet eller dennas motsats. Det krävs stor lyhördhet hos hela wikigemenskapen för att undvika uppslitande konflikter.

Konstgjorda språk

redigera

Konstgjorda språk har inte växt fram naturligt, utan är resultatet av en medveten process med ett givet syfte. I allmänhet, i synnerhet vad gäller konstgjorda språk förknippade med skönlitteratur, så uppfyller sådana språk inte de grundläggande krav som framställts på ovan, i det att det är osannolikt att man stöter på dem och vill ta reda på vad de betyder. Det finns undantag till denna regel, till exempel esperanto, vilket idag måste betraktas som ett levande språk med modersmålstalare.

Ord och uttryck som har sitt ursprung i konstgjorda språk, men som har lånats in i andra språk, till exempel grok(ka) skall naturligtvis kunna inkluderas även om det ursprungliga språket som sådant inte anses kunna tas med. I etymologin för dessa ord skall då det konstgjorda språket anges som källa. På samma sätt kan mycket väl ett artikeluppslag för språkets namn vara av nytta.

engelska Wiktionary har i dagsläget dessa konstgjorda språk godkänts som Wiktionary-språk: esperanto, ido, interlingua, interlingue, lojban, novial, volapük. På svenska Wiktionary har inte någon reell debatt förts ännu, men ett stort antal esperanto-ord finns redan inlagda.

Rekonstruerade språk

redigera

Ingen policy finns i nuläget, däremot en del uppslag som skulle falla under sådan.

Vandalism

redigera

Ibland händer det att någon lägger in material på Wiktionary som uppenbarligen inte har något att göra med Wiktionarys syfte eller principer. Detta anses vara vandalism, och kommer att tas bort så fort som möjligt. Om vandalismen är i form av en ändring till en existerande sida kommer denna att återställas, om i form av en ny sida kommer denna att raderas, även om artikeluppslaget i sig är giltigt. Denna typ av vandalism åtgärdar administratörerna efter egen bedömning.

Wiktionary är inte en encyklopedi

redigera

Artikeluppslagen i Wiktionary skall inte bli encyklopediska artiklar. Om detta skulle ske, bör det överflödiga innehållet flyttas till Wikipedia, och artikeln behållas i en ansad form.

Uppslag i Wiktionary är om ord, inte människor eller platser. Många platser och några människor är kända under ord som av andra anledningar är lämpliga att inkludera i Wiktionary. Det kan också vara lämpligt att inkludera personnamn och platsnamn m m för att förklara dessas bruk, stavningsvarianter, uttal, etymologi och eventuella eponymer bildade från namnet, men aldrig för att beskriva en enskild person eller plats. Sådana beskrivningar hör hemma på Wikipedia.

Problemområden

redigera

Belagd eller ej belagd, det är frågan

redigera

Ibland ventileras bekymmer om att tilläggande av ett visst artikeluppslag kommer att bilda prejudikat för att en stor mängd liknande artikeluppslag kommer att överflöda Wiktionary. Detta är de facto inte något problem, eftersom varje ord eller form beaktas utifrån det bruk denna har, inte efter liknande ords bruk. Några exempel:

  • Vilket ord som helst kan återges som fikonspråk eller rövarspråk, men enbart ett litet fåtal av dessa ord (t ex fimp) infogas i det svenska ordförrådet.
  • Vilket ord som helst kan återges som leet, men enbart ett litet fåtal av dessa ord (t ex pr0n) kan göra några som helst anspråk på att tillhöra det svenska ordförrådet.
  • Grammatiska affix som meta- och -ism kan i teorin användas i mycket större utsträckning än vad som faktiskt i praktiken sker. (Vissa mycket grundläggande suffix som pluraländelser och tempusändelser kan verkligen användas i princip överallt.)
  • Det kan ibland verka som om trendiga internetprefix som e- och i- kan användas överallt, men det kan de inte. Om jag beslutar mig för att tala om e-tumrullning och ingen annan använder ordet behövs inte någon artikel i Wiktionary.