Wiktionary:Bybrunnen/Arkiv25

LUA, länkar och apostrofer

Jag sneglar avundsjukt på en:template:t som tycks kunna ta parametern ста́рый (med accent) och ändå länka till sidan старый (utan accent). Detta skulle vara användbart i diverse ryska mallar, t.ex. {{ru-adj}}. Det tycks dock inte gå att åstadkomma med vanlig wikitext, men den engelska mallen anropar en:Module:translations och dess LUA-kod verkar innehålla den här kritiska raden:

terminfo.term2 = mw.ustring.gsub(terminfo.term, "^%^", "")

Är uttrycket "^%^" ett mönster som innefattar sådana apostrofer? Eller hur går det till? --LA2 (diskussion) 8 augusti 2017 kl. 19.14 (CEST)[svara]

^ matchar början av en sträng. % är ett escape-tecken. Det andra ^ är alltså ett ^. Så koden tar bort ^ från inledningen av term och returnerar det och lagrar det i term2. Ingen direkt magi där, alltså. Vet dock inte varför koden finns där.

Istället lär en:Module:languages/data2, en:Module:languages/data3 och en:Module:languages/datax vara rätt ställen att börja leta efter svar på (vilka motsvarar vår Modul:lang/data). Där finns regler som förklarar vilka tecken som ska rensas från sina diakriter för respektive språk i "entry_name"-attributet. Vi bör absolut se till att ha något motsvarande i vår Modul:lang/data.. ~ Dodde (diskussion) 8 augusti 2017 kl. 20.20 (CEST)[svara]

Jaha. Vår Modul:lang verkar rätt liten och har ingen funktion makeEntryName. Men även om vi inför det, så blir det bara tillgängligt för moduler som anropar den funktionen (som engelska template:t gör). Det räcker väl inte med att skriva [[ста́рый]], för uppförandet är beroende på språk. Så hur får vi smidigast in det i t.ex. mall:ru-adj? Kanske en mall {{l|ru|ста́рый}} som skapar en länk för ryska (där apostrofen ska kapas bort)? Just en sådan mall finns på en.wiktionary, men den skapar inte bara en länk utan även en parentes med transkribering [[старый|ста́рый]] (stáryj), vilket kanske inte (?) är önskvärt i böjningsmallarna. --LA2 (diskussion) 8 augusti 2017 kl. 20.42 (CEST)[svara]

Det är riktigt, det måste finnas en modul som anropar funktionen. Det enda långsiktiga och bra, som jag ser det, är att skapa en Modul:ru-adj. Och naturligtvis vill vi även ha en Modul:ö. ~ Dodde (diskussion) 8 augusti 2017 kl. 21.16 (CEST)[svara]

Jag är intresserad av att se Wiktionary växa och utvecklas på fler språk än de 20 största: Estniska, färöiska, isländska, lettiska, nynorska, ... vitryska. Dessa små språk med några få bidragslämnare kommer aldrig att kunna ha någon stab av egna programmerare som orkar underhålla LUA-moduler, så varför ska vi? Detta måste gå att rationalisera och centralisera, så att all avancerad kod kan vara gemensam och internationell. Kvar på de enskilda sajterna kan vi ha enkla mallar. Något annat är inte realistiskt. Redan att modul:lang ska kopieras och utvecklas i olika versioner på varje sajt (olika på sv.wikt och en.wikt) är fel väg att gå. --LA2 (diskussion) 8 augusti 2017 kl. 21.34 (CEST)[svara]

Diskussionen hamnade nog lite OT nu... Det finns såvitt jag har förstått inget tekniskt stöd för att anropa moduler från andra språkversioner, så att lägga ner modulverksamheten på svwikt är ju inget riktigt alternativ. Centralisering har sina fördelar men även sina nackdelar. I valda delar arbetar man med centralisering i och med wikidata osv. Men detta är övergripande frågor som jag inte tror leder nånstans om de hålls lokalt på svwikt. ~ Dodde (diskussion) 8 augusti 2017 kl. 21.53 (CEST)[svara]

Jag har redan ropat efter delad kodbas på wikidata. Läs [1] [2] [3]. Jag har dock svårt att förstå vad som behöver göras på vår ända och om det skulle börja fungera direkt då. –d Moberg 24 augusti 2017 kl. 21.13 (CEST)[svara]

Våra översättningsmallar {{ö}} och {{ö+}} har nu äntligen stöd för detta. Ordet med diakriter ska inte längre skrivas ut med text-parametern, utan direkt som en vanlig översättning. Detta gäller för såväl ryska som ett fyrtiotal andra språk, inklusive arabiska och latin med deras hamzor respektive makron. ~ Dodde (diskussion) 16 oktober 2017 kl. 00.09 (CEST)[svara]

Tack! Dock valdes mall:ö, trots att artikeln (utan apostrof) fanns på målspråkets Wiktionary och mall:ö+ borde ha valts. --LA2 (diskussion) 16 oktober 2017 kl. 00.54 (CEST)[svara]

@LA2, ah, just det. Tack för det påpekandet, vi får kika på det imorrn kväll. Om fel mall väljs kan det enkelt åtgärdas med bot i efterhand, så det är bara att köra på så länge. ~ Dodde (diskussion) 16 oktober 2017 kl. 02.00 (CEST)[svara]

@LA2, nu ska det vara löst. //Skal 16 oktober 2017 kl. 22.35 (CEST)[svara]

Bra jobbat! Antik grekiska verkar dock inte vara löst än. Jag hittar inte i vilken modul en.wikt. löser detta men någonstans gör de det då diakriterna försvinner.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 16 oktober 2017 kl. 13.00 (CEST)[svara]

@Jonteemil Bra iakttagelse. Jag ska kika närmare på det. ~ Dodde (diskussion) 16 oktober 2017 kl. 22.06 (CEST)[svara]

@Dodde: Bra👍🏻.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 16 oktober 2017 kl. 22.37 (CEST)[svara]

@Dodde: Inte heller forn- eller medelengelska, fornsvenska, forndanska (funkar dock inte på en.wikt. heller), forn- och medelhögtyska, hebreiska funkar dock!, inte i fornsaxiska. Bokstäverna som ska tas bort används av vissa språk i sidnamnet men av vissa språk bara i det fetstilta så beroende på vilket språk så ska bokstäverna bytas ut.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 17 oktober 2017 kl. 12.45 (CEST)[svara]

@Jonteemil: Du får gärna utveckla den sista meningen. Vilka språk och bokstäver pratar vi om, eller menar du diakriter - alltså precis som vanligt, att diakriterna visas på fetstilsraden men inte inkluderas i sidnamnet? Jag har kopierat över det som enwikt använder direkt, men de kanske har någon "gömd" funktionalitet som att ett språk ärver ett annat språks "entryname"-inställningar på nåt sett, kanske genom "acestors"-egenskapen. Jag har själv iakttagit detta för fornengelska. Jag ska luska lite i detta nu. ~ Dodde (diskussion) 17 oktober 2017 kl. 22.31 (CEST)[svara]

@Dodde: Jag menar ord med diakriter i de nämnda språken - att de inte blir såsom det blir med exempelvis hebreiska eller ryska diaktriter.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 17 oktober 2017 kl. 22.42 (CEST)[svara]

@Jonteemil: Nu har jag gått igenom alla språk jag missade första gången. Inställningarna för alla språk med språkkoder som innehåller fler än 2 tecken låg i andra datafiler. Nu är forn- och medelengelska, forn- och medelhögtyska, fornsaxiska, fornsvenska och 18 andra glömda språk tillagda. Forndanska (gmq-oda på enwikt, gmq-fda på svwikt) saknar enwikt särskilda regler för. ~ Dodde (diskussion) 18 oktober 2017 kl. 00.03 (CEST)[svara]

@Dodde: Perfekt! Bra detektivarbete!Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 18 oktober 2017 kl. 01.13 (CEST)[svara]

Nu är det bara att få in denna data i övriga länka-mallar såsom {{kognat}}, {{länka}}, {{g-cell}}, {{länka-b}}, {{synonymer}} m.fl., {{härledning}} o.s.v.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 18 oktober 2017 kl. 01.14 (CEST)[svara]

@Jonteemil Jag tror att diakriterna ska vara med på sådana ställen där uttalsinformation är önskad, dvs på fetstilsraden, i grammatiktabellerna och i översättningslistan (så {{ö}}, {{ö+}}, {{g-cell}}, {{g-cell-tveksam}}, {{g-länk}} samt grammatikmallar som stödjer sig på grammatikmoduler har alltså denna funktion nu redan). Denna information ska så vitt jag förstår däremot inte in någon annan stans. ~ Dodde (diskussion) 18 oktober 2017 kl. 01.57 (CEST)[svara]

@Dodde: Jag kan tycka att {{kognat|sl|dúša}} bör ge "slovenska: ''[[duša#Slovenska|dúša]]''".Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 18 oktober 2017 kl. 02.03 (CEST)[svara]

@Jonteemil: {{kognat|sl|duša}} bör du nog skriva. Skapa gärna ny självständig diskussion om du anser att begränsningen översättningar, fetstilsrad och grammatikmallar inte är lämplig. ~ Dodde (diskussion) 18 oktober 2017 kl. 02.35 (CEST)[svara]

Jag skapade en ny diskussion. ~ Dodde (diskussion) 18 oktober 2017 kl. 03.05 (CEST)[svara]

Transkriptioner

Tror du (@Dodde) att du kan/orkar/vill kopiera enwikts automatiska transkriptioner när du ändå håller på? Det vore en välkommen funktion.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 17 oktober 2017 kl. 22.45 (CEST)[svara]

Jag vet inte hur detta är uppbyggt på enwikt, men är tveksam till att det "bara" är att kopiera. Men jag kan kika på det nån gång. ~ Dodde (diskussion) 17 oktober 2017 kl. 22.51 (CEST)[svara]

@Dodde: Detta hänvisade användaren Erutuon mig till: en:Category:Transliteration modules. Där verkar varje språk med en transliterationsmodul finnas. Kanske kan vi åtminstone överföra några data till en svensk motsvarighet.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 18 oktober 2017 kl. 01.19 (CEST)[svara]

Se en:Wiktionary:Grease pit/2017/October#Transcriptions för hens hela kommentar.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 18 oktober 2017 kl. 01.21 (CEST)[svara]

Det är väldigt mycket jobb med detta. Jag är inte beredd att ta på mig det. ~ Dodde (diskussion) 18 oktober 2017 kl. 02.32 (CEST)[svara]

@Dodde: Okej, om du ändrar den så har vi ju detta i minnet i alla fal|.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 18 oktober 2017 kl. 13.32 (CEST)[svara]

EU-språken

Jag utmanar er att uppnå en milstolpe för svenska Wiktionary, nämligen att för vart och ett av Europeiska unionens officiella språk få ihop 500 ord som är gränsen för inkludering i {{språkindex}}, som visas på framsidan. EU-språken är 24 till antalet: bulgariska, danska, engelska, estniska, finska, franska, grekiska, iriska, italienska, kroatiska, lettiska, litauiska, maltesiska, nederländska, polska, portugisiska, rumänska, slovakiska, slovenska, spanska, svenska, tjeckiska, tyska och ungerska. Jag har sett till att rumänska kom över gränsen och snart följer grekiska och litauiska. Iriska, kroatiska och maltesiska har längre kvar. --LA2 (diskussion) 10 augusti 2017 kl. 04.32 (CEST)[svara]

De återstående språken är bulgariska (370, ✔ nu 1 019) · grekiska (492, ✔ nu 732) · iriska (209, ✔ nu 1 061) · kroatiska (269, ✔ nu 1 234) · litauiska (482, ✔ nu 678) · maltesiska (45, ✔ nu 696) · slovakiska (358, ✔ nu 721) · slovenska (336, ✔ nu 701). --LA2 (diskussion) 10 augusti 2017 kl. 11.30 (CEST)[svara]

Någon gång i höst passerar vi milstolpen 600 000 sidor. Jämna hundratusental har vi passerat med 18-24 månaders intervall, så det är lagom för ett firande. Då kan vi passa på att nämna även den här milstolpen och kanske något mera? --LA2 (diskussion) 15 augusti 2017 kl. 00.00 (CEST)[svara]

Det vore kul att bidra, men då jag inte kan språken så är det lite vanskligt. Stötte direkt på frågetecken när jag gick på mitt förstaspår slovenska: Vilka diakriter ska vi skriva ut? Vi borde ha Om-sidor för varje språk som beskriver våra val kring sånt här. Jämför en:Wiktionary:About_Slovene –d Moberg 15 augusti 2017 kl. 19.22 (CEST)[svara]

Jag skapar uppslagsord som redan finns på engelska Wiktionary och hoppas att de har gjort rätt. (Så är förstås inte alltid fallet, som jag upptäckte rörande orden svensk och Sverige på maltesiska. Men det upptäckte jag först när vi hade 20 adjektiv på maltesiska.) En typisk arbetsgång är att slå upp en:Category:Maltese adjectives, välja något som ser skoj ut, slå upp hur det förklaras på engelska, gå till lämplig svensk översättning och fylla i det maltesiska ordet som översättning där. --LA2 (diskussion) 15 augusti 2017 kl. 22.07 (CEST)[svara]

Det tråkiga med arbetet är att jag bara känner hur en robot skulle kunna göra jobbet ^^' –d Moberg 15 augusti 2017 kl. 22.51 (CEST)[svara]

Det finns förslag att lägga över mycket av Wiktionary i Wikidata. Det kan liknas vid att en robot gör mycket av jobbet åt oss. Kanske kommer vi dit, men jag tippar att det dröjer 2-3 år. Och fram till dess behöver vi ha mer volym, skapad på det gamla sättet, om inte annat för att se om "robotarna" gör rätt. Vi befinner oss just nu i en tidig fas. Det betyder inte att vår insats idag är oviktig eller förspilld. Det finns många undantag och specialfall att ta hänsyn till. Om vi får upp de 24 EU-språken på nivån av 500 ord, och kanske så småningom 1000 ord, så har vi totalt lika många till (japanska, turkiska, älvdalska, ...) på samma nivå. Sedan finns det ett hästjobb i att ta nästa 100 språk upp till nivån 10.000 ord och där kan robotar och andra mekanismer komma in. --LA2 (diskussion) 16 augusti 2017 kl. 00.48 (CEST)[svara]

Det går nu framåt med fart. Ċipru blev sida nr 595.000 och maltesiskt uppslag nr 359. --LA2 (diskussion) 2 september 2017 kl. 23.58 (CEST)[svara]

Med ordet colainn, som betyder kropp på iriska, har vi nu uppnått målet att ha minst 500 ord på vart och ett av de 24 officiella EU-språken. Och detta gick på mindre än en månad efter att idén kläcktes. Tack till alla som hjälpt till. --LA2 (diskussion) 7 september 2017 kl. 01.36 (CEST)[svara]

Genus vid tilläggning av översättningar

Vid "Lägg till översättningar" borde albanska (sq), grekiska (el) och maltesiska (mt) ha valen m/f/n. --LA2 (diskussion) 10 augusti 2017 kl. 13.25 (CEST)[svara]

@LA2: Gjort! [4]. Jonteemil (diskussion) 10 augusti 2017 kl. 13.35 (CEST)[svara]

Ändrade en till el i efterhand.Jonteemil (diskussion) 10 augusti 2017 kl. 13.38 (CEST)[svara]

Suböversättningar

Finns det någon lösning på följande problem? När en suböversättning (*portugisiska: **portugisisk portugisiska **brasilianisk portugisiska:) ingår i översättningarna, inte sortering fungerar inte längre. --2A02:908:C30:3680:19E:28D8:822C:24D6 15 augusti 2017 kl. 14.00 (CEST) P.S.: väte är ett exempel.[svara]

Vad är det för sortering som inte fungerar? –d Moberg 15 augusti 2017 kl. 18.42 (CEST)[svara]

Förmodligen "balanseringen". --Andreas Rejbrand (diskussion) 15 augusti 2017 kl. 18.44 (CEST)[svara]

Nej, jag menar att den alfabetiska sorteringen inte fungerar längre. Nya poster läggs automatiskt bakom "dubbelpost". --2A02:908:C30:3680:19E:28D8:822C:24D6 15 augusti 2017 kl. 23.49 (CEST)[svara]

Om du ger ett konkret exempel så kan det vara lättare att återskapa problemet. När jag testade fungerade det mestadels klanderfritt ibland men det hamnade lite fel ibland (jag vet dock inte om felet som uppstod i mitt fall berodde på att listan redan hade en dålig sortering, så det kanske inte var nåt "fel") ~ Dodde (diskussion) 16 augusti 2017 kl. 03.37 (CEST)[svara]

T.ex.: Estland. Jag har lagt till maltesiska där och det har ordnats bakom portugisiska. Liksom med väte och frisiska. --2A02:908:C30:3680:19E:28D8:822C:24D6 23 augusti 2017 kl. 14.24 (CEST)[svara]

Det samma problem finns med Bolivia och serbiska/iriska/maltesiska.--2A02:908:C30:3680:19E:28D8:822C:24D6 23 augusti 2017 kl. 17.45 (CEST)[svara]

Behörighetsfel

Försökte skapa sidan ta med en klackspark och fick följande besked:

Du har inte behörighet att skapa denna sida, av följande anledning:

Sidtiteln "ta med en klackspark" har stoppats från att skapas. Den matchar följande rad i svarta listan för sidtitlar: .*\x{00AD}.* <casesensitive> # Soft-hyphen

Om du är säker på att sidan bör skapas, skriv gärna något i Bybrunnen.

Vad händer? Tidigare var det inga problem med fraser. --Meander 15 augusti 2017 kl. 19.26 (CEST)[svara]

Din sträng har ett osynligt tecken innan s:et. Ett så kallat mjukt bindestreck (soft hyphen), som bara syns om ordet behöver radbrytas. Så sudda ut tecknet innan s:et så fungerar det sen! :) –d Moberg 15 augusti 2017 kl. 19.39 (CEST)[svara]

Tack Moberg! --Meander 16 augusti 2017 kl. 02.18 (CEST) Glömde nämna att det nu naturligtvis fungerar som det ska. --Meander 16 augusti 2017 kl. 14.45 (CEST)[svara]

Az...

Skulle vi kunna döpa om kategorier för azerbajdzjanska till synonymen azeriska? Det skulle vara så mycket enklare att skriva när man taggar ord. --LA2 (diskussion) 17 augusti 2017 kl. 13.00 (CEST)[svara]

Jag tycker nog inte vi ska ändra av en sådan anledning. Azerbajdzjanska verkar vara vanligare i en googlesökning och Wikipedia använder azerbajdzjanska som artikelnamn, inte att det kanske är tillräckligt, men det pekar ändå åt azerbajdzjanska ur POMMF-synpunkt. Om det bara handlar om språkparametern för tagg-mallen~~, strunta i att ange den, den används bara för att sorteringen av sidor i kategorierna~~. Språkparametern är på väg bort och ska ersättas med en ny syntax där språkkoden används som första parameter istället. ~ Dodde (diskussion) 17 augusti 2017 kl. 16.04 (CEST)[svara]

Det hade jag förstås fel i. Den används ju även för kategoriseringen i sig. :/ Det går att snabbt korrigera tagg-modulen så att man kan välja om man vill ange språknamnet eller språkkoden - ska jag göra det? Så länge. Då får man ange {tagg|något|språk=az}. ~ Dodde (diskussion) 17 augusti 2017 kl. 16.12 (CEST)[svara]

Detta med POMMF (förvåning) ska man nog ta med en nypa salt. Kulturutbytet mellan Sverige och Azerbajdzjan är minimalt, så folk blir förvånade oavsett hur man stavar, och vi har ännu bara ett hundratal uppslag för azeriska ord. Om det blir vanligare, kommer nog ordet att nötas ner från azerbajdzjanska till azeriska, eftersom folk inte orkar varken säga eller skriva det längre ordet. Dessutom heter det redan Azeri på engelska och POMMF handlar mycket om att ligga nära det engelska språkbruket. Om vi ska lägga om stavningen, så bör vi göra det nu, innan vi får tusentals uppslag. Det blir jobbigare längre fram.

Att generellt kunna skriva språk=<kod> vore en fördel. Man kunde invända att mer koder gör Wiktionary mer kryptiskt, men det är redan så kryptiskt att man inte kommer undan att lära sig några språkkoder. --LA2 (diskussion) 17 augusti 2017 kl. 16.28 (CEST)[svara]

Ok, fixar modul-taggen lite senare ikväll. Om azerbajdzjanska/azeriska har jag egentligen inte någon jättestark åsikt om och inte heller någon vidare kunskap. Om din åsikt är stark eller kunskap stor, ändra på. Det är språkrubriker, språk=-argument och kategorinamn. De första två bör kunna fixas enkelt med bot (har du så att du kan köra?), det tredje är väl en del manuellt arbete med. ~ Dodde (diskussion) 17 augusti 2017 kl. 17.09 (CEST)[svara]

@LA2 nu kan man använda språkkod till språkparametern i tagg-mallen. Funkar för både azerbajdzjansja/azeriska och för andra språk. ~ Dodde (diskussion) 18 augusti 2017 kl. 00.36 (CEST)[svara]

Tydligen är "Azeri" namnet på ett gammalt utdött språk och det är oklart varför turkiska och engelska har börjat återanvända dess namn för azerbajdzjanska språket och folket. Kanske ligger det ett missförstånd bakom? Tills vidare bör vi nog fortsätta använda det långa adjektivet. --LA2 (diskussion) 19 augusti 2017 kl. 00.05 (CEST)[svara]

Jubileum

Inom högst tio veckor kommer vi att passera några jämna tal, vilket gör att vi kan formulera ett (press)meddelande. Här är ett förslag till text:

Svenska Wiktionary (sv.wiktionary.org) har den 21 och 22 september 2017 passerat två milstolpar, nämligen 600 000 artiklar och 70 000 svenska uppslagsord. I maj månad gjordes också den 3 miljonte redigeringen sedan projektet startade i maj 2004.

Wiktionary, den fria ordboken, är ett systerprojekt till Wikipedia, den fria encyklopedin. Båda drivs av Wikimedia Foundation, som i Sverige företräds av föreningen Wikimedia Sverige. Allt arbete utförs ideellt, vem som helst får hjälpa till, och resultatet är fritt att återanvända i andra sammanhang enligt samma Creative Commons-licens som gäller för Wikipedia. Liksom Wikipedia, finns även Wiktionary på många olika språk, varav svenska Wiktionary är bland de tjugo största. Varje språkutgåva av Wiktionary förklarar ord från många olika språk.

Svenska Wiktionary innehåller svenska förklaringar till ord från 325 olika språk. Störst av dessa är svenska (70 000 ord), tyska (67 000) och engelska (31 000), men även finska, franska, polska, ryska och isländska är representerade med fler än 5000 ord vardera. Av Europeiska unionens 24 officiella språk är nu samtliga representerade med minst 500 ord. Sämre står det till med flera stora världsspråk (som kinesiska och arabiska), invandrarspråk (som somaliska) och de svenska minoritetsspråken (som meänkieli och romani). Svenska Wiktionary har ett trettiotal aktiva deltagare, som bidrar med minst fem redigeringar i månaden, och några få som är mycket aktiva. Det finns gott om utrymme för fler deltagare som vill hjälpa till med ordboksprojektet.

Låter det bra? Siffrorna måste förstås ses över när det blir aktuellt att posta meddelandet. --LA2 (diskussion) 18 augusti 2017 kl. 23.29 (CEST)[svara]

Väl skrivet

~ Dodde (diskussion) 19 augusti 2017 kl. 00.00 (CEST)[svara]

Invandrarspråk -> Övriga språk. Annars ser det bra ut.Jonteemil (diskussion) 19 augusti 2017 kl. 00.20 (CEST)[svara]

Det jag ville framhålla med just det ordet är språk som talas av människor som numera även behärskar svenska (och då borde kunna bidra till svenska Wiktionary) eftersom de har invandrat till Sverige. Det finns många svensktalande som behärskar somaliska, många fler än som behärskar mongoliska och uzbekiska, som ju inte är några betydande invandrarspråk. --LA2 (diskussion) 19 augusti 2017 kl. 00.46 (CEST)[svara]

ID behöver lite mer hjälp för få ihop 500 ord som är gränsen för inkludering i {{språkindex}} (numera 327 ord). Taylor 49 (diskussion) 23 augusti 2017 kl. 13:28 (CEST)

Av Europeiska unionens 24 officiella språk är kroatiska det svagaste med hittills bara 279 ord. --2A02:908:C30:3680:19E:28D8:822C:24D6 23 augusti 2017 kl. 14.28 (CEST)[svara]

Bra jobbat! Men det som var sant klockan 14 behöver inte vara sant klockan 23. --LA2 (diskussion) 23 augusti 2017 kl. 23.36 (CEST)[svara]

Någonstans på slutet skulle det passa med något i stil med: "Tack vare fantastiska systemutvecklare är ordboken en av de bästa och ständigt utvecklas." --Meander 23 augusti 2017 kl. 16.00 (CEST)[svara]

ID : 341 ord (160 saknas). Taylor 49 (diskussion) 28 augusti 2017 kl. 15:48 (CEST)

ID : 370 ord (131 saknas). Taylor 49 (diskussion) 30 augusti 2017 kl. 13:11 (CEST)

ID : 442 ord (59 saknas). --2A02:908:C30:3680:19E:28D8:822C:24D6 5 september 2017 kl. 17.49 (CEST)[svara]

ID : 473 ord (28 saknas). Taylor 49 (diskussion) 2017-Sep-06 kl. 17:02 (CEST)

ID : 523 ord men syns inte i {{språkindex}}! Wiktionary är sprucken. Taylor 49 (diskussion) 2017-Sep-08 kl. 12:59 (CEST)

Språkindex uppdateras manuellt. --Vesihiisi (diskussion) 8 september 2017 kl. 13.02 (CEST)[svara]

ID : 536 ord och syns i {{språkindex}}. Taylor 49 (diskussion) 2017-Sep-08 kl. 13:39 (CEST)

Nu är datumen 21 och 22 september 2017 inskrivna i texten. Det tog alltså inte tio utan fem veckor. Grattis till alla medverkande! --LA2 (diskussion) 23 september 2017 kl. 09.58 (CEST)[svara]

Svenskspråkiga Wiktionary – 600 000 artiklar och 70 000 svenska ord! skriver Wikimedia Sverige på sin blogg. --LA2 (diskussion) 23 september 2017 kl. 13.17 (CEST)[svara]

ID : 591 ord (10 saknas). "skriver Wikimedia Sverige på sin blogg" jo men endast om "invandrarspråk", inte om ID. Taylor 49 (diskussion) 27 september 2017 kl. 16.04 (CEST)[svara]

Gröna länkar för översättningar

Jag noterar med glädje en nyhet, nämligen att när man klickar en grön länk från översättningarna, så skapas inte bara en artikel för det ord och språk man klickade på, utan man får med sig alla språk som använder samma stavning. Det är mycket användbart när man har lagt till att "kvadrat" heter "квадрат" på mer än ett språk.

Men skulle det också gå att få med sig taggar? Om ursprungsartikeln kvadrat är uppmärkt med kat=matematik så vore det fint att få med den taggen (med tillägg av språk=xy) i den artikel som skapas när man klickar på gröna länken. --LA2 (diskussion) 3 september 2017 kl. 23.09 (CEST)[svara]

Den funktionen har jag också tänkt på att efterfråga! Det vore så bra med en tagg-parameter. @Skalman som håller på med det här har nog inte ens börjat med att transkriptionen kommer med i de gröna översättningarna men kanske orkar du (syftande på Skalman) fixa båda?Jonteemil (diskussion) 4 september 2017 kl. 02.00 (CEST)[svara]

Det är möjligt om det med säkerhet går att säga vilken definition som hör till den aktuella översättningen. Finns bara en definition underlättar det, kan man t.ex. vara säker på att den tredje översättningslistan motsvarar den tredje definitionen? I grammatikmallarna och även u uttalsmallen har vi en parameter "betydelser" där man kan ange vilken eller vilka definitoner grammatikmallen/uttalsmallen gäller - inte helt stabilt. Det finns troligen bättre system. Märka upp definitioner med id:n och ange id:t i översättningsmallen? eller definiera exakt vad som ska stå i översättningsmallens rubrik (t.ex. upprepa definitionen exakt) så att ett script kan avgöra vilken definition översättningsavsnittet hör till?

En annan fråga är kvalitén på taggningen - om den är dålig kanske vi inte vill fortplanta den till 40 nyskapade uppslag på andra språk. Hur gör vi med dolda taggar (endast kategoriseringar), specialtaggar, stilnivåtaggar? Ett ord som har taggen vardagligt på svenska, kanske har en översättning som inte är vardaglig på det andra språket. Även här finns det lite frågor att besvara. Vilka taggar ska följa med, och vilka ska inte det?

Ska {{ö-topp}} förses med kategoriseringsinformation för det här ändamålet? Eller ska man ange en lista med kategorier som ska överföras och de som inte finns med i listan ska inte föras vidare?

Angående translitterationerna så borde vi få med dem nu och om och när alla frågor är uträtade angående taggarna så kan vi införa det också, eller i etapper i takt med att svaren på frågorna klarnar. ~ Dodde (diskussion) 5 september 2017 kl. 06.12 (CEST)[svara]

Jag tänker mig inte att taggar såsom föga brukligt och vardagligt ska följa med. Endast sådana som länder, städer, trädarter etc.Jonteemil (diskussion) 5 september 2017 kl. 10.19 (CEST)[svara]

@Jonteemil Tänker du att vi ska ha en lista med alla kategorier som ska följa med? ~ Dodde (diskussion) 5 september 2017 kl. 13.16 (CEST)[svara]

@Dodde: Jag tror inte det behövs, jag tror common sense löser det hela. Om du mot förmodan vill han en lista så är väl det helt okej.Jonteemil (diskussion) 5 september 2017 kl. 13.46 (CEST)[svara]

@Jonteemil Vi måste ha en lista/uppmärkning om det ska gå att automatiskt välja ut vilka som ska följa med. Om vi tar med alla så kommer några felaktiga taggar (likt vardagligt) med stor sannolikhet att slinka med (d.v.s. inte upptäckas och tas bort). –d Moberg 5 september 2017 kl. 14.11 (CEST)[svara]

@Moberg: Jag hade tänkt att man manuellt lägger till taggen som ska följa med men om det går automatiskt med lista håller jag med om att det är att föredra.Jonteemil (diskussion) 5 september 2017 kl. 14.13 (CEST)[svara]

Men det är ju just automatisk medflytt av taggar vi pratar om här, eller? –d Moberg 5 september 2017 kl. 14.45 (CEST)[svara]

Jag tror det är rimligt att man (kanske helt manuellt) lägger in tagg=biologi som argument i {{ö-topp}}. När man då klickar på den bulgariska gröna länken, skapas artikeln med raden #{{tagg|biologi|språk=bg}}[[gurkfrö]]. I nästa steg skulle "Lägg till översättningar..." kunna skapa en ö-topp med tagg=biologi. --LA2 (diskussion) 5 september 2017 kl. 17.33 (CEST)[svara]

Gröna länkarna ska nu stödja att få med translitterationerna också. Javascriptet har gjorts om lite så att det använder sig av Modul:entry för att generera wikitexten på det nya uppslaget. Det är bra för att en modul har enkel tillgång till andra moduler som kan vara till nytta, till exempel för hantering av kategorier som diskuterats ovan. Jag har pratat lite med Skalman och en bra automatisk lösning (och det är nog vad vi vill ha här), vore att javascriptet samlar in alla taggar (skiljer på gömda och synliga) och skickar med dem till Modul:entry, och även indikerar om det kunde avgöra vilken definition de tillhörde eller ej. Förmodligen - finns en definition så blir det ett ja, finns fler än en definition så blir det ett nej. Om inte, så läggs en {{struktur}}-mall till på målsidan ({{struktur|Taggarna behöver ses över så att de överensstämmer med det svenska uppslaget}} eller dylikt) så att personen som skapar sidan ska uppmärksammas på att kolla till taggarna så att de blev korrekta för att i samma veva isåfall ta bort strukturmallen, men om personen glömmer fixa taggarna, så hamnar uppslaget i en kategori över sidor som behöver kollas. Liten risk för fel, utan att vi manuellt behöver göra mer än nödvändigt. Låter bra tycker jag. Däremot har Skalman sagt att när det blir dags att kika på en sådan här lösning får vi se. Inte den närmaste tiden, som det verkar. ~ Dodde (diskussion) 7 september 2017 kl. 10.56 (CEST)[svara]

Önskelistor

Den tyska önskelistan är del av kategorierna geografi och geologi och den svenska är del av gruvdrift. Är det rätt??? --2A02:908:C30:3680:19E:28D8:822C:24D6 4 september 2017 kl. 15.14 (CEST)[svara]

Det såg lite konstigt ut. Jag tog bort användningen av {{tagg}}-mallen på önskelistorna. ~ Dodde (diskussion) 5 september 2017 kl. 13.32 (CEST)[svara]

Historisk statistik för fler språk

På sidan Wiktionary:Statistik finns en tabell med siffror över svenska Wiktionary i allmänhet och antalet svenska uppslagsord, en ny rad läggs till varje vecka (med en del stora uppehåll). Men för uppslagsord på andra språk saknas en sådan historik. Just nu håller polska (5750 uppslag) på att växa sig större än ryska (5780 uppslag), men hur såg det ut för ett halvår sedan? Det minns ingen. Nyligen växte många språk upp till 500 uppslag. Hur fortsätter de att växa under kommande halvår? Vill vi i efterhand kunna kontrollera det? Då borde vi kanske logga siffrorna. Hur gör vi i så fall det på bästa sätt? Det går ju att utöka den nuvarande tabellen på Wiktionary:Statistik med fler kolumner, en för varje språk. Är det rätt väg att gå? Ska man i så fall ta med de 10 största språken eller 30 eller 300? Har vi några andra språk av Wiktionary som förebild här? Inom engelska Wiktionary tror jag att det inte finns någon sådan statistik, men jag har emellanåt (från 2010 till 2015) fört en tabell över de nordiska språkens utveckling på sidan en:Wiktionary talk:About Swedish#Statistics. --LA2 (diskussion) 8 september 2017 kl. 00.43 (CEST)[svara]

Min första tanke var att analysera databasdumparna, men det är visst bara de 10 senaste som är tillgängliga -- finns det någon mirror med fler? --Vesihiisi (diskussion) 8 september 2017 kl. 09.29 (CEST)[svara]

En av dumparna innehåller även varje sidas historik, dvs. varje version av varje sida sedan den skapades. Så teoretiskt sett finns det möjlighet att skapa en hel mängd statistik. ~ Dodde (diskussion) 8 september 2017 kl. 09.47 (CEST)[svara]

Men finns det något smidigt sätt att lista ut när en viss sektion på en sida skapades? Det behöver inte synas tydligt i historiken. --Vesihiisi (diskussion) 8 september 2017 kl. 16.52 (CEST)[svara]

Det finns säkert någon algoritm man kan komma på, som läser igenom alla sidversioner och jämför den tidigare med den senare, läser ut vilka nya språkavsnitt som skapades och lagrar varje tidstämpel för respektive språk på något sätt så att man kan skicka en fråga till lagringen om hur många avsnitt som fanns för varje språk vid en speciell tidpunkt. Men inte tillräckligt enkelt för att jag personligen skulle känna mig motiverad att sätta igång med det just nu. ~ Dodde (diskussion) 8 september 2017 kl. 17.19 (CEST)[svara]

Idén att läsa historiedumpen är inte så dum. Jag skickade en fråga till wikitech-l om någon redan har ett sådant program. Vi får se om någon svarar. Ett krux är förstås att man vill kunna skilja "uppslag" från böjningsuppslag. Det räcker inte med att hitta rubriken ==Substantiv== i en sida, utan man måste också se om det finns ett verkligt uppslag för ett substantiv där. --LA2 (diskussion) 8 september 2017 kl. 20.58 (CEST)[svara]

Fast eftersom vi vet att sidan "får" idag är ett svenskt substantiv (uppslag) och en svensk verbböjning (ej uppslag) så räcker det att historiedumpen talar om när rubriken får-svenska-substantiv skapades. Så vi behöver nog bara läsa ut rubrikerna. --LA2 (diskussion) 9 september 2017 kl. 03.11 (CEST)[svara]

Deltagarportalen

Uppe i menyn till vänster klickar jag ibland på Bybrunnen och ibland på Senaste ändringarna, men nästan aldrig på Deltagarportalen. Om man gör det, hamnar man på en sida som tycks vara anpassad för nykomlingar. Det är ju mycket berömvärt att vi har en sådan sida, men namnet "Deltagarportalen" är en dålig reklam för denna fina sida. Kanske borde den heta "Välkommen, Wiktionary behöver din hjälp" eller något lika tydligt? --LA2 (diskussion) 10 september 2017 kl. 00.27 (CEST)[svara]

Femininum av ord

Vissa språk har femininum av i princip alla ord som kan ha kön. Exempel på detta är tyska, spanska, portugisiska, galiciska, asturiska, aragonska, katalanska, franska, italienska, jag tror även nederländska och till viss del även svenska. På en.wikt. skrivs dessa former såsom de andra böjningsformerna bredvid det fetstilta inom parentes. Jag tycker vi kan ta in dessa femininer i sv.wikt. mallar på samma sätt såsom vi gör med perfektparticip i verbmallarna och adverbavledningar i adjektivmallarna. Jag var från en början lite skeptisk till ett införande i de svenska mallarna och förblir nog det till viss del. Med till viss del så menar jag att alla -are-substantiv har en regelbunden -erska-femininumform som skulle kunna införas som en parameter f= eller liknande. Jag skulle i mitt iver kunna gå in på mer språkliga fakta men avvaktar nog med hur detta skulle kunna ske innan jag vet vad ni tycker.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 11 september 2017 kl. 01.54 (CEST)[svara]

@Jonteemil Detta är ju intressant att ha med, på något sätt, men jag är också tveksam till att böjningstabellen är rätt ställe. Det är ett besläktat ord och vi har en mall för sådana. Jag känner att vi ger oss själv gränsdragningsproblem när vi försöker säga vilka besläktade ord som är viktigare än andra och som därför borde flyttas till grammatikmallen. (Ja, jag är fortfarande tveksam till avledningsdelen av några av våra mallar, samtidigt som det är svårt att inte erkänna hur väldigt nära släktskap som råder mellan verben och participen, adjektiven och adverben). När det gäller genus så tänker jag att det i en böjningsmall dessutom skulle bli förvirrande - vad betyder det egentligen när det i böjningstabellen för ett maskulint ord står "femininum" helt plötligt? Vill vi vara tydligare med vad för släktskap som råder så finns möjligheten att "tagga" det besläktade ordet {{besläktade ord|[[motsvarande feminint ord]] ''(kvinna)''}} eller liknande (för det rör väl sig om semantiskt kön, sexus, va, och inte grammatiskt kön, genus? Så är det väl även, om jag uppfattat det rätt, för ord som använder mallar som slutar på -mf, men där är det feminina och maskulina ordet i grundform exakt samma, så det är väl inte riktigt jämförbart. ~ Dodde (diskussion) 11 september 2017 kl. 02.19 (CEST)[svara]

Slaviska språk har dessutom diminutivformer och barnformer (anka-ankunge) och jag tror inte dessa låter sig formaliseras som mallparametrar, utan måste hanteras som individuella besläktade ord. Jämför städerska (kvinnlig städare) och doktorska (fru till doktor), som är grammatiskt lika (-erska), men betyder olika saker. --LA2 (diskussion) 11 september 2017 kl. 04.01 (CEST)[svara]

Somaliska och Lexin

I ett plötsligt anfall av övermod, började jag här om dagen lägga till somaliska ord. Först månadernas och veckodagarnas namn. Men stavningen skiljer sig mellan olika källor, rentav mellan somaliska Wikipedia och somaliska Wiktionary. Ett tydligt exempel är fredag som kan skrivas jimce eller jimco och med stor eller liten bokstav. En engelsk-somalisk ordbok som jag hittade på biblioteket säger till och med: "Friday : Jamce, Jimce, Jimco, Jumce, khudbo". Så det är tydligen bara att välja och vraka. De allra flesta källor skriver "Jimce". Jag hade däremot skapat uppslagsordet Jimco, som jag nu misstänker inte är det bästa valet.

Så hur borde man förhålla sig? Jag lutar åt att vi bör godta svenska Lexin som norm. Det är en seriöst utarbetad ordbok, rätt omfattande och finns gratis tillgänglig på nätet (http://lexin.nada.kth.se/). I så fall bör vi skriva jimce med liten bokstav, vilket strider mot en del andra ordböcker, som föredrar stor bokstav för veckodagar och månader. (Engelska och polska Wiktionary skriver med liten bokstav, men stavar en:jimco.) Andra former kan vi lägga till som alternativformer.

Men detta väcker en fundering: Varför kopierar vi inte in hela Lexin här? De har ett ordförråd om 28.500 svenska ord som har utgetts som ordbok med översättning till flera språk, däribland svensk-somaliska och svensk-ryska. Ett lagom bot-jobb kanske? Har det varit på förslag tidigare? --LA2 (diskussion) 12 september 2017 kl. 21.31 (CEST)[svara]

En del problem uppstår när man arbetar med ord och uttryck för språk man inte har så stor kännedom om. Vi höjer ibland på ögonbrynen när någon välmenande person lägger till svenska uppslag men saknar kännedom om svenska språket. Google translate blir ibland inte korrekt. Motsvarande gäller förmodligen när vi välmenande försöker lägga till översättningar på andra språk. För vissa typer av ord är risken mindre - frukter, landsnamn, nationaliteter, sådana ord som har en väldigt tydlig definition och som inte finns i ett flertal nyanser. Åtminstone för språk som har ett relativt etablerat skriftspråk. Hur det är med somaliska har jag inte riktigt koll på, men det låter som att somaliska kanske inte har samma fasta regler för stavning som exempelvis svenskan har. Morgan Nilsson skriver följande på sin hemsida sin hemsida som dök upp när jag gjorde en sökning på google:

Situationen i Somalia har dock sedan dess inte varit sådan att organiserad språkvård har kunnat bedrivas i någon större omfattning. Därför finns ingen egentlig reglering av stavningen, utan vissa normer har helt enkelt etablerat sig av egen kraft. Inom ramen för dessa mer eller mindre etablerade normer finns det ett betydande utrymme för variation i stavningen. Detta gör i sin tur att begreppet "stavfel" inte kan användas på samma sätt i förhållande till somaliskan som när man talar om mera etablerade skriftspråk, utan snarare måste man många gånger tala om mera vanligt förekommande respektive mindre vanligt förekommande stavningssätt. Framför allt är dubbelteckning av bokstäver något som man ofta inte är konsekvent med.

Så vad gäller somaliskan så är en norm, oavsett vilken den är, nog bättre än ingen, så att vi åtminstone på svwikt har våra huvuduppslag konsekvent med stor eller liten bokstav för veckonamnen. Om Lexin är konsekventa på det sättet, så låter det ju bra att ha Lexin som utgångspunkt för vår struktur också, som du föreslår.

Vad jag förstår så är Lexins licens CC-BY och därmed kompatibel med Wiktionary:s, och det är även andra Wiktionarys material. Varför kopierar vi inte bara över innehållet? Svaret är nog tvådelat.

1. Tekniskt. Dels så är det inte så enkelt att bara kopiera över. Det finns alltid specialfall som måste hanteras manuellt. Det är mycket enklare om sidan inte redan existerar, men om sidan redan existerar så krävs det även då manuellt arbete att infoga uppslagen, eller ett script som är bra på att parsa sidornas innehåll. Det är inte helt trivialt att skapa ett sådant script så att det på ett säkert sätt infogar den nya informationen på rätt plats. Det är bättre att fixa till strukturen på sidorna först och infoga innehållet sedan. Om någon är villig att ta det manuella arbetet som blir om man bara infogar innehållet på ej existerande sidor, så kan detta arbete utföras så snart det finns en strukturerad lista med data att generera innehållet ifrån. Listan bör även ta hänsyn till att begränsa sig till sådant som uppfylls av inklusionskriterier. Att skapa innehållet bara för tomma sidor och strunta i redan befintliga sidor tycker jag däremot är en dålig idé, då det skulle innebära hål i täckningen av orden. Måndag och tisdag, fredag, lördag och söndag skulle till exempel kanske finnas med för somaliska, men onsdag och torsdag skulle saknas. Då är det bättre att avvakta och göra det ordentligt vid ett senare tillfälle.

2. Korrekthet. Jag utgår ifrån att innehållet i Lexin är relativt pålitligt, och vi kan säkert titta närmare på detta. Man kan också tänka sig frågan om varför vi inte bara kopierar in översättningar från enwikt, dewikt och frwikt eller andra stora Wiktionary-versioner. Det kan vi ju också göra lika gärna. Men det finns alltid undantag på alla möjliga olika sätt som måste hanteras manuellt. Enwikt kanske använder uppdelning av språk som vi på svwikt inte gör, har definitioner eller en uppdelning av definitioner som inte överensstämmer med svwikts. Och hur kan vi kontrollera kvalitén på de översättningar vi genom kopieringen fortplantar. Om ett fel som tidigare fanns på enwikts översättningslista rättas till, hur ser vi till att detta uppmärksammas så att även översättningen på svwikt korrigeras? Och om vi genom gröna-länkar skapat ett eget uppslag för denna översättningen, att även detta uppslag korrigeras och kanske en böjningstabell och ett antal böjningsformer. Allt som vi skapar och lägger till i ordboken kräver på ett eller annat sätt underhåll. Det är inte bara att skapa och sen är det klart. Vi har tusentals kvalitetsmallar på befintliga uppslag, som bara ökar och ökar, mallar som ligger kvar i årtionden. Vem tittar på kvaliteten på våra befintliga uppslag i jakten på högre siffror? Det ena behöver inte utesluta det andra, jag vet, men jag ville ändå lyfta det. Hur som helst kan det vara fördelaktigt att man är lite noggrannare med vad man lägger till så att det åtminstone är god kvalitet på det så att behovet av senare underhåll minimeras.

~ Dodde (diskussion) 13 september 2017 kl. 01.00 (CEST)[svara]

Missförstånd och oklarheter, även för språk man inte själv behärskar, brukar kunna redas ut genom att man kollar språkets egen Wikipedia och Wiktionary, inklusive hur ordet används i Wikipedias textmassa. Men för ett ungt språk som somaliska, där ingen fast skriftnorm är etablerad, så varierar ordvalet och stavningen inom Wikipedia (t.ex. månadsnamn med stor eller liten bokstav, sålunda är Barack Obama född Ogosto 4, Napoleon 15 agoosto och François Hollande 12 Agoosto enligt so.wikipedia). Och några få aktiva skribenter i Wiktionary (speciellt för ett språk med en liten krets av skribenter) kan låta sitt personliga språkbruk färga hela projektet. Då känns Lexin, som finns på bibliotek och skolor i hela Sverige, som en rätt stabil grund att stå på. Lexin har i senare utgåvor en bas av 28.500 svenska ord, som är utvalda för att vara "vanliga". Men i äldre utgåvor är det färre ord. Det vore intressant att ha tillgång till hela Lexin maskinläsbar form och kunna rangordna orden i frekvensordning, så att vi kan se om vi har täckt de 500, 1000, 5000 viktigaste orden. --LA2 (diskussion) 13 september 2017 kl. 03.20 (CEST)[svara]

@LA2 Absolut, jag håller med. Lexin finns i xml-format här, eller menade du nåt annat? ~ Dodde (diskussion) 13 september 2017 kl. 05.52 (CEST)[svara]

Medaljer

Ska riksmedalj (i skytte) och simborgarmärke vara uppslagsord? Är de vanliga substantiv eller egennamn? De brukar skrivas med liten bokstav, men är ju inga generella företeelser (som guldmedalj). --LA2 (diskussion) 15 september 2017 kl. 17.38 (CEST)[svara]

Jag kan inte se att det skulle finnas nån tvekan om att vi vill ha med dessa ord också. Är ju som sporttermer eller facktermer eller ämnestermer att de inte är generella. ~ Dodde (diskussion) 15 september 2017 kl. 19.21 (CEST)[svara]

Ange språkkod för {{synonymer}} mfl

@Dodde, @LA2, @Jonteemil: Ett flertal mallar har på sistone normaliserats att ha första parametern som språkkod, också för svenska. Jag ser följande fördelar:

Med syntaxen {{synonymer|en|bar, pub}} skulle man då kunna få länkar direkt till rätt språkavsnitt: [[bar#Engelska|bar]], [[pub#Engelska|pub]].
Man kan använda språkspecifika kategorier och få språkspecifik statistik

Om vi gör ändringen, så borde, förutom {{synonymer}}, rimligtvis också alla andra listmallar justeras (varianter, homofoner, besläktade ord, sammansättningar, fraser, *onymer, jämför, seäven, smeknamn, anagram).

Vad tror ni? //Skal 18 september 2017 kl. 23.18 (CEST)[svara]

Låter jobbigt, tycker jag. Borde det inte gå att, med någon CSS- eller Javascript-magi, få ==Engelska== att sätta en <div> som gör alla efterföljande länkar till #Engelska som default? --LA2 (diskussion) 18 september 2017 kl. 23.24 (CEST)[svara]

Om det går att göra som LA2 säger så vore ju det bättre än Skalmans version då man inte behöver skriva någon språkkod. Om begränsningar i CSS- eller Jacascriptmagin gör att det inte går att genomföra så vore ju ändå Skalmans version bättre än den vi har idag. Som sagt så är jag för alla förändringar som gör antalet tecken man måste skriva färre men behåller samma eller förbättrar tydligheten.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 19 september 2017 kl. 00.25 (CEST)[svara]

@Jonteemil, @LA2, @Skalman Javascript/CSS kan ändra saker i efterhand, så wikitexten i sig kan inte manipuleras så att ändringarna ger effekt, men den resulterande html-koden kan justeras på olika sätt om någon gör ett sådant script. Delen med språkbaserad kategorisering och statistik är inte möjligt att göra på det viset, utan språkkoden måste vara en direkt del av wikitexten.

Jag inser att det är problematiskt att behöva skriva språkkod på fler mallar, men tänker att det är en vanesak. Som helhet blir det mycket enklare med den nya förändringen som t.ex. även innebär att [[]] inte längre kommer att behöva anges. {{synonymer|[[rolig]], [[kul]], [[glädjande]]}} skulle istället skrivas {{synonymer|sv|rolig, kul, glädjande}}.

Fördelen med statistik och kategorisering är inte omedelbar utan möjliggör ett ramverk att skapa funktionalitet kring, på samma sätt som modulifiering av mallar gör. Vi pratade för inte så länge sedan om statistik kring användning av uttalsmallen. Vi ska titta på möjligheten att gömma statistikkategorier från visning på uppslagssidorna, vilket för närvarande utgör ett hinder.

Jag är för förändringen om det får tillräckligt stort stöd. Om det står och väger tycker jag att vi bör avvakta, eftersom det är en ganska omfattande strukturell ändring som inte går att ändra tillbaka hur som helst. ~ Dodde (diskussion) 19 september 2017 kl. 07.26 (CEST)[svara]

@Andreas Rejbrand, @‎Pametzma, @‎Vesihiisi, @‎Eliashedberg, @‎Diupwijk, @Taylor 49, @Moberg, @Meander, vill ni dela med er av åsikter? ~ Dodde (diskussion) 19 september 2017 kl. 08.47 (CEST)[svara]

Jag försökte komma fram till om en modul kunde lista ut under vilken rubrik den var inkluderad. Då skulle man nämligen slippa ange språkkod och ändå få alla fördelar. Men jag hittade tyvärr inget sånt. –d Moberg 19 september 2017 kl. 10.53 (CEST)[svara]

Jag samhåller med LA2:s föreslag att använda raden ==SPRÅK== för att sätta språkkod automatisk.--Pametzma (diskussion) 19 september 2017 kl. 12.19 (CEST)[svara]

Sakta i backarna. Jag har inget konkret och genomförbart förslag, mera en önskedröm. --LA2 (diskussion) 19 september 2017 kl. 15.53 (CEST)[svara]

Att göra av med [[ ]] vore en positiv utveckling, men jag är av principskäl emot att lägga till extra parametrar som skribenten måste lägga mentala resurser på. Ingångströskeln för nybörjare är redan nu oproportionerligt hög med hänsyn till vårt stora behov av nytt blod. Jag känner mig inte sällan vilse och okunnig här (till exempel förnekar jag existensen av böjningsmallarna och kategorisystemet), trots att jag är såväl väldigt intelligent som synnerligen erfaren. Jag förstår poängen med språkparametern, den är definitivt av godo, men den borde kunna läggas till av en bot. Då den är av en rent teknisk karaktär (och en direkt konsekvens av att Mediawiki-programvaran, åtminstone i det utförande vi ~~jobbar med~~ kämpar emot, är lika lämplig för en ordbok som min katt är för en karriär inom partikelfysik), skall inte skribenten tvingas hantera den. --Vesihiisi (diskussion) 19 september 2017 kl. 12.47 (CEST)[svara]

Tack för synpunkter. Jag tolkar det som att det inte finns tillräckligt stöd för att göra språkparametern obligatorisk, men att det däremot är ok om den är valbar så att någon bot automatiskt kan lägga till språkkoden i efterhand. (Någon sådan bot finns inte i nuläget, men det är fritt fram att skapa en i framtiden). Både {{synonymer|bar, pub}} och {{synonymer|en|bar, pub}} skulle då vara ok att skriva. Gör någon en annan samlad tolkning? ~ Dodde (diskussion) 19 september 2017 kl. 13.44 (CEST)[svara]

Ja, en icke-obligatorisk parameter kan jag ställa mig bakom. Angående automatisk länkning - jag kom precis på att det finns fraser som innehåller kommatecken, tex. frihet, jämlikhet, broderskap. Ska man undanta {{fraser}} från den automatiska länkningen, eller välja en annan avgränsare överhuvudtaget? --Vesihiisi (diskussion) 19 september 2017 kl. 13.52 (CEST)[svara]

Nej, i vissa fall måste man explicit ange hur länkningen ska gå till, genom att sätta ut [[]], i detta fallet: {{fraser|Så kan det gå, [[Surt, sa räven]], En tredje fras}}. ~ Dodde (diskussion) 19 september 2017 kl. 14.11 (CEST)[svara]

Frivillig/valbar språkparameter låter bäst. --LA2 (diskussion) 19 september 2017 kl. 15.53 (CEST)[svara]

Jag instämmer med föregående talare. Jag har inget emot en till parameter men Vesihiisi har en viktig poäng i att det ska vara lätt att börja redigera Wiktionary – där är jag en alldeles för flitig och van redigerare för att vara representativ, så att jag tycker det är lätt med en till parameter är irrelevant i sammanhanget. –föregående osignerade kommentar är från Eliashedberg (diskussion • bidrag)

Slaviska rörelseverb

Jag införde nya kategori:Bestämda rörelseverb och kategori:Obestämda rörelseverb, som har tillämpning i ryska och andra slaviska språk, inklusive interwiki-länkar (via Wikidata) till en.wiktionary. Gjorde jag rätt? Bör dessa dokumenteras i Wiktionary:Kategorier? Terminologin "(o)bestämd" är den som används i Norstedts ryska ordbok. Engelska Wiktionary kallar dem abstrakt/konkret, ryska Wiktionary (icke-)enkelriktade. Kärt barn har många namn. --LA2 (diskussion) 20 september 2017 kl. 22.02 (CEST)[svara]

@LA2: Så länge man inte använder andra synonymer än obestämd och bestämd såsom de du nämnde så ska det nog gå bra. Lägg till dem i WT:KAT under verb skulle jag säga.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 21 september 2017 kl. 01.00 (CEST)[svara]

Modul

Är det någon modul som jobbas med nu? Annars kanske vi borde diskutera den kommande verbmodulen vad det gäller syntax och liknande.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 26 september 2017 kl. 21.41 (CEST)[svara]

@Jonteemil Modul:lang (framförallt funktionaliteten kring entryname - ryska diakriter, arabiska hamzor o.d.) känns ganska prioriterad, Modul:härledning står och stampar men bör slutföras, behöver få klarhet i om gemenisering är ok. Nyligen gjorda förändringar i Modul:link, Modul:grammar-link, Modul:grammar-table, {{g-cell}} och {{g-länk}} ger bättre funktionalitet för mallar som använder grammatikmoduler eller som så småningom byter från {{länka-b}} till {{g-cell}} (Någonting som lär ta en stund för att säkerställa att inga problem med bakåtkompatibilitet råder). Vi jobbar lite på funktionalitet kring gröna länkar och lite funktionalitet som rör språkkodangivelse i mallar. Jag försöker hjälpa nowikt skapa en gemensam grammatikmodul för bokmål, nynorska och riksmål, och hoppas att få hjälp att få till bättre substantivmallar och -moduler för bokmål och nynorska här på svwikt. Det ligger ytterligare några projekt på Wiktionary:Projekt/Mallar och moduler och Wiktionary:Projekt/Struktur på uppslag som det inte händer så mycket med, nu uppe i 35 pågående projekt. Du frågade för några dagar sedan om en kognatmodul, men du la aldrig till något projekt för det så jag vet inte om det ska göras? Jag vill också komma någon vart med Modul:sv-verb, men jag känner att det är lite för många lösa trådar för att sätta igång med det riktigt ännu. Det är inte bara koden som ska göras utan varje sådan förändring kräver mycket manuellt arbete och det manuella arbetet bara växer på hög så jag tänker att en del av de projekten behöver betas av också innan vi hoppar på ett nytt stort projekt. Jag har dock läst diskussionen igen och det är ett bra förberedande arbete som har gjorts. Det kommer att underlätta. ~ Dodde (diskussion) 27 september 2017 kl. 06.22 (CEST)[svara]

Vad bra👍🏻. Då har jag koll.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 27 september 2017 kl. 09.13 (CEST)[svara]

Gröna länkar

Är tanken och programkoden till våra "gröna länkar" inlånade ifrån något annat projekt, eller uppfunna här? När jag visade dem för andra deltagare på Wikimedia CEE Meeting i Warszawa, så var det flera som blev häpna och avundsjuka. Det är något som borde spridas till fler språk av Wiktionary. --LA2 (diskussion) 27 september 2017 kl. 22.31 (CEST)[svara]

@LA2: Det verkar som om @Bounce1337 skapade våra gröna länkar, enl. historiken med "inspiration" från en:WT:ACCEL. //Skal 27 september 2017 kl. 23.43 (CEST)[svara]

Franska Wiktionary har en gadget för detta som heter "Créer Trad" i inställningar > gadgets. --LA2 (diskussion) 9 oktober 2017 kl. 08.45 (CEST)[svara]

Latin och klassisk grekiska

Jag noterade att @LA2 lade till en klassisk grekisk översättning på slåss. Den grundformen han använde var enligt en.wikt. presens mediopassivt infinitiv enligt en.wikt. På en.wikt. står uppslagen i grundform i "jag" form. På μάχεσθαι står det alltså presens mediopassivt infinitiv av μάχομαι, vilket betyder "jag slåss". Även en.wikt.:s latinska verb står i "jag-form". Hur bör vi förhålla detta? På sv.wikt. har vi bara ett klassiskt grekiskt verb (εὑρίσκω) och det står faktiskt i "jag-form". I Kategori:Latin/Verb står vissa i jag-form och vissa i "presesn aktiv infinitiv" (enligt en.wikt.).Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 2 oktober 2017 kl. 12.56 (CEST)[svara]

Blanda inte in mig i detta! Det var en IP-adress som gjorde redigeringen, inte jag. --LA2 (diskussion) 2 oktober 2017 kl. 13.01 (CEST)[svara]

Stämmer! Läste fel antar jag😆. Frågan kvarstår dock och du är välkommen att delta!Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 2 oktober 2017 kl. 13.02 (CEST)[svara]

Så tråkigt att ingen vill svara. Ni behöver inte besitta någon stor kunskap inom ämnet utan bara komma fram till något. Om ingen är med i diskussionen föreslår jag att vi följer en.wikt.:s stilguide med jag-form.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 4 oktober 2017 kl. 11.55 (CEST)[svara]

Vi har pratat om detta rörande latin eller möjligtvis något annat språk, för länge sedan, men jag kan inte hitta diskussionen nu. Slutsatsen var att "grundformen" bör hanteras på det sätt som är sedvanligt för det aktuella språket, alltså samma slutsats som du kom fram till, att i detta fallet göra som enwikt. Att använda jag-formen som grundform både i översättningar och huvuduppslag. Jag kan inte uttala mig konkret om klassisk grekiska men principen gäller för alla språk. ~ Dodde (diskussion) 4 oktober 2017 kl. 17.42 (CEST)[svara]

Vad bra! Då har jag något att hänvisa till.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 4 oktober 2017 kl. 18.12 (CEST)[svara]

Språkbalans och mognad

cirkeldiagram

Jag gjorde ett cirkeldiagram över hur många uppslag vi har på respektive språk. Därav är det lätt att se att vi borde ha fler uppslag på några stora språk, däribland franska, spanska, kinesiska och arabiska.

Men går det också att mäta på något sätt hur mogna eller fullständiga våra 3000 spanska uppslag är? Hur många av dem anger böjningsmönster eller uttal? Är det 3000 bra uppslag vi har på spanska eller 3000 stubbar? Kan vi mäta vår framgång bara genom att räkna uppslagens antal, eller också deras mognad? Hur skulle ett sådant mått vara konstruerat? Görs någon sådan mätning på något annat språk av Wiktionary? --LA2 (diskussion) 4 oktober 2017 kl. 11.52 (CEST)[svara]

@LA2 Jag har också tänkt tanken, att det vore bra att ha något sätt att mäta kvalitet, så att allt fokus inte bara handlar om kvantitet. För en "rättvisare" bild skulle man kunna använda någon form av viktning där man t ex tar med antal rader med information, räknar på vilken information som tillhandahålls, hur långa definitionerna är, om uppslaget är försett med grammatiktabell osv. Hur man än vrider och vänder på det blir det nog ändå subjektivt. Jag känner inte till, men har heller inte försökt kolla upp, om någon mer sofistikerad statistik sammanställs i någon annan språkupplaga av Wiktionary. ~ Dodde (diskussion) 5 oktober 2017 kl. 08.31 (CEST)[svara]

En rå och enkel metod är att dra ut alla franska avsnitt ur XML-databasdumpen och mäta textlängden (i bytes, tecken, rader eller bytes efter komprimering). --LA2 (diskussion) 5 oktober 2017 kl. 09.30 (CEST)[svara]

for l in Svenska Tyska Engelska Finska Polska Franska Ryska Isländska Bottniska Nederländska \
 Japanska Danska Bokmål Tvärspråkligt Spanska Italienska Albanska Nynorska Latin Portugisiska \
 Esperanto Lettiska Estniska Katalanska Färöiska Ungerska Bosniska Tjeckiska Älvdalska Ukrainska \
 Turkiska Vitryska Fornnordiska Armeniska Kurdiska Bretonska Indonesiska Rumänska Maltesiska Grekiska \
 Slovenska Bulgariska Nordsamiska Litauiska Iriska Slovakiska Kroatiska Baskiska Serbiska Limburgiska
  do
    echo -n $l ""
    bunzip2 <svwiktionary-20170901-pages-articles.xml.bz2 |
      sed '/<\/text>/a==Endtext=='| sed 's/>==/>\n==/'|
      sed '/^== *'$l' *==/,/^==[^=]/!d'| sed '/^==[^=]/d'|
      sed 's/<\/text>//'|gzip|LANG=C wc -c
  done

Vilket ger följande intressanta resultat: Svenska 9093503, Tyska 2667287, Engelska 1339434, Finska 205907, Polska 156354, Franska 316458, Ryska 230358, Isländska 178923, Bottniska 384816, Nederländska 76941, Japanska 217504, Danska 118223, Bokmål 108648, Tvärspråkligt 149968, Spanska 111832, Italienska 52768, Albanska 25139, Nynorska 46514, Latin 48292, Portugisiska 34094, Esperanto 43161, Lettiska 28582, Estniska 18974, Katalanska 19700, Färöiska 29125, Ungerska 18780, Bosniska 38378, Tjeckiska 17232, Älvdalska 21207, Ukrainska 16399, Turkiska 14068, Vitryska 13235, Fornnordiska 33421, Armeniska 17985, Kurdiska 14317, Bretonska 10656, Indonesiska 7624, Rumänska 10270, Maltesiska 4771, Grekiska 12551, Slovenska 8618, Bulgariska 9576, Nordsamiska 13516, Litauiska 10922, Iriska 7462, Slovakiska 8572, Kroatiska 6579, Baskiska 6246, Serbiska 9582, Limburgiska 11413. Av detta tycks alltså vårt franska innehåll (316 kbyte komprimerat) vara något omfångsrikare än det finska (205 k), polska (156 k) och ryska (230 k). Det kan nog förklaras av att den här räkningen tar med böjningsformer. Rubriken ==Franska== finns med 9792 gånger, vilket är 50% fler än de 6500 uppslagsord (i grundform) vi har på franska. (Första versionen av koden och resultaten hade ett stort mätfel.) --LA2 (diskussion) 5 oktober 2017 kl. 10.38 (CEST)[svara]

När jag gör om samma analys nästan ett år senare (2017-09-01 till 2018-07-20), har tillväxten i dessa siffror varit för ukrainska +303%, vitryska +211%, indonesiska +136%, ryska +109%, maltesiska +74%, iriska +62%, kurdiska +38%, bulgariska +38%, kroatiska +35%, albanska +34%, baskiska +33%, serbiska +33%, portugisiska +32%, ... svenska +7,5%, tyska +5,5%, engelska +2,6%. För ryska och ukrainska har antalet uppslagsord inte ökat så dramatiskt, men volymen av deras innehåll har ökat genom att böjningsmallar, böjningsuppslag och textexempel har lagts till. --LA2 (diskussion) 1 augusti 2018 kl. 19.19 (CEST)[svara]

Utbyte och samarbete mellan användare och språk av Wiktionary - TWUG

På meta finns en sida för en gemenskap som kallas m:Wiktionary/Tremendous Wiktionary User Group, vanligen förkortat TWUG. Den har faktiskt fått status som officiell "user group" inom Wikimedia Foundation (det finns 82 sådana). Jag nämner detta, eftersom TWUG inte tidigare har nämnts på svenska Bybrunnen. TWUG startades efter Wikimania 2016 och är alltså lite drygt ett år gammal. Det är väl alltid oklart i början exakt vad en sådan grupp ska ägna sig åt. Ett exempel är ett försök till månadens samarbeten, kallat LexiSession, där man nu under oktober 2017 försöker förbättra innehållet rörande straffväsen; september månads tema var fred. Det verkar dock mest vara franska Wiktionary som deltar.

Just med tanke på att franska wiktionarister är aktiva inom TWUG, kanske det kan vara en plattform för att hitta folk som vill hjälpa till med att skapa fler franska uppslag i svenska Wiktionary. Och svenska uppslag i franska Wiktionary? Finns det någon överblick alls på vilka språk av Wiktionary det finns många svenska ord eller aktiva användare som underhåller de svenska uppslagen? --LA2 (diskussion) 7 oktober 2017 kl. 22.24 (CEST)[svara]

Valutor

Hur hanterar vi valutor? Bör alla (nuvarande) valutor vara rena? Endast på nationalspråket? Eller med översättningar? --2A02:908:C31:B780:939E:F093:ED28:D998 8 oktober 2017 kl. 16.02 (CEST)[svara]

Exempel? ~ Dodde (diskussion) 8 oktober 2017 kl. 16.19 (CEST)[svara]

Jag vet inte vad som avses med frågan, men kan meddela att jag har interwiki-länkat (via Wikidata) vår Kategori:Valutor (och dess underkategorier) med en:Category:Currency. Detfinns även en en:Category:Currencies, som jag valt att inte använda. Jag tycker att både krona och öre (både dollar och cent) kan ingå i den kategorin. Var det detta, som var frågan? --LA2 (diskussion) 8 oktober 2017 kl. 17.31 (CEST)[svara]

Vi har en artikel om Real med en svensk definition i den portugisiska artikeln, men vi har ingen artikel om den svenska (och tyska, engelska, franska, ...) namnet på denna valuta. --2A02:908:C31:B780:939E:F093:ED28:D998 8 oktober 2017 kl. 18.12 (CEST) P.S.: Jag tror att länken svarar på min fråga.[svara]

Real är fel. Dels ska det vara gemen initial (real), dels ska definitionen vara på det svenska uppslaget, och övriga språk hänvisa till det svenska. Samma princip som kemidefinitionerna. :) ~ Dodde (diskussion) 8 oktober 2017 kl. 18.27 (CEST)[svara]

Jag tycker själva motsvarigheten till "krona" i "Svensk krona" ska få ha ett uppslag men att "svensk krona" kan hänvisas till Wikipedia. dollar skulle då få ha ett uppslag med en definition såsom #namn på flertalet valutor såsom amerikansk, nyzeeländsk och australiensisk dollar eller något i den stilen medan "amerikansk dollar" hänvisas till Wikipedia. Tankar?Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 17 oktober 2017 kl. 12.52 (CEST)[svara]

Ping ‎@Dodde, @LA2, @2a02:908:c31:b780:939e:f093:ed28:d998.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 18 oktober 2017 kl. 15.57 (CEST)[svara]

@Jonteemil Jag förstår inte frågan. ~ Dodde (diskussion) 18 oktober 2017 kl. 17.08 (CEST)[svara]

@Dodde: Jag tycker krona, dollar, euro, peso, pund m.fl. bör ha ett uppslag då de är ord medan jag tycker att svensk krona, brittiskt pund, nyzeeländsk dollar, mexikansk peso m.fl. inte bör ha ett uppslag. Om man söker på "nyzeeländsk dollar" kommer det ändå upp en ruta med "Wikipedia har en artikel om Nyzeeländsk dollar". Jag tycker det räcker för en ordbok.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 19 oktober 2017 kl. 02.44 (CEST)[svara]

@Andreas Rejbrand, @Skalman, @LA2: Vad tycker ni?Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 19 oktober 2017 kl. 21.38 (CEST)[svara]

Ja, alla artiklar om "svensk krona", "dansk krona", "tjeckisk krona" känns lite som artiklar om "röd bil", "blå bil". Det finns väl inget som skiljer i grammatik, böjning, användning eller översättning? Det är väl en annan sak om man bildar särskilda ord som D-mark, östmark eller silverdaler. --LA2 (diskussion) 19 oktober 2017 kl. 22.14 (CEST)[svara]

Jag ser inte heller värdet av dessa definitioner. //Skal 19 oktober 2017 kl. 22.21 (CEST)[svara]

Om ingen (‎@Dodde, @Andreas Rejbrand, @2a02:908:c31:b780:939e:f093:ed28:d998, @övriga) motsäger så ska alltså alla valuta uppslag i form av (svensk krona, amerikansk dollar m.fl.) i Kategori:Valutor raderas.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 20 oktober 2017 kl. 13.13 (CEST)[svara]

@Jonteemil Det verkar råda begreppsförvirring här och min uppfattning är att "svensk krona" är en valuta som motsvaras av valutakoden SEK. "Norsk krona" är en annan valuta, som motsvaras av valutakoden NOK. Att kalla "krona" för valuta känns dock inte helt korrekt, åtminstone inte i en striktare betydelse där "svensk krona" anses vara valutan. Jag tror att samtliga enordiga valutauppslag för närvarande har denna tveksamhet. Jag föreslår en generell definitionsformulering på alla dessa uppslag motsvarande "#(gemensam) benämning på [[valuta]]n/[[valuta|valutorna]] i <landet/länderna>", eller åtminstone att berörda enordiga sidor förses med en faktamall där problemet med den nuvarande formuleringen synliggörs i samband med att de flerordiga uppslagen som föreslagits ovan raderas. ~ Dodde (diskussion) 20 oktober 2017 kl. 15.34 (CEST)[svara]

@Dodde: Det låter rimligt och logiskt👍🏻.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 22 oktober 2017 kl. 17.43 (CEST)[svara]

Jag raderar alla uppslag i formen ”svensk krona” om ingen har något emot det.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 23 oktober 2017 kl. 15.51 (CEST)[svara]

Kan du förse alla övriga uppslag med {{fakta}}-mall också, eller ännu hellre åtgärda de tveksamma definitionerna? Annars, skapa gärna ett projekt, så att det inte glöms bort. ~ Dodde (diskussion) 23 oktober 2017 kl. 23.27 (CEST)[svara]

Var anges orden med diakriter?

För närvarande anges ord med (vissa) diakriter på vissa språk (ex.vis ryska) på fetstilsraden, i grammatiktabellerna och i översättningslistorna. @Jonteemil föreslog att orden ska anges med diakriter på fler (alla?) ställen, specifikt föreslogs bl.a. {{kognat}}, {{synonymer}}, {{härledning}} och praktiskt taget alla andra mallar som använder {{länk}} (som är tänkt att ersätta {{länka}}) och {{g-cell}} (som är tänkt att ersätta {{länka-b}}). {{länk}} och {{g-cell}} inkluderar redan funktionaliteten som sådan, men frågan gäller mer var orden med diakriter ska anges, oavsett om teknisk lösning är på plats eller ej. I exemplet användes en:duša där enwikt med sina respektive härlednings- och kognatmallar inkluderar orden med diakriter medan länkningen sker till sidan utan diakriter. Vad som förordas enligt enwikts stilguide känner jag inte till. Exakt på vilka fler ställen bör diakriter används, utöver de tre ställen där de för närvarande anges, om några? @LA2, @Skalman, @Andreas Rejbrand, @Moberg, @Alla jag glömt nämna ~ Dodde (diskussion) 18 oktober 2017 kl. 03.04 (CEST)[svara]

På ryska (och ukrainska och vitryska) sätts betoningsaccent ut på en stavelse i alla flerstaviga ord (alltså ко́шка med accent men кот utan) i ordböcker och i löpande text i läseböcker för nybörjare (alltså motsvarande våra språkexempel). Våra böjningsmallar är sådana, att man ofta sätter parametern rot=ко́т och då får accent även i grundformen, vilket är fel/onödigt eftersom det är ett enstavigt ord. Den här svensk-ryska ordboken tryckt i Moskva är så ambitiös att den till och med sätter ut uttalsaccenter i de svenska orden (vilket är en missriktad välvilja som ofta blir fel), dock inte i kursivstil, som i fallet fárfars|far -fadern, -fäder пра́дед (по отцу), där är ju отцу ett tvåstavigt ord (dativ av отец) och skulle ha behövt accent, men räddas av att stå i kursivstil. --LA2 (diskussion) 18 oktober 2017 kl. 11.12 (CEST)[svara]

@LA2 ruwikt brukar skriva ut accent även på enstaviga ord. Onödigt låter rimligt, men inte fel, väl. Men frågan jag ställde rörde inte "för vilka ord" utan "var". Ska accenterna sättas ut i {{sammansättningar}}, i definitionerna, i {{böjning}}, {{avledning}}, {{härledning}} osv. osv? Är det rimligt att olika regler ska gälla för olika språk på olika platser och hur ska användarna förväntas kunna hålla reda på alla specialregler som då skulle omgärda detta? ~ Dodde (diskussion) 18 oktober 2017 kl. 15.26 (CEST)[svara]

Jag vill inte se ett krav på att diakriterna på ordet följer med i alla mallar utan snarare en möjlighet. Att om man vill förtydliga uttalet eller "diakritiseringen" i ex. {{kognat}} så ska den möjligheten ges.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 18 oktober 2017 kl. 15.30 (CEST)[svara]

Jag tycker att {{kognat}} och {{härledning}} känns särskilt passande för diakriter eftersom man då är intresserad av etymologin, men jag vet inte om jag ser värdet på andra platser. Jag ställer mig ganska neutral till listmallarna (synonymer mfl), men vill inte ha dom i {{böjning}}, {{avledning}} eller i (variant)definitionen.

Jag håller också med Jonteemil om att det aldrig bör vara ett krav, utan bara en möjlighet. //Skal 18 oktober 2017 kl. 19.24 (CEST)[svara]

@Skalman: Då definitionerna är på svenska, som inte har diakriter (på samma sätt som i ryska), förstår jag inte riktigt med vad du menar med att du inte vill ha med diakriter i definitioner? Och varför vill du inte ha med det i {{böjning}}? Vi har ju redan en text=-parameter, vilken skulle kunna tas bort i sådana fall.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 19 oktober 2017 kl. 02.38 (CEST)[svara]

@Jonteemil: Jag tänkte inte så långt - definitionerna är som du säger ändå på svenska.

Jag tycker att böjningsuppslag ska vara minimala, och bara hänvisa till grundformen. Jag skulle alltså föredra att inte ha någon text=, och inte heller tillåta diakriter där. //Skal 19 oktober 2017 kl. 18.45 (CEST)[svara]

@Jonteemil: Definitioner kan visst ha ord på främmande språk, med {{böjning}}, {{avledning}} eller "variant av ord". I dessa fall vill jag helst inte ha diakriter. //Skal 20 oktober 2017 kl. 09.29 (CEST)[svara]

@Skalman: Jo, det är väl sant... I alla fall så tycker jag att alla former av länkningar ska kunnas (bör rekommenderas att) ske med diakriter, detta för att inget försämrar utan diakriterna förbättrar endast.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 20 oktober 2017 kl. 13.08 (CEST)[svara]

@Jonteemil: Jag håller inte med. Böjningsuppslag ska vara hänvisningar utan extra info. Kompletta böjningsuppslag måste kunna underhållas med robot, och med text= eller diakriter i länken, kan detta inte längre göras entydigt (t.ex. om grundformen har flera/konstiga fetstilsrader). Det hela måste också kunna hanteras av dom gröna länkarna.

Mina åsikter gällande {{avledning}} och variantdefinitioner är inte lika starka, men har ungefär samma logik. //Skal 20 oktober 2017 kl. 13.40 (CEST)[svara]

Elakt varningsmeddelande om strukturprinciper

Idag bemöttes jag, efter att ha klickat på en grön länk, av varningsmeddelandet "Sidan du håller på att skapa är сутках, men texten på länken du klickade på var су́тках. Länktexten och länken brukar skilja sig åt när något rörande översättningen avviker från det vanliga. Det är troligt att utformningen av den här sidan behöver anpassas innan den sparas. [_] Jag känner till speciella strukturprinciper och är extra uppmärksam på att allt blir rätt." Och jag tilläts inte spara artikeln med mindre än att jag godkände detta med ett kryss i rutan. Och även efter att jag hade lyckats spara, så kom samma varning upp på nästa artikel, så tydligen har systemet inget minne av mitt tidigare kryss. Så kan vi inte ha det. Vem är skyldig? --LA2 (diskussion) 22 oktober 2017 kl. 20.20 (CEST)[svara]

Svar: Skalman. diff. Men varför? Vilket problem löses? --LA2 (diskussion) 22 oktober 2017 kl. 20.26 (CEST)[svara]

Möjligheten att visa ett varningsmeddelande är något positivt och är helt befogat i vissa fall, för att undvika att fel smyger sig in. Andra meddelanden för andra fel kan bli aktuella att lägga till allteftersom, men just detta meddelandet är tänkt att aktiveras endast när en grön länk skapats med hjälp av en översättningsmall där text-parametern har använts. Detta innebär att man bör vara observant och att man har koll på vad man gör innan man sparar. Strukturprinciperna kan vara olika från fall till fall, så att man kryssar i rutan innebär inte att man inte bör vara observant även nästa gång. Att varningsmeddelandet aktiverades när du klickade på en länk i en böjningstabell är dock en bugg. ~ Dodde (diskussion) 22 oktober 2017 kl. 21.27 (CEST)[svara]

Jag fixar det nu ikväll. För att folk ska veta vad vi pratar om, kika på den här länken. //Skal 22 oktober 2017 kl. 21.31 (CEST)[svara]

Det ska vara löst nu. //Skal 22 oktober 2017 kl. 21.44 (CEST)[svara]

Vad är fixat? Jag fick det elaka varningsmeddelandet fortfarande nu i eftermiddag vid klick på grönlänkar i böjningstabeller. --LA2 (diskussion) 23 oktober 2017 kl. 20.23 (CEST)[svara]

@LA2, det ska vara fixat i översättningslistor. Jag glömde bort böjningstabeller, men ska kika på det strax. //Skal 23 oktober 2017 kl. 20.51 (CEST)[svara]

@LA2, nu ska en mer robust lösning vara på plats. Kika gärna, så att det blir som du förväntar dig. //Skal 23 oktober 2017 kl. 21.31 (CEST)[svara]

Ja, nu är det elaka varningsmeddelandet borta från grönlänkarna i böjningstabellerna. Men vilket är då problemet som varningsmeddelandet skulle lösa? Du skriver att detta är "något positivt och är helt befogat i vissa fall", men vilka är dessa fall? Jag tror du smyger in krångligheter i onödan och sedan får vi alla skulden för att vårt projekt är ovälkomnande och har en otrevlig ton. Bevisbördan ligger på dig. Och sluta med detta @-trams. Det är en nymodighet som vi har klarat oss utmärkt utan i alla år och som inte tillför något verkligt värde. Om jag är intresserad av att återvända till en diskussion, så gör jag det. --LA2 (diskussion) 24 oktober 2017 kl. 11.55 (CEST)[svara]

Jag uppskattar inte din ton som du har i dina inlägg ovan. Den är omotiverad.

Till sakfrågorna:

Varningsmeddelande:
- Syftet är att vara mer välkomnande, inte mindre. Med tankesättet fail-fast hindrar vi att misstag smyger sig in i potentiellt hundratals uppslag, och också diskussioner om vem som ska korrigera det.
- Ett exempel där varningsmeddelandet ska dyka upp: {{ö|no|gjemme|text=gjemme seg}}. Här vore det ganska dåligt om användaren bara skapade sidan rakt av (vilket gröna länkar underlättar), utan att ta hänsyn till att översättningen gäller den reflexiva betydelsen.
{{@}}: Mallen gör att berörda personer får notifieringar om att titta på en viss diskussion. Jag uppskattar verkligen notifieringen, eftersom jag inte orkar hålla koll på alla diskussioner på sv-wikt, och jag tror att många andra också ser värdet. (Exempelvis efter sommaren hade jag 10 diskussionsnotifieringar att svara på - jag skulle aldrig ha hittat dom annars.) Det ger också en möjlighet för andra att påkalla uppmärksamhet till en diskussion där personen kan bidra. Om dessa notifieringar utgör ett stort irritationsmoment för dig, så skulle jag kunna dölja dom för dig. Är detta något du vill att jag gör?

//Skal 24 oktober 2017 kl. 23.23 (CEST)[svara]

(perifert: Utan @ skulle jag missa i stort sett alla svar på diskussioner som jag är med i. –d Moberg 25 oktober 2017 kl. 23.30 (CEST))[svara]

Engelska presensparticip

Jag märker att de flesta engelska presensparticip står som både en verbform och en prespart-avledning (adjektiv). Hur kommer detta sig. Se Kategori:Engelska/Adjektiv. Hur ska det vara. Antingen det ena eller det andra tycker jag.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 30 oktober 2017 kl. 23.08 (CET)[svara]

Det är både och. Mallen hade behövt förtydligas. Exempel på verbform (gerundium): "(To be) chewing gum is good for your teeth". Översätts med tugga på svenska. Exempel på adjektiv (presensparticip): "He was always seen chewing on something." Översätts med tuggande(s). ~ Dodde (diskussion) 31 oktober 2017 kl. 07.32 (CET)[svara]

@Dodde: Är du säker? i ditt exempel "(To be) chewing gum is good for your teeth" kan ju lika gärna översättas som "Att vara tuggande tuggummi är bra för dina tänder." Så här uttrycker vi oss ju inte på svenska men jag skulle tolka "chewing" som ett adjektiv eftersom det förklarar hur någon är. Jämför "To chew gum..." (verb) och "To be chewing gum". Jag kanske är ute och cyklar men vet inte. Detta med gerundium är främmande för mig. Om det är så att ”gerundium” är ett verb och ”presensparticip” är ett adjektiv kanske vi bör ändra mallen.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 8 februari 2018 kl. 17.34 (CET)[svara]

@Jonteemil Ja, jag är säker. Din alternativa översättning låter konstlad i mina öron. Det finns gott om resurser på internet som förklarar gerundium. Det är mycket möjligt att det vore rimligt att skilja på gerundium och presensparticip i grammatikmallen. ~ Dodde (diskussion) 8 februari 2018 kl. 20.47 (CET)[svara]

Lämpliga mått på framgång

För de minsta språken, har ju antalet uppslagsord visat sig vara ett fungerande mått på framgång. Vi såg det tidigare i år, när vi lyfte ett antal språk över nivån 500 uppslagsord, så att de blev synliga i språkindex på vår huvudsida. Jag tror att det är ett fullgott fungerande mått upp till 2000 uppslagsord.

Men däröver, i området 2–20 tusen och över 20 000 uppslagsord, hur avgör vi vad som egentligen skiljer danska och bokmål (båda omkring 4000 uppslag) eller franska och polska (båda omkring 7000 uppslag) eller svenska och tyska (båda omkring 70 000)? Bara antalet uppslagsord säger förmodligen inte allt som är av intresse. Kanske borde vi följa en checklista för att täppa till luckor? Vilka är de mest uppenbara bristerna i vår behandling av ett visst språk? Kanske saknar vi verbböjningar på bokmål eller prepositioner på danska eller anger vi inga synonymer alls på polska? Men hur vet vi i vilken ordning vi bör prioritera sådana aspekter? Har vi några förebilder i sådana mätningar, rankningar eller prioriteringar?

För länge sedan (2010) gjorde jag en täckningsanalys av de svenska orden i engelska Wiktionary, men det var till stor del ett manuellt arbete, som jag aldrig automatiserade, så det är svårt att upprepa. Med täckningsanalys menar jag, att jag använde frekvensordlistor för att täcka in de vanligaste orden och ordformerna. Det visade sig till exempel att väldigt få svenska adverb (som "därefter") hade artiklar, så jag skapade många sådana artiklar. Men jag gjorde inte samma analys för andra språk, så jag vet inte hur den svenska ordskatten står sig i en jämförelse. --LA2 (diskussion) 6 november 2017 kl. 19.55 (CET)[svara]

Vore ju trevligt att fler frekvensordlistor att gå efter. Det känns som ett bra steg efter att antalet ord kommer upp till ~1000-2000. Kelly-projektet har en del sådana: http://corpus.leeds.ac.uk/serge/kelly/ samt en sida där man slå upp ord: http://kelly.sketchengine.co.uk/ –d Moberg 6 november 2017 kl. 20.12 (CET)[svara]

Min täckningsanalys använde en sorts frekvensordlista, men baserad på enstaka texter. Jag tog exempelvis Herr Arnes penningar och räknade hur många av ordförekomsterna i den, som täcktes av de ordformer som fanns i Wiktionary. Om det hade varit meningen "att vara eller inte vara", så räcker det med ordet "vara" (2 av 5 förekomster) för att täcka 40% av meningen. Vi kunde ju ta någon text som vi har på flera språk, t.ex. Hamlets monolog eller Kejsarens nya kläder, eller inledningskapitlet i Bibeln (I begynnelsen skapade Gud himmel och jord...), och göra en sådan täckningsanalys för olika språk. En brist med den metoden är att man tar med ett ord som "så" och därmed har man "täckt" det ordet, men man kanske har missat flera sidobetydelser av ordet. Man kanske har med "vara" som substantiv, men har missat "vara" som verb. --LA2 (diskussion) 6 november 2017 kl. 21.54 (CET)[svara]

Reflexiv form på franska verb i tagg

Jag lade till så att franska reflexiva verb får utskriven text som visar hur den reflexiva formen ser ut i grundform. Jag kan inte franska så någon som kan lite mer får gärna kika på de få ord som är kategoriserade och se om det ser rätt ut: Kategori:Franska/Reflexiva verb (Jag gjorde så att verb som börjar på aeiouh prefigeras med "s'" och andra med "se ".) –d Moberg 7 november 2017 kl. 21.04 (CET)[svara]

(Flyttar kommentaren hit) @Moberg: Logiken du la till stämmer inte alltid - det finns verb som börjar med "h" och som inte ska vara "s'" - t.ex. [5]. Mitt förslag skulle vara att aldrig visa "se" eller "s'" på ord som börjar med "h". //Skal 7 november 2017 kl. 21.35 (CET)[svara]

Ok, hur ser man (i grammatikmallarna) att de där verben tar se och inte s'? Är det som i engelska beroende på om h:et uttalas eller inte? –d Moberg 7 november 2017 kl. 21.37 (CET)[svara]

Jag tror inte att reflexivitet anges i våra mallar, trots att böjningen ändrar sig en hel del för reflexiva verb (våra franska verbmallar är minst sagt bristfälliga). H uttalas aldrig på franska. Som jag minns det från mina franskalektioner, så gäller det (ofta?) ord som har germanskt ursprung. //Skal 7 november 2017 kl. 21.44 (CET)[svara]

En till bugg i {{#invoke:tagg}}: den stödjer inte verb med diakriter - framförallt "é" är relevant. Andra diakriter som används på franska (men jag kan inte komma på nåt i början på verb): àâéèêëîïòôœûù. Förutom dessa, så listar en-wikt även æäöüÿ, men jag kan inte minnas att jag nånsin sett dom i ett franskt ord. //Skal 7 november 2017 kl. 21.52 (CET)[svara]

Jag gjorde som du tyckte med h. Borde finnas nåt lätt sätt att strippa diakriter (eller kanske få en sträng med alla vokaler för givet språk?). –d Moberg 7 november 2017 kl. 23.58 (CET)[svara]

@Moberg, i princip skulle man kunna använda {{#invoke:sort}} för att i princip ta bort diakriter... Jag är osäker på om det är bra att använda den eller inte. //Skal 8 november 2017 kl. 22.09 (CET)[svara]

@Skalman, det är nog inte så bra, men att bryta ut undiacritic-funktionaliteten till en egen modul kanske är tänkbart så att den kan användas både av Modul:sort och andra moduler. ~ Dodde (diskussion) 8 november 2017 kl. 23.24 (CET)[svara]

Mapping Japanese Hiragana and Katakana for On-Wiki Search

Hej—sorry for posting in English. (Hjälp till att översätta till ditt språk.) I am working on enabling a mapping between Japanese hiragana and katakana for searching on English-language wikis. For example, this would allow おおかみ and オオカミ (both "wolf") to match each other in a search. This is something that would probably be easy to enable for all Swedish-language projects as well. Is this something that you would find useful? Tack! TJones (WMF) (diskussion) 8 november 2017 kl. 16.03 (CET)[svara]

I don't know Japanese, but I suppose that wouldn't be a problem. @Moberg, @Dodde, @Fiskjuice - do you have any opinion? //Skal 8 november 2017 kl. 22.14 (CET)[svara]

@TJones (WMF), I have not seen any statistics of how commonly the search for Japanese entries on svwikt is used, but I'd believe it's not used much. However, I too can't see a problem enabling the mapping from our end. ~ Dodde (diskussion) 8 november 2017 kl. 23.17 (CET)[svara]

I haven't looked at how often people search for Japanese words, but I will look at how many words in wiktionary entries are affected as part of the testing before deployment. I expect the number to be small. TJones (WMF) (diskussion) 9 november 2017 kl. 16.23 (CET)[svara]

Just enable it. It is a service that someone searching for オオカミ can find おおかみ. –d Moberg 9 november 2017 kl. 17.49 (CET)[svara]

Tack! Since the consensus is positive, I've opened a ticket to enable this for Swedish-language projects. T180387 TJones (WMF) (diskussion) 13 november 2017 kl. 20.05 (CET)[svara]

Hur ska ålderdomlig böjningsformer hanteras?

Flyttad från Moduldiskussion: sv-adj

Ett frågetecken som jag kom på nu, och det är nog ett knepigt frågetecken som fler (@Skalman?) behöver fundera kring: Hur ska böjningsuppslagen se ut för gammalstavningar? Jag har sett några böjningsuppslag som inte följer standarden (t.ex. hjertat). Ska gammalstavningsmallen bara användas på huvuduppslag eller även på böjningsuppslag? ~ Dodde (diskussion) 8 november 2017 kl. 00.25 (CET)[svara]

@Dodde: Bra! Bybrunnen bör nog hantera den frågan.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 8 november 2017 kl. 00.27 (CET)[svara]

@Jonteemil, @Dodde: Jag tycker att det är ok med bara {{böjning}} - informationen hittas på huvuduppslaget. Om det inte känns acceptabelt för andra, så tycker jag att vi ska ha en särskild {{böjning-gammalstavning}}. //Skal 8 november 2017 kl. 22.20 (CET)[svara]

@Jonteemil, @Skalman: Bara en undran. Finns det fall då huvudformen är samma, men där bara böjningsformerna tillhör olika stavningsreformer, och som behöver stödjas? På svenska eller på andra språk? Om svaret är ja, hur då (hur borde huvuduppslagen se ut, olika mallar/tabeller för olika stavningsreformer?) Vilka potentiella problem ställs vi inför om vi börjar införa detta på bred front? ~ Dodde (diskussion) 8 november 2017 kl. 23.28 (CET)[svara]

@Jonteemil, @Dodde: Vilken info som är relevant på huvuduppslaget kommer variera per språk och per stavningsreform. T.ex. franska har sådana fall: "match" har plural "matches", men "matchs" i en stavningsreform. Osäker på bästa sättet att hantera det, men utan att lägga till nya mallar skulle jag ha två tabeller, med en not i den ena. //Skal 8 november 2017 kl. 23.41 (CET)[svara]

En hel grammatikmall för en stavning som inte är den vanligaste pga stavningsreform känns lite mycket. Otillbörlig vikt. Kanske räcker {{användning}} eller {{grammatik}}? –d Moberg 9 november 2017 kl. 17.54 (CET)[svara]

Eller {{stavning}} som jag hade missat att vi har! –d Moberg 9 november 2017 kl. 17.57 (CET)[svara]

Changes to the global ban policy

Hello. Some changes to the community global ban policy have been proposed. Your comments are welcome at m:Requests for comment/Improvement of global ban policy. Please translate this message to your language, if needed. Cordially. Matiia (Matiia) 12 november 2017 kl. 01.34 (CET)[svara]

New print to pdf feature for mobile web readers

New print to pdf feature for mobile web readers

The Readers web team will be deploying a new feature this week to make it easier to download PDF versions of articles on the mobile website.

Providing better offline functionality was one of the highlighted areas from the research done by the New Readers team in Mexico, Nigeria, and India. The teams created a prototype for mobile PDFs which was evaluated by user research and community feedback. The prototype evaluation received positive feedback and results, so development continued.

For the initial deployment, the feature will be available to Google Chrome browsers on Android. Support for other mobile browsers to come in the future. For Chrome, the feature will use the native Android print functionality. Users can choose to download a webpage as a PDF. Mobile print styles will be used for these PDFs to ensure optimal readability for smaller screens.

The feature is available starting Wednesday, Nov 15. For more information, see the project page on MediaWiki.org.

Tack!

CKoerner (WMF) (talk) 20 november 2017 kl. 23.07 (CET)[svara]

genitiv av pronomen

allas, övrigas, vissas, mångas, sistas, andras, andres, annans, annats, bådas, bägges. Ska dessa verkligen finnas? Det känns väldigt lika adjektivens genitivformer som ju inte ska finnas.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 21 november 2017 kl. 17.29 (CET)[svara]

@Jonteemil Vad jag minns är det genitiv av adjektiv som inte ska redovisas (t.ex. i adjektivens böjningstabeller), då det landade i att det i själva verket var substantiveringar av adjektiven och deras genitivformer det hela i slutändan handlade om. Och i den mån substantiveringarna redovisas ser jag inget problem med att redovisa deras respektive genitivformer, precis som för vilka andra substantiv som helst. Alltså, ja, jag tycker att de bör redovisas. ~ Dodde (diskussion) 21 november 2017 kl. 23.57 (CET)[svara]

@Dodde: Men inga av dessa genitivs nominativformer visas som substantiveringar på de respektive uppslagen. Ska formerna alltså raderas tills någon känner sig manad att skapa nominativen (substantiveringarna)?Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 21 november 2017 kl. 23.59 (CET)[svara]

@Jonteemil: Jag hänger inte med på vad du menar. Jag syftade på diskussionen om adjektiv i våras, att genitiv av adjektiv inte ska finnas med som adjektivformer, men väl för substantiveringar, alltså substantiv, som substantivformer (i den mån substantiveringar av adjektiven faktiskt redovisas på sina egna huvuduppslag). I detta sammanhang är pronomen som alla, övriga osv. att jämställa med sådana substantiv. Jag tycker alltså att de genitivformer av pronomen som du listar här ovan ska vara kvar. ~ Dodde (diskussion) 22 november 2017 kl. 00.43 (CET)[svara]

@Dodde: Du skriver att formerna ska få finnas kvar, om det finns ett substantiveringsuppslag på nominativets uppslag. Då det inte finns något sådant borde formerna väl raderas.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 22 november 2017 kl. 09.41 (CET)[svara]

@Jonteemil: Nej, det skriver jag inte. Jag försökte redovisa ett resonemang som dels förklarade varför ditt antagande rörande "adjektivens genitiv" såg ut att vara ett missförstånd, dels ledde fram till slutsatsen "behåll genitivformer av pronomen". Alltså:

Redovisa (skapa uppslag för) genitiv av substantiv (även substantiverade adjektiv, som ju är substantiv). Redovisa genitiv av pronomen (jämställ resonemanget med vad som gäller för substantiv). Redovisa inte "genitiv" av adjektiv (de är i själva verket substantiveringar av adjektiv, alltså substantiv, och ska därför inte redovisas som adjektiv). Redovisa inga genitiv om motsvarande nominativ inte redovisas (följer den generella principen om att böjningsuppslag som inte backas upp av ett huvuduppslag inte ska redovisas - redoviså alltså inte genitiv av substantiveringar om inte nominativen av motsvarande substantiveringar redovisas, vilket sällan görs). ~ Dodde (diskussion) 22 november 2017 kl. 13.20 (CET)[svara]

Jo de ska definitivt finnas. allas ska finnas på samma sätt som folkets finns. Sådana pronomen ersätter ju substantiv, inte adjektiv. Taylor 49 (diskussion) 22 november 2017 kl. 14.39 (CET)[svara]

Flerordiga prepositioner (inte "prepositionsfraser")

Listan flyttad till Appendix:Svenska_flerordiga_prepositioner 2018-Aug-14. Diskuterades redan 2017-Apr, numera arkiverat.

Kan någon leta fram någon betydelseskillnad mellan i strid med och i strid mot ? Taylor 49 (diskussion) 3 augusti 2017 kl. 12.04 (CEST) redigerat Taylor 49 (diskussion) 4 augusti 2017 kl. 14.27 (CEST)[svara]

Båda är korrekta, men "med" är det normala i mer abstrakt användning 'vara i konflikt med', 'gå emot ngt', 'tvärtemot': Jag är i strid med förlaget; i strid med § 5. "Mot" är vanligt i den mer konkreta innebörden 'gå i krig mot ngn', 'slåss mot ngn'. den 19 december 2012 kl. 12:41 Ola Karlsson, Språkrådet (Facebook). ~ Dodde (diskussion) 3 augusti 2017 kl. 13.11 (CEST)[svara]

Kan någon leta fram någon betydelseskillnad mellan vid sidan av och vid sidan om ? Taylor 49 (diskussion) 23 augusti 2017 kl. 13.15 (CEST)[svara]

Observera att detta inte är vad lingvister kallar prepositionsfraser. Detta är flerordiga prepositioner. I prepositionsfrasen ingår även rektionen (ibland kallat komplement). I meningen

"Adjektivet ändrar sig beroende på om substantivet är en-ord, ett-ord eller plural"
- "beroende på om substantivet är en-ord, ett-ord eller plural" prepositionsfras, och
- "beroende på" är prepositionen (huvudordet) i prepositionsfrasen.

En annan analys är att "beroende" är huvudordet i en participfras och har en prepositionsfras (PP) som bestämning (där PP börjar med huvudordet "på"). –d Moberg 24 augusti 2017 kl. 20.32 (CEST)[svara]

Tack för tipset, rättat rubriken. Känner du till någon skillnad mellan vid sidan av och vid sidan om ? Taylor 49 (diskussion) 28 augusti 2017 kl. 15.17 (CEST)0[svara]

@Taylor 49, jag känner inte till någon skillnad förutom att dom ger lite olika känsla. Vad önskar du för resultat av den här diskussionen? //Skal 2 december 2017 kl. 19.28 (CET)[svara]

Spruckna participformer

Listan flyttad till Appendix:Svenska_verb_med_avvikande_participformer 2018-Aug-14. Det finns en längre diskussion [6] men kanske borde problemet lösas med tanke på de övriga verben och adjektiven med liknande problem? Taylor 49 (diskussion) 20 november 2017 kl. 14.04 (CET)[svara]

Code ee

Hejsan!

It's common to see in Sweden the code ee used on food packages. Yet, this code corresponds to an African language [7], which sounds strange next to languages like Finnish, Swedish, Danish. Have you an idea what language it corresponds to? It is the country code top-level domain (ccTLD) of Estonia, so I presume it corresponds to Estonian; yet, do you confirm it is the case? It is weird that a ccTLD is used instead of the official language code et. Automatik (diskussion) 8 december 2017 kl. 00.32 (CET)[svara]

Food packages often use the country code, e.g. SE for Sweden/Swedish language (language code SV) and DK for Denmark/Danish language (language code DA), so it's natural to use EE for Estonia/Estonian language (language code ET). It's similar to using the flag to represent language. Not correct, but very common. --LA2 (diskussion) 8 december 2017 kl. 01.32 (CET)[svara]

@Automatik.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 8 december 2017 kl. 02.46 (CET)[svara]

Thanks, you're right, that's indeed the country code. And I had not even noticed the code for Swedish was actually the country code as well, rather than the language code! Makes sense, now, thank you. Automatik (diskussion) 8 december 2017 kl. 12.45 (CET)[svara]

Justering i brödtextmallar

I korthet: Jag har gjort en mindre ändring i {{användning}}, {{etymologi}}, {{diverse}} och {{grammatik}}. Det borde inte påverka i någon större utsträckning.

Detaljer: Våra list- och brödtextmallar har hittills inte kunnat hantera radbrytningar och listor, utan mkt komplicerad syntax. Ibland har det visuellt sett någorlunda korrekt ut, men skript kan inte hantera detta (se t.ex. [8]). (Listmallarna ska aldrig ha radbrytningar, så dom har jag inte brytt mig om.) För att lösa detta för brödtextmallarna har jag normaliserat innehållet med {{#invoke:body-text}}, som kan hantera stycken=dubbel radbrytning (men inte listor eller indentering). Om man ändå skulle råka använda en lista, så placeras sidan i Kategori:Wiktionary:Brödtextmall med lista, så att någon kan korrigera problemet vid tillfälle. När jag aktiverade denna normalisering fanns ett femtiotal sidor som behövde korrigeras (jag har fixat dessa). //Skal 30 december 2017 kl. 23.11 (CET)[svara]

Förväxling av jiddisch och yi

Oj! Nu har något blivit riktigt rörigt. När jag skriver in "yi" som språk för nytt uppslag så står titeln som jiddisch, men kategoriseras som det sydostasiatiska språket yi. Det är mängder av uppslag skapade med samma malfunktion. Går det att ändras med robot? Vissa av uppslagen hör däremot till språket yi och behöver inte ändras (vad jag sett). ╰ Sven ji 8 januari 2018 kl. 12.12 (CET)[svara]

Det stämmer. Problemet är att många mallar nu accepterar både språknamn och språkkod. Vi kommer behöva ändra detta för att lösa problemet. Troligen bör också {{#invoke:lang}} uppdateras för att bättre stödja detta. //Skal 8 januari 2018 kl. 13.25 (CET)[svara]

Jag har löst det temporärt, så att språkkod alltid går före språknamn, men vi kommer behöva skriva om {{#invoke:lang}} och alla moduler/mallar som använder den. //Skal 8 januari 2018 kl. 13.42 (CET)[svara]

Tekniskt fel (trasiga redigeringar)

Idag (2018-Jan-11) dykte upp ett nytt tekniskt fel med textkodningen. Alla redigeringar från och med den här är trasiga. Taylor 49 (diskussion) 11 januari 2018 kl. 11.21 (CET)[svara]

Märker också det. Konstigt.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 11 januari 2018 kl. 15.10 (CET)[svara]

Jag har rapporterat buggen: [9] //Skal 11 januari 2018 kl. 18.37 (CET)[svara]

Det verkar vara löst för vår del nu. //Skal 11 januari 2018 kl. 21.41 (CET)[svara]

Felet var en del av veckans nya MediaWiki-version, och hann påverka svensk- och danskspråkiga Wiktionary. Den har rullats tillbaka tills problemet är löst. /Johan (WMF) (diskussion) 12 januari 2018 kl. 06.18 (CET)[svara]

Estniska och språknamn

Skal är övertygad om att det inte går att utelämna keel bakom estniska språknamn, vilket är möjligt på tyska eller finska. Jag tror på grundval av indikationer som et-wikt och et-wikt som detta är mycket möjligt. Finns det en estnisk talande användare här som kan svara på frågan? --2A02:908:C31:B780:A079:B872:42C2:8DE4 16 januari 2018 kl. 21.47 (CET)[svara]

Min analys till varför jag tror att man inte kan utelämna "keel" hittas på Diskussion:albaania. //Skal 16 januari 2018 kl. 22.00 (CET)[svara]

Jag har frågat en person med estniska som modersmål. Min uppfattning därifrån:

Formen utan "keel"
- ...är föråldrad förutom i skämtsamt talspråk
- ...finns också i vissa dialekter
- ...lånades in från finskan under 1900-talets första hälft
- ...används på et-wikt för att undvika upprepning ("keel" är underförstått)
Vi skulle teoretiskt kunna lägga till dessa föråldrade former, men det känns orimligt att underhålla all denna information när ingen av oss kan estniska (och många viktigare estniska ord saknas)

//Skal 17 januari 2018 kl. 22.42 (CET)[svara]

@Skalman: Jag tolkade hens svar som att det var benämningen på språk utan ”keel” som lånades in från finskan under 1900-talets första hälft, men jag kanske såg fel.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 17 januari 2018 kl. 23.19 (CET)[svara]

@Jonteemil: Jag tror att det är precis det jag skrivit här ovanför. //Skal 18 januari 2018 kl. 14.44 (CET)[svara]

@Skalman: Ja, nu ser jag ju det. Måste ha läst med istället för utan av någon anledning.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 18 januari 2018 kl. 23.27 (CET)[svara]

Senast tillagda sidor i kategorier

På en-wikt kan man se vilka sidor som senast lagts till i en kategori (exempel). Vad tror ni om att lägga till något liknande på sv-wikt?

I så fall skulle vi behöva be om att få "DynamicPageList" aktiverad här. //Skal 7 februari 2018 kl. 23.33 (CET)[svara]

@Skalman: Det vore väl bra, ser inget negativt med det.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 7 februari 2018 kl. 23.38 (CET)[svara]

@Skalman, jag ser heller inga nackdelar. Kör på! ~ Dodde (diskussion) 10 februari 2018 kl. 23.08 (CET)[svara]

Det verkar dessvärre som att DynamicPageList inte kommer att aktiveras på fler wikier pga. prestandaproblem. Dessa har varit kända i över 10 år, så det är osannolikt att nåt skulle förändras i närtid. Förfrågan i Phabricator. //Skal 11 februari 2018 kl. 09.42 (CET)[svara]

Mall:oböjl vs oböjliga substantiv

Listan flyttad till Appendix:Svenska_oböjliga_substantiv 2018-Aug-14.

Är mall Mall:oböjl endast för adjektiv eller också för substantiv? Taylor 49 (diskussion) 9 februari 2018 kl. 13.10 (CET)[svara]

{{oböjl}} kan användas för substantiv, och mer generellt för ord i en ordklass där man normalt skulle kunna anta att det finns böjningar. För att ange genus (en/ett) brukar vi använda u och n. //Skal 9 februari 2018 kl. 17.16 (CET)[svara]

Homografer

Hej, hade vi inte en lista med homografer här förut? –d Moberg 13 februari 2018 kl. 18.31 (CET)[svara]

@Moberg Det har jag inget minne av. Du uttalade intresse för en sådan lista 2010 [10], men vad jag känner till har det inte skapats någon sådan sedan dess. Homofon-listor finns (Appendix:Homofoner) och ett önskemål om en lista med homonymer har lagts till på Wiktionary:Projekt. ~ Dodde (diskussion) 14 februari 2018 kl. 02.18 (CET)[svara]

Apostrofer

I’m, you’re, he’s, it’s, she’s, we’re, they’re, ain’t, isn’t, aren’t, wasn’t, haven’t, hasn’t, hadn’t, won’t, wouldn’t, can’t, couldn’t, shaun’t, shouldn’t, I’ve, you’ve, we’ve, they’ve, I’d, you’d, he’d, she’d, it’d, we’d, they’d, I’ll, you’ll, he’ll, she’ll, it’ll, we’ll, they’ll och one’s kan raderas väl då man ändå kommer till uppslaget med rätt apostrof..Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 24 februari 2018 kl. 13.57 (CET)[svara]

Man kommer inte till uppslaget om man har en direkt länk. T.ex. om man går till fr:I’m, så hittar man idag en länk till den svenska omdirigeringen. Den skulle försvinna om sidorna raderas. Jag är därför mot det här förslaget. //Skal 25 februari 2018 kl. 20.35 (CET)[svara]

@Skalman: Finns det ens några direktlänkar till sidor med apostrofen (’) (bortsett från iw-länkar)?Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 27 februari 2018 kl. 01.44 (CET)[svara]

@Jonteemil: Kanske inte inom sv-wikt, men jag visade dig ju en från fr-wikt. //Skal 27 februari 2018 kl. 07.53 (CET)[svara]

(Jag missade att du skrev "bortsett från iw-länkar".) //Skal 27 februari 2018 kl. 20.05 (CET)[svara]

Böjningsmall för ryska verb

Diskussion flyttad till Moduldiskussion:ru-verb.

Homofoner

Mallen { { homofoner } } verkar inte funka rätt: [11]. Resultat: [12]. Inte bra. Taylor 49 (diskussion) 19 april 2018 kl. 12.29 (CEST)[svara]

@Taylor 49 Vad jag kan hitta finns ingenting som indikerar att {{homofoner}} skulle ha stöd för språkkod, som förmodats. Mallinstruktionerna nämner ex.vis ingenting om det. Det är nog riktigt att den borde ha stöd för det, eftersom det är så {{tagg}} numera fungerar, med sin språktagg. Vi får kika på detta vid tillfälle. ~ Dodde (diskussion) 23 april 2018 kl. 00.58 (CEST)[svara]

Mallinstruktionerna för {{homofoner}} finns i stort sett inte alls. Men vad bra att problemet har lagts på att-göra-listan. Taylor 49 (diskussion) 23 april 2018 kl. 12.44 (CEST)[svara]

Tell us what you think about the automatic links for Wiktionary

Hello all,

(Sorry for writing in English. Feel free to translate this message below.)

One year ago, the Wikidata team started deploying new automatic interwiki links for Wiktionaries. Today, the links for the main namespace are automatically displayed by a Mediawiki extension, and the links for other namespaces are stored in Wikidata. You can find the documentation here (feel free to help translating it in your language).

We would like to know if you encountered problems with the system, if you would have suggestions for further improvements. This could be for example:

Some automatic links don’t work as expected
Some problems you encountered with entering links (for non-main namespace) in Wikidata
Some new features you’d like to have, related to links

To give feedback, you have two options:

Let a message on this talk page
Let a message here. If you do so, please mention me with the {{ping}} template, so I can get a notification.

Our preferred languages are English, French and German, but you can also let a message in your own language if you feel more comfortable with it.

I’m looking forward for your feedback! Lea Lacroix (WMDE) 24 april 2018 kl. 12.23 (CEST)[svara]

Ordning och reda vid översättningar

När man lägger till översättningar (via Javascript), bör "imperfektiv aspekt" stå före "perfektiv aspekt" (för de slaviska språken) och "utr." stå före "neut." (för danska). --LA2 (diskussion) 27 april 2018 kl. 07.55 (CEST)[svara]

Böjningsmallar för ukrainska och vitryska verb

Kan vi nu få mall:uk-verb-impf och uk-verb-pf, som är exakta kopior av motsvarande ryska, men med en extra rad för imperativ i 1:a person pluralis? För detta behövs en extra namnlös parameter, som kommer före de övriga imperativ-formerna.

Kan vi nu få mall:be-verb-impf och be-verb-pf, som är exakta kopior av motsvarande ryska, men utan particip, enbart gerundier? För detta krävs 4 (-impf) respektive 2 (-pf) färre namnlösa parametrar. Tack! --LA2 (diskussion) 27 april 2018 kl. 08.55 (CEST)[svara]

Japp. Undrar bara: Finns impf+pf även för ukrainska och vitryska? Hur ska rubrikerna sättas för den undre delen i den vitryska mallen (ska det ens finnas en ruta "particip")? ~ Dodde (diskussion) 27 april 2018 kl. 20.29 (CEST)[svara]

Och uttalsmarkeringar som makron används inte i ukrainska och vitryska, eller? Isåfall är grundformsparametern inte obligatorisk som i de ryska verbmallarna. ~ Dodde (diskussion) 27 april 2018 kl. 20.35 (CEST)[svara]

Impf/pf och uttalsaccenter fungerar som i ryska. (Men om kombinationen impfpf förekommer, det vet jag inte.) Dock ser jag nu att ukrainska impf-verb även har 6 futurum-former. Se t.ex. ru:знати#Украинский, ett typiskt ukrainskt verb som slutar på -ати där motsvarande ryska verb slutar på -ать (ru:знать, att veta). Jag tror det är pedagogiskt att behålla gerundiernas position nederst till höger, även när particip saknas. --LA2 (diskussion) 27 april 2018 kl. 21.32 (CEST)[svara]

Blev det rätt (Användare:Dodde/test/uk-verb, Användare:Dodde/test/be-verb)? ~ Dodde (diskussion) 28 april 2018 kl. 02.23 (CEST)[svara]

Ser bra ut, så vitt jag kan se. --LA2 (diskussion) 28 april 2018 kl. 09.09 (CEST)[svara]

Som du märkt finns inga grönlänkar för skapande av participuppslag i de ryska, ukrainska och vitryska tabellerna. Det beror på att {{avledning}} (Wiktionary:Mallar/avledning#Speciella parametrar), Modul:entry och MediaWiki:Gadget-green_links.js inte stödjer andra particip än presensparticip, perfektparticip och aktiv/passiv particip. Analogt är det lätt ordna stöd för aktiv/passiv presensparticip/preteritumparticip, men jag känner mig osäker på gerundiumformerna.

Vi skiljer på rena böjningsuppslag och på participuppslag som vi hanterar som egna huvuduppslag som i sin tur t.ex. kan innehålla böjningstabeller (även om det kanske inte är fallet för vissa particip om det är oböjliga). När jag kollade lite närmare på engelskans -ing-form, så verkar det som om den kan användas både som gerundium och som presensparticip och därför är både en böjningsform till verbet och ett självständigt particip, dvs. ett adjektiv.

Är det likadant eller liknande med ryskans gerundium, att de kan vara "både och", eller är det begränsat till endera - isåfall är det gerundium (alltså en böjningsform och endast en böjningsform) som vi har att göra med här? Eller är det något annat - någon form av adjektiv? Om det är en böjningsform, så får målsidan samma formulering som alla andra böjningsformer "böjningsform av [grundformen]", om det är något annat, hur ska det isåfall formuleras - "aktiv gerundiumparticip" respektive "passiv gerundiumparticip" (gissar att det inte är så, men utan kunskap om rysk grammatik och om man tittar på tabellen är det kanske inte en helt otänkbar tolkning). ~ Dodde (diskussion) 6 maj 2018 kl. 16.25 (CEST)[svara]

För stunden är jag fullständigt nöjd med vad vi har. Vi rör oss här i utkanten av mina ryskakunskaper. --LA2 (diskussion) 6 maj 2018 kl. 22.18 (CEST)[svara]

Dock skulle gröna länkar i {{ru-adj}} sitta fint, för alla 6 kasus och kortformerna, t.ex. för artikeln бездарный. Det är vanliga böjningsformer av adjektiv, inget konstigt. --LA2 (diskussion) 6 maj 2018 kl. 22.48 (CEST)[svara]

Avsaknande av gröna länkar i ryska adjektivtabeller har en annan orsak, nämligen att många (de flesta) adjektivuppslag i nuläget saknar betoningsangivelser (eftersom mallen fram tills nyligen gjorde det mycket krångligt att ange dessa). Det innebär att böjningsuppslag som skulle skapas från dessa gröna länkar också skulle sakna betoningsangivelser. Det går säkert att ändra i MediaWiki:Gadget-green_links.js eller något för att endast låta länkarna bli gröna om betoningsmarkering finns med i ordet för ryska (och jag antar ukrainska och vitryska också). Jag vet inte om jag vågar joxa med detta, utan hade helst velat att @Skalman kikade på det vid tillfälle. ~ Dodde (diskussion) 6 maj 2018 kl. 23.21 (CEST)[svara]

Avsaknad av accenter låter som ett påhittat argument. Det är färre än femtio artiklar som använder mallen (Special:Länkar_hit/Mall:ru-adj) och av dessa var det bara ett adjektiv (мокрый, fuktig) som saknade accenter, vilket jag nu har fixat.

Att börja villkora grönlänkar på förekomst av accent vore nog ett misstag. Det finns minst en form (kortformen мокр) som ska sakna accent, eftersom den enbart har en vokal som därför självklart är betonad, även utan markering.

Dock är jag tveksam till att komparativ- och superlativformerna alls bör vara del av mallen. I synnerhet borde former som "более мокрый" inte vara en länk. Vi har ju inga uppslag för den svenska kombinationen "mer fuktig". --LA2 (diskussion) 7 maj 2018 kl. 10.07 (CEST)[svara]

Det har att göra med att om böjningsuppslag skapas med minimal information är det mycket mer arbetsamt att lägga till informationen i efterhand än att se till att det blir rätt från början. Nu kände jag inte till detaljerna kring när accenter ska anges och inte och därför framstod det som att det fanns fler sidor i behov att åtgärdas än det i verkligheten gjorde. Olika språkupplagor av Wiktionary gör olika - till och med ryska Wiktionary använder accenter för ord med bara en vokal, åtminstone ibland, men ditt resonemang låter naturligtvis rimligt.

Jag har aktiverat grönlänkningen i mallen nu. Jag har utgått ifrån att kortformerna kan behandlas som böjningsformer och man alltså skapar vanliga böjningsformsuppslag för dem. более мокрый ska liksom andra flerordsböjningsformer inte ha egna böjningsformsuppslag och därför inte heller länkas, precis som du säger. {{g-cell}} tar hänsyn till det. Formen kan ändå vara med för att göra komparationsavsnittet i tabellen mer komplett. ~ Dodde (diskussion) 8 maj 2018 kl. 01.06 (CEST)[svara]

Sök och språk

När jag söker utan att finna, t.ex. Special:Sök/войти, så kunde det vara användbart att lätt kunna göra om samma sökning på några andra språk, främst kanske engelska Wiktionary. Söksidan på franska och tyska Wiktionary har språklänkar i vänstermarginalen. Allt länkarna gör är att länka till xx:Special:Search/yyy för några vanliga språk xx och samma sökuttryck yyy. Kan vi få det infört här också? --LA2 (diskussion) 5 maj 2018 kl. 12.29 (CEST)[svara]

@Skalman, något du vet hur man gör? ~ Dodde (diskussion) 6 maj 2018 kl. 16.29 (CEST)[svara]

Ja, det skulle vara ganska lätt att göra. Jag har inte tid att titta på det, och kommer kanske inte ha det på ett par veckor. Om jag inte har lagt in det innan 23 maj, så får nån gärna påminna mig. //Skal 6 maj 2018 kl. 20.59 (CEST)[svara]

Påminner @Skalman. --LA2 (diskussion) 23 maj 2018 kl. 22.21 (CEST)[svara]

@LA2: Jag har lagt till samma funktion på MediaWiki:Searchmenu-new. Det funkar när man söker på "normala" termer, men inte om man använder specialfunktioner i sökningen. Räcker detta? //Skal 26 maj 2018 kl. 23.17 (CEST)[svara]

Fungerar utmärkt för mig. Tack! --LA2 (diskussion) 28 maj 2018 kl. 19.36 (CEST)[svara]

AdvancedSearch

Från och med 8 maj kommer Avancerat Sök att finnas som en betafunktion på din wiki. Funktionen förbättrar söksidan genom ett formulär med avancerade parametrar, och den siktar på att göra befintliga sökval mer synliga och lättare att nå för alla. Avancerat Sök är ett projekt med ursprung från WMDE:s tekniska önskelista. Alla är välkomna att pröva funktionen, och vi hoppas att den kommer väl till användning i ditt arbete!

Birgit Müller (WMDE) 7 maj 2018 kl. 16.53 (CEST)[svara]

Lexicographical data is now available on Wikidata

Hello,

Sorry for writing in English. Feel free to translate the content of this message below.

After several years discussing about it, and one year of development and discussion with the communities, the development team of Wikimedia Germany has now released the first version of lexicographical data support on Wikidata.

Since the start of Wikidata in 2012, the multilingual knowledge base was mainly focused on concepts: Q-items are related to a thing or an idea, not to the word describing it. Starting now, Wikidata stores a new type of data: words, phrases and sentences, in many languages, described in many languages. This information will be stored in new types of entities, called Lexemes, Forms and Senses.

The goal of lexicographical data on Wikidata is to provide a structured and machine-readable way to describe words and phrases in multiple languages, stored in a same place, reusable under CC-0. In the near future, this data will be available for Wiktionaries and other projects to reuse, as much as you want to.

For now, we’re at the first steps of this project: the new data structure has been released on Wikidata, and we’re looking for people to try it, and give us feedback on what is working or not. Participating to this project is the opportunity for you to have a voice in it, to make sure that your needs and requests are taken in account very early in the process, and to start populating Wikidata with words in your language!

Here’s how you can try lexicographical data on Wikidata:

First of all, if you’re not familiar with the data model, I encourage you to have a look at the documentation page. If you’re not familiar with Wikidata at all, I suggest this page as a start point.
You can also look at the Lexemes that already exists (search features will be improved in the future).
When you feel ready to create a word, go on d:Special:NewLexeme.
If some properties that you need are missing, you can suggest them on this page (if you’re not sure how to do it, just let a message on the talk page and someone will help you).
The main discussion page is d:Wikidata:Lexicographical data. Here, you can ask for help, suggest ways to organize the data, but also leave feedback: if you encounter any bug or issue, let us know. We’re looking especially to know what are the most important features for you to be worked on next.

In any case, feel free to contact me if you have a question or problem, I’ll be very happy to help.

Cheers, Lea Lacroix (WMDE) 23 maj 2018 kl. 14.20 (CEST)[svara]

Som framgår av det ovanstående, har arbetet kommit igång med att lägga in lexikala data i Wikidata. Jag är skeptisk till att detta är rätt väg att gå, men det kan ju ändå vara intressant att hålla ett öga på. Det finns en diskussion på d:Wikidata talk:Lexicographical data och man har nu bland annat skapat objekt för månadernas namn (diskussion) på några olika språk, t.ex. d:Lexeme:L8460 som är februari på svenska och d:Lexeme:L8232 som är februar på danska, båda skapade den 31 juli. Danska objektet har dessutom en genitivform (februars) och en källhänvisning till DDO, tack vare Finn Årup Nielsen, men sådana finesser saknas på det svenska uppslaget. Om jag förstår saken rätt, håller man nu på att handsnickra, för att senare kunna massimportera från böjningsmallar i vanliga Wiktionary. Jag för min del arbetar vidare med böjningsmallar, så att de i framtiden ska ha något att massimportera ifrån. Hur lexikala wikidata ska användas efter massimporten, återstår att se. --LA2 (diskussion) 4 augusti 2018 kl. 01.36 (CEST)[svara]

SDO

En nyhet är att "Svensk-dansk ordbog" med 57.000 ord nu finns gratis tillgänglig på https://sdo.dsl.dk/ --LA2 (diskussion) 8 juni 2018 kl. 02.49 (CEST)[svara]

Vadbegåelse ("vadslagning" vs "vadhållning")

Finns det någon skillnad mellan vadslagning (vanligare) och vadhållning (mindre vanligt) eller ska de betraktas som perfekta synonymer? Taylor 49 (diskussion) 27 juni 2018 kl. 14.23 (CEST)[svara]

Det verkar finnas nyansskillnader [13] ~ Dodde (diskussion) 27 juni 2018 kl. 21.42 (CEST)[svara]

Global preferences are available

Du kan nu ställa in globala inställningar på din nya globala inställningar-sida. Kolla på mediawiki.org för mer information om hur att använda dem och för att lämna återkoppling. /Keegan (WMF) (talk)

10 juli 2018 kl. 21.20 (CEST)

Tematisk

Jag vill bara lämna ett betänkande att ordboksbeståndet, till exempel svenska ord, behöver mer teman (fler nya kategorier), däri ligger ett av Wiktionarys stora möjligheter och styrkor. Sätt gärna upp ett samarbete där. --Vannucci (diskussion) 12 juli 2018 kl. 12.28 (CEST)[svara]

Vilka kategorier tycker du saknas? Det är rätt lätt att avgöra vad som är sport (64 underkategorier, många hundra sidor), och frestande (men kanske skadligt) att finkategorisera olika sporter, medan man lätt glömmer bort kategorin för känslor (2 underkategorier, 14 sidor). I möjligaste mån, tycker jag att våra kategorier bör följa dem som finns på andra språk. --LA2 (diskussion) 13 juli 2018 kl. 23.40 (CEST)[svara]

Hur mäts projektets hälsa?

Är projektet "svenska Wiktionary" friskt eller sjukt? Går det att mäta? Vad fungerar bra och vad kunde bli bättre? Detta är temat för en pågående kampanj, där de bästa svaren eller idéerna belönas med stipendier för att förverkliga idén. Jag menar att vi har bra teknik och samarbetsanda, och att vi kan ta emot många fler bidragslämnare utan att riskera att skrämma bort dem. Men rätt få personer ansluter sig, så kanske gör vi något fel? Kanske är vårt projekt bäst för en typ av språknördar, som det finns alltför få av, och projektet skulle må bättre av att anpassa sig till någon typ av människor som det finns fler av? Eller vad tror ni? --LA2 (diskussion) 29 juli 2018 kl. 19.37 (CEST)[svara]