Wikifunctions:Status-Updates/2025-02-26
| ◀ | ▶ |
Von Dingen zu Worten

In den letzten Wochen haben wir einen unserer wichtigsten Meilensteine für dieses Quartal bereitgestellt und getestet: die Möglichkeit, für ein Wikidata-Datenobjekt das richtige Lexem zu erhalten oder, einfacher ausgedrückt, für eine Sache das richtige Wort zu erhalten.
Lexeme in Wikidata vereinen die verschiedenen Aspekte eines Wortes: Formen (wobei die richtige auf Grundlage der Grammatik der Sprache ausgewählt wird) und Sinne (die standardisierten Bedeutungen, auf die sich ein Lexem bezieht). Im Englischen wären die Formen eines Lexems wie rose rose, roses, rose’s etc. und die aktuellen drei Sinne beziehen sich auf die Blume, das biologische Taxon und die Farbe.
Sinne in Wikidata-Lexemen können auf viele verschiedene Arten dargestellt werden. Für die Zwecke von Wikifunctions ist eine wichtige Möglichkeit, Sinne zu strukturieren, sie mit Wikidata-Datenobjekten zu verbinden. Beispielsweise hat das englische Nomen water drei Sinne, von denen zwei mit Wikidata-Datenobjekten verbunden sind, unter anderem mit dem Datenobjekt für Wasser. Die erste Verbindung ist mit dem englischen Nomen (einem Lexem) und die zweite mit der Flüssigkeit (einem Datenobjekt). In vielen Fällen wie diesem verbindet ein Sinn ein Lexem mit einem Datenobjekt.
Es gibt eine Reihe nützlicher Eigenschaften, die einen Sinn mit einem Datenobjekt verbinden. Dazu gehören:
- insbesondere Objekt für diesen Sinn, was in Wikidata am häufigsten ein Nomen mit einem Ding oder einer Klasse von Dingen verbindet;
- Prädikat für, was ein Verb mit einer Handlung oder einem Ereignis verbindet; und
- Demonym zu, was ein Nomen oder Adjektiv mit einem Ort verbindet und die Menschen und Dinge beschreibt, die an diesem Ort leben oder von dort stammen.
Dies ermöglicht es uns zum ersten Mal in Wikifunctions, einen sprachunabhängigen Wert zu verwenden und die in einer bestimmten Sprache zu verwendenden Wörter zu finden. Das Bildschirmfoto zeigt die Verwendung der neuen integrierten Funktion Finde Lexeme für ein Wikidata-Datenobjekt, die zum Nachschlagen des Hausa-Nomens ruwa verwendet wird, das Wasser bedeutet.
Die Community hat diese neue Funktionalität schnell aufgegriffen und ein leistungsstarkes Beispiel dafür erstellt, wie man mit Wikifunctions sprachunabhängig eine ganze indefinite Nominalphrase erstellen kann. Mehr zu dieser Funktion kannst du weiter unten lesen, wo sie als aktuelle Funktion der Woche hervorgehoben wird.
Freiwilligentreffen am 3. März
Nächste Woche, am Montag, 3. März 2025, um 19:30 MEZ, findet unser monatliches Freiwilligentreffen statt. Sofern es nicht viele Fragen gibt, werden wir unserer üblichen Agenda folgen, Neuigkeiten zu den bevorstehenden Plänen und jüngsten Aktivitäten mitteilen, viel Zeit und Raum für deine Fragen haben und gemeinsam eine Funktion erstellen. Wir freuen uns darauf, dich am Montag online zu treffen!
Letzte Änderungen an der Software
Neben der oben besprochenen Wikidata-Arbeit haben wir uns auch auf die anderen großen Arbeiten des Quartals konzentriert.
Wir haben mehr an der Integration von Wikifunctions in MediaWiki gearbeitet, die es Benutzern nach der Veröffentlichung ermöglichen wird, Funktionsaufrufe in Wikitext einzubetten (T383106). Dies umfasst eine Reihe von Fehlerbehebungen, Vereinfachungen und Codeverbesserungen sowie Tests des kürzlich veröffentlichten Stacks, den wir letzte Woche erwähnt haben. Wir haben auch intensiv an Experimenten gearbeitet (T386791), um herauszufinden, wie wir am besten ein vernünftiges Front-End im Wikitext-Editor und im visuelle Editor in jedem Client-Wiki bereitstellen können, ohne Benutzer zu überfordern, die nicht unbedingt Erfahrung mit der Funktionsweise von Wikifunctions haben (T373118).
Wir haben eine Zugänglichkeitsverbesserung von User:Abbe98 akzeptiert, die die Schaltfläche für Details zur Ausführung über die Tastatur zugänglich macht. Dies wurde im November eingereicht, ist aber übersehen worden. Wir bitten um Entschuldigung! Wir haben diese Woche auch ein paar Verbesserungen der Stilvariablen von User:Taavi umgesetzt, die das Erlebnis im Dark Mode verbessern sollten. Danke!
Wir und der gesamte von Wikimedia bereitgestellte Code verwenden seit dieser Woche die neueste Version der Codex UX-Bibliothek, v1.20.x. Wir sind der Meinung, dass es keine für den Benutzer sichtbaren Änderungen an Wikifunctions geben sollte. Kommentiere daher bitte in der Projektdiskussion oder erstelle einen Phabricator-Task, wenn du ein Problem entdeckst.
Funktion der Woche: Indefinite Nominalphrase
Die Funktion der Woche ist eine Kolumne, die von der Community geschrieben wird. Die Planung der Kolumne und die Einreichung von Beiträgen sind hier möglich. Danke an User:Feeglgeef und User:GrounderUK für das Schreiben und Bearbeiten dieses Beitrags.
Eines der wichtigsten Ziele der Abstrakten Wikipedia ist die Umwandlung der Strukturen von Wikidata-Datenobjekten in Texte. Diese Strukturen werden dann von Autoren erstellt und in Inhalte in vielen Sprachen der Welt umgewandelt, wodurch die Gesamtheit allen menschlichen Wissens für fast alle zugänglich wird.
Letzte Woche sind wir diesem Ziel einen großen Schritt näher gekommen, indem wir finde Lexeme für Wikidata-Datenobjekt erstellt haben, eine vordefinierte Funktion, die von David Martin aus dem Team Abstrakte Wikipedia geschrieben wurde. Vordefinierte Funktionen werden im Back-End-Code für Wikifunctions geschrieben und unterliegen daher nicht den normalen Sandboxing-Anforderungen von Funktionen. Diese Funktion ermöglicht es uns, Wikidata-Datenobjekte zu finden, die mit Lexemen in Zusammenhang stehen, die wir dann zum Erstellen von Text verwenden können.
Die Funktion, auf die wir uns konzentrieren, ist indefinite Nominalphrase, die 2 Wikidata-Datenobjekt-Referenzen annimmt, die ein Nomen und ein Adjektiv darstellen, sowie eine Sprache, nämlich die Sprache, in der die Ausgabe erfolgt. Die Funktion gibt eine Zeichenkette aus, die eine indefinite Nominalphrase im Singular darstellt. Im Deutschen beginnen indefinite Nominalphrasen im Singular mit ein oder eine, wie "eine gelbe Banane" oder "ein Apfel". Diese machen einen großen Teil der deutschen Sätze aus, wobei etwa die Hälfte einen unbestimmten Artikel in irgendeiner Form verwendet. Die Erstellung dieser Funktion markiert einen sehr wichtigen Meilenstein in der Entwicklung der Abstrakten Wikipedia.
Die Funktion hat zwei Implementierungen: eine, die eine andere Funktion verwendet, um die richtige Funktion zum Parsen der Lexeme zu finden, und eine andere, die dies direkter tut.
Die Funktion hat fünf Tests:
- Dass aus einer orangen (Farbe, Q39338) Orange (Frucht, Q13191) im Spanischen "una naranja naranja" wird.
- Dass aus einer schwarzen (Q23445) Hauskatze (Q146) im Französischen "un(e) chat(te) noir(e)" wird (was fehlschlägt)
- Dass aus einer orangen (Farbe, Q39338) Orange (Frucht, Q13191) im Englischen "an orange orange" wird.
- Dass aus einer orangen (Farbe, Q39338) Orange (Frucht, Q13191) im Russischen "апельсин морковный" wird.
- Dass aus einer grünen (Farbe, Q3133) Limette (Frucht, Q13195) im Englischen "a green lime" wird
Es gibt noch einige Mängel an dieser Funktion, die behoben werden müssen. Zeitüberschreitungen sind recht häufig. Ein Teil davon kann auf Seiten der Community gelöst werden, da die Funktion vereinfacht werden kann, um Abhängigkeiten zu verringern, aber auf Seiten des Teams der Abstrakten Wikipedia muss möglicherweise noch etwas Arbeit geleistet werden, um die Leistung in diesem Bereich zu verbessern.
Manchmal kann ein ziemlich wenig hilfreicher Argumentwert-Fehler auftreten, wenn mit dem von dir ausgewählten Wikidata-Datenobjekt kein gültiges Wikidata-Lexem in der richtigen Sprache verknüpft ist. Leider ist dies kein Problem, das derzeit leicht behoben werden kann und von den Beitragenden auf Wikidata viel Arbeit erfordern wird. Dies wird wahrscheinlich ein großes Hindernis sein, wenn wir uns immer weiter der Abstrakten Wikipedia nähern.
Die Funktion kann nur in einigen wenigen Sprachen indefinite Nominalphrasen im Singular erstellen. Um damit richtig zu arbeiten, sind weitere Sprachen erforderlich. Funktionen für weitere Sprachen können durch Bearbeiten von Z21733 hinzugefügt werden. Bitte trage eine Funktion bei und verbinde sie, wenn du kannst!
Einladung zu einem hybriden Vortrag von Denny Vrandečić in London
Am Montag, den 10. März 2025, wird Denny Vrandečić am King’s College London zum Thema Wissen im Zeitalter der KI sprechen. Wikidata und Wikifunctions werden Themen dieses Vortrags sein. Die Veranstaltung wird hybrid sein. Du kannst entweder online oder vor Ort in London teilnehmen. Wenn du teilnehmen möchtest, wird um eine kostenlose Registrierung über Eventbrite gebeten. Der Vortrag wird aufgezeichnet.
Neuigkeiten zu Typen: Unicode-Codepunkt
Der Vorschlag zur Reparatur des Unicode-Codepunkts wurde umgesetzt und Unicode code point (Z86) wurde geändert. Alle relevanten Funktionen wurden aktualisiert oder als veraltet markiert und die Kennzeichnung “nicht verwenden” wurde entfernt. Wir laden dich ein, Funktionen mit dem neuen Typ zu erstellen: Das kann vom Spaß mit Emojis bis zur richtigen Konstruktion von Zeichenketten mithilfe komplexerer Skripte reichen.
Derzeit können nur Mitarbeiter Anzeige- und Lesefunktionen zu Typen hinzufügen. Bei einigen Typen fehlen Anzeige- und Lesefunktionen. Wir möchten dich einladen, an Lese- und Schreibfunktionen für die folgenden fünf Typen mitzuarbeiten, diese vorzuschlagen und sich darauf zu einigen:
- Gregorian calendar date (Z20420): A date in the proleptic Gregorian calendar
- Day of Roman year (Z20342): A day of the month and a month of the Gregorian calendar
- Gregorian year (Z20159): Numbered years according to the proleptic Gregorian calendar
- Byte (Z80): Beschreibung fehlt
- Unicode code point (Z86): A single code point in Unicode
Wöchentliche neue Funktionen: 39 neue Funktionen
Hier ist eine Liste einiger der neuen Funktionen mit verbundenen Implementierungen und bestandenen Tests, die seit letzter Woche erstellt wurden. Diese Woche gibt es eine ganze Reihe neuer Funktionen zu feiern!
- geometric mean of float64 list (Z22596): Beschreibung fehlt
- nth root of float64 (Z22600): Beschreibung fehlt
- multiplicative inverse of float64 (Z22605): Beschreibung fehlt
- harmonic mean of float64 list (Z22610): Beschreibung fehlt
- sort list ascending (float64) (Z22615): Beschreibung fehlt
- Arabic to Church Slavonic numeral (Z22623): Convert a number to Church Slavonic Cyrillic numeral See for a reference: https://school.orthpatr.ru/sites/default/files/sites/default/files/image/TcSYa_C_05.pdf
- Box-Cox transformation of float64 (Z22629): Beschreibung fehlt
- is zero (float64) (Z22636): Beschreibung fehlt
- all grammatical features of lexeme form (Z22638): similar to Z22487 but also inherits and appends any grammatical features of the overall lexeme Z22556
- Arabic numerals to Devanagari numerals (Z22649): Converts any Arabic numerals in string to Devanagari numerals. Reverse at Z22294
- byte as list of Booleans (Z22654): Returns a byte as a list of eight Boolean values
- indefinite noun phrase with adjective (Z22664): returns an indefinite noun phrase combining the adjective and noun in the convention of a chosen language
- list of Booleans to Byte (Z22672): constructs a Byte object from a list of Booleans
- Code point equality (Z22683): tests whether two code-point realisations (as entered) have identical Unicode code-point representations
- Codepoint list to string (Z22693): Converts a list of code points to a string. Reverse at Z22717
- fetch first lexeme from item ref. and lang, P5137 (Z22696): Beschreibung fehlt
- Find lexemes for a Wikidata item (Z6830): Search for lexemes related to the given item by the given property, and return those having the given language
- String to codepoint list (Z22717): Converts a string to a list of codepoints. Reverse at Z22693
- to Scream Cipher (Z22725): Based on xkcd.com/3054 - reverse at Z22728
- from Scream Cipher (Z22728): Based on xkcd.com/3054 - reverse at Z22725
- Italian word starts with a vowel (Z22786): Returns whether an italian word start with a vowel (useful for example to establish which article it requires between "il" and "l'")
- Italian word requires article "lo" (Z22791): Check whether an italian word stars with "impure" s, z, x, pn, ps, gn, sc, semiconsonantic i
Wir sehen eine große Vielfalt an Funktionen – über Mathematik, Linguistik und Byteoperationen – und es gab noch mehr, die es nicht auf die Liste geschafft haben, weil sie keine Tests oder Implementierungen haben. Eine umfassende Liste aller Funktionen, sortiert nach Erstellungsdatum, findet sich im Wiki.