Jump to content

Wikifunctions:Status-Updates/2025-02-19

From Wikifunctions
This page is a translated version of the page Wikifunctions:Status updates/2025-02-19 and the translation is 100% complete.
Wikifunctions Status-Updates Translate

Abstrakte Wikipedia über Mailingliste Support-Team Abstrakte Wikipedia auf IRC Wikifunctions auf Telegram Wikifunctions auf Mastodon Wikifunctions auf Twitter Wikifunctions auf Facebook Wikifunctions auf Youtube Website von Wikifunctions Translate

Ein Vorschlag für Typen je Sprache und Wortart

Wir haben einen Vorschlag für Typen zur Darstellung einer Wortart in einer Sprache geschrieben, z. B. einen Typ für englische Nomen, einen Typ für englische Adjektive, für polnische Nomen etc.

Obwohl viele dieser Wortarten in verschiedenen Sprachen sehr unterschiedlich sind, weisen sie gewisse Gemeinsamkeiten auf. Wir schlagen ein Muster für diese Typen vor, das einen “Tabellen”-Typ und eine “Vereinigen”-Funktion verwendet, die bei vielen Vereinbarungsaufgaben in vielen verschiedenen Sprachen hilfreich sein kann.

Basierend auf der Beobachtung früherer Systeme zur Generierung natürlicher Sprache, wie beispielsweise Grammatical Framework, haben wir diesen Vorschlag entwickelt. Dieser Vorschlag berührt noch nicht die große Frage, wie abstrakte Inhalte dargestellt werden können, sondern nur die Frage, wie Sätze aus lexikografischen Einträgen in Wikidata bequemer erstellt werden können. In den letzten Wochen und Monaten haben wir gesehen, wie einige Funktionen zum Konstruieren von Phrasen und Sätzen erstellt wurden. Wir haben einige Herausforderungen festgestellt und versuchen, diese mit dem vorliegenden Vorschlag zu bewältigen.

Wir haben den Typ auch beim NLG-SIG-Treffen besprochen (eine Aufzeichnung findest du unten) und die Diskussionen im Wiki haben bereits begonnen.

Aufzeichnung des NLG-SIG-Treffens vom 18. Februar

Diesen Dienstag hatten wir unser erstes öffentliches Treffen der Natural Language Generation Special Interest Group. Eine Aufzeichnung des Treffens ist auf Wikimedia Commons verfügbar. Eine Wiki-Seite für die NLG SIG wurde erstellt und die Tagesordnungspunkte für das Treffen im nächsten Monat können dort bereits gesammelt werden.

Letzte Änderungen an der Software

Diese Woche wurden einige größere Änderungen vorgenommen, allerdings sind nicht alle sofort verfügbar.

Im Rahmen unserer Arbeit in diesem Quartal zur Erweiterung der Wikidata-Nutzung fügen wir die neue vordefinierte Funktion Z6830 und ihre integrierte Implementierung Z6930 hinzu, um die mit einem Datenobjekt verbundenen Lexeme abzurufen (T383631). Wir erweitern auch die Definition von Z6002, um ein umfassenderes Abrufen von Wikidata-Eigenschaften zu ermöglichen (T383636), und stellen neue Front-End-UX-Komponenten zum Referenzieren, Abrufen und Anzeigen dieser Eigenschaften bereit (T383643).

Im Bereich der Integration von Wikifunctions-Aufrufe in Wikipedias haben wir die wichtigsten Basisfunktionen auf der PHP-Seite implementiert (T272516). Diese befinden sich hinter einer Funktionsmarkierung und sind daher noch nicht für Tests in der Produktion verfügbar. Bisher umfasst dies das Auslösen der entsprechenden Anzeigefunktion für die Antwort, damit diese im Inhalt angezeigt werden kann (T362252), die entsprechenden Lesefunktionen für die Eingaben, damit diese von Text in Objekte umgewandelt werden können (T368604), das Zwischenspeichern jedes Aufrufergebnisses in einem clusterweiten System, um die Geschwindigkeit zu verbessern und die Belastung zu verringern (T362256), und den Beginn des wikiübergreifenden Benachrichtigungscodes, der sicherstellt, dass der Inhalt aktualisiert wird, wenn sich die Funktion oder der Wikidata-Inhalt ändert, und Einträge in die Seiten für die Letzten Änderungen und die Beobachtungsliste in Client-Wikis einfügt werden, wie es für Wikidata der Fall ist (T383156). Wir stehen auch kurz vor der Fertigstellung der Basisintegration mit Wikitext und den visuellen Editoren (T373118), was es uns ermöglichen wird, mit der Einbettung des vollständigen Wikifunctions-Erlebnisses für Benutzer zu experimentieren. Die PHP-Version des Fehlersystems kann nun aufgefordert werden, Nachrichten in einer beliebigen Sprache auszugeben, statt nur in Englisch (T362236), was verwendet wird, um Fehler anzuzeigen, wenn auf der Leserseite etwas schief geht.

Wir haben diese Woche ein paar kleinere für Benutzer sichtbare Probleme behoben. Wir haben den 'Sprachen'-Dialog, der über das Info-Feld ausgelöst wird, optimiert, um die Sprachen basierend auf der lokalen Sprache des Benutzers zu sortieren (T355951). Wir haben einige Fehler behoben, die bei der Verwendung der neuen Codex-Komponente für die Tabelle mit den Implementierungen und Tests für Funktionen entdeckt wurden – vielen Dank für die Hilfe der Community, die einige dieser Fehler entdeckt hat!

Für Entwicklungszwecke haben wir ein neues, nur Mitarbeitern vorbehaltenes Recht hinzugefügt, um die Zwischenspeicherung der Ergebnisse zu umgehen (T379432). Wir haben die MediaWiki-Registrierung unseres Codes neu geschrieben, sodass sie jetzt genau angibt, welche Codex-Komponenten wir verwenden, sodass wir eine benutzerdefinierte Version statt der gesamten Bibliothek erhalten (T372799). Dadurch werden die an jeden Benutzer von Wikifunctions.org gesendeten Bytes reduziert, was unserer Hoffnung nach die Leistung bei der Verwendung der Seite verbessern könnte. Wir haben die Front-End-Codebasis neu erstellt, um die Pinia-Statusverwaltungsbibliothek anstelle von Vuex zu verwenden, das veraltet ist (T318630), und Dateien und require()-Aussagen entsprechend konsolidiert und umbenannt. Wir haben den Testcode neu organisiert, um mit der Aufteilung der Tests für den 'Repo-Modus', d. h. für Wikifunctions.org, und die für den 'Client-Modus', wie beispielsweise Wikipedias, zu beginnen.

GitHub-Video zur Einführung in die Abstrakte Wikipedia und Wikifunctions von Danny Thompson

Letzte Woche lud GitHub Danny Thompson, den CTO von this.dot, zu einem Gespräch in ihrer Reihe Open Source und KI ein. Er gab eine großartige Erklärung, worum es bei der Abstrakten Wikipedia und Wikifunctions geht, und wir empfehlen dir, dir das Video anzusehen, das auf YouTube und Twitch verfügbar ist:

Einladung zu einem hybriden Vortrag von Denny Vrandečić in London

Am Montag, den 10. März 2025, wird Denny Vrandečić am King’s College London zum Thema Wissen im Zeitalter der KI sprechen. Wikidata und Wikifunctions werden Themen dieses Vortrags sein. Die Veranstaltung wird hybrid sein. Du kannst entweder online oder vor Ort in London teilnehmen. Wenn du teilnehmen möchtest, ist eine kostenlose Registrierung über Eventbrite erforderlich. Der Vortrag wird aufgezeichnet.

Funktion der Woche: Zeichenkette geordneter Ziffern aus Sprache

Die Funktion der Woche ist eine Kolumne, die von der Community geschrieben wird. Der Eintrag dieser Woche wurde von 99of9 geschrieben, Bearbeitungen wurden von Feeglgeef und GrounderUK vorgenommen. Die Planung der Kolumne und die Einreichung von Beiträgen sind hier möglich.

Diese Woche diskutieren wir: Zeichenkette geordneter Ziffern aus Sprache.

Die Funktion nimmt eine Eingabe, eine natürliche Sprache, und gibt eine Zeichenkette der Länge 10 mit allen Ziffern der Zahlen dieser Sprache zurück. So haben beispielsweise Sprachen mit westlichen arabischen Ziffern die Ziffern "0123456789". Auf den ersten Blick scheint dies eine seltsame Funktion zu sein. Wenn du bereits eine Sprache sprichst, kennst du diese Ziffern bereits, und wenn du keine Sprache sprichst, erhältst du nur eine Information in einer fest codierten, unflexiblen Zeichenkette. Aber für ein mehrsprachiges Projekt wie unseres erweist es sich als so nützliche Hilfsfunktion, dass wir sie derzeit indirekt jedes Mal verwenden, wenn wir die Lesefunktionen für eine natürliche Zahl oder Gleitkommazahl in Wikifunctions verwenden.

Bisher ist nur eine Implementierung verfügbar, eine Python-Suche. Sie prüft im Wesentlichen nur, ob die Eingabe eine Sprache mit einer bekannten Antwort ist, und gibt, wenn ja, direkt die Zeichenkette für diese Sprache zurück. Andernfalls wird standardmäßig "0123456789" zurückgegeben. Diese Implementierung kann nie vollständig abgeschlossen werden, ist aber selbst in ihrer aktuellen Form sehr nützlich. Sie kann verbessert werden, indem zusätzliche Dezimalskripte hinzugefügt werden oder indem eine vorhandene Zeichenkette auf einen anderen Dialekt angewendet wird, der eines der vorhandenen Skripte verwendet. Unter Indische Zahlschrift sind etwa 20 weitere Skripte aufgeführt. Zögere also nicht, eines hinzuzufügen. Eine JavaScript-Implementierung wäre hier ebenfalls leicht umzusetzen und könnte einen kleinen Effizienzgewinn bringen, der angesichts der Häufigkeit, mit der diese Funktion aufgerufen wird, nützlich sein könnte.

16 Tests sind verfügbar. Ist sprachliche Vielfalt nicht schön? Kannst du Muster erkennen?

Diese Tests wiederholen einfach alle Zeichenketten, die bisher in der Python-Implementierung dargestellt wurden. Es handelt sich also nicht um besonders strenge Tests der Fälle, die die Funktion nicht abdeckt, sondern sie dienen eher dazu, ihre aktuellen Fähigkeiten aufzuzeigen. Füge gerne Tests anderer Sprachen oder Dialekte hinzu, die du kennst.

Natürliche Zahlen addieren zeigt "৯৯" (99) plus "৪২" (42) in Bengalisch an

Was ist der Sinn dieser Funktion? In Skripten, die ein dezimales Zahlensystem und Positionsnotation verwenden, ist die Struktur der Zahlen so gut definiert, dass selbst wenn du die Sprache nicht lesen kannst, die Kenntnis der Dezimalstellen ausreicht, um zu folgern, welche Zahl eine Ziffernfolge darstellt. Dies wird zu unserem Vorteil in drei Kompositionen genutzt, die diese Funktion aufrufen: ein generischer Leser für natürliche Zahlen, ein generischer Float64-Leser und ein konfigurierbarer Float64-Leser, der sie verwendet, um Ziffern vorzuverarbeiten, bevor eine sprachspezifische Konfigurationsfunktion verwendet wird. Obwohl wir nur eine skriptspezifische Funktion zum Lesen von Zahlen haben, natürliche Zahlen auf Malayam lesen, bieten diese allgemeinen Kompositionen einen alternativen, breiteren generischen Ansatz, der es uns ermöglicht, Zahlen in einer viel größeren Bandbreite von Skripten zu lesen (siehe die Abbildung für ein Beispiel zum Addieren natürlicher Zahlen mit einer bengalischen Oberflächensprache). Obwohl sie noch nicht implementiert ist, können wir diese Funktion auch in ähnlichen Kompositionen für Anzeigefunktionen verwenden, um in diesen Skripten numerische Ausgaben anzuzeigen.

Bitte denke darüber nach, dieser Funktion eine einzige zusätzliche Codezeile hinzuzufügen, um ein komplettes zusätzliches Zahlensystem in Wikifunctions zu unterstützen!

Wöchentliche neue Funktionen

Hier ist eine Liste der neuen Funktionen mit verbundenen Implementierungen und bestandenen Tests, die seit letzter Woche erstellt wurden. Es gibt viele neue Funktionen zu feiern!

Wir sehen eine große Vielfalt an Funktionen – und es gab noch mehr, die es nicht auf die Liste geschafft haben, weil sie keine Tests oder Implementierungen haben. Eine umfassende Liste aller Funktionen, sortiert nach Erstellungsdatum, findet sich im Wiki.