Visual Bank erweitert das „Qlean Dataset“ zur Unterstützung umfassender japanischer Sprach-Basismodelle (Foundation Models): Pressemeldung
Eine Pressemeldung der Visual Bank Inc. am Freitag, 03.04.2026
Uhr
Suche
Bereitstellung von über 100.000 Stunden rechtegeklärtem japanischem Audiomaterial, einschließlich regionaler Dialekte und kulturell kontextbezogener Sprache, die für die Entwicklung kommerzieller KI unerlässlich sind.
TOKIO--(BUSINESS WIRE)--Visual Bank Inc. (CEO: Saneyuki Nagai) hat heute über seine Tochtergesellschaft amanaimages Inc. – einen der größten Anbieter digitaler Ressourcen für die Marketing- und Werbebranche in Japan mit über40-jähriger Geschichte – die Erweiterung seines „Qlean Dataset“ bekannt gegeben, einer Premium-Lösung für KI-Trainingsdaten, die speziell für Entwickler konzipiert wurde, die leistungsstarke japanische Sprachgrundmodelle erstellen.
Eine neue Entwicklung innerhalb des Geschäftsbereichs „Qlean Dataset“, der sich auf die Bereitstellung von Datensätzen für Forschungs- und Entwicklungseinrichtungen konzentriert, deren Rechte für KI-Training und groß angelegte Datenanwendungen geklärt sind, hat das Unternehmen als führenden Anbieter von Dateninfrastruktur für die japanische Sprache positioniert, insbesondere für strukturierte japanische Sprachkorpora, die nach Sprecherkonfiguration und Themenbereich organisiert sind.
Wichtigste Funktionen für KI-Entwickler
**Rechtssichere Daten für die kommerzielle Nutzung** Alle Datensätze sind vollständig für die kommerzielle Nutzung freigegeben und entsprechen globalen Compliance-Standards wie der DSGVO (GDPR) und dem CCPA.
**Audioinhalte in Hi-Fi-Qualität** Aufnahmen mit 48 kHz/16 Bit oder höher erfassen sowohl Sprache in Studioqualität als auch akustische Umgebungen.
**Annotation durch Experten** Transkripte in Originalsprache und strukturierte Metadaten liefern trainingsfähige Datensätze für die KI-Entwicklung.
**Datensätze zu Sicherheit und Moderation** Die Datensätze unterstützen die Erkennung von beleidigenden Äußerungen, einschließlich Hassreden und beleidigender Eingabeaufforderungen.
**Japanische Bewertungsdatensätze** Die Bewertungsdatensätze sind auf internationale Benchmarks wie MMSU abgestimmt, um die Argumentationsfähigkeit und sprachliche Nuancen im Japanischen zu messen.
**Japanspezifische akustische Umgebungen** Japan-spezifische Audiodaten, darunter traditionelle Instrumente, Schreine und städtische Umgebungen, unterstützen multimodale und räumliche KI.
Diese Datensätze sind über „AI Data Recipe“ verfügbar, ein flexibles Angebot, das sowohl gebrauchsfertige Datensätze als auch die Erstellung maßgeschneiderter Daten umfasst, einschließlich Sprecherauswahl, Aufnahme und Annotation, die auf bestimmte Modellarchitekturen und Entwicklungsanforderungen zugeschnitten sind.
„Angesichts der steigenden Nachfrage nach kulturell kontextualisierten Grundmodellen gewinnen hochwertige, rechtskonforme japanische Trainingsdaten zunehmend an Bedeutung“, sagte Saneyuki Nagai, CEO von Visual Bank Inc.„Visual Bank hat es sich zum Ziel gesetzt, durch sorgfältige Datenaufbereitung und -verarbeitung die Lücke zwischen Rohdaten und produktionsreifen KI- Systemen zu schließen.“
AI Data Recipehttps://qleandataset.visual-bank.co.jp/en/lineup
Japanische Sprachkorporahttps://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora
Die Ausgangssprache, in der der Originaltext veröffentlicht wird, ist die offizielle und autorisierte Version. Übersetzungen werden zur besseren Verständigung mitgeliefert. Nur die Sprachversion, die im Original veröffentlicht wurde, ist rechtsgültig. Gleichen Sie deshalb Übersetzungen mit der originalen Sprachversion der Veröffentlichung ab.
Contacts
Anfragen https://qleandataset.visual-bank.co.jp/en/contact
Visual Bank Inc.qlean-dataset@visual-bank.co.jp
+++ Dies ist eine Pressemeldung, übermittelt von Business Wire +++
businesswire/roj/news.de
Erfahren Sie hier mehr über die journalistischen Standards und die Redaktion von news.de.