Unser Ziel ist es, die Art und Weise, wie SIE Dokumente benutzen, um zu verstehen, wer SIE sind, und wer ANDERE sind, völlig zu verändern.

  • WER WIR SIND
    Wir sind ein Ingenieurbüro mit dem Arbeitsgebiet TextAnalytics. Für unsere Arbeit benutzen wir technische Dokumente, um komplexe Zusammenhänge sichtbar zu machen
    WARUM
    Ergebnisse werden nachvollziehbar
    ERGÄNZUNG
    Als Ergänzung oder Ersatz eines Brainstormings
  • Was wir tun
    Wir betreiben Explorative Dokumentanalyse (Mustererkennung und maschinelles Lernen), um das zu finden, was Sie sich durch klassisches Lesen sonst mühsam erarbeiten müssten.
    90 Millionen
    Werkstoffnamen finden wir ebenso wie Reaktionsgleichungen, Formeln, Herstellungsverfahren oder Normen
    90 Mess
    größen in ca. 3000 Schreibweisen können wir erkennen und ineinander umwandeln.
  • WIR LIEFERN ANTWORTEN
    Anstatt Experten zu befragen, die Sie zuerst suchen müssten, liefern wir Antworten aus Dokumenten, die von Experten weltweit verfasst worden sind.
    80 %
    geringerer Zeitaufwand
    200 %
    und mehr Steigerung der Ergebnissqualität
  • MASCHINELLES LESEN
    Wir haben Zugriff auf Millionen von Dokumenten mir regelmässigem Update des Datenbestands.
    450
    Millionen Dokumente
    UPDATES
    jede Woche

sipoc extractor672x357

Der SIPOC-Extraktor liest Paper, erkennt Stoffe, Prozesse und Eigenschaften und fügt sie zu einem durchsuchbaren Wissensgraphen zusammen. Aus Fragmenten Prozesse synthetisieren — die Kernidee in einem Wort.

Kulmbach, im März 2026. SIPOC steht für Supplier — Input — Process — Output — Customer und ist eigentlich ein Schema aus dem Qualitätsmanagement, mit dem Geschäftsprozesse beschrieben werden. Numberland hat es auf die Materialwissenschaft übertragen: ein keramischer Sintervorgang ist auch ein Prozess mit Vorlieferanten (Pulver, Binder, Atmosphärengasen), Inputs (Grünkörper, Sinterprofil), Outputs (Sinterkörper, Schwund, Gefüge) und Abnehmern (Polung, Bauteilintegration). Was im Maschinenbau funktioniert, funktioniert auch im Labor - und macht das, was sonst in Freitext schwimmt, maschinenlesbar.

Der SIPOC-Extraktor ist die Pipeline, die diese Übersetzung automatisch leistet. Eingang: wissenschaftliche Fachartikel als PDF. Ausgang:
strukturierte RDF-Tripel im OCO*-Wissensgraphen. Dazwischen vier Verarbeitungsstufen. Die Struktur des PDFs (Titel,
Autoren, Abschnitte, Tabellen) extrahieren, mit Named Entity Recognition Stoffe, Methoden und Eigenschaftsangaben erkennen, mit regelbasierter Normalisierung Synonyme, Einheiten und Schreibweisen abgleichen. Eine Ontologie-Tagging-Schicht ordnet jedes erkannte Element der passenden OCO*-Klasse zu. Am Ende steht eine maschinenlesbare Repräsentation dessen, was im Paper steht.

Die Pipeline läuft täglich, neue Inhalte fließen automatisch in den Wissensgraphen ein. Was daraus entsteht, ist nicht nur eine Datenbank - es ist ein Korpus, aus dem sich Strukturen ableiten lassen, die im einzelnen Paper nicht sichtbar sind. Welche Sintertemperaturen
werden für welche Komposition bevorzugt? Welche Methoden korrelieren mit welchen Ergebnissen? Welche Forschergruppen arbeiten an welchen Themen?

Die Synthese funktioniert nur, weil sie eine semantische Grundlage hat. Ohne OCO* als Klassifizierungs-Skelett wäre das Resultat eine
Schlagwortwolke. Mit OCO* als Ankerpunkt entstehen abfragbare Beziehungen. Genau das macht die Pipeline zum Vorbild dafür, was synthetisches Datenwerk in der Materialwissenschaft leisten könnte — wenn es flächendeckend betrieben wird.

„Wir behandeln Fachartikel wie Bauklötze, aus denen wir einen Wissensgraphen synthetisieren. Jeder Klotz für sich ist ein Paper, das
ein Mensch gelesen hat. Aber tausend Klötze zusammen sind etwas Neues - eine Struktur, die kein Mensch im Kopf haben kann. Genau hier setzt der Wert an." - Dr. Wolfgang Grond, Inhaber Numberland

*OCO: Ontocrafter Ceramics Ontology - ein im Rahmen von MaterialDigital3 entwickelter Bausatz für Material Science Ontologien

Zahlen, Daten, Fakten

  • SIPOC-Pipeline: 4 Stufen (Struktur, NER, Normalisierung, Ontologie-Tagging)
  • Semantische Grundlage: OCO mit 5200 Klassen, 1700 Properties und 168000 Axiomen als Klassifizierungs-Skelett
  • Anwendungsfälle: Trendanalysen, Lückenidentifikation, automatische Lab-Notebook-Vorschläge, Material-Vergleichs-Queries
EXPLORE
Forschungseinrichtung: finden von Werkstoffnamen
(Werkstoffe für die thermische Energiespeicherung).
NAVIGATE
Forschungseinrichtung: finden von Märkten,
auf denen Werkstoffe aus Metallschaum gebraucht werden.
IDEATE
Unternehmen: finden von Möglichkeiten, um den
Abfüllvorgang einer hochviskosen Flüssigkeit zu beschleunigen.
EXPLORE
Kommune mit > 500.000 Einwohnern: finden von regionalen
IT-Unternehmen und clustern der Interessen
REMEMBER
Unternehmen: automatisches Verschlagworten
von Dokumenten im Intranet
COMPARE
Unternehmen: Vergleich des internen Wissens
mit dem Wissen von Wettbewerbern.
LOCATE
EU-Projekt einer Landesentwicklungsgesellschaft:
Verfahren, um Regionen mit gleichen Kenntnissen und
Interessen sichtbar zu machen.
EXPLORE
IHK: finden von regionalen Automobilzulieferern
und clustern der Interessen
BLEND
Hochschule: finden von passenden Partnern
für ein EU-Entwicklungsvorhaben.
CHANGE
Unternehmen: Innovationsaudit zur Ausrichtung
der Unternehmensstrategie auf Megatrends.
REMEMBER
Ablagesystem für studentische Abschlussarbeiten
Combine
Expansion und / oder Marktanpassung im Verlauf einer Unternehmensnachfolge