Das Textkorpus beinhaltet ausgewählte repräsentative Texte in verschiedenen ob-ugrischen Dialekten: Nordmansisch, Ostmansisch und Westmansisch (Pelym-Mansisch, Nordvagilsk-Mansisch, Mittel-Lozva-Mansisch), Kazym-Chantisch, Surgut-Chantisch und dessen Subdialekt Jugan-Chantisch.
Die Texte stammen aus unterschiedlichen Quellen, z.B. beinhandelt es bereits publizierte Texten in verschiedenen Versionen, Transkriptionen, mit verschiedenen Übersetzungen – vor allem solche Texte, die bislang in Europa nahezu unzugänglich waren. Andererseits besteht das Textkorpus aus unveröffentlichten Texten aus Archiven und Feldforschungsaufnahmen von Projektmitgliedern. Somit werden einerseits wichtige ältere Publikationen, wie z.B. die von Munkácsi, Kálmán, Kannisto und Liimola für das Mansische und die von Paasonen und Rédei für das Chantische, aufgearbeitet, andererseits werden die Feldforschungsarchive von Chernetsov (aus den 1930er Jahren für Mansisch) und unsere eigenen Materialien bearbeitet und analysiert.
Alle Texte werden in einer standardisierten Transkription (IPA) dargestellt, mit Glossierungen, die unseren eigenen Glossierungskonventionen (FLEx Preliminaries und Glossing Rules, FLEx Template OUDB) entsprechen, sowie mit Übersetzungen ins Englische versehen, was die Hauptaufgabe der beiden Projekte OUL und OUDB darstellt. Die Texte, die während des Projekts OUL bearbeitet wurden, verfügen größtenteils bereits über eine russische und eine deutsche Übersetzung, die entweder bereits in den Textquellen vorhanden waren oder von den Projektmitgliedern erstellt wurden. Wenn ungarische Übersetzungen verfügbar waren, wurden auch diese hier aufgenommen. Informationen dazu sind in den Metadaten der einzelnen Texte zu finden. Einige Texte verfügen außerdem über eine zusätzliche Analyse der funktionellen, semantischen und pragmatischen Rollen (weitere Informationen dazu finden Sie unter Annotation). Wenn möglich, werden auch Audioaufnahmen zur Verfügung gestellt.
Der Inhalt des Korpus ist über die Überblicksseite mit der Suchmaske (hier) zugänglich. Zusätzlich gibt es einige voreingestellte Suchtemplates sowohl für beide Sprachen als auch für jeden (Sub-)Dialekt. Die Korpora der einzelnen Dialekte kann man auch über das Menüband links direkt anwählen. Jedes Subkorpus ist mit einer kurzen Beschreibung zu Quellen und Bearbeitung versehen. Jeder Text öffnet sich in einem neuen Tab, das alle relevanten Metadaten enthält, dazu gehört auch eine automatisch generierte Quellenangabe, die zur Zitierung angegeben werden kann.
Die Symbolleiste zeigt an, welche Analysen (z.B. glossierter Text, Annotation oder Audio) für die jeweiligen Texte verfügbar sind, danach kann die Auswahl auch gefiltert werden. Wählt man einen Text aus, lassen sich in der oberen Zeile verschiedene Anzeigemöglichkeiten (z.b. Metadaten, nur Übersetzung, Audiodaten) auswählen. Über den Knopf "Glossierter Text" gelangt man auch zur Exportfunktion. Über jedem Satz befindet sich ein entsprechender Knopf, der den jeweiligen Satz in verschiedenen Formaten in einem externen Fenster zum Export anzeigt. Der Knopf export mode zu Beginn des Textes bietet die Möglichkeit, den gesamten Text zu exportieren. Hier kann ebenfalls ausgewählt werden, ob die Annotation (mit dem Knopf Synpra Layer zugeschaltet) oder die Audiodaten mit angezeigt und/oder exportiert werden sollen.
Die Glossen wiederum sind mit der Konkordanz verlinkt, sodass man direkt aus einem Text über eine bestimmte Glosse zum Lexikon gelangen kann.