sciLibRuModal v2 · обучающий корпус SciLibModal · SciLib

⊕ Датасет · slm-data-v2 · v2.0

sciLibRuModal v2

Обучающий корпус для модели SciLibModal: математические объекты Mathlib в пяти модальностях (EN, RU, Lean4, LaTeX, изображение) с привязкой к онтологии SciLib.

sciLibRuModal v2 — мультимодальный обучающий корпус, использовавшийся для тренировки модели SciLibModal. Каждая запись — научный объект Mathlib в пяти согласованных модальностях; все модальности привязаны к одной интерпретационной сущности через идентификаторы онтологии SciLib.

Состав записи: формулировка на двух языках (EN — из Mathlib, RU — переводы лаборатории и автоматический перевод с пост-проверкой), Lean-сигнатура и тело определения, LaTeX-представление (где сгенерировано), изображение формулы (где доступно). Все модальности — части одного семантического объекта.

Доступ: по запросу через info@scilibai.ru (с указанием авторов).

Теги: dataset, multimodal, math, lean, latex, image

← К каталогу