⊕ Датасет · slm-data-v2 · v2.0
sciLibRuModal v2
Обучающий корпус для модели SciLibModal: математические объекты Mathlib в пяти модальностях (EN, RU, Lean4, LaTeX, изображение) с привязкой к онтологии SciLib.
sciLibRuModal v2 — мультимодальный обучающий корпус, использовавшийся для тренировки модели SciLibModal. Каждая запись — научный объект Mathlib в пяти согласованных модальностях; все модальности привязаны к одной интерпретационной сущности через идентификаторы онтологии SciLib.
Состав записи: формулировка на двух языках (EN — из Mathlib, RU — переводы лаборатории и автоматический перевод с пост-проверкой), Lean-сигнатура и тело определения, LaTeX-представление (где сгенерировано), изображение формулы (где доступно). Все модальности — части одного семантического объекта.
Доступ: по запросу через info@scilibai.ru (с указанием авторов).