⊕ Каталог
Датасеты
Открытые датасеты лаборатории: граф знаний над Mathlib, обучающие корпуса для моделей SciLibMath / SciLibModal, полные логи бенчмарков. Большинство — на открытых лицензиях с указанием авторов; обучающие корпуса — по запросу.
SciLibMath dataset v1
Первая версия учебного корпуса (январь 2026): пары формулировок Mathlib для тренировки модели SciLibMath v1. Только английский текст, без Lean-кода и LaTeX.
{# Декоративный фоновый знак — только короткий symbol (один глиф), длинные LaTeX-формулы из artifact.formula не используются: они теснили контент и ломали выравнивание. #}sciLibRuModal v2
Обучающий корпус для модели SciLibModal: математические объекты Mathlib в пяти модальностях (EN, RU, Lean4, LaTeX, изображение) с привязкой к онтологии SciLib.
{# Декоративный фоновый знак — только короткий symbol (один глиф), длинные LaTeX-формулы из artifact.formula не используются: они теснили контент и ломали выравнивание. #}MathLib Embeddings
Векторные представления утверждений Mathlib моделями SciLibMath v2 / SciLibModal. 1 миллион векторизованных утверждений 312-dim, готовый Qdrant payload + dense vectors.
{# Декоративный фоновый знак — только короткий symbol (один глиф), длинные LaTeX-формулы из artifact.formula не используются: они теснили контент и ломали выравнивание. #}MiniF2F Bench Logs
Полные логи прогонов 488 задач MiniF2F через четыре пайплайна подбора лемм. JSON-Lines, метрики pass@1, сравнение SciLib-GRC21 / LeanSearch / LeanFinder / LeanExplore.
{# Декоративный фоновый знак — только короткий symbol (один глиф), длинные LaTeX-формулы из artifact.formula не используются: они теснили контент и ломали выравнивание. #}MathLib RDF · Knowledge Graph
Граф знаний над утверждениями Mathlib, материализованный из онтологии SciLib. Типизированные рёбра usesInType / usesInValue, доменная таксономия с провенансом. Первый шаг к семантическому описанию научного знания за пределами математики.