Автор:
Мартина Калпачева
вторник 16 декември 2025 17:18
вторник, 16 декември 2025, 17:18
Проектът съдържа 48 856 реконструирани сцени от реалния свят
СНИМКА: БТА
Размер на шрифта
Институтът за компютърни технологии и изкуствен интелект (INSAIT) към Софийския университет "Св. Климент Охридски" е разработил най-голямата в света публично достъпна 3D база данни за системи с изкуствен интелект, които разбират едновременно език и пространство.
Проектът съдържа 48 856 реконструирани сцени от реалния свят, като 12 061 от тях са обогатени с езикови характеристики. Създаването на набора от данни е изисквало значителен човешки труд и изчислителни ресурси.
Д-р Никола Попович, изследовател в INSAIT и участник в проекта, пояснява още:
"През последната година ние събирахме данни – комплексни такива: сцени на закрито и открито, обстановката в околната среда, пространства, които са много големи и сложни. Тъй като много от учените досега експериментираха само с малки обекти, що се отнася до 3D сферата."
Част от моделите в базата данни имат текстови описания. Те използват Language Gaussian Splatting — подход, който позволява на системите с изкуствен интелект да взаимодействат с 3D среди чрез естествен език. Така те могат да разбират пространствени и семантични отношения директно в три измерения. Досега развитието на подобни системи е било затруднено от недостига на мащабни, висококачествени 3D данни и от липсата на стандартизирани методи за оценка.
За да преодолее този проблем, платформата за оценка на модели SceneSplat-Benchmark въвежда по-реалистични и по-предизвикателни условия за тестване. Платформата обхваща 1 060 сцени и 325 семантични класа и позволява директна оценка на моделите в 3D среда, вместо чрез 2D проекции, което според разработчиците води до по-точни и надеждни резултати.
Инициативата е осъществена в сътрудничество с международни научни институции.
По публикацията работи: Зоя Димитрова