[GCV @ CVPR23] Adam Kortylewski - Opening

Adam Kortylewski

3 Jul 202307:37

Summary

TLDRВ этом выступлении обсуждаются достижения в области компьютерного зрения за последнее десятилетие, такие как высокоточная сегментация и 3D-оценка. Однако остаются проблемы, включая необходимость большого объема аннотированных данных, слабую обобщаемость моделей и их непредсказуемые сбои в реальных условиях. Также затрагиваются уязвимости моделей и отсутствие объяснимости. Главный вопрос, который поднимается на семинаре, заключается в том, как генеративные модели могут помочь решить эти проблемы. Обсуждаются перспективы их применения для улучшения задач классификации, детекции и сегментации.

Takeaways

😀 Проблема с участием людей в программе из-за визовых вопросов, хотя многие способствовали организации мероприятия.
👍 Организационный комитет программы занимался рецензированием всех статей, среди которых выделяется Кунхао, который является мастером Zoom.
📊 За последние десятилетия наблюдается значительный прогресс в области компьютерного зрения, с точностью более 90% в задачах распознавания изображений и сегментации.
🖼️ Современные модели компьютерного зрения могут решать сложные задачи, такие как распознавание материалов объектов на изображениях.
❗ Открытые проблемы включают необходимость больших объемов аннотированных данных и плохую обобщаемость моделей при изменении контекста.
⚠️ Существуют проблемы с уязвимостью моделей к атакам и неожиданными сбоями, особенно при внедрении в реальный мир, например, с беспилотными автомобилями.
🔍 Отсутствие объяснимости и предсказуемости является важной проблемой в работе визуальных моделей.
🤖 Вопрос на повестке дня: могут ли генеративные модели помочь решить эти проблемы в компьютерном зрении?
🎥 Генеративные модели продвинулись, теперь они могут создавать изображения, видео и 3D-объекты на основе текста.
📅 Программа мероприятия включает множество докладов, постерную сессию и дискуссионные панели с участием мировых экспертов.