Как компьютер научился видеть?
Компьютерное зрение (CV) появилось на горизонте где-то в 1960-х годах. Мало того, что это было время, когда компьютеры сами по себе были чем-то из области фантастики, но инженеры в этой области уже начали задумываться: "А что если мы научим эти машины видеть?"
Лоуренс Робертс, или просто Ларри, стал пионером в области CV. Закончив MIT, он в 1963 году защитил докторскую по использованию компьютеров для обработки изображений.
Но какой была его мечта? Научить машины "видеть".
В те времена ученые уже понимали, что компьютеры могут больше, чем просто считать. Робертс и его коллег вдохновляла идея, что машины могут анализировать визуальную информацию так же, как и люди. Они хотели автоматизировать задачи, которые до сих пор были подвластны только человеческому глазу.
Что ж, у них это получилось.
Робертс сосредоточился на преобразовании 2D-изображений в 3D-информацию. Это была сложная задача, но он разработал методы для определения границ объектов и их сопоставления с моделями.
Технически, методы Ларри были похожи на нынешние сверточные нейронки (CNN): доктор использовал техники для выделения границ объектов на изображениях. Этот процесс включал нахождение изменений яркости или контраста на изображении, чтобы определить, где один объект заканчивается, а другой начинается.
И это дало свои плоды — его первым достижением стала программа, способная распознавать простые формы: круги, треугольники, квадраты. Компьютер смог обработать изображение блок-схемы или чертежа с четкими линиями и углами. Это и стало тем самым “мостиком” от догадок к действиям – машины действительно могли анализировать визуальные данные.
Что было дальше?
Расскажем в следующих постах.