В продолжение темы обучения моделей. Из статьи в предыдущем посте про распознавание птичек вы могли заметить, что на предварительную обработку (то есть разметку данных) ушло около 20 часов со специальным инструментом, и это еще хороший вариант.
Я, к примеру, вчера потратил полдня на посекундную разметку видео с камеры наблюдения, а до этого еще полдня, и будет еще раза два по полдня. И это все просто для того, чтобы иметь минимальную выборку для сборки пайплайна обучения модели... с каким-то (еще неизвестным) качеством. И вот только после того, как вся цепочка заработает, можно будет двигаться к расширению данных, подстройке модели и т.п.
Как говорят, коллеги, активно занимающиеся машинным обучением, важно две вещи: 1) данные, если их нет, никакого интеллекта не будет и 2) процесс, его нужно выстроить как можно быстрее, чтобы потом улучшать, а не толкаться в одной точке.
#ai #data #process
Я, к примеру, вчера потратил полдня на посекундную разметку видео с камеры наблюдения, а до этого еще полдня, и будет еще раза два по полдня. И это все просто для того, чтобы иметь минимальную выборку для сборки пайплайна обучения модели... с каким-то (еще неизвестным) качеством. И вот только после того, как вся цепочка заработает, можно будет двигаться к расширению данных, подстройке модели и т.п.
Как говорят, коллеги, активно занимающиеся машинным обучением, важно две вещи: 1) данные, если их нет, никакого интеллекта не будет и 2) процесс, его нужно выстроить как можно быстрее, чтобы потом улучшать, а не толкаться в одной точке.
#ai #data #process