Quantum Quintum

В области машинного зрения есть "сложные" задачи, в которых традиционные подходы (и готовые наборы изображений вроде ImageNet) работают не очень хорошо. MIT Technology Review с некоторым пафосом описывает одну из таких задач — распознавание трав, листьев деревьев и похожих аморфных структур.

Takeshi Ise с коллегами из Киотского университета (Япония) нашли подход к решению аналогичной задачи с распознаванием разновидностей мха (тут надо вспомнить, как выглядит мох!). Самая большая проблема тут — в наличии размеченной базы изображений, которая покрывала бы разные ракурсы, схемы освещения и комбинации.

Чтобы составить такую базу, исследователи отправились в традиционный японский сад Murin-An, где на обычный фотоаппарат (вроде Olympus OM-D E-M5 Mark II) сделали множество фотографий в высоком разрешении. Дальше эти фотографии нарезали на маленькие фрагменты, в итоге получив около 90000 размеченных изображений, которые после небольшой фильтрации можно было использовать в качестве тренировочной базы.

Дальнейшая гипотеза — этот же подход можно будет применять, например, к анализу лесов. https://www.technologyreview.com/s/608631/how-moss-helped-machine-vision-overcome-an-achilles-heel/ (ссылка на исследование https://arxiv.org/ftp/arxiv/papers/1708/1708.01986.pdf) #ai #ml #dataset

MIT Technology Review

How Moss Helped Machine Vision Overcome an Achilles’ Heel

There are some thing machine vision just cannot recognize well. Now a research project to identify moss has found a way to overcome this limitation.

189 views12:37

Quantum Quintum

Хороших размеченных датасетов мало не бывает. Команда исследователей из Facebook, DigitalGlobe и MIT (и других университетов) запустила соревнование DeepGlobe Satellite Challenge по анализу спутниковых снимков поверхности земли. Участникам предлагается автоматизировать выделение трех типов информации: дорожная сеть, строения и использование земли.

Чтобы вам было проще обучать сеточки, организаторы предоставили три достаточно больших размеченных датасата: 9000 изображений с маской дорог, 24000 изображений с полигонами зданий и 1000 изображений с сегментированными масками типов земли/поверхности.

https://www.technologyreview.com/s/611198/the-machine-vision-challenge-to-better-analyze-satellite-images-of-earth/ #ai #ml #dataset #image #segmentation

MIT Technology Review

The machine vision challenge to better analyze satellite images of Earth

Machine vision has revolutionized many areas of technology, but satellite image analysis isn’t one of them. That may be about to change.

387 views08:10

Quantum Quintum

Большая новость от Microsoft Research - коллеги запустили проект MSR Open Data, большую коллекцию готовых датасетов, которые вы можете использовать для обучения своих моделей. Всего на сегодня доступно около 50 наборов данных, разбитых на 9 категорий: от биологии до городских данных.

Помимо того, что хороших данных мало не бывает, я бы подчеркнул еще один момент. Наличие таких открытых наборов данных делает возможным воспроизведение, перепроверку, коррекцию и развитие научных результатов. (Большая часть опубликованных датасетов — это то, что используют внутри наши исследовательские команды.)

Анонс: https://www.microsoft.com/en-us/research/blog/announcing-microsoft-research-open-data-datasets-by-microsoft-research-now-available-in-the-cloud/
Портал с датасетами: https://msropendata.com/

#ai #ml #open #data #dataset

Microsoft Research

Announcing Microsoft Research Open Data - Datasets by Microsoft Research now available in the cloud - Microsoft Research

The Microsoft Research Outreach team has worked extensively with the external research community to enable adoption of cloud-based research infrastructure over the past few years. Through this process, we experienced the ubiquity of Jim Gray’s fourth paradigm…

394 views12:31

About

Blog

Apps

Platform