Quantum Quintum

История недельной давности, но интересная в контексте автоматизации рутинной интеллектуальной деятельности (и я не про селфи, как в статье). Каждый раз, когда мне нужно сделать (физическую) фотку на визу, паспорт и т.д., я прихожу в какое-нибудь ателье, — обычно это какая-нибудь каморка 2x2 метра с небольшим задником и цифровым фотоаппаратом. И я всегда наблюдаю одну и ту же картину: человек делает несколько снимков, открывает их в доисторической версии Photoshop (потому что сложная не нужна) на каком-нибудь Windows XP или Vista и проделывает привычные упражнения: побелить фон, выровнять кривые, сгладить что-нибудь на лице и т.п. Вот это и есть рутинный интеллектуальный труд. А в статье Adobe использует алгоритмы искусственного интеллекта, чтобы улучшить селфи. http://www.popsci.com/adobe-is-using-ai-to-make-complex-photo-editing-simple-enough-for-selfies?dom=rss-default&src=syn #ai #ml #image

Making complex photo editing selfie-friendly

183 viewsedited 08:43

Quantum Quintum

Про кастомные чипсеты. Google также включается в гонку за кастомные чипсеты для обработки изображений (IPU, Image Processing Unit). Пока речь идет о Pixel Visual Core, чипсете для процессинга изображений в Pixel 2 и Pixel 2 XL с фокусом на ускорение обработки, HDR-съемку и т.п. Но пример Qualcomm и других производителей показывает и следующий шаг: специализированные чипсеты для помощи распознавания изображений, действий и т.п. https://www.theverge.com/2017/10/17/16487834/google-pixel-visual-core-ipu-custom-processor-chip #custom #hardware #image #vision #chipset

The Verge

Google's first mobile chip is an image processor hidden in the Pixel 2

The Pixel Visual Core is a big deal

282 views06:55

Quantum Quintum

И еще немножко про AI — тут вот наши коллеги из AI&Research сделали бота, который генерирует картинки по описанию. https://blogs.microsoft.com/ai/drawing-ai/ (технические подробности - тут https://arxiv.org/abs/1711.10485) #ai #image #text #processing

The AI Blog

Microsoft builds a bot that draws what you tell it to

A new AI technology under development with Microsoft Research is programmed to generate images based on caption-like text descriptions.

335 views08:28

Quantum Quintum

Большая головная боль машинного обучения - разметка сырых данных. Вот тут коллеги рассказывают про использование метода Otsu для подготовки данных под задачу сегментация изображений. https://www.microsoft.com/developerblog/2018/05/17/using-otsus-method-generate-data-training-deep-learning-image-segmentation-models/ #ai #ml #image #vision

CSE Developer Blog

Using Otsu's method to generate data for training of deep learning image segmentation models | CSE Developer Blog

In this article, we introduce a technique to rapidly pre-label training data for image segmentation models such that annotators no longer have to painstakingly hand-annotate every pixel of interest in an image. The approach is implemented in Python and OpenCV…

391 views14:18

Quantum Quintum

Хороших размеченных датасетов мало не бывает. Команда исследователей из Facebook, DigitalGlobe и MIT (и других университетов) запустила соревнование DeepGlobe Satellite Challenge по анализу спутниковых снимков поверхности земли. Участникам предлагается автоматизировать выделение трех типов информации: дорожная сеть, строения и использование земли.

Чтобы вам было проще обучать сеточки, организаторы предоставили три достаточно больших размеченных датасата: 9000 изображений с маской дорог, 24000 изображений с полигонами зданий и 1000 изображений с сегментированными масками типов земли/поверхности.

https://www.technologyreview.com/s/611198/the-machine-vision-challenge-to-better-analyze-satellite-images-of-earth/ #ai #ml #dataset #image #segmentation

MIT Technology Review

The machine vision challenge to better analyze satellite images of Earth

Machine vision has revolutionized many areas of technology, but satellite image analysis isn’t one of them. That may be about to change.

387 views08:10

Quantum Quintum

Две новости про стикеры, фильтры и т.п. как платформу.

1. Snap запускает платформу разработки (SDK) -- Snap Kit для расширения функциональности камеры Snapchat и интеграции сервиса в свои приложения. Фактически, речь идет о четырех направлениях: 1) дать возможность расширить камеру собственными стикерами, фильтрами и ссылками, 2) позволить создавать динамичные стикеры (открытки), 3) расширить использование аватаров снэпа, Bitmoji, в других приложениях, и 4) разрешить сторонним приложениям искать и встраивать публичные истории из снэпа в свои приложения.

Ну и само собой, возможность залогиниться в чужое приложение с помощью аккаунта снэпчата.

Анонс на TheVerge: https://www.theverge.com/2018/1/30/16949402/bitmoji-deluxe-snapchat-customization
Snap Kit: https://kit.snapchat.com

2. Google (потихоньку) расширяет AR-стикеры на дополнительные устройства. Функция "дополненных" стикеров позволяла накладывать трехмерные объекты и текста на фотографии, но до сих пор была доступна только на собственных устройствах - Google Pixel. Сейчас компания расширала доступность приложения на флагман от LG - G7 ThinQ.

Анонс на TheVerge: https://www.theverge.com/2018/6/12/17453296/lg-google-pixel-ar-stickers-thinq-g7

--
Что связывает эти две истории?
Обычно про AR думают как о чем-то, происходящем в реальном времени с экрана смартфона/планшета, очков и т.п., но в сущности тема AR столько же актуальна и для отложенного взаимодействия с реальностью -- через фотографии, истории, стикеры и т.п.

В этом смысле два примера выше бьют в нишу между профессиональным производством контента (кино, спецэффекты и т.п.) и "дополнением" в реальном времени. И есть позозрение, что эта ниша будет постепенно складываться в континуум: как платформенно-инструментальный (например, AR стикеры используют тот же ARCore), так и контентный (я, например, жду в ближайшие 2-3 года первого фантастического фильма со спецэффектами, снятого и смонтированного целиком на iPhone/Android).

#ar #mr #image #camera

The Verge

Snapchat takes Bitmoji deluxe with hundreds of new customization options

Snapchat launches Bitmoji Deluxe with more customization options

2.9K viewsedited 10:23

Quantum Quintum

Сегодня пара ссылок про генерацию графики.

Начнем с NVidia. Исследователи компании натренировали сеточки для генерации недостающих кадров для создания супер-медленного видео. В итоге видео в 30fps становится замедленным видео в 240fps. Хотя, в принципе, с некоторых смартфонов можно снимать видео со схожей частотой кадров, AI-решение, как говорят ученые, позволяет 1) обрабатывать существующие видео и 2) получить удовлетворительный результат, не тратя ценное место и вычислительные мощности на стороне смартфона.

Кажется, сценарий из фильмов с анализом кадров из съемки в духе "ну-ка замедли этот фрагмент" становится вполне реалистичным.

Обзор на The Verge: https://www.theverge.com/2018/6/19/17478110/fake-slow-motion-ai-nvidia-research
Технические детали: https://arxiv.org/pdf/1712.00080.pdf

#ai #image #video #generation

The Verge

Nvidia uses AI to create convincing slo-mo video by filling in extra frames

New research from Nvidia shows how

326 views06:00

Quantum Quintum

Вторая история — от исследователей из Microsoft и китайского Института науки и технологий о том, как генерировать изображения человеческих лиц. Фактически, команда научилась разделять идентичность (identity), специфичные свойства конкретного лица, и атрибуты, переносимые параметры вроде эмоции. На стыке получается делать трансформацию исходного лица в нужное состояние.

Мне тут видятся также большие перспективы как с точки зрения биометрии, так и с точки зрения консьюмерских применений вроде генерации аватаров и реалистичных изображений в кино и играх. Ну и еще один кирпичик в области фейкового контента, конечно.

https://www.microsoft.com/en-us/research/blog/believing-is-seeing-insightful-research-illuminates-the-newly-possible-in-the-realm-of-natural-and-synthetic-images/ #ai #image #face #generation

Microsoft Research

Believing is seeing: Insightful research illuminates the newly possible in the realm of natural and synthetic images - Microsoft…

A pair of groundbreaking papers in computer vision open new vistas on possibilities in the realms of creating very real-looking natural images and synthesizing realistic, identity-preserving facial images. In CVAE-GAN: Fine-Grained Image Generation through…

330 views11:00

About

Blog

Apps

Platform