Quantum Quintum

Классная российская история стартапа CVizi про анализ зрителей в кинотеатрах и на конференциях с помощью когнитивных технологий.. https://m.habr.com/company/microsoft/blog/413015/ #ai #vision #cognitive

Habr

Как нас анализируют в кинотеатрах… и не только

Компьютерное зрение все глубже интегрируется в нашу жизнь. При этом, мы даже не замечаем всего этого наблюдения за нами. Сегодня расскажем о системе, помогающей анализировать эмоции посетителей на...

361 views07:31

Quantum Quintum

Коллеги вместе с O'Reilly опубликовали бесплатную книжку: A Developer’s Guide to Building AI Applications. Налетай!

Внутри:
* Understand how the intersection of cloud, data, and AI is enabling organizations to build intelligent systems.
* Learn the tools, infrastructure, and services available as part of the Microsoft AI Platform for developing AI applications.
* Teach the Conference Buddy application new AI skills, using pre-built AI capabilities such as vision, translation, and speech.
* Learn about the Open Neural Network Exchange.

https://blogs.technet.microsoft.com/machinelearning/2018/06/04/free-e-book-a-developers-guide-to-building-ai-applications/ #ai #ml #book

495 viewsedited 08:03

Quantum Quintum

Футбольное, пятнично-субботнее: Chintan Trivedi рассказывает, как использовать обучение с подкреплением, чтобы научить бота забивать угловые в FIFA2018. https://towardsdatascience.com/using-deep-q-learning-in-fifa-18-to-perfect-the-art-of-free-kicks-f2e4e979ee66 #ai #ml #sport #esport

Towards Data Science

Using Deep Q-Learning in FIFA 18 to perfect the art of free-kicks

A code tutorial in Tensorflow that uses Reinforcement Learning to take free kicks.

376 views07:17

Quantum Quintum

Еще футбола! Помните, я тут выше писал про восстановление (реконструкцию) 3D-сцены по 2D-съемки? Группа исследователей из университета Вашингтона (+Google, +Facebook) сделали еще один шаг в этом направлении:
* взяли ролики игры в FIFA2017
* обучили сеточки распознавать поле, игроков и т.п.
* транслировали движения фигур в движения скелетов и карты глубины
* реконструировали игру в 3D
* перевели сцену в MR (Hololens)

А теперь представьте, что вы можете смотреть чемпионат мира по футболу на своем столе в 3D, как будто у вас на поверхности стола копия футбольного поля, вокруг которой вы можете ходить, приближаться и т.п.

http://www.i-programmer.info/news/190-augmentedvirtual-reality-arvr/11868-watch-soccer-games-in-3d-on-your-table-top-.html

Детали и публикация: https://arxiv.org/pdf/1806.00890.pdf

#ai #ml #mr #vision

www.i-programmer.info

Watch Soccer Games In 3D On Your Table Top

Programming book reviews, programming tutorials,programming news, C#, Ruby, Python,C, C++, PHP, Visual Basic, Computer book reviews, computer history, programming history, joomla, theory, spreadsheets and more.

378 views08:10

Quantum Quintum

Сегодня пара ссылок про генерацию графики.

Начнем с NVidia. Исследователи компании натренировали сеточки для генерации недостающих кадров для создания супер-медленного видео. В итоге видео в 30fps становится замедленным видео в 240fps. Хотя, в принципе, с некоторых смартфонов можно снимать видео со схожей частотой кадров, AI-решение, как говорят ученые, позволяет 1) обрабатывать существующие видео и 2) получить удовлетворительный результат, не тратя ценное место и вычислительные мощности на стороне смартфона.

Кажется, сценарий из фильмов с анализом кадров из съемки в духе "ну-ка замедли этот фрагмент" становится вполне реалистичным.

Обзор на The Verge: https://www.theverge.com/2018/6/19/17478110/fake-slow-motion-ai-nvidia-research
Технические детали: https://arxiv.org/pdf/1712.00080.pdf

#ai #image #video #generation

The Verge

Nvidia uses AI to create convincing slo-mo video by filling in extra frames

New research from Nvidia shows how

326 views06:00

Quantum Quintum

Вторая история — от исследователей из Microsoft и китайского Института науки и технологий о том, как генерировать изображения человеческих лиц. Фактически, команда научилась разделять идентичность (identity), специфичные свойства конкретного лица, и атрибуты, переносимые параметры вроде эмоции. На стыке получается делать трансформацию исходного лица в нужное состояние.

Мне тут видятся также большие перспективы как с точки зрения биометрии, так и с точки зрения консьюмерских применений вроде генерации аватаров и реалистичных изображений в кино и играх. Ну и еще один кирпичик в области фейкового контента, конечно.

https://www.microsoft.com/en-us/research/blog/believing-is-seeing-insightful-research-illuminates-the-newly-possible-in-the-realm-of-natural-and-synthetic-images/ #ai #image #face #generation

Microsoft Research

Believing is seeing: Insightful research illuminates the newly possible in the realm of natural and synthetic images - Microsoft…

A pair of groundbreaking papers in computer vision open new vistas on possibilities in the realms of creating very real-looking natural images and synthesizing realistic, identity-preserving facial images. In CVAE-GAN: Fine-Grained Image Generation through…

330 views11:00

Quantum Quintum

Несколько интересных размышлений на тему технологий.

Первое - от Justin Lee в TheStarup о том, что с чатботами что-то пошло не так. Два года назад про них говорили, как "the next big thing", но этого явно не случилось. Почему?

Изначальный запал ожиданий объясним. Мессенджеры были на взлете, диалоговый маркетинг (conversational marketing) был новым баззвордом, успех WeChat в Китае не мог не вдохновлять. На фоне хаоса и застоя в мобильных приложениях это все казалось свежей спасительной струей.

Самый главный вопрос, который задавали в сообществе и медиа: "кто же будет игроком номер один, монополизирующим тему вокруг себя", но никак не, "будут ли чатботы успешны в принципе"?

Поэтому ответ на вопрос "будет ли единая платформа, доминирующая в экосистеме чатботов и первональных ассистентов", простой: "Нет". По крайней мере пока трудно говорить о сколь-нибудь существенной экосистеме.

Мы все попали в ловушку хайпа. Итан Блох из Digit говорит так: "Я даже не уверен, можем ли мы говорить, что чатботы мертвы, потому что я не знаю, были ли они на самом деле живы." Дейв Филдман из Heap описывает ситуацию не менее жестко: "Чатботы не просто попробовали взять какую-то одну сложную проблему и провалили ее, они замахнулись на несколько и провалили их все".

--
Ну а за деталями, как так получилось, и почему это не так уж и плохо, приглашаю в статью Джастина. (Краткий вывод: мы набили как индустрия достаточное большое число шишок, чтобы теперь последовательно внедрять чатботов там, где работает как с точки зрения технологий, так и с точки зрения адекватности сценариев.)

https://medium.com/swlh/chatbots-were-the-next-big-thing-what-happened-5fc49dd6fa61

#chatbots #ai #hype

Medium

Chatbots were the next big thing: what happened?

Oh, how the headlines blared:

450 views06:00

Quantum Quintum

Большая новость от Microsoft Research - коллеги запустили проект MSR Open Data, большую коллекцию готовых датасетов, которые вы можете использовать для обучения своих моделей. Всего на сегодня доступно около 50 наборов данных, разбитых на 9 категорий: от биологии до городских данных.

Помимо того, что хороших данных мало не бывает, я бы подчеркнул еще один момент. Наличие таких открытых наборов данных делает возможным воспроизведение, перепроверку, коррекцию и развитие научных результатов. (Большая часть опубликованных датасетов — это то, что используют внутри наши исследовательские команды.)

Анонс: https://www.microsoft.com/en-us/research/blog/announcing-microsoft-research-open-data-datasets-by-microsoft-research-now-available-in-the-cloud/
Портал с датасетами: https://msropendata.com/

#ai #ml #open #data #dataset

Microsoft Research

Announcing Microsoft Research Open Data - Datasets by Microsoft Research now available in the cloud - Microsoft Research

The Microsoft Research Outreach team has worked extensively with the external research community to enable adoption of cloud-based research infrastructure over the past few years. Through this process, we experienced the ubiquity of Jim Gray’s fourth paradigm…

394 views12:31

Quantum Quintum

Отличное интервью с конференции LiveWorx 2019 с Алексом Кипманом про Hololens, Mixed Reality, AI, инновации и этичность технологий. https://www.youtube.com/watch?v=nkm3HceFpQM #MR #holographic #AI

YouTube

Mixed Reality and the Future of Computing: A Conversation with Alex Kipman

Save The Date | LiveWorx 2019 | June 10th-13th http://livewrx.co/ypVD30kHU6f

An innovator at heart, Alex Kipman has led four major break-through products at Microsoft, including Kinect in 2010. Microsoft HoloLens and the Windows Mixed Reality software platform…

296 views06:00

Quantum Quintum

В нескольких американских околонаучных медиа вышла новость о том, что ИИ воссоздал с нуля периодическую систему элементов. Несколько интересных моментов:
1. Группа исследователей из Стэнфорда решила проверить, что будет, если в механике word2vec заменить в учебной выборке предложения на химические формулы, рассматривая отдельные химические элементы, как слова. В результате получился проект Atom2vec. (Анонс: https://news.stanford.edu/press-releases/2018/06/25/ai-recreates-chemistrys-periodic-table-elements)

2. Как следствие, сеточка научилась самостоятельно выводить классы близости элементов, например, предсказывая, что калий и натрий - похожие по свойствам элементы, способные оброзовывать соединения с хлором. Это позволило пиарщикам раструбить мысль о воссоздании периодической системы, что, конечно, не так. Например, Менделееву в свое время хватило ума не только упорядочить известные элементы, но и предположить существование еще не открытых так, где образовывались пробелы.

3. Тем не менее, сама мысль, что простая нейронная сеть может выводить скрытые связи, близость элементов и т.п. просто по анализу существующих наблюдений, очень крута. В случае с химическими элементами сеточка смогла "вывести" наличие нескольких "свойств" атомов -- измерений в многомерных векторах, по которым можно делать группировку элементов. Например, явно выделяются кластеры щелочных и щелочноземельных металлов, или можно наблюдать корреляцию с увеличением валентности элементов. (Технические детали: http://www.pnas.org/content/early/2018/06/25/1801181115)

4. Насколько я могу судить по результатам быстрого поиска, подобные техники начали активно использоваться в том числе для предсказания возможных свойств новых соединений. Вот, например, немецкий проект Mol2vec, направленный как раз на эту задачу: https://github.com/samoturk/mol2vec (кстати, по внешним признакам, кажется, что это очень похоже на американскую работу, но не так распиарено).

5. Также это хорошо согласуется с темой векторного представления различных соединений, белковых последовательностей и т.п. + описания "отпечатков" соединений. См., например, проект Deep Proteomics: https://github.com/ehsanasgari/Deep-Proteomics

#ai #ml #chemistry #biology #genetics #deep #learning

354 viewsedited 12:52

Quantum Quintum

Я уже писал про возможности трекинга тела на изображениях прямо в браузере. Теперь очередь за распознаванием лиц, определением контрольных точек и т.п.: face-api.js — библиотека для распознавания лиц на базе tensorflow.js

https://itnext.io/face-api-js-javascript-api-for-face-recognition-in-the-browser-with-tensorflow-js-bcc2a6c4cf07 #ai #ml #javascript #face

Medium

face-api.js — JavaScript API for Face Recognition in the Browser with tensorflow.js

A JavaScript API for Face Detection, Face Recognition and Face Landmark Detection

358 views07:56

Quantum Quintum

Очередное поглощение прогрессивных команд (лабораторий, стартапов) крупными компаниями: Facebook купила Bloomsbury AI из Лондона (https://www.theverge.com/2018/7/3/17531506/facebook-acquires-bloomsbury-ai-human-speech-natural-language-processing). [Для сравнения подхода - в мае Microsoft купила компанию Semantic Machines в той же нише.]

Понимание человеческого языка машинными интеллектами (NLP) — это один из ключевых барьеров в построении следующего поколения чат-ботов, цифровых ассистентов и в целом систем, понимающих человеческий контекст.

Причем сложность задачи и широта поляны таковы, что, с одной стороны, задачу очень трудно поднять самостоятельно даже таким гигантам как Google, Microsoft, Facebook, ..., — отсюда огромный запрос на поиск внешних решений, наработок, команды и т.п., а с другой, есть множество ниш, в которых можно независимо развить уникальную экспертизу (понятно, что все поглощаемые компании/лаборатории не вчера родились), так как единый универсальный ответ навряд ли возможен.

#ai #language #processing

The Verge

Facebook acquires London-based AI firm to help it better understand human speech

Facebook announced today that it’s acquired London-based artificial intelligence firm Bloomsbury AI, which specializes in natural language processing.

354 views07:16

Quantum Quintum

Интересно наблюдать, как Китай (или точнее китайские компании) отстраивают шаг за шагом независимую от США AI-экосистему - свои сервисы, свои фреймворки, и свои чипсеты теперь.

—

Список компаний, выпускающих кастомные AI-чипсеты пополнился Baidu. Новый процессор Kunlun базируется на FPGA, подходит для использования как в дата-центрах, так и на конечных устройствах (хотя компания пока не готова к массовому производству).

Аналогично другим поисковым компаниями, Baidu ориентируется прежде всего на сценарии ранжирования, а также на интеграцию с собственным фреймворком для машинного обучения PaddlePaddle.

https://www.zdnet.com/article/baidu-creates-kunlun-silicon-for-ai/

#ai #hardware #chipset

ZDNet

Baidu creates Kunlun silicon for AI

A pair of chips from the Chinese search giant are aimed at cloud and edge use cases.

291 viewsedited 09:38

Quantum Quintum

Poppy Crum рассказывает в TED о том, как современные компьютерные устройства и сенсоры уже умеют "считывать" людей лучше самих людей, и почему это может быть как хорошо (развитие эмпатии), так и плохо (слежка, выявление скрываемых чувств и т.п.).

https://www.ted.com/talks/poppy_crum_technology_that_knows_what_you_re_feeling

#ai #emotions #sensors

Ted

Technology that knows what you're feeling

What happens when technology knows more about us than we do? Poppy Crum studies how we express emotions -- and she suggests the end of the poker face is near, as new tech makes it easy to see the signals that give away how we're feeling. In a talk and demo…

438 views06:00

Quantum Quintum

Andrej Karpathy из Tesla рассказывает о новом софтверном стеке на базе автоматической оптимизации кода (сети) - Software 2.0. Про концепцию, кажется, я уже писал — идея в том, что это новый тип софта, в котором человек задает данные и критерии эффективности, а внутренняя структура и веса нейронной сети (или кода) подбираются автоматически.

Отдельный интересный вопрос отсюда, сформулированный, как открытый запрос и что-то над чем активно работают в Tesla для своих нужно, — это уславная IDE для таких задач.

https://www.figure-eight.com/building-the-software-2-0-stack-by-andrej-karpathy-from-tesla/ #ai #ml #software

Appen

Blog - Appen

The latest insights about training data, artificial intelligence, machine learning, and our company

355 viewsedited 12:01

Quantum Quintum

Во многих сценариях создания диалоговых интерфейсов разработчики сталкиваются с одной и той же задачей: как отобразить естественные языковые запросы на API конкретных используемых сервисов? Обычно это требует разработки нескольких промежуточных слоев, включая "понимание" речи с разбором на намерения (intent) и отображение намерений на конкретные вызовы API с учетом некоторой логики (например, состояний).

Группа исследователей из Microsoft Research задается в этом контексте таким вопросом: можно ли сделать общий подход для создания NL2API — прослойки между естественными запросами и API конкретных сервисов. В работе по ссылке ниже детально описывается архитектура такого решения, использующая модульный подход, в котором каждый блок имеет свою нейронную сеть, вычленяющую нужные параметры из оргинального запроса + общий контроллер, определяющий, какие модули нужно активировать.

Подобная архитектура, как пишут исследователи, также упрощает создание интерактивных систем, позволяющих пользователям легко уточнять запросы.

Общее описание: https://www.microsoft.com/en-us/research/blog/democratizing-apis-with-natural-language-interfaces/
Публикация: https://www.microsoft.com/en-us/research/uploads/prod/2018/04/sigir18_nl2api.pdf

#ai #ml #conversational #ui

Microsoft Research

Democratizing APIs with Natural Language Interfaces - Microsoft Research

Benefiting from a confluence of factors, such as service-oriented architecture, cloud computing, and Internet-of-Things (IoT), application program interfaces – APIs – are playing an increasingly important role in both the virtual and the physical world. For…

409 views10:17

Quantum Quintum

Продолжаем тему "вот еще одна крупная компания, которая делает кастомные AI-чипсеты". На этот раз очередь дошла до Tesla. Компания планирует в течение года начать переходить на собственное железо для обсчета нейронных сетей. Какими бы прекрасными не были видео-карты Nvidia, Илон обещает, что переход к реальному вычислению нейронок "в металле" должен дать порядковый прирост в вычислительной мощности.

Интересная деталь: компания шла к этому 2-3 года, постепенно формируя детальное понимание, как их нейронные сети будут эволюционировать в будущем. Тонкость ситуации в том, что обновить железо на машине гораздо сложнее, чем софт. Поэтому, если GPU, фактически, выступало как обобщенное всеядное железо, то в случае с кастомными AI-чипами обычно речь идет о достаточно жесткой заточке под конкретную структуру сети, точнее необходимые для ее исполнения вычислительные блоки.

https://techcrunch.com/2018/08/01/tesla-is-building-its-own-ai-chips-for-self-driving-cars/ #ai #hardware

TechCrunch

Tesla is building its own AI chips for self-driving cars

“We’ve been in semi-stealth mode on this basically for the last 2-3 years,” said Elon Musk on an earnings call today. “I think it’s probably time to let the cat out of the bag…” The cat in question: the Tesla computer. Otherwise known as “Hardware 3,” it’s…

337 viewsedited 06:00

🚗 4 🏍 1 🚲

Quantum Quintum

Начнем сегодня с AI и генерации видео. Тут ребята из университета Berkeley развлекаются и пытаются научить людей танцевать. Точнее так: сделать перенос стилей с видео танцующего человека на подопытного пытающегося. Пока хромает в мелких деталях, но в целом трекинг скелета по контрольным точкам вполне кажется неплохим: https://www.youtube.com/watch?v=PCBTZh41Ris

Обзор на Engadget: https://www.engadget.com/2018/08/26/ai-alters-video-to-make-people-dance/ #ai #video #generation

YouTube

Everybody Dance Now

Full paper - https://arxiv.org/pdf/1808.07371.pdf

Website - https://carolineec.github.io/everybody_dance_now/

330 viewsedited 12:04

Quantum Quintum

В продолжение темы и отлично на фоне ожидаемых 11-тысячных сокращений в Microsoft:

Вчерашнее интервью Сатьи Наделлы для Wall Street Journey: https://www.youtube.com/watch?v=UNbyT7wPwk4

И сегодняшняя (прямо сейчас) дискуссия на Davos с примерное теми же тезисами и примерами, но чуть подробнее: https://www.youtube.com/watch?v=DS1sdsn7rTg

(Смотреть оба не имеет смысла, будет дежавю.)

Отмечу несколько моментов, которые MSFT озвучивает уже публично (хотя и витиевато, и не так прямолинейно, как я 😄):

💤 Экспоненциальный рост облаков/мобилки закончен, все, вышли в мачурность. Дальше только внедрения, больше внедрений. Все низкие фрукты съедены, дальше зарабатывать будут те, кто готов идти в долгие тяжелые проекты, масштабировать в длинный хвост партнерской сетью или идти прямо в какие-то нишевые истории и бизнес-модели. Глобальное окно возможностей закрыто.

🔝 Хотя ИИ стопятьсот лет, мы только-только со штуками вроде DALL*E и ChatGPT подобрались к началу экспоненциального роста, но с переходом к платформам. Не миллион кастомных сеточек сделают погоду, а миллион адаптаций и решений поверх платформ вроде ChatGPT. Конкретно для майков: вся история с ИИ — это второе дыхание для роста облаков.

🤔 Майкрософт будет перекладывать СВОЕ позеленение на плечи клиентов. Выключат ваши искбоксы, пока вы не играете. Опа, заработали себе зеленых кредитов. Заложили вам в ажурную подписку затраты углерода: теперь любая ваша экономия — это экономия Microsoft.

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

Satya Nadella: Microsoft's Products Will Soon Access Open AI Tools Like ChatGPT | WSJ

Microsoft CEO Satya Nadella discusses the company expanding access to OpenAI tools and the growing capabilities of ChatGPT at WSJ’s Journal House during the ...

518 viewsedited 13:13

About

Blog

Apps

Platform