Quantum Quintum
1.62K subscribers
342 photos
8 videos
49 files
1.62K links
Авторский канал Константина Кичинского про информационные технологии и науку: новости, запуски, мнения, исследования противоречия и комментарии.

😶‍🌫️ Вопросы и предложения (кроме рекламы) — @constantinkichinsky.
Download Telegram
Начнем сегодня с AI и генерации видео. Тут ребята из университета Berkeley развлекаются и пытаются научить людей танцевать. Точнее так: сделать перенос стилей с видео танцующего человека на подопытного пытающегося. Пока хромает в мелких деталях, но в целом трекинг скелета по контрольным точкам вполне кажется неплохим: https://www.youtube.com/watch?v=PCBTZh41Ris

Обзор на Engadget: https://www.engadget.com/2018/08/26/ai-alters-video-to-make-people-dance/ #ai #video #generation
Немного в сторону от айтишного к человеческому. Есть такая штука - Spotlight Effect (эффект прожектора), когда люди сильно переоцинивают насколько хорошо окружающие замечают их, их внешний вид и поведение (в частности, оплошности). Нам кажется, что на нас сейчас все смотрят, конечно же, все вокруг заметили, как мы сконфузились, хочется пропасть на ровном месте, но, на самом деле, всем плевать. А если и заметили, то через минуту другую забудут.

Соседняя с этой — тема иллюзии прозрачности. Нам часто кажется, что наши эмоции, чувства, мысли и т.п. прозрачны и должны быть понятны окружающим. Это же так естественно! Но, на самом деле, нет.


Иногда мы переносим такие предположения на социальные взаимодействия. Классический для IT миф — это, что если код находится во всеобщем поле внимания (выложен в единый репозитарий, гитхаб и т.п.), то все точно увидят, что там есть, заметят наши оплошности, ошибки друг друга и т.п. Конечно же, в массе это так не работает.

Аналогичное искажение происходит, когда мы хотим, чтобы, например, какие-то государственные данные были открыты. Нам кажется, что тогда все будет прозрачно, будет легко выявить проблемы, нестыковки и т.п., но ничего такого в массе также не происходит.


Если есть такого рода искажения, то есть и те, кто этим пользуется осознанно или нет. С одной стороны, когда мы сподвигаем кого-то, скажем, использовать общий репозиторий, мы заведомо играем на спотлайт-эффекте для этого человека или группы людей. То есть даже, если никто не будет проверять код, сам факт такой возможности или ощущение "ну все же смотрят, что я коммичу", будет делать свою работу.

С другой стороны, если я знаю, что всем в массе плевать, то это большая дырка в безопасности за счет социальной инженерии. И мы знаем такие случаи, когда злоумышленники сознательно выкладывали вроде как открытый полезный код, но на самом деле его никто не проверял.


Контр-меры тоже понятны. Проверка качества не имеет права рассчитывать на то, что человек действует благономеренно или на него работает spotlight effect, но при этом его можно стимулировать случайными или автоматическими проверками кода.


Про сам Spotlight Effect в отрыве от IT: https://medium.com/personal-growth/the-spotlight-effect-why-no-one-else-remembers-what-you-did-feb3ba8dbfc0
Коллеги выложили большой персонализированный лонгрид про то, как Matthew Bennett и команда создают звуковую начинку Windows и других продуктов Microsoft.

В статье много интересных деталей, например, я как-то перестал обращать внимание, что при удалении чего-то в корзинку изчез звук скомканной бумаги! А он исчез. Меттью описывает это как избавление от скеоморфичных звуков, которые нужны были на заре создания GUI, но не нужны сегодня.

Чем больше устройств нас окружает, тем более критичным становится, чтобы 1) они были гармонизированы друг с другом и 2) каждое из них создавала как можно меньше дополнительных шумов. В Windows 7 было 40 базовых звуков, в 10 - их уже 8. Многие звуки были перепроектированы, основываясь на звучании речи (во множестве языков). Например, напоминалка в календаре своим ритмом повторяет фразу "ready to go?" (готовы идти?).

Для всех фанатов дизайна, рекомендую. Редкий материал на тему важности звуковой составляющей в операционнке и приложениях.
https://news.microsoft.com/stories/people/matthew-bennett.html #design #sound
На фоне развития спекуляций о грядущем общем искусственном интеллекте (Artificial general intelligence, AGI), и присущих ему сверх-интеллектуальных и скоростных способностей, растет также страх о будущем победивших машин, закате человечествества и т.п. (не волнуйтесь, другая волна спекуляций предвещает нам новую "зиму" в ИИ).

Но допустим, что искусственный сверх-интеллект возможен, что нам нужно делать, чтобы он нас не поработил или не уничтожил? Группа исследователей из университетов Сорбоны и Луисвилля предлагает инвестировать в новое направление — искусственную тупость (artificial stupidity). Это не шутка.

Ученые определяют это так: мы делаем ИИ искусственно глупым, когда добавляем к нему некоторые ограничения, позволяющие свести его возможности совершать какую-то задачу до человеческого уровня. В некотором смысле, это попытка придать ИИ ограничения человеческого разума: мы не можем помнить все, не можем мгновенно и масштабно обсчитывать и т.п. У потенциального сверх-интеллекта таких ограничений не будет.

Помимо программных и логических ограничений, исследователи рассматривают также ограничения на уровне железа (часть из которых, говорят они, потенциально легко обходится, например, за счет облачных вычислений) и на уровне предубеждений (bias), которые "делают людей реально тупыми".

Вот несколько примеров, таких предубеждений, которые можно "натягивать" на ИИ: ошибки планирования, эффект присоединения к большинству, склонность к подтверждению своей точки хрения, консерватизм, эффект уклонения, функциональная закрепленность и т.п. всего список содержит 14 позиций, включая упомянутый мной ранее эффект прожектора.

Обзор в The Next Web: https://thenextweb.com/artificial-intelligence/2018/08/23/want-to-make-robots-more-human-try-artificial-stupidity
Публикация: https://arxiv.org/pdf/1808.03644.pdf
Я уже как-то писал про заметку MIT Technology Review, где авторы опасливо говорили, что, похоже, гонку за лидерство в ИИ выигрывает Китай.

Вот еще одна заметка на эту тему, на этот раз от SIngularityHub. Четыре главных преимущества Китая:

1. Изобилие данных. Особый акцент -- крупные компании с миллиардной аудиторией (WeChat от Tencent) и экосистемой из местных стартапов, делающих связку между online и offline. Сюда же относятся данные о мобильных платежах через WeChat Wallet или Alipay. Сюда же относятся транспортные стартапы (вроде Mobike), генерирующие уйму данных о потоках населения. Ну а об успехах распознавания лиц вы, наверняка, наслышаны.

2. Голодные предприниматели. За десяток другой от позиции копирования китайские предприниматели начинают переходить в позицию создания того, чему нет аналогов на западе. Со свойственной им скоростью и жесткой внутренней конкуренцией, а также явными амбициями выхода на внешние рынки. Три из семи мировых AI-гигантов находятся в Китае (Baidu, Alibaba и Tencent). Одна из оценок венчурного рынка показывала, что в апреле этого года в Китае было 168 потенциальных единорогов с суммарной оценкой в $628B.

3. Экспертиза в ИИ. Хотя Китай все еще новый игрок на площадке, он очень быстро растет. Это хорошо видно по количеству публикаций на международных конференциях, где количество исследователей из Китая уже сравнялось с показателями США. Китайские IT-гиганты активно сотрудничают с китайскими же университетами, открывают собственные лаборатории. В отдельных соревнованиях китайские стартапы обходят лучшие результаты от Alphabet, Facebook, Microsoft и IBM.

4. Китайское правительство. История с гугловским AlphaGo, разбившим лучше китайского играка в Go, стала своего рода "Sputnik Moment" для китайского руководства. Спустя два месяца, оно выпустило план, согласно которому Китай должен стать глобальным центром инноваций в ИИ. В отличие от многих других стран, включая США, план правительства Китая должен работать. В течение года китайские венчурные фонды вложили в ИИ-стартапы рекордные суммы, составившие 48% от всех мировых инвестиций. Директивы работают на всех уровнях: от чиновников (например, Пекин планирует инвестирвать $2B в строительство парка разработки ИИ для размещения 400 компаний и национальной ИИ-лаборатории) до технологических гигантов, работающих в тесной связке с Национальной инженерной лабораторией Китая.

https://singularityhub.com/2018/08/29/china-ai-superpower
В обсуждениях будущего технологий очень трудно избежать темы искусственного интеллекта и машинного обучения, в частности. У очень многих людей есть огроменная такая иллюзия всемогущества технологии и надвигающегося призрака сингулярности. Я, обычно, на это привожу один простой факт: модель нейрона, используемая повсеместно в компютерных нейронных сетях, — это наше представление о живых нейронах 60-летней давности, этакая математическая модель, дающая хорошие результаты в отдельных случаях, но имеющая мало общего с реальностью.

Вот свежий пример на эту тему. В журнале Nature Neuroscience описывается новый тип нейронов, обнаруженный пока только в человеческом мозге. Rosehip neuron (модель шиповника?) составляет около 10-15% верхнего слоя неокортекса, обычно ассоциируемого с сознанием. Особенностью таких нейронов является форма окончаний аксонов, выпускающих нейротрансмиттеры в другие клетки. В данном случае она выглядит веретенообразно, напоминая формой гипантий цветка шиповника после опадения лепестков. Сам нейрон выглядит достаточно компактным, в два раза меньше традиционно наблюдаемых у животных. Функциональное предназначение таких нейронов пока не понятно, но ученые предполагают, что их форма и структура позволяют эффективно и выборочно гасить активацию нейронов.

А вывод для адептов технологической сингулярности очень простой: пока мир все еще сложнее и эффективнее наших моделей.

https://medium.com/popular-science/a-new-type-of-neuron-lurks-in-the-human-brain-and-we-have-no-idea-what-it-does-e6bb2d140bd0
Новый телеграм-курс про Inclusive Design, Digital Transformation и Inclusive Transformation Framework.
Микро-анонс. Я последние пару лет довольно много занимался темой инклюзивного дизайна и попытками вырастить из этого "технологию" для чего-то, что мы внутри называем обычным английским словом "envisioning", проводил воркшопы, тренинги, разбирал разные кейсы внутри, снаружи, с заказчиками и т.п. Но это все было в оффлайне и на ограниченную аудиторию.

Теперь же будет веселее! Я запустил новый канал - Human Spectrum Lab (HSL), где короткими порциями буду рассказывать про Inclusive Design, Digital Transformation и наш Inclusive Transformation Framework. В отличие от Quantum Quintum, где я делюсь новостями, HSL стоит воспринимать скорее как онлайн-курс в telegram-формате.

В "курсе" будет много контента, упражнений, домашки, обсуждения и т.п., но это также съедает больше времени, чем "просто новостной канал": в среднем до 20 минут в день, чтобы погрузиться в практическую трансформацию и получить для себя новые инструменты и ментальные модели для обсуждения интересных вам сценариев.

Еще важный момент: курс рассчитан на широкую аудиторию - от разработчиков, продуктологов и дизайнеров до менеджеров, аналитиков и консультантов, а также их друзей и знакомых, которым интересны темы дизайн-мышления, цифровой трансформации и футуризма. :)

Подписываться сюда: https://teleg.eu/humanspectrum
На тему организации инновационной деятельности. Inc Magazine в небольшой заметке описывает как случаются плановые прорывы в перспективной области на примере энергетики в штатах.

Ключевая проблема в том, что барьер, который нужно преодолеть выше возможностей отдельных компаний, при этом государство не готово вкладывать деньги на исследования в широком поле без понятной линии коммерциализации.

Организационное решение также лежит на поверхности (в том смысле, что оно уже много лет как применяется, и отличный пример этому - MIT Media Lab).

Inc рассказывает об опыте работы JCESR (Joint Center for Energy Storage Research), организованном пять лет назад совместно Департаментом энергетики, академическими лабораториями (5 национальных лабораторий и 10 университетов) и частным сектором (5 частных компаний). Как следует из названия, фокус центра -- решение проблем передачи и сохранения энергии.

5-летняя программа (это, кстати, важный момент, что изначально деятельность организовывалась со сроком окончания) работы центра ставила перед собой три задачи:
1) Сделать библиотеку знаний о материалах и хранении энергии на атомном и молекулярном уровне.
2) Создать два прототипа (для передачи и для сети (грида)), которые при масштабировании смогут показать сверх-производительность и дешивизну (по сравнению с современным уровнем).
3) Предложить новую парадигму исследований батарей и разрабокти, объединяющую науку, промышленный дизайн, исследовательское прототипровании и сотрудничество с производством в единую живую организацию.

Сегодня они все кажутся решенными и даже перевыполненными. Одну из ключевых достижений "внутренней кухни" -- это новые инструменты для анализа материалов и, в частности, электролитов, а также технико-экономического моделирования. Все это позволяет оценить перспективность идеи до капитальных инвестиций, а также выкинуть из рассмотрения до 98% вариантов комбинаций материалов.

Объединение исследователей в проектные команды позволяет сильно ускорить процесс. "Обычно исследование продвигаентся со скоростью публикаций, но здесь мы можем двигаться в ритме перерывов на кофе."

Здесь также стоит отметить, что центр берет на себя задачу лицензирования интеллектуальной собственности для внешних участников, желающих использовать наработки в коммерческих продуктах. А из совместных исследований выросла новая плеяда энергетических стартапов.

Подводя итоги, Inc пишет, что модель JCESR -- это схема работы для будущего в разных областях, в которых сеть важнее узлов, а быстрое создание связей является конкурентным преимуществом.

https://medium.com/inc./heres-how-the-next-big-thing-really-happens-8a8ee2d8ff81

p.s. Кстати, обратите внимание, как это пересекается с активностями вокруг ИИ в Китае, о которых я писал неделю назад.
В продолжение темы Китая и искусственного интеллекта, SingularityHub рассказывает о фреймворке "4х волн ИИ" от Kai-Fu Lee (одного из самых больших инвесторов в тематику ИИ, управляющего более $2B между шестью фондами и с портфелем более 300 компаний в США и Китае).

Первая волна: интернет-ИИ
На этой стадии мы сталкиваемся в основоном с рекомендательными системами, которые обрабатывая данные о массе, стараются выдать индивидуализированный контент для каждого из нас. Продукты в Amazon, следующие видео в YouTube и даже реклама в Facebook.

Интернет-ИИ опирается на данные, которые автоматически накапливаются и размечаются по мере нашего использования контента. Ли пишет, что сейчас компании в США и Китае идут в ровень, но прогнозирует, что преимущество последнего в накапливаемых данных позволит ему вырваться вперед.

Пример - китайская компания Toutiao, начинавшаяся как копия Buzzfeed и оценивающаяся теперь в $20B со 120 ежедневных активных пользователей. Компания использует обработку естественно языка и компьютерного зрения, чтобы не просто создавать виральный контент, но и оптимизировать его на уровне заголовков для каждого пользователя.

Вторая волна: бизнес-ИИ
В отличие от интернет-ИИ, в котором данные размечаются действиями пользователей, бизнес-ИИ опирается на данные, которые уже накоплены и размечены компаниями в прошлом. Данные о транзакциях, медицинских диагнозах, лечении и последствиях, судебные решения, история рецидивов и т.п.

В отличие от людей, ИИ может находить "слабые" связи, обозначающие скрытые отношения между параметрами, остающиеся незаметными для бытовой причинно-следственной связи.

Здесь Ли отдает сильное преимущество американским компаниям, но тут же отмечает, что пробел Китая в наличии структурированных индустриальных данных может стать наоборот точкой роста, если государство позволит в этом поле оперировать стартапам, не сковывая их юридическими ограничениями.

В свежей истории Китайская экономика перепрыгнула через период конкуренции кредитных карт сразу в спользование мобильных платежей, превышая по количеству транзакций США в 50 раз. Вот на этом поле уже появляются игроки вроде "Smart Finance", приложения для микрокредитов, ИИ-которого использует часть информации о телефоне, чтобы высчитать вероятность возврата кредита. Оказывается, ваша скорость печати и даже заряд батареи могут рассказать, стоит ли вам доверять!

Третья волна: ИИ восприятия
ИИ получает существенное обновление, теперь он может видеть, слышать и чувствовать физический мир множеством других сенсоров. По мере того, как сенсоры и умные устройства проникают в наши дома и города, мы становимся все ближе к новой экономике на базе генерируемых ими данных.

Компании вроде Xiaomi выпускает почти 100 миллионов IoT-устройств в год, исследователи активно работают над умной пылью -- автономных частицах, использующих солнечную энергию и способных собирать и передавать данные везде и в любое время. Это новый тип окружения - OMO (online-merge-offline), в котором цифровой слой сливается с физическим.

Так, в китайской дочке KFC на базе партнерства с Alipay внедрена возможность оплаты с помощью лица. Никакого кеша, карт и даже мобильных телефонов. OMO в работе!

И Китай, и США активно инвестирую в это направление, но Кай-Фу предсказывает, что Китай будет лидером в силу своего "железячного" преимущества.

Четвертая волна: автономный ИИ
Самая критичная и непредсказуемая - последняя четвертая волна, объединяющая все предыдущие, и позволяющая ИИ-машинам не просто чувствовать, но и отвечать миру вокруг них.

Представьте себе рой дронов, которые могут выборочно распределиться и собрать урожай с целой фермы, используя компьютерное зрение и необычайную ловкость. Жаро-прочные дроны смогут тушить лесные пожары в 100 более эффективно, а автономные машины 5го уровня смогут самостоятельно перемещаться по умным дорогам и в общем траффике.

Но все это благоденствие приведет к пересборке целых индустрий с новыми основаниями. Ли сегодня отдает явное преимущество в этом направлении США, особенно в том, что касается автономного транспорта.
На стороне Китая готовность к масштабным экспериментам. Так в процинции Zhejiang и в окрестностях Пекина (Xiong`an) правительство строит экспериментальные зоны специально под автономный транспорт будущего: от цемента с сенсорами и умного управления траффиком до распознавания лиц на перекрестках.

Впрочем, в дронах беспорное преимущество за Китаем. Один только DJI владет 50% северо-американского рынка дронов.

https://singularityhub.com/2018/09/07/the-4-waves-of-ai-and-why-china-has-an-edge
Пара профессоров, Kate Crawford (Distinguished Research Professor в NYU, Principal Researcher в Microsoft Research, со-основатель AI Now Institute в NYU) и Vladan Joler (Professor в Academy of Arts в University of Novi Sad и основатель SHARE Foundation) проделали огромную работу, чтобы показать, что стоит за современными AI-решениями вроде Amazon Echo Dot.

Основной сайт: https://anatomyof.ai/ — здесь гигантская диаграмма (ее можно пару часов изучать, я вас предупредил!), показывающая в разных аспектах сборку и работу Amazon Echo: от химических элементов до проблем этики и распределения доходов.

Обзор на The Verge: https://www.theverge.com/2018/9/9/17832124/ai-artificial-intelligence-supply-chain-anatomy-of-ai-kate-crawford-interview
Еще раз про условность границы между AR/VR. В начале этого года Lenovo представила Mirage Solo, standalone-шлем виртуальной реальности, не требующий мобильного устройства. Одна из особенностей устройства — наличие внешних камер (обычно используемых для трекинга).

На днях Google добавила в Daydream новую возможность, заточенную именно под этот шлем, — режим see-through, позволяющий видеть окружающее пространство параллельно с накладываемым цифровым контентом. Фактически, сочетание этого режима со встреенным в шлем трекингом движения, позволяет превратить VR-шлем в устройство дополненной реальности (AR).

В принципе, можно ожидать, что со временем данная технология начнет проникать и в другие шлемы, а сама граница между AR/VR будет размываться еще сильнее. За здравствует Mixed Reality! ;)

https://www.engadget.com/2018/09/21/google-ar-6dof-motion-tracking-daydream/
Доверие — огромная новая тема в IT. Она, конечно, была важна всегда, но сейчас особенно актуальна. Fast Company тут пишет, что валидация контента — это, возможно, следующая большая индустрия в этой нише.

По мере роста технологий обмана (от deepfake и размытия в потоке контента до классической дезинформации), — отмечу, что это также огромная индустрия! — возникает запрос на ответные технологии, позволяющие обнаружить сгенерированный контент, направленные усилия по размытию, а также системные подходы к подтверждению происхождения информации. Не очевидно только, что в этой войне можно победить на стороне "светлых".

Особенно интересно наблюдать, как на наших глазах исчез миф о том, что в социальных сетях "информация от наших друзей" более чистая и достоверная, чем то, что мы привыкли получать от рупора пропаганды в масс-медиа. Легкость распространения фейкового контента тут сталкивается с печально неудачными попытками модерирования и внедрения шильдиков и механизмов жалоб. Пока там пытаются натренировать одни модельки на распознавание, "темные" тренируют свои, на генерацию — персонализированные заголовки лишь первая ласточка.


Но все же мы наблюдаем, что индустрия валидации контента растет и вполне неплохо. Почему? Ryan Holmes, автор статьи, приводит несколько примеров. Truepic, привлекший $10m от Reuters, специализируется на анализе фото и видео с акцентом на глаза и волосы, которые сегодня все еще очень трудно генерировать (если только вы не крупный анимационный гигант). Gfycat для анализа гифок использует сеточки, натренированные на поиск незаметных для глаза аномалий — опять-таки работая на том, что не профессионалам будет трудно сделать действительно качественную подделку.

Другими словами, мы сейчас находимся в той нише, когда низкопробность фейка компенсируется высокой скоростью создания и распространения. Но именно плохому качеству можно противопоставить ИИ, который сможет работать в нужных скоростях, снимая с людей рутину. Но это касается только медиа-контента. С текстом все сильно хуже и решения пока не видно.


Социальные сети и подход "каждый теперь может создавать истории" размыли понятие журналистики и редакторской фильтрации. Можно думать об введении рейтингов, попытках отслеживать трансформацию информации с помощью блокчейна, использовать сети волонтеров для фильтрации и затачивать дальше технологии ИИ, но... это все не меняется сегодня того факта, что любая информация может оказаться фейком. Огромная возможность для нового рынка.

https://medium.com/fast-company/is-content-validation-the-next-growth-industry-40cbbe582cae
В продолжение темы смешанной реальности. Facebook проводит уже 5ю конференцию Oculus Connect (подумать только, уже пять лет с момента выпуска первой версии Oculus Rift!), там много интересного.

Отмечу пару моментов, зацепивших с открытия первого дня:
0. Странные шутки Марка. :)

1. Facebook двигается в сторону Mixed Reality, как логичный шаг развития социальных коммуникаций и, в частности, в контексте их усилий по созданию среды бизнес-коммуникаций. На открытии показали съемку из прототипа следующей версии шлема с наложением скана физического пространства и виртуального мира: https://youtu.be/o7OpS7pZ5ok?t=20m29s (смотреть с 20 минуты).

2. Более реалистичные аватары (Expressive Avatars) с симуляцией мимики и движения глах. Это также инвестиция в сближение реальностей. Пока вы в виртуальной реальности, кажется нормальным общаться мультяшными аватарами, но в смешанной реальности — надо приближаться к реальности. Небольшой обзор от The Verge: https://www.theverge.com/2018/9/26/17906514/oculus-vr-rift-expressive-avatars-eye-mouth-tracking-home-customization

3. Проводные шлемы уходят в прошлое как класс. Новый Oculus Quest — как раз про это в относительно массовом сегменте, причем с inside-out трекингом. Вот тут ребята из Engadget делятся первыми впечатлениями использования: https://www.engadget.com/2018/09/26/oculus-quest-hands-on/ Хотя Rift, кажется, остается проводным для особо требовательных сценариев, я думаю, это тоже временно.

4. Связанный опыт, но пока с кривыми интерфейсами. Фейсбук представил новую концепцию гибридных (между десктопом и VR) приложений. В примере редактор 3D-объектов после натягивания шлеме переносится с экрана монитора в трехмерное окружение: проектируемый объект теперь можно вертеть-крутить и смотреть на него с разных сторон, а рядом висит проекция интерфейса исходного приложения, в котором можно править и т.п. (См. с 41 минуты - https://youtu.be/o7OpS7pZ5ok?t=41m45s). Проблема в том, что десктопные интерфейсы (пока?) очень плохо подходят для использования внутри VR.

5. Unity и Unreal. Никакого массового движка #3 нет.

6. Технология продолжит эволюционировать и сжиматься в размерах. Вот тут Engadged пересказывает прогнозы от Michael Abrash — без четких отсылок, когда это счастье спустится на нас. :) https://www.engadget.com/2018/09/26/oculus-predicts-ultra-thin-vr-headsets/

Но, если у вас есть 15 минут, рекомендую посмотреть в оригинале. Там отличные примеры того, как технологии развиваются даже быстрее, чем мы думаем, хотя по-прежнесу кажется, что светлое будущее наступит позже, чем нам хочется: https://youtu.be/o7OpS7pZ5ok?t=1h22m29s
Очередная вариация не тему взлома умных колонок по открытым каналам. Исследователи из Рурского университета в Бохуме (Германия) научились генерировать фоновый звук, похожий на щебетание птичек, который распознается системами анализа речи как команды на человеческом языке. Причем этот фоновый звук можно накладывать на маску в виде обычной речи.

В теории, такую композицию можно проиграть на удалении от колонки, соответственно, запустив выполнение некоторых команд без того, что рядом стоящий человек сможет что-либо разобраться или вообще понять, что с его колонкой кто-то взаимодействует.

От себя отмечу, что те же банки, которые сегодня начинают экспериментировать с умными колонками, на все критичные операции накладывают дополнительные подтверждения (например, через мобильный телефон), априори считая данный канал слабозащищенным.

https://medium.com/fast-company/alexa-can-be-hacked-by-chirping-birds-aed97c8f562
Когда я рассказываю про цифровую трансформацию, я часто говорю, что новых (уточнение: независимых) единорогов в IT-сфере не будет. Это довольно жесткое заявление, за которым стоит простая идея: дело не в том, что не будет новых прорывных компаний, а в том, что за ними так или иначе будут стоять большие (не обязательно) технологические гиганты, так или иначе вставляя их в свои цепочки создания ценности или получения прибыли (от покупки до патентования, от новых ниш до диверсификации рисков). Часто, эти цепочки будут оставаться долгое время не очевидными в продуктовом смысле.

Иногда кажется, что это мое утверждение идет в разрез с реальностью. Взять, например, рынок такси, который, казалось бы, должны были подмять под себя Uber и еще несколько глобальных компаний со схожей моделью. Но вот мы смотрим, что происходит в мире и оказывается, что Uber вполне успешно вытесняют с некоторых рынков локальные игроки (оставим за скобками причины такого "безобразия"). Китай и Россия тому отличная иллюстрация.



Свежий пример — дубайский сервис Careem, который выходит в лидеры на среднем востоке, подминая под себя рынок от Марокко до Пакистана. В статье по ссылке Fast Co-Design рассказывает, как так получилось: https://medium.com/fast-company/how-a-middle-east-startup-took-on-uber-and-won-1f854b6f494f

Хотя вокруг Careem ходит множество слухов: от скорого выхода на IPO до возможной покупки Uber'ом, одно из критичных ограничений, озвучиваемых в статье, заключается в том, что такси, будучи физическим бизнесом, очень сильно завязано на локальных предпринимателей.

Для полностью цифровых IT-компаний (аля Facebook или Google), глубокая локализация или модель франшизы кажется не очень удобной. Со стороны Uber это звучит примерно так: "мы ввязались в слишком много битв на слишком многих фронтах со слишком большим числом конкурентов." Поэтому секрет успеха Careem, прежде всего, в локализации — глубоком понимании региональных особенностей и адаптация под них. "Наши региональные директора каждую неделю звонят местным водителям, чтобы узнать, есть ли какие-то новые неучтенные проблемы?" (Подробнее — в статье по ссылке выше, там много специфичных деталей, которые кажутся не по зубам Uber с его глобальной стратегией.)



Вернемся к моему тезису про единорогов. Мы смотрим, как развиваются те же сервисы вроде Яндекс.Такси или Careem, и при внимательном рассмотрении оказывается, что они не полностью независимые новые игроки. Яндекс.Такси, мало того, что является дочкой Яндекса, так еще и поддерживает федерацию с Uber, соответственно, встроен в его экосистему. А тот же Careem имеет в запасе инвестиции от немецкого автомобильного гиганта Daimler и китайской Didi Chuxing (тоже сервис перевозки), которая в свою очередь имеет тесные отношения с Tencent и Alibaba.

В одном случае проявление в продукте очевидное (заказывая Uber в Москве, я получаю Яндекс.Такси). В другом — пока нет. Но ребята из Careem говорят, что строят не просто такси-сервис, а платформу для региональных инноваций, позволяющую раскатывать новые продукты в регионе, используя местные особенности. Didi в Китае делает примерно то же самое.

Поэтому, кажется, мой тезис в целом оказывается все еще верным.



У меня появляется стойкое ощущение, что цифровая трансформация, будучи завязанной на физический бизнес, будет в какой-то (скорее большой, чем малой) степени подвержена этой коррекции на локальный фактор. Какой будет итоговая комбинация из глобальных цифровых компаний, не понятно: замах на быструю глобализацию, типичный для цифрового бизнеса, резко начал сталкиваться со стремлением на локализацию капитала физического. Причем происходит этого не только из "шкурных" интересов контроля капитала, но и из именно что потребности на локализацию под местные экономику, социальные отношения, людей, в конце концов.
Про бытие водных автономок: преодолеть бюрократические барьеры сложнее технических, что логично, так как технология потенциально ставит под удар не просто целую отрасль, но и приведет к перераспределению потоков.

---

Rolls-Royce делится планами о создании автономных кораблей вместе с Intel. Там полный фарш для анализа состояния: лидары, радары, тепловизионные камеры и обычне HD, поэтому не удивительно, что встал запрос на обработку данных на месте, а не только в "командном центре".

Из интересных деталей:
🛥 Помимо процессоров Xeon, на борт также зайдут чипы на FPGA со специализированными алгоритмами.

🛥 Есть интересная задача -- сделать современный аналог "черного ящика" с данными о принятии решения и т.п. И их тут, кажется, сильно больше, чем в обычных транспортных средствах.

🛥 Управление полуавтономное -- с дистанционным доступом, хотя на самих лодках наличие людей не предполагается.

🛥 Значитальная часть решений подходит для улучшения существующих систем навигаций (как дополнительный слой информации для людей) и проходит обкатку в Японии.

🛥 Самый большой вызов в создании автономных дронов на сегодня -- создание новой международной правовой системы для подобной деятельности. На ближайшие два года акцент будет на отдельных странах и работе с прибрежных водах.

https://www.engadget.com/2018/10/16/rolls-royce-intel-autonomous-ships
Тема этичности в развитии ИИ у меня то и дело проскакивает. Вот еще несколько мыслей, записанных Fast Co-Design по следам симпозиума AI Now, посвященного этике и ответственности с сфере ИИ:

🤖 ИИ не нейтрален. Хотя алгоритмизация решений создает ощущение нейтральности и повышения эффективности, в реальности мы занимаемся "deep social programming" - загоняем сложившиеся отношения еще глубже в алгоритмы. На повехности кажется, что мы проводим административные изменения, а не существенное политическое решение. На практике, мы ускоряем процесс реализации системной несправедливости.

🤖 ИИ обычно опирается на огромное количество низкооплачиваемой человеческой работы. Как только кто-то говорит, что в его продукте, сервисе или приложении используется ИИ, не стоит этому слепо верить. ИИ часто используется как маркетинг, скрывающий работу людей. Не всегда пришедшее вам сообщение, отправлено роботом. Кажется, самое время начать говорить о лжеавтоматизации (fauxtomation), использующей невидимый человеческий труд, чтобы сделать компьютер выглядищим умнее.

🤖 Мало говорить об этике -- нужно думать о человеческих правах. Этичность стала всеобъемлющим термином в разговорах о влиянии алгоритмов и ИИ на общество, размывающим предмет разговора. Мы много говорим о неравенстве, влиянии автоматизации, но измерение прав человека часто остается нетронутым. Этика размыта, неизмерима и этим удобна.

🤖 Если вы проектируете ИИ, задайте себе эти два вопроса.
1) Улучшает ли ваш инструмент самоопределение и достоинство людей, на которых он направлен?
2) Если он направлен не на бедных людей, будет ли это приемлемо?

https://medium.com/fast-company/a-skeptics-guide-to-thinking-about-ai-4b5cfcadba09
Навряд ли вы решитесь на такой эксперимент в ближайшем будущем, но кажется, это и есть часть будущего в истории с AR/MR/VR. Один из аспектов удаленного присутствия, который долго был неподвластным для переноса, — это ощущение запахов. В принципе, не важно, каких: ромашек с прекрасного зеленого луга или зомбаков, продящих в смердящем подземелье.

Одно из направлений, которое с переменным успехом развивалось последние годы с лозунгом "интернет запахов", — в размещении в конечных точках мини-фабрик, смешивающих ингридиенты в нужной пропорции и выдающих вам в нос соответствующие ароматы. Но непохоже, что этот подход является масштабируемым, хотя на его стороне — неинвазивность.

TechCrunch рассказывает про эксперимент ученых из малазийского Imagineering Institute по симуляции запахов путем воздействия электродами на обонятельные нервы: "Самый большой вопрос, впрочем, можно ли создать ощущение запахов без запихивания трубок в нос. Эксперимент был сильно дискомфортным для большинства волонтеров. Многие хотели принять участие, но уходили после первой же попытки.”

Но, несмотря на неприятные физические ощущения от прототипа, кажется, что подход работает. Вопрос в том, как сделать решение медицински и эстетически приемлемым. Я, например, тоже не готов засовывать себе в нос трубки, чтобы почувствовать запах зомби за углом.

https://techcrunch.com/2018/10/18/researchers-create-virtual-smells-by-electrocuting-your-nose/
The Art of Instagram Captions: Writing Engaging and Authentic Descriptions