Quantum Quintum
1.63K subscribers
330 photos
7 videos
49 files
1.62K links
Авторский канал Константина Кичинского про информационные технологии и науку: новости, запуски, мнения, исследования противоречия и комментарии.

😶‍🌫️ Вопросы и предложения (кроме рекламы) — @constantinkichinsky.
Download Telegram
Любопытствующий AI через обучение с подкреплением исследует уровни Марио, учится обходить шипы и расправляться с монстриками. Правда пока ему трудно справляться с безумными человеческими задумками вроде прыжков в никуда, чтобы попасть на висящую в воздухе платформу, длинных комбинаций клавиш, и он игнорирует короткие пути, так как они дают меньше прибавки к целевой функции. В общем, есть еще над чем работать, мы вот буквально вчера на ЦИПР обсуждали, что ИИ будут много времени проводить в виртуальных мирах... И учиться, учиться... https://www.newscientist.com/article/2132916-curious-ai-learns-by-exploring-game-worlds-and-making-mistakes/ #AI #learning #virtualworlds
Пожалуй, самая большая проблема всего бума машинного обучения, искусственного интеллекта, когнитивных сервисов и т.д. лежит не в области составления конкретного алгоритма или накопления необходимого массива данных, а в том, как мы, как социум, к этому относимся.

Причем вопрос не только в уже растиражированном экономико-социальном аспекте вроде вытеснения отдельных профессий с рынка труда или, наоборот, усиления некоторых за счет новых возможностей, — но и в том, что именно мы как разработчики, ученые, интепретаторы, внедренцы и т.п. зашиваем в такие алгоритмы.

Время от времени я вижу на разных хакатонах, стартаперских тусовках и в лентах новостей проявления, например, такой идеи: а что, если по анализу фотографии (или видео-ряда) предсказывать хакактер человека? Его тип личности (интраверт, экстраверт и еще с десяток других систем), насколько он будет хорошим сотрудником, врет/не врет, кредитоспособность и много чего еще.

Все это называется физиогномикой и в широких кругах называется псевдонаукой, просторы которой простираются от банального шарлатанства всяких экстрасенсов до онаучненного оправдания расизма, с которым человечество то и дело сталкивается с самых разных формах.

Интересный вопрос — а какое отношение к этому имеет машинное обучение?

В прошлом году пара ученых из Китая Xiaolin Wu and Xi Zhang, — хотя страна тут не важна, потому что (и в этом главная проблема!) подобные работы плодятся по всему миру, — выкатили исследование о том, как с помощью натренерованной сеточки предсказать по фотографии человека, является ли он криминальным элементом или нет. При детальном рассмотрении оказывается, что в работу неявно (?) и, возможно, бессознательно, зашито очень много допущений и, в целом, неверных, предположений.

И хотя, даже здравый смысл, подсказывает, что невозможно по фотографии человека назвать его с 90% преступником, "научный" подход, объективность нейронных сетей, компьютеров, машинного обучения и вот этого всего — позволяют подвести достаточный фундамент для того, чтобы СМИ, социум и, что еще хуже, лица, принимающие соответствующие решения, приняли это все на веру.

===
Так вот, на этот счет и по поводу этого "исследования", в частности - большая детальная статья за авторством Blaise Agüera y Arcas, Margaret Mitchell и Alexander Todorov (на английском).

Потратьте 30-40 минут своего времени. Это важно. Я бы даже сказал, что это одна из самых важных статей на тему машинного обучения за последнее время — "Новые одеяния физиогномики"
https://medium.com/@blaisea/physiognomys-new-clothes-f2d4b59fdd6a #machine #learning #ai #bias

===
P.s. Очевидно все это касается не только распознавания лиц, но и вообще любых других ситуаций, когда мы переносим принятие решения на компьютер и как бы снимаем с себя ответственность (потому что "машина не может ошибаться"). Вот тут всегда должен стоять вопрос — а на заложили ли мы в данные и алгоритмы существующие в обществе стереотипы? Не закрепили ли мы в сеточке существующее неравенство, придав ему научного шарма и оправдания?
Между новостями поделюсь учебным курсом по глубокому обучению, который я сейчас прохожу на EdX. В целом, понятно, что курсов на данную тему уже достаточно много на разных площадках и на разных языках. Если же вы хотите не только понять базовые концепции, но и попробовать на практике CNTK (Microsoft Cognitive Toolkit), то этот курс - то, что вам надо (знание python рекомендуется, но мой опыт показывает, что можно делать упражнения и на здравом смысле при поддержке документации). https://www.edx.org/course/deep-learning-explained-microsoft-dat236x #ai #cntk #education #deep #learning
В блоге Evernote рассказывают о подходе Ричарда Феймана к изучению новых тем. Резюме: 1) Запишите, все, что вы знаете о предмете (делайте закладки на источники информации). 2) Объясните это ребенку (коротко и простыми словами), 3) Отметьте, что вы НЕ знаете — изучайте по ссылкам на источники, восполняйте пробелы, 4) Организуйте, упрощайте, объединяйте в истории. https://medium.com/taking-note/learning-from-the-feynman-technique-5373014ad230 #stories #always #learning #explaining #complexity
В MIT Technology Review большая крутейшая статья из Торонто, где сейчас одна из самых горячих точек развития искусственного интеллекта, где работает Geoffrey Hinton, отец глубокого обучения, где все большие американские IT-компании открывают свои офисы и борются за внимание постдоков и профессуру по Data Science. Статья, в частности, о том, что сейчас происходит с глубоким обучением, и почему, несмотря на все инженерные (!) заслуги последних лет, в научном плане мы застряли. https://www.technologyreview.com/s/608911/is-ai-riding-a-one-trick-pony/ #ai #deep #learning #backprop #future
Удивительные вещи происходят в наши дни. Microsoft продолжает партнерство с Amazon (AWS) на почве AI (ранее была интеграция Alexa и Cortana) — только что анонсировали новую библиотеку (хотя это прежде всего спецификация интерфейса) для глубокого обучения - Gluon, совместимый на сегодня с Apache MXNet и скоро с CNTK и позволяющий единообразно описывать модели для обучения и алгоритм тренировки. https://news.microsoft.com/2017/10/12/aws-and-microsoft-announce-gluon-making-deep-learning-accessible-to-all-developers/ #ai #deep #learning #мирдружбажвачка
И в догонку, в рамках нашей большой инициативы Microsoft AI, мы запустили (на английском) AI.School - собрали в одном месте ссылки на разные учебные материалы по теме AI с нашими технологиями - от инструкций на GitHub до курсов на edX. https://aischool.microsoft.com/learning-paths #ai #learning
Учебного в ленту: Tess Ferrandez прошла на Coursera знаменитый курс лекций Andrew Ng по глубокому обучению и сделала очень классный визуальный конспект https://www.slideshare.net/TessFerrandez/notes-from-coursera-deep-learning-courses-by-andrew-ng #ai #deep #learning

p.s. Речь об этом курсе: https://www.deeplearning.ai/
В нескольких американских околонаучных медиа вышла новость о том, что ИИ воссоздал с нуля периодическую систему элементов. Несколько интересных моментов:
1. Группа исследователей из Стэнфорда решила проверить, что будет, если в механике word2vec заменить в учебной выборке предложения на химические формулы, рассматривая отдельные химические элементы, как слова. В результате получился проект Atom2vec. (Анонс: https://news.stanford.edu/press-releases/2018/06/25/ai-recreates-chemistrys-periodic-table-elements)

2. Как следствие, сеточка научилась самостоятельно выводить классы близости элементов, например, предсказывая, что калий и натрий - похожие по свойствам элементы, способные оброзовывать соединения с хлором. Это позволило пиарщикам раструбить мысль о воссоздании периодической системы, что, конечно, не так. Например, Менделееву в свое время хватило ума не только упорядочить известные элементы, но и предположить существование еще не открытых так, где образовывались пробелы.

3. Тем не менее, сама мысль, что простая нейронная сеть может выводить скрытые связи, близость элементов и т.п. просто по анализу существующих наблюдений, очень крута. В случае с химическими элементами сеточка смогла "вывести" наличие нескольких "свойств" атомов -- измерений в многомерных векторах, по которым можно делать группировку элементов. Например, явно выделяются кластеры щелочных и щелочноземельных металлов, или можно наблюдать корреляцию с увеличением валентности элементов. (Технические детали: http://www.pnas.org/content/early/2018/06/25/1801181115)

4. Насколько я могу судить по результатам быстрого поиска, подобные техники начали активно использоваться в том числе для предсказания возможных свойств новых соединений. Вот, например, немецкий проект Mol2vec, направленный как раз на эту задачу: https://github.com/samoturk/mol2vec (кстати, по внешним признакам, кажется, что это очень похоже на американскую работу, но не так распиарено).

5. Также это хорошо согласуется с темой векторного представления различных соединений, белковых последовательностей и т.п. + описания "отпечатков" соединений. См., например, проект Deep Proteomics: https://github.com/ehsanasgari/Deep-Proteomics

#ai #ml #chemistry #biology #genetics #deep #learning
TikTok Video Downloader: Download TikTok Videos without Watermark