Machine, are you learning?
Insights in recent Machine Learning topics, approaches, models and papers.
The neural ordinary differential equation (Neural ODE) is a novel machine learning architecture whose weights are smooth functions of the continuous depth. We apply the Neural ODE to holographic QCD by regarding the weight functions as a bulk metric, and train the machine with lattice QCD data of chiral condensate at finite temperature. The machine finds consistent bulk geometry at various values of temperature and discovers the emergent black hole horizon in the holographic bulk automatically. The holographic Wilson loops calculated with the emergent machine-learned bulk spacetime have consistent temperature dependence of confinement and Debye-screening behavior. In machine learning models with physically interpretable weights, the Neural ODE frees us from discretization artifact leading to difficult ingenuity of hyperparameters, and improves numerical accuracy to make the model more trustworthy. - Gaussian ODE😍😍😍❤️ Learning ODE Models with Qualitative Structure Using Gaussian Processes
Recent advances in learning techniques have enabled the modelling of dynamical systems for scientific and engineering applications directly from data. However, in many contexts, explicit data collection is expensive and learning algorithms must be data-efficient to be feasible. This suggests using additional qualitative information about the system, which is often available from prior experiments or domain knowledge. In this paper, we propose an approach to learning the vector field of differential equations using sparse Gaussian Processes that allows us to combine data and additional structural information, like Lie Group symmetries and fixed points, as well as known input transformations. We show that this combination improves extrapolation performance and long-term behaviour significantly, while also reducing the computational cost.
804.9 KB DenseNet for Time Series Classification. Very useful paper, describes both various preprocessing types and architectures of the Dense blocks,then compares performances and scores. Strongly recommend for practitioners #timeseries #DenseNet
Who needs fancy DenseNets, EfficientNets, NasNets and so on if you have THIS: Making ResNets Great Again!
Нейросеть Codex от OpenAI: увольняйте ваших Data Scientist’ов

Будущее наступило! Нейросеть Codex (gpt 3 для генерации кода) позволяет решать data science задачи на естественном языке!
🤖🏆 SimVLM — Новый CLIP

Представьте себе одну модель, которая может:
- Классифицировать фото
- Отвечать на вопросы по фото
- Дополнять текстовые описания
- Решать задачу «визуального обоснования»
- Выполнять мультимодальный перевод

А самое главное, делать все это в режиме zero-shot (обучение без обучения)!

Встречайте: SimVLM, который по факту является мультимодальной сетью Text + Image (как CLIP), с классической трансформер архитектурой. ViT+Bert энкодер + декодер GPT (см картинку поста).

Такой текстовый-визуальный претрейн сравнили с современными (SOTA) методами, включая LXMERT, VL-T5, UNITER, OSCAR, Villa, SOHO, UNIMO и VinVL.

SimVLM превосходит все существующие модели и бьет SOTA по всем рассматриваемым задачам, часто со значительным отрывом.

Скоро сделаю подробный обзор архитектуры.

CLIP — Главная нейросеть 2021

📄 Детальный разбор CLIP на habr от Мишин Лернинг

Нейросеть CLIP — устойчивый классификатор, который не нужно даже обучать. Кроме того, этой сети нашли десятки разных применений: от нейронного поиска по фото и видео до генеративного искусства, от zero-shot классификации изображений до zero-shot Domain Adaptation для StyleGAN (NADA).

CLIP — это действительно новый взгляд на объединение NLP и CV. Последние несколько лет мы наблюдали триумфы в области обработки естественного языка, и языковые модели действительно наделали много шума, совершив новую революцию и, в очередной раз, отложив новую "зиму" искусственного интеллекта в долгий ящик.

Совсем недавно мы начали наблюдать явление, когда технологии, вроде бы изначально присущие только NLP, стали бить рекорды в компьютерном зрении: Vision Transformers. Теперь методы few-shot и zero-shot learning проникают в сферу компьютерного зрения уже благодаря гибридным nlp и cv моделям.

Infinitely Deep Bayesian Neural Nets with Stochastic Differential Equations. Next big thing since Neural ordinary differential equations model. Might become a SOTA for stochastic process forecasting and noisy time-series/signal processing #sde #neuralsde #sota
Happy programmer’s day!!! Have a bug-free code and indulgent project managers.
Починаю свій авторський курс по Data Science - основи часових рядів як куратор і лектор. Завтра записуємо вступну лекцію. Курс закладе основи аналізу та прогнозування часових рядів, фундамент на якому будуються вже більш складні та високо рангові задачі часових рядів. Спойлер, оскільки це перший такий курс в Україні, було прийнято рішення робити його базовим. Наступні будуть вже більш продвинуті у яких розглянемо в том числі стохастичні процеси та глибоке навчання, але основи аналізу часових рядів обов‘язикові для подальшої роботи навіть із глибокими моделями і чому - ми розглянемо на курсі.

Starting my very first Data Science - Timeseries Baseline course as a curator and lector. Will be filming our introductory lecture tomorrow - the basics of time series as a curator and lecturer. Tomorrow we will record the introductory lecture. This course will lay foundations for the time series analysis and forecast, the basis on which are built more complex and highly noisy time series problems. Spoiler, this is first such course in Ukraine, so I decided to give baseline of time series analysis and forecasting. In future courses I’m planning to give a full grasp into deep learning for time series and stochastic process modelling. But all this approaches require baseline techniques.
