Scalable Machine Learning Complex Data Analysis at Scale
#777 Год выпуска: 12/2015 Производитель: O'Reilly Media Сайт производителя: shop.oreilly.com/product/0636920045274.do Автор: Mikio Braun Продолжительность: 3:08 Тип раздаваемого материала: Видеоклипы Язык: Английский Описание: Machine-learning expert Mikio Braun moves budding data scientists into the world of big data with this overview of how to do complex data analysis at scale. You'll learn the general concepts behind machine learning, compare small scale and large scale data analysis algorithms, and review the basics of the architectures used in large-scale distributed processing. You'll then explore the use of Spark programming for data flow systems,and the many uses of approximation. Braun also outlines evaluation, feature extraction, and model-selection computing costs in big data analysis. The video closes with a discussion of the relationship between the amount of available data and the complexity of the learning problem. Review machine learning concepts such as fitting a model to data Learn core concepts behind large scale algorithms like stochastic gradient descent Review the architectures used in Hadoop-based systems and data flow systems Explore resilient distributed dataset structures, vectors, and matrices using Spark Review Sparks’s machine libraries and how to run basic machine learning tasks Understand the use of approximation in optimization and compressing feature spaces Learn what makes data “complex” Описание: машина-обучение экспертов Микио Браун движется бутонизации данных ученых в мир "больших данных" с помощью этой обзор того, как делать сложный анализ данных в масштабе. Вы узнаете общих понятиях машинного обучения, сравнить мелкомасштабных и крупномасштабных данных, алгоритмы анализа и обзора основы архитектур, используемых в крупномасштабной распределенной обработки. Вы будете затем исследовать использование свечей для программирования потока данных систем,и многие использует аппроксимации. Браун также излагает оценку, выделение признаков, и модель-выбор вычислительных затрат в больших данных анализа. Видео закрывается с обсуждения взаимосвязи между количеством имеющихся данных и сложность изучения проблемы.
Содержание
Part 1: Introduction Introduction to Scalable Machine Learning 11m 12s Some Machine Learning Background 12m 29s Algorithms for Large Scale Learning 20m 09s
Part 2: Hadoop And Friends Overview of Hadoop and Current Big Data Systems 14m 00s
Part 3: Programming for Data Flow Systems How Programming for Data Flow Differs 16m 11s Basic Spark 19m 13s Working with Vectors and Matrices in Spark 34m 53s A Brief Tour of Spark ML 29m 40s
Part 4: Beyond Paralleization Approximation is the Key 15m 34s
Part 5: Practical Big Data Practical Big Data 06m 56s Size vs. Complexity 05m 06s Summary 02m 53s
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения
Ресурс не предоставляет электронные версии произведений, а занимается лишь коллекционированием и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями. Если вы являетесь правообладателем какого-либо представленного материала и не желаете чтобы ссылка на него находилась в нашем каталоге, свяжитесь с нами и мы незамедлительно удалим её. Файлы для обмена на трекере предоставлены пользователями сайта, и администрация не несёт ответственности за их содержание. Просьба не заливать файлы, защищенные авторскими правами, а также файлы нелегального содержания!