Архив автора: admin

Видеолекции курса Технологии хранения и обработки больших объёмов данных

Видеолекции курса Технологии хранения и обработки больших объёмов данных.

Лекторы: Дмитрий Барашев, Александр Дольник.

Курс посвящён теоретическим и практическим аспектам технологий, связанных с хранением, обработкой и анализом больших объёмов данных. В основном будут рассматриваться технологии, ставшие массовыми относительно недавно, такие как распределённые файловые системы и NoSQL СУБД, но будут также затронуты возможности, предоставляемые привычными реляционных СУБД.

В материалах курса используются примеры программ на языке Python; кроме того, домашние задания тоже предполагают программирование на этом языке. Поэтому от слушателей требуется понимание элементарных конструкций этого языка и способность писать несложные программы, а также знание алгоритмов вообще. Знание реляционных СУБД и языка SQL тоже существенно облегчит восприятие некоторых тем курса.

Лекция 1. Распределенные файловые системы.
Поговорим о распределенных файловых системах. Рассмотрим основные аспекты их функционирования, немного затронем историю, подробнее углубимся в архитектуру G(oogle)FS, Apache HDFS и в некоторые интересные алгоритмы.


Посмотреть видео на сайте Лекториума

Дополнительные материалы


Скачать: Презентация

Лекция 2. Распределенная параллельная обработка данных технологией Map-Reduce.
Поговорим о том, что такое Map-Reduce, к каким задачам эту технологию можно применять и при каких условиях она будет эффективной. Повертим в руках игрушечный (но работающий!) Map-Reduce.


Посмотреть видео на сайте Лекториума

Дополнительные материалы


Скачать: Презентация
Реализация среды выполнения MR на Питоне и примеры программ

Семинар 2. Алгоритм коррекции ошибок Рида-Соломона.
Небольшой рассказ о применении матриц Вандермонда, метода Гаусса и конечных полей к вполне практическим вещам. Рассказывают Григорий Рожков и Дмитрий Харьковский.

Дополнительные материалы


Скачать: Презентация

Лекция 3. Полнотекстовый поиск.
Как производить полнотекстовый поиск в большом корпусе документов; какие структуры данных и какие методы обработки могут помочь; какой документ лучше удовлетворяет запросу, а какой хуже.


Посмотреть видео на сайте Лекториума

Дополнительные материалы


Скачать: Презентация

Лекция 4. Статический ранг документов. Распределенные вычисления на графах.
Статический не зависимый от запроса ранг документов и его конкретный вариант PageRank. Вычисление PageRank при помощи Map-Reduce. Системы распределенного выполнения алгоритмов на графах.


Посмотреть видео на сайте Лекториума

Дополнительные материалы


Скачать: Презентация

Лекция 5. Введени
е в NoSQL. Google Bigtable.
Предпосылки появления NoSQL СУБД, их разновидности, основные отличия от реляционных СУБД, и основные используемые технологии. Подробнее о Google Bigtable.


Посмотреть видео на сайте Лекториума

Дополнительные материалы


Скачать: Презентация

Семинар 5. Вероятностная модель информационного поиска.
Антон Алексеев расскажет о вероятностной модели информационного поиска.

Дополнительные материалы


Скачать: Презентация

Лекция 6. Согласованность в распределенных системах. Percolator.

Дополнительные материалы


Скачать: Презентация

Лекция 7. Средства интеграции больших объёмов данных.
Александр Дольник рассказывает об интеграции данных из разнородных источников и последующем их анализе.


Посмотреть видео на сайте Лекториума

Дополнительные материалы


Скачать: Презентация

Лекция 8. Создание ETL процесса: Case Study.
Александр Дольник демонстрирует создание ETL процесса по обработке отчетов о продажах в торговой сети.


Посмотреть видео на сайте Лекториума

Дополнительные материалы


Скачать: Презентация

Лекция 9. Поиск похожих документов.


Посмотреть видео на сайте Лекториума

Дополнительные материалы


Скачать: Презентация

Лекция 10. Алгоритмы кластеризации.


Посмотреть видео на сайте Лекториума

Дополнительные материалы


Скачать: Презентация

Автор: Roman Brovko

​Куриное филе с томатным соусом и двумя гарнирами Термомикс.

Ингредиенты:

  • 400 г куриного филе
  • 300 г капусты
  • 1 кг картофеля
  • 1 луковица
  • 1 морковь
  • 1 болгарский перец
  • укроп
  • петрушка
  • зеленый лук
  • соль
  • перец
  • приправы
  • 3-4 ст. л. томатной пасты
  • 450 г кипятка Читать

Полезнушки CentOS7

Чего-то тут на-переделывали… Совсем не похож на 6.Х!

CentOS 7 настройка сервера (для сети)

Репозиториии:
rpm -Uvh http://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm 
(yum -y install epel-release)
rpm —import http://apt.sw.be/RPM-GPG-KEY.dag.txt
rpm -Uvh http://pkgs.repoforge.org/rpmforge-release/rpmforge-release-0.5.3-1.el7.rf.x86_64.rpm
Обновление ядра и всего ПО, установленного из rpm:
yum update

 

Установка пакета для компиляции исходников:
yum groupinstall «Development Tools» Читать

Вышивка бисером.

Чтобы отвлечься от сумок-косметичек-вязания попробовала себя в вышивке бисером.

Кулон-брошь «Летучая мышь» (продаётся) .

Размеры:  8 х 5,3 см. , цепочка 59 см.


Брошь-кулон вышита черно-серым и серебристым бисером, украшена стеклянным кристаллом и бусинами граната треугольной формы.

Задник из натуральной кожи, цепочка съемная.


Дальше еще одна бисерная работа и вязальный процесс.
Колье «Русалка» ( купить можно на ЯМ).


Размер
Ширина — 9 см
Высота (без кисти) — 6,5 см
Кисть — 6 см
Цепочка — 40 см

Вышито белым, серебристым, голубым (цвет аквамарин), прозрачным («бензиновым») бисером и хрустальными бусинами.

Задник — натуральная кожа белого цвета.

Кисточка-подвеска состоит из цепочек с мелкими звеньями — не цепляется, струится и приятна на ощупь. 🙂


Сейчас в процессе еще одна летучая мышь. 😉

Ну и вяжу я конечно, куда без этого? ;)))


Вяжу себе длинный свитер (или платье), осталось связать один рукав и воротник. 
К новому году буду в обновке. 🙂

Цвет «слива» — он гораздо темнее, чем получилось на фото. Потом при свете дня попробую пофотографироваться уже в готовой вещи.

 



Автор: Арбузова Анастасия
Дата публикации: 2015-12-04T06:13:00.000-08:00

Motor 0.5

Мы строили-строили и наконец построили.

Motor 0.5 (асинхронный драйвер для MongoDB) доехал до релиза.

Новая версия работает с asyncio.
Всем рекомендую

Автор: Andrew Svetlov

Видеолекции курса Машинное обучение

Видеолекции курса Машинное обучение.

Лекторы: Игорь Кураленок, Андрей Гулин.


Лекция 1. Машинное обучение: начало.

Постановка задачи. Виды обучения. “Дедуктивные” и “индуктивные” методы обучения.


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 2. Один эксперимент.
Векторизация, факторы, интерпретация решений.


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 3. Оценка методов обучения с учителем.
Отличия от стохастической оптимизации. Переобучение. Оценка качества обучения. Overfitting on validation. Кроссвалидация.


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 4. Машинное обучение: обзор целевых функций.
Некоторые способы построения параметрической целевой функции: Lq, maximum a posteriori, метод максимального правдоподобия, метод максимальной энтропии.


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 5. Переборные методы: сэмплирование.
Переборные методы. Сэмплирование пространства параметров.


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 6. Генетические алгоритмы.
Генетические алгоритмы. Differential evolution.


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 7. Линейные модели: введение.


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 8. Линейные модели: уменьшаем variance.


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 9. Линейные модели: сжатые чувства, SVM.


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 10. Линейные модели: SVM (продолжение). Collaborative filtering.


Посмотреть видео на сайте Лекториума< /em>

Лекция 11. Генеративные вероятностные модели.


Посмотреть видео на сайте Лекториума

Лекция 12. Обзор методов оптимизации.


Посмотреть видео на сайте Лекториума

Лекция 13. Instance based learning (IBL).


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 14. Обучение метрикам (по Brian Kulis).


Посмотреть видео на сайте Лекториума

Дополнительные материалы

Лекция 15. Обзор методов уменьшения размерности.


Посмотреть видео на сайте Лекториума

Лекция 16. Выбор свойств (feature selection).


Посмотреть видео на сайте Лекториума

Лекция 17. Уменьшение размерности: представление.


Посмотреть видео на сайте Лекториума

Лекция 18. Нейронные сети.


Посмотреть видео на сайте Лекториума

Лекция 19. Глубокое обучение.


Посмотреть видео на сайте Лекториума

Лекция 20. Деревья решений.


Посмотреть видео на сайте Лекториума

Лекция 21. Классификация.


Посмотреть видео на сайте Лекториума

Лекция 22. Классификация последовательностей (Андрей Гулин).


Посмотреть видео на сайте Лекториума

Лекция 23. GBDT. Смешанные модели.


Посмотреть видео на сайте Лекториума

Дополнительные материалы:
Видеолекции курса Машинное обучение. Часть 1 (2012).
Видеолекции курса Машинное обучение. Часть 2 (2012).

Автор: Roman Brovko