Отзывы на книгу: Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных; Альпина Диджитал, 2020

от 359 р. до 449 р.

Где купить

Отзывы (10)


  • 5/5

    Я уже давно понимал и учитывал темные данные в своих отчетах и общении с бизнес-заказчиками, а теперь есть хорошо структурированная и полезная книга, которую можно рекомендовать всем.
    Считаю, что эту книгу обязательно должны прочесть все аналитики и те, кто работает с отчетами.

  • 4/5

    Михаил Панкратов, спасибо вам, что нашли время и не поленились написать такой толковый отзыв.

  • 4/5

    Просмотр других отзывов вызывает некоторое недоумение. Эти комментаторы точно читали книгу?
    Итак, о чем же книга: эта книга написана президентом Британского Королевского Статистического Общества, и основная ее тема это теория вероятности и математическая статистика. Целевая аудитория – те кому нравится творчество Талеба, Млодинова, Мобуссина и других сходных авторов.
    Из того, что я читал, похоже на книгу «Как лгать при помощи статистики» Дарелла Хаффа. Но гораздо глубже и современнее конечно.
    В книге разбираются такие вопросы как, например, что делать если в социологическом опросе часть респондентов вообще не ответили на вопросы? Можно их просто не учитывать? (спойлер: нет, нельзя) Ну или как поступать, когда при испытаниях нового лекарства часть испытуемых по собственному желанию вышли из программы досрочно. Можно их просто вычеркнуть, как будто их и не было никогда? (спойлер: снова нет). Вот это и есть те самые «темные данные» которым посвящена книга.
    Эта книга НЕ ПРО приватность и сохранность личных данных в интернете. Этот вопрос пару раз упоминается но совершенно мимоходом.
    Также эта книга НЕ ПРО Big Data. Все что рассматривается тут это структурированные данные полученные от агентств вроде министерства здравоохранения или в ходе, скажем, клинического эксперимента. Big Data это обработка естественного языка, изображений, звука и видео контента. В книге про это нет ничего или почти ничего.
    Этические вопросы сбора данных о людях по большей части тоже лежат за пределами данной книги. Тоже пара упоминаний вскользь о том, что такая проблема в принципе есть – не более того. Так что книга НЕ ПРО это тоже.
    Ближе к самой книге: первая половина, на мой взгляд, написана просто отлично. Очень интересно, много классных вопросов и примеров. Все по теме. Вторая половина, к сожалению, огорчает. Автор начинает слишком сильно растекаться мыслями. Получается повествование просто обо всем и в результате ни о чем одновременно. Он пытается охватить сразу и астрофизику и биржевые махинации и медицинские вопросы и вообще все. В итоге повествование теряет фокус, становится расплывчатым и неконкретным.
    Было бы лучше, если бы автор пошел не в ширь, а в глубь. То есть более глубоко рассмотрел поднятые им же самим вопросы. Почему промахивались социологические опросы касательно победы Трампа? Почему статистические органы рапортуют аномально низкие показатели инфляции хотя потребители отмечают повышение цен? А промахи опросов касательно брексита? Вот где не мешало бы покопаться в темных данных.
    А как насчет проблем с кредитным скорингом перед кризисом 2008 года? Как получалось, что множество заемщиков невероятно низкого качества получило такие объемы кредитов? Я изучал вопрос более глубоко и знаю, что тут тоже не обошлось без изрядной доли темных данных.
    В общем, за первую половину книги 5 звезд, а за вторую половину две. В итоге в среднем 3,5 звезды, которые я округлил в пользу автора до 4. Почитать все же стоит.

  • 5/5

    Просто, понятно, без длинных отступлений и туманных рассуждений на отвлеченные темы. Книга, которую хочется перечитывать. Жалею, что не прочла раньше.

  • 4/5

    Книга-топ. Достаточно простая, чтобы не считать её академической литературы. Но на весьма сложную и специфическую тему. Напоминает концепцию безмасштабных сетей, но уже в более практическом, конкретном смысле.

  • 5/5

    В условиях повальной цифровизации всего и вся наконец кто-то начал задавать неудобные вопросы..Очень необычная теория. Оригинально, познавательно и на понятных примерах рассказано где «обитает» информация, по каким правилам движется в сети и реально ли полностью извлечь собственные данные из всемирной паутины (и разумно ли это).

  • 5/5

    Если любите математику и теорию вероятности, книга точно вас развлечёт. Особенно в голову запал принцип работы с тёмными данными, ближе к концу книги. Людям со стороны может быть интересно прочитать её как путеводитель в мире современного интернета и облачных данных. Сразу вспоминаю недавний «слив» личных данных россиян и общую беспомощность людей в таких вопросах. После прочтения книги где-то станет менее страшно, а где-то наоборот)

  • 4/5

    Книга может показаться немного сложноватой, но она того стоит. Ещё рекомендую книгу «Формула» Барабаши, подобного плана. Как статистика и информатика поможет увидеть важные или опасные закономерности в повседневности.

  • 5/5

    Готовьтесь, будет много цифр. Но прочитать это нужно всем, кто задействован в продажах или занимается распространением своего/чужого творчества. Из приведённых теорий и алгоритмов можно начать интуитивно понимать любые механизмы распространения и хранения данных.

  • 5/5

    Мы живем в мире в котором, казалось бы, уже есть бесчисленное множество информации и знаний о каждом из нас. Но на самом деле существует иная сторона – Dark Data – «темные данные», которые хранятся, но нигде не используются! Простой пример – при текущем уровне развития искусственного интеллекта (ИИ), машинного обучения и Интернета вещей (IoT), объём хранимых в мире Dark Data через пять вырастет в 5 раз – до 91 зеттабайт при условии что общий объем Big Data будет составлять по оценкам IDC 175 зеттабайт. На разных примерах Дэвид Хэнд показывает необходимость в идентификации и выявлении этого огромного океана данных, их классификации, а так же изменения политик обработки таких данных. Острая необходимость в этом связана хотя бы с тем что
      "для поглощения выбросов углекислого газа, связанных с хранением «темных данных», потребуется 7 500 000 акров леса (3,0 млн гектаров)" (c)



Где купить (2)

Цена от 359 р. до 449 р. в 2 магазинах

МагазинЦенаНаличие
Яндекс.Маркет
5/5
449 р.
Кэшбэк до 3.8%
Промокоды на скидку

23.05.2024
359 р.
449 р. -20% Электронная книга Кэшбэк до 14%

23.05.2024
Один из первых книжных интернет-магазинов, работающий с 2002 года
Промокоды на скидку
Заказ от 800 рублей мы привезем бесплатно!
Avito доставка позволит получить любой товар, не выходя из дома

Описание

Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем? Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой – крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, результатах медицинского исследования, которые намеренно утаили или случайно исказили, или данных, ставших «темными» из-за плохого набора критериев для включения в выборку. Хэнд также рассказывает о том, какие меры могут сгладить эффект «темных данных» и как их можно обратить себе на пользу. Книга будет интересна широкому кругу читателей, интересующихся дата-сайенс, программированием и статистикой.

Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных - фото №1

Смотри также о книге.

О книге


ПараметрЗначение
Автор(ы)
ИздательАльпина Диджитал
Год издания2020
Возрастные ограничения12
ISBN978-5-9614-5893-0


Зарегистрируйтесь и получайте бонусы за покупки!


Книги: Программирование, Базы данных - издательство "Альпина Диджитал"

Книги: Программирование, Базы данных

Категория 287 р. - 430 р.

закладки (0) сравнение (0)

15 ms