вторник, 16 апреля 2013 г.

8 примеров применения Больших данных в реальном мире

Количество данных в мире растет экспоненциально; каждые 1,5 года оно удваивается. Множество разговоров вокруг больших данных касаются как проблем, связанных с ними, так и их потенциальной пользы. Но некоторые переходят от разговоров к действиям.

Национальная метеорологическая служба Национального управления океанических и атмосферных исследований (NOAA)

 

Служба NOAA уже 50 лет имеет дело с большими данными. Сейчас она управляет 30 петабайтами новых данных в год, собирая в день более 3,5 млрд. наблюдений со спутников, суден, летательных аппаратов, буев и других датчиков.

Затем используют непосредственное измерение атмосферных, океанографических и геодезических данных вместе с комплексным прогнозирующим моделированием высокой точности, чтобы передать информацию Национальной метеорологической службе (НМС).

Модели НМС формируют миллионы продуктов ежедневно - метеорологические предупреждения и руководящие указания синоптикам, включая государственные органы вроде Министерства обороны и НАСА.


Компания AM Biotechnologies (секвенирование ДНК)


Бостонская компания AM Biotechnologies занимается разработкой новой технологии для продуцирования химически модифицированных молекулярных единиц на основе ДНК (аптамеры).

У аптамеров широкая область применения: от диагностического количественного определения конкретного аналита в пробах крови до направленной терапии. Для этого необходимо анализировать десятки миллиардов коротких последовательностей ДНК.

Чтобы обработать огромный объем данных, компания использует веб-инструменты анализа больших данных, предоставляемые CD-HIT и платформой Galaxy.

Администрация национальных архивов и документации США (Архив электронных записей)

 
Администрация национальных архивов и документации (NARA) является национальным архивом США. Она управляет 142 петабайтами информации, что составляет более 7 млрд. объектов, включая документацию федеральных агентств, Конгресса и нескольких президентских библиотек.

Оцифрованные записи существуют в 4800 различных форматах. Кроме того, NARA выполняет оцифрование более 4 млн. куб. футов традиционных архивных фондов.

До 2016 года, 95% информации, сохраняемой в электронном виде, будет доступно исследователям. NARA создала Архив электронных записей (ERA) как "систему систем" для выполнения целого комплекса архивных функций и управления документами, руководствуясь разными правовыми основами.

Компания Vestas (Установка и обслуживание ветрогенетаторов)

 
Датская компания Vestas использует суперкомпьютеры и технологию моделирования больших данных, чтобы определить оптимальное месторасположение ветрогенераторов с целью максимально увеличить получение энергии и снизить затраты.  Все данные из глобальной метеосистемы и данные, собранные из существующих турбин хранятся в специальной библиотеке ветров. На сегодняшний день их объем составляет около 2, 8 петабайтов.

Текущие параметры включают: температуру, атмосферное давление, влажность, осадки, направление и скорость ветра на уровне земли и на высоте 300 футов, и архивные данные компании. Vestas планирует добавить показатели глобальной вырубки леса, снимки со спутника, исторические показатели, геопространственные данные и данные касательно фаз луны и приливов.

Служба внутренних доходов (IRS) (Хранилище налоговых данных)

 
В 1996 году IRS инициировала проект загрузки данных налоговых деклараций за один год. Результатом такого проекта стало Хранилище налоговых данных (CDW), в котором содержится более 1 петабайта информации.

Большинство старых данных структурировано, однако новые данные из электронных налоговых деклараций, стран-партнеров международных налоговых соглашений и третьих сторон доступны в формате XML или других полу или почти неструктурированных форматах.

Исследовательская группа IRS проводят аналитику данных для разного рода задач: от оценки "налогового разрыва" США до прогнозирования краж персональных данных и моделирования влияния политических изменений на налоговое поведение.

Технологический институт университета Онтарио (UOIT) (Медицинский контроль)

 
UOIT в сотрудничестве с IBM взялись за проект "Artemis", цель которого - улучшить технологию медицинского контроля, что позволит выявлять предупреждающие признаки до того, как жизненные показатели достигнут критического уровня - как, например, при нозокомиальной инфекции, опасной для жизни недоношенных детей, когда сперва пульс находится в приемлемых пределах, но со временем появляются проблемы.

Проект основан на ПО потоковой аналитики. Это создаст возможность быстро анализировать данные и принимать взвешенные оперативные решения.

Компания TerraEchos (Обнаружение вторжения по периметру)

 
TerraEchos специализируется на технологиях для защиты и контроля критически важной инфраструктуры. Один из ее клиентов - Национальные лаборатории Министерства энергетики США, которые доверяют компании защиту своей научной разведки, технологий и ресурсов.

TerraEchos нуждалась в технологическом решении, способном определить, классифицировать, установить местонахождение и отследить потенциальные угрозы (механические и биологические). В основном, нужно было отличить шепот от шума ветра на расстоянии нескольких миль.

Компания использует датчики, аналитическое ПО и высокопроизводительные вычисления, чтобы постоянно анализировать гигантские массивы информации "в движении" - от движений человека и животных до атмосферных условий.

НАСА (Архив изображений)

 
Космический центр имени Линдона Джонсона (JSC) - центр НАСА по обучению астронавтов США и подготовки и контроля за космическими полетами.

Начиная с 1959 года им было собрано более 4 млн. снимков, 9,5 млн. футов 16-мм пленки и 85 тыс. видеопленок и файлов, что эквивалентно 81,616 часам видео в аналоговом и цифровом форматах. Коллекция используется как источник материалов для журналистов, а также в научно-техническом сообществе.

НАСА разработало приложение под названием "Imagery Online", связывающее имена файлов с их метаданными. Однако, управление все еще испытывает проблемы с обеспечением свободного доступа к информации. 

Комментариев нет:

Отправить комментарий