Все умирает, включая информацию

Умирает все: люди, машины, цивилизации. Может быть, мы сможем найти некоторое утешение, зная, что все важные вещи, которые мы узнали на этом пути, сохранятся. Но даже у знаний есть срок годности. Документы исчезают. Искусство исчезает. Целые библиотеки и коллекции могут столкнуться с быстрым и неожиданным уничтожением.

Конечно, мы находимся на технологическом этапе, когда мы могли бы придумать способы сделать знания доступными и доступными навсегда. Ведь плотность хранения данных уже невероятно высока. В постоянно меняющемся интернет-музее можно плавно перейти от изображений космического телескопа Джеймса Уэбба к диаграммам, объясняющим философию Пифагора о музыке сфер, к обучающему видео на YouTube по блюзовому гитарному соло. Чего еще можно желать?

Немного, по мнению экспертов. С одной стороны, то, что мы считаем постоянным, таковым не является. Цифровые системы хранения данных могут стать нечитаемыми уже через три-пять лет. Библиотекари и архивариусы спешат копировать вещи в новые форматы. Но энтропия все еще там, ждет своего часа. «Наши профессии и люди часто пытаются максимально продлить нормальную продолжительность жизни с помощью различных методов, но это всегда идет против течения», — говорит Джозеф Джейнс, доцент Информационной школы Вашингтонского университета.

Что еще больше усложняет ситуацию, архивариусы сейчас борются с беспрецедентным потоком информации. В прошлом материалы были в дефиците, а место для хранения ограничено. «Теперь у нас есть обратная задача, — говорит Джейнс. "Все постоянно записывается."

В принципе, это может исправить историческую ошибку. На протяжении веков у бесчисленного множества людей не было нужной культуры, пола или социально-экономического класса, чтобы их знания или работу можно было обнаружить, оценить или сохранить. Но огромные масштабы цифрового мира теперь представляют собой уникальную проблему. Согласно оценке исследовательской компании IDC, проведенной в прошлом году, объем данных, которые предприятия, правительства и частные лица создадут в течение следующих нескольких лет, вдвое превысит общее количество всех цифровых данных, созданных ранее в начале компьютерной эры.

В некоторых университетах целые школы изо всех сил пытаются найти лучшие подходы к защите данных под их эгидой. Центр данных и обслуживания гуманитарных наук Базельского университета, например, разработал программную платформу под названием Knora не только для архивирования многих типов данных из гуманитарной деятельности, но и для обеспечения того, чтобы люди могли читать и использовать их в своей работе. будущее. И тем не менее, процесс трудоемкий.

"Мы не можем спасти все... но это не причина не делать то, что мы можем."

Андреа Ожье

"Вы делаете обоснованные предположения и надеетесь на лучшее, но некоторые наборы данных теряются, потому что никто не знал, что они будут полезны, – – говорит Андреа Ожье, заместитель декана и директор службы данных Академических библиотек Технологического института Вирджинии. .

Для выполнения всей работы никогда не хватает персонала или денег, а форматы постоянно меняются и множатся. «Как нам лучше всего распределять ресурсы для сохранения вещей? Потому что бюджеты не очень важны», — говорит Джейнс. «В некоторых случаях это означает, что элементы записываются или хранятся, но остаются там, не каталогизированными и необработанными, и поэтому их практически невозможно найти или получить к ним доступ». В некоторых случаях архивариусы отказываются от новых коллекций.

Форматы, используемые для хранения данных, сами по себе непостоянны. НАСА хранит около 170 полос данных о лунной пыли, собранных в эпоху Аполлона. Когда исследователи впервые начали использовать ленты в середине 2000-х годов, они не смогли найти никого с машиной IBM 729 Mark 5 1960-х годов, необходимой для их чтения. С некоторой помощью команда в конце концов нашла один в плохом состоянии на складе Австралийского музея компьютеров. Волонтеры помогли восстановить машину.

Программное обеспечение также имеет срок службы. Ожье вспоминает, как пытался изучить старый файл электронной таблицы Quattro Pro, но обнаружил, что нет доступного программного обеспечения для его чтения.

Были попытки создать перспективные программы. В 2015 году широко обсуждался проект Open Library of Images for Virtualized Execution (Olive), в котором запущено старое программное обеспечение, такое как Chaste 3.1, исследовательская программа по биологии и физиологии 2013 года, а также компьютерная игра The Oregon Trail 1990 года для Mac. набор виртуальных машин. Проект все еще активен, говорит Махадев Сатьянараянан, профессор компьютерных наук Университета Карнеги-Меллон. Но было...

Все умирает, включая информацию

Умирает все: люди, машины, цивилизации. Может быть, мы сможем найти некоторое утешение, зная, что все важные вещи, которые мы узнали на этом пути, сохранятся. Но даже у знаний есть срок годности. Документы исчезают. Искусство исчезает. Целые библиотеки и коллекции могут столкнуться с быстрым и неожиданным уничтожением.

Конечно, мы находимся на технологическом этапе, когда мы могли бы придумать способы сделать знания доступными и доступными навсегда. Ведь плотность хранения данных уже невероятно высока. В постоянно меняющемся интернет-музее можно плавно перейти от изображений космического телескопа Джеймса Уэбба к диаграммам, объясняющим философию Пифагора о музыке сфер, к обучающему видео на YouTube по блюзовому гитарному соло. Чего еще можно желать?

Немного, по мнению экспертов. С одной стороны, то, что мы считаем постоянным, таковым не является. Цифровые системы хранения данных могут стать нечитаемыми уже через три-пять лет. Библиотекари и архивариусы спешат копировать вещи в новые форматы. Но энтропия все еще там, ждет своего часа. «Наши профессии и люди часто пытаются максимально продлить нормальную продолжительность жизни с помощью различных методов, но это всегда идет против течения», — говорит Джозеф Джейнс, доцент Информационной школы Вашингтонского университета.

Что еще больше усложняет ситуацию, архивариусы сейчас борются с беспрецедентным потоком информации. В прошлом материалы были в дефиците, а место для хранения ограничено. «Теперь у нас есть обратная задача, — говорит Джейнс. "Все постоянно записывается."

В принципе, это может исправить историческую ошибку. На протяжении веков у бесчисленного множества людей не было нужной культуры, пола или социально-экономического класса, чтобы их знания или работу можно было обнаружить, оценить или сохранить. Но огромные масштабы цифрового мира теперь представляют собой уникальную проблему. Согласно оценке исследовательской компании IDC, проведенной в прошлом году, объем данных, которые предприятия, правительства и частные лица создадут в течение следующих нескольких лет, вдвое превысит общее количество всех цифровых данных, созданных ранее в начале компьютерной эры.

В некоторых университетах целые школы изо всех сил пытаются найти лучшие подходы к защите данных под их эгидой. Центр данных и обслуживания гуманитарных наук Базельского университета, например, разработал программную платформу под названием Knora не только для архивирования многих типов данных из гуманитарной деятельности, но и для обеспечения того, чтобы люди могли читать и использовать их в своей работе. будущее. И тем не менее, процесс трудоемкий.

"Мы не можем спасти все... но это не причина не делать то, что мы можем."

Андреа Ожье

"Вы делаете обоснованные предположения и надеетесь на лучшее, но некоторые наборы данных теряются, потому что никто не знал, что они будут полезны, – – говорит Андреа Ожье, заместитель декана и директор службы данных Академических библиотек Технологического института Вирджинии. .

Для выполнения всей работы никогда не хватает персонала или денег, а форматы постоянно меняются и множатся. «Как нам лучше всего распределять ресурсы для сохранения вещей? Потому что бюджеты не очень важны», — говорит Джейнс. «В некоторых случаях это означает, что элементы записываются или хранятся, но остаются там, не каталогизированными и необработанными, и поэтому их практически невозможно найти или получить к ним доступ». В некоторых случаях архивариусы отказываются от новых коллекций.

Форматы, используемые для хранения данных, сами по себе непостоянны. НАСА хранит около 170 полос данных о лунной пыли, собранных в эпоху Аполлона. Когда исследователи впервые начали использовать ленты в середине 2000-х годов, они не смогли найти никого с машиной IBM 729 Mark 5 1960-х годов, необходимой для их чтения. С некоторой помощью команда в конце концов нашла один в плохом состоянии на складе Австралийского музея компьютеров. Волонтеры помогли восстановить машину.

Программное обеспечение также имеет срок службы. Ожье вспоминает, как пытался изучить старый файл электронной таблицы Quattro Pro, но обнаружил, что нет доступного программного обеспечения для его чтения.

Были попытки создать перспективные программы. В 2015 году широко обсуждался проект Open Library of Images for Virtualized Execution (Olive), в котором запущено старое программное обеспечение, такое как Chaste 3.1, исследовательская программа по биологии и физиологии 2013 года, а также компьютерная игра The Oregon Trail 1990 года для Mac. набор виртуальных машин. Проект все еще активен, говорит Махадев Сатьянараянан, профессор компьютерных наук Университета Карнеги-Меллон. Но было...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow